2017年12月04日-12月08日
トップ  > 科学技術ニュース>  2017年12月04日-12月08日 >  中国の音声認識技術の正解率が95%以上に

中国の音声認識技術の正解率が95%以上に

2017年12月13日

 スピーディな会話内容にも素早く対応できるスマート音声認識技術とその「魔力」を科大訊飛の劉慶峰会長はある講演でアピールした。スピーチの内容はリアルタイムで中国語・英語字幕として巨大ディスプレイに表示された。その反応は速く、間違いもほとんどみられなかった。新華網が伝えた。
 劉会長は「『科大訊飛スーパーブレーン計画』に基づき、当社は音声と言語を入り口とする『認知の革命』を起こした。当社の音声認識技術の正解率はこの6年間で60.2%から95%以上まで向上し、世界トップになっている」と話した。
 同社は6年前、世界初の音声クラウド開放プラットフォームをリリースした。同プラットフォームは現在、毎日40億回以上の音声情報の処理を行っている。同社の胡郁副総裁は、「音声合成で、中国は世界の先駆者となっている」と説明した。

◆スマート音声認識技術、広がる応用
 「私は羅永浩です。落ち着いてください。まもなくナビを開始します」これは高徳地図羅永浩バージョンのナビ音声だ。高徳地図は2014年に初めて音声合成技術により、有名人の声によるナビゲーションを実現した。そして林志玲(リン・チーリン)の声がリリースされると、瞬く間のうちに話題になった。その後さらに羅永浩などの有名人の音声がリリースされた。
 近年のAIブームにより、スマート音声を始めとする各種アプリが次々と登場している。QQ閲読は科大訊飛の音声合成技術を用い、本の朗読サービスを発表した。また蝦米音楽は科大訊飛の音声認識技術を使い、ハミング検索を発表した。
 科大訊飛は公安・検察・裁判所と革新的な協力を展開し、スマート音声技術応用の新分野を開拓している。安徽省で2016年に実施されたテストによると、AIが詐欺電話と判断できる正確率は非常に高い。AIはさらに法廷の速記官を担うこともできるとされており、スマート音声認証を法廷審理に用いたところ、その時間を3割短縮することができた。
 中国中部のある省立病院の診察ホールでは、2台のロボットが注目を浴びている。「こんにちは、私は案内ロボットの暁医です。あなたのお役に立てて光栄です。診察室の場所、どの診察室に行くか、それから診察での問題点についてお答えします」このような音声と共に、219種の一般的な病気と症状に対応する診察室を熟知している暁医は、スマート音声認識技術により、1日あたり5000回サービスを近く提供している。
 百度の李彦宏会長兼CEOは、「AIは複雑な世界をシンプルにする点が重要だ。今後30年から50年間に渡り、AIは人類の歴史の進歩を促す力強い力になるだろう」と述べた。

※掲載された記事、写真の無断転載を禁じます