2018年06月18日-06月22日
トップ  > 科学技術ニュース>  2018年06月18日-06月22日 >  無限の能力を秘めるスマートスピーカー

無限の能力を秘めるスマートスピーカー

2018年06月22日

 率先してスマートスピーカーを発売したアマゾンは、その試みによりこの業界が4年後、全世界に影響を及ぼすとは想像しなかっただろう。今年第1四半期の世界スマートスピーカー出荷台数は920万台に達しており、多くの製品が日常生活に進出していることが分かる。人民日報海外版が伝えた。
 アマゾンとグーグルは早くから市場に進出していた。アマゾンが2014年に発売したスマートスピーカーは数千万台出荷されており、市場トップの地位を占めていた。グーグルのスマートスピーカーは2016年の年間開発者大会で公開されてから、同社の最も人気のある商品の一つとなり、市場2位の位置につけている。
 中国市場でもスマートスピーカー業界は流行をけん引しており、IT企業が有利な地位を占めようとしている。百度は「小度」を、テンセントは「聴聴」を、京東は「叮ドン」(ドンは口に冬)を、小米は「小愛同学」を次々と発表した。
 スマートスピーカーの流行の裏側にあるのは、スマート音声認識と機械学習技術の急成長だ。この2つの技術により、スピーカーは言葉を理解し、言葉を口にできるようになった。中国企業はこの分野においては先頭集団から遅れを取っていない。
 科大訊飛は中国スマート音声認識分野のエース企業と言える。貴州省貴陽市で先ごろ開かれた「2018中国国際ビッグデータ産業博覧会」で、同社はスマートカスタマーサービス、暁曼スマートスピーカー、暁譯AIアシスタントなど一連の新製品を発表した。職員によると、これは現在のAI分野の音声認識、音声合成、自然言語処理などの技術の総合的な応用例となり、同社は、「最新版の訊飛翻訳機2.0は、中国語と33種の言語の双方向翻訳をサポートする。広東語や四川省の方言なども外国語に翻訳できる」としている。
 音声認識技術によって、利用者が何の話をしているのかを理解できるようになった。機械学習は、利用者の発言が何を意味し、それにどう反応すべきかという問題を解消する。大量のデータを蓄積することで、スマートスピーカーは徐々に利用者の指示をそれに応じた操作に結びつける。「ニュース」と言えばニュースアプリを立ち上げ、「音楽」と言えばプレイヤーを立ち上げる。利用者との持続的な交流により進化・成長を続け、利用者の好みに応じてコンテンツの設定と推薦を行う。
 スマートスピーカーはスマートホームの「司令部」にもなる。音声認識技術により利用者と知らない人の声を区別する。利用者は声で指示を出せば、手を使うことも部屋を出ることもなく、自宅内の窓、照明、エアコン、給湯器を操作できる。
 市場に流通している大多数のスマートスピーカーは、利用者の体験の面で大きな改善の余地を残している。音声交流や言葉の理解などの面でまだまだ「スマート」とは言えず、多くのメーカーの現段階の中心的な改善点となっている。小米の「小愛」チームは相互学習アルゴリズムを採用している。責任者の王剛博士は、「当初は小愛も今ほど賢くなく、聞き取れないことが多かった。しかし利用者との交流でますます賢くなる。多くの利用者データにより、昔ならば聞き取れなかったことを理解できるようになっている」と述べた。

※掲載された記事、写真の無断転載を禁じます