成都人型ロボットイノベーションセンターはこのほど、中国初のロボットマルチモーダルモデル・双腕協調システムを発表した。ロボットは同モデルによって抽象的な指示を推理・理解し、双腕協調システムによってタスクを実行する。科技日報が伝えた。
マルチモーダルデータ共同推理とは、2種類以上の認知ソースを融合して総合的な推理を行い、複雑なタスクを完了させるプロセスを指す。同センターの研究者はマルチモーダル技術を人型ロボット分野に応用し、ロボットが画像や意味、力覚、環境知覚など複数の要素を融合して総合的に判断することで、タスクを生成・実行させる。これは人型ロボットが自主的な思考能力を持つための重要コア技術となる。
同センターの張睿睿董事長は「抽象的な指示には飲料と非飲料を区別して分類することや、円柱状と長方形の物体、食用と非食用の物品を区別して分類することなどが含まれる。これらのタスクを完了するためには、ロボットがマルチモーダルモデルにより自らすべての物品を抽出して一般化する必要がある。特に複数の類似した瓶の形をした物品について、ロボットはそのボトルパッケージの文字や画像などの要素から、化粧品などの非食用品が入ったボトルではなく食用品が入ったものであることを総合的に判断し、初めてタスクを完了できる」と説明した。
張氏はまた「マルチモーダルモデルの発表は『AIの物理化』プロセスを加速させ、人型ロボットが『プリセット撮影』や『リモート操作』から、より強力な頭脳と自律的な実行能力を持つように進化することを意味する。当センターは引き続き技術開発を深化させ、マルチモーダルモデルと双腕協調システムの統合と応用を持続的に最適化し、人型ロボットの複雑な環境における知覚、意思決定、実行能力を向上させる」と語った。
サイエンスポータルチャイナ事務局が、中国の科学技術に関するニュース記事を人民網と共同通信の記事より選んで、日々届くフレッシュなニュースとしてお届けしています。
下記よりご覧ください。