近年ディープラーニングやニューラルネットワークの広範な応用に伴い、機械翻訳の精度が大幅に向上している。機械翻訳により、科学研究者が外国語情報を取得する効率が大幅に高まり、外国語科学技術文献の内容を詳細に理解することが可能になる。中国科学技術情報研究所は27日に開催したシンポジウムで、中日両国が中日科学技術論文翻訳システムの共同開発に成功したと発表した。その翻訳可能な割合は97%に達する。
インターネットとビッグデータの時代において、科学技術の発展ペースが上がっている。科学技術論文、特許、科学技術報告書などの各種科学技術文書の数が急増している。日本の科学技術振興機構と京都大学は、中国科学技術情報研究所と長期的に業務提携している。また、中国科学院自動化研究所、ハルビン工業大学、北京交通大学と協力し、「科学技術文書向けの日中双方向実用型機械翻訳共同研究」を展開した。双方はまず科学技術論文を基礎とする500万フレーズ以上の高品質中日言語材料バンクを構築し、それから日本の科学者が開発したニューラルネットワーク翻訳エンジンを使い、これらのデータの学習を行った。
評価によると、同システムによる中国語から日本語への翻訳可能な割合は97%に達しており、うち60%の翻訳の精度が「情報が適切であり、理解しやすい」程度に達している。2016年12月に開かれたアジアの言語を対象とする国際機械翻訳シンポジウム「WAT2016(Workshop on Asian Translation 2016)」において、同システムは科学技術情報機械翻訳の精度で1位の成績を収めた。
科学技術振興機構上席フェローの沖村憲樹氏、有名機械翻訳専門家の長尾真教授、中国科学技術情報研究所の趙志耘書記、戴国強所長、中国科学技術部(省)国際合作司の姜小平調研員、業務提携に参与した中日の研究者が会議に出席した。