2019年9月27日の日経で、AI翻訳がプロの領域に迫っているという話がありました。
AI翻訳、医療・法律で先行 深層学習で早まる進化 :日本経済新聞
- 独自の用語が多く、論理が分かりやすい医療や法律などの専門分野が先行
- ディープラーニングを翻訳に応用
- 英語の契約書をAI翻訳を手がけるロゼッタのシステム。違和感のない日本語に自動的に翻訳
- 精度は95%と、プロの翻訳者に匹敵
- 機械翻訳では、芸術性の高い文章より、実務的な書類の方が処理しやすい
- 深層学習AIは、大量のデータを与えるほど賢くなる
- ロゼッタは医療や金融など専門分野に特化
- 英語でプロ並みの精度を実証したことで企業からの引き合いが急増。2019年2月期の売上高は29億円と前期に比べ45%増
- グーグルなどは汎用型のAI翻訳。企業や業界ごとに異なる文脈を読み取るのが難しい
- 「Male」という英単語は「男性」と訳すのが一般的だが、製薬で試験対象が動物の場合は「雄(オス)」としたほうが自然
- ロゼッタは企業ごとにシステムを作り分ける「オーダーメードAI翻訳」を実現。社内用語を学習し、精度をさらに高める
- データの量が勝負を左右。「GAFA」が有利。しかし、巨大企業は母国語の開発を優先する傾向
- ロゼッタは、日本語を軸とした翻訳に特化
- 企業と連携を強化して、データを確保できるかが成長のカギ
コメント
文学作品より、実務的な文章の方が得意というのは頷けます。
特に、契約書は正確に文章が出来ているので、機械翻訳に向いているかもしれません。
少し前から、ロゼッタのT-400のことは聞いていました。1年少し前にGMOブライツコンサルティングが代理店になったと言って、パンフレットを置いていきました。
また、最近、トライアルで使ってみましたが、主語述語が複数あって意味のとりにくい、英文でもちゃんと構文を分析して、和訳してくれています。
ロゼッタは、95%の精度と言っていますが、単語を学習させると、そんな感じになりそうだな問いのが感想です。
翻訳に出すよりは安く、早いというのが特徴でしょうか。
特に、ソフトですので、あっという間に翻訳してくれるのが、翻訳会社を使うときと比べてメリットがあります。
まだ、和文英訳には使ったことがないので、一度、試しに使って見たいなと思います。
その時、ポイントは、もともとの日本語になりそうです。
ディープラーニングですので、皆が使っているような言い回しは上手く処理すると思うのですが、特殊な言い回しは辞書登録しないといけません。
辞書を作るのは面倒そうなので、一般的な言い回しを使った方が簡単です。
今度、和文英訳で使って見たいなと思います。