[ザ・プロジェクト]

NTTドコモ「はなして翻訳」開発の軌跡─技術競わせ翻訳精度を向上、細かな改善を重ねて本サービスへ

2013年1月30日(水)川上 潤司(IT Leaders編集部)

日本語しか話せなくても外国人と会話できる─。そんな夢物語を可能にしたのがNTTドコモの「はなして翻訳」だ。スマートフォンを使い、日本語と英語、中国語、韓国語など10言語をほぼリアルタイムに翻訳する。果たしてどのように実用化したのか。サービス開始までの道のりを聞く。聞き手は本誌副編集長・川上潤司 Photo:陶山 勉

西本 暁洋 氏
西本暁洋氏
NTTドコモ サービス&ソリューション開発部 サービス開発推進担当 主査
2001年4月、NTTドコモに入社。リモートアクセスサービスの企画、運用業務を経て、法人向けIP電話サービスの立ち上げや、業務用機器への通信モジュール組み込みプロジェクトに従事。2010年4月にネットワーク開発部に異動し、新サービスの企画や開発業務に従事。「メール翻訳コンシェル」、「はなして翻訳」の企画開発、トライアルを推進し、2012年に商用提供を開始した。現在、これらサービスの利用拡大に向け、さらなる改善、機能拡充の検討を進めている。

 

飯村 葉子 氏

 

飯村葉子氏
NTTドコモ 研究開発センター ネットワーク開発部 サービスサポートノード担当
2005年4月、NTTドコモに入社。ネットワーク開発部に配属。以降、ネットワーク経由で提供する映像、テキスト、音声などといったメディアコンテンツの付加価値サービスの開発に従事。テレビ電話形式のライブビデオストリーミングサービス、SMSの国内事業者間相互接続対応、通話録音サービスなど、数々の開発プロジェクトに携わる。

 

金野 晃 氏

 

金野 晃氏
NTTドコモ マーケティング部 サービス戦略担当 主査
2001年4月、NTTドコモに入社。マルチメディア・移動体端末の研究・開発業務を経て、ベイズ統計のマーケティングへの応用業務に従事。2011年4月よりマーケティング部へ異動し、ドコモ全体のサービス戦略企画・実行の業務に従事する。現在、「しゃべってコンシェル」や「はなして翻訳」といったR&D発のサービスを提供するプロジェクトを推進している。

 

はなして翻訳とは

スマートフォンを使った無料の翻訳サービス。対面利用と通話利用の2通りの使い方が可能。前者は1台の端末を使い、翻訳した内容を画面に表示し、交互に見せ合うことで対話できるようにする。後者は電話での会話を翻訳し、音声として読み上げる(画面に表示することも可能)。着信側はドコモの契約者である必要はなく、固定電話でも利用できる。対面利用時には、英語、韓国語、中国語をはじめ10言語をサポートする。通話利用時は英語、韓国語、中国語の3言語のみサポート。Android用アプリとして提供する

─「はなして翻訳」は話題を呼んでますよね。一体、どんな経緯で生まれたんですか。

西本:社内外を問わず、技術の最新動向をチェックしている中で、翻訳に関する技術の精度が向上していることに目を付けました。複数の技術を組み合わせれば、新たなサービスを生み出せるのではと考えたのが、そもそものきっかけです。

─具体的にはどんな技術?

西本:大きく3つの技術を用いています。まず話し言葉をテキスト化する「音声認識」。それからテキストを別の言語に翻訳する「機械翻訳」、最後が翻訳した内容を音声として発話する「音声合成」です。

飯村:実は要素技術だけではなく、実績のない技術を使うことを前向きに捉える風潮が社内に出始めていたことも開発や商用化を後押ししました。

─以前は慎重な姿勢だったと。

飯村:ええ。この6月に退任した山田隆持前社長の言葉が分かりやすいかもしれません。「完成度が100%でなければ世に出すことができない時代は終わった。80%であっても早く顧客に届けることが大事である」という言葉です。

金野:当社は通信キャリアですので、わずかなリスクでもゼロにしない限り、サービス化しないという風潮が強かったんですよ。でもアップルやグーグルといった海外企業は、スマートフォン市場に対して非常にスピーディに製品やサービスを投入している。これまでの開発スピードでは、これら海外勢には到底太刀打ちできません。

─なるほど。市場から刺激を受けたことも大きなきっかけなんですね。それで開発に着手したのはいつ頃ですか。

西本:「はなして翻訳」の前身である「通訳電話」を作ろうとしたのが2010年の夏です。その後、試験的に2011年11月から2012年の3月まで「通訳電話サービスお試し版」を提供しました。さらに2度目の試験を2012年の6月から9月まで実施した上で、11月から正式サービスとして「はなして翻訳」を開始しました。

─翻訳需要が増えるとの見込もあった?

西本:いえ、実は…(笑)。開発部門が主導して進めたため、ニーズよりも技術の価値や当社の先進性をアピールすることの方が強く働いていました。そもそも当初は、必ずしも商用化を目指していたわけではありません。まずは試作品を開発し、使えるものなのかチェックしてみたかったというのが本心です。

─実際に作ってみてどうでした。

西本:最初は社内での反響が大きく驚きました。もちろん試験サービスを利用したユーザーからも、継続して使いたいという回答が7割を超えたんです。これなら行けると手ごたえを感じ、商用化に向けて走り出すことになりました。

有望な外部技術を採用
競争させて精度向上を促進

NTTドコモが発表した2012年の冬モデル。上がサムスンの「GALAXY Note II SC-02E」。下がソニーモバイルコミュニケーションズの「Xperia AX SO-01E」)NTTドコモが発表した2012年の冬モデル。上がサムスンの「GALAXY Note II SC-02E」。下がソニーモバイルコミュニケーションズの「Xperia AX SO-01E」

─それでは3つの主力技術について教えてください。これらはNTTグループが開発した技術ですか。

西本:いえ、外部の企業が開発した技術を用いています。国内はもちろん海外も含め、優れた技術を持つ企業を探したんです。ベンチャー企業から大企業の一部門が開発している技術まで、幅広くチェックしましたね。気になる技術が海外にあれば、現地まで調査に行くこともしました。

─具体的に何社に絞ったんです?

飯村:言語ごとに翻訳エンジンや音声認識エンジンなどを選定していたので、1言語につき10社以上はあったかと思います。

─えっ、そんなに。でも翻訳エンジンごとに性能差って大きいものなんですか?

西本:それがですね、明らかに違いがあるんですよ。同じように端末を持って話しかけると、あるエンジンは正しく音声を認識したのに、別のエンジンはまったく認識しない、ということはよくありました。何度も試すと明確に精度差が現れてきます。

─各エンジンが持つ辞書に差があるんでしょうか?

飯村:外部のエンジンのため、具体的にどういったアルゴリズムなのかまで把握することはできませんが、辞書も確かに重要ですね。加えて語句と語句の関係性を、どう処理するのかも、認識や翻訳の精度の違いになるんだと思います。各社はここに工夫を凝らしているようです。

─それでどうしました?10社以上のエンジンを同時に使うわけにはいきませんよね。

飯村:最終的にどの企業の技術を採用するのかを決めるため、今年の春まで検討を重ねました。ある言語に関しては抜群の精度の技術があったので容易に絞り込めた一方で、中国語のようにエンジンごとに性能差が見られなかった言語もありました。もう少し精度を高めてもらおうということで、決められずにいました。

─例えば英語はどうです。実際に精度が高いように思いますが、早々に決まった?

西本:はい。試験サービスは当初、英語から始めたこともあり、有用な技術は早くから目星をつけやすかったですね。でも中国語と韓国語は試験サービスの開始が遅かったこともあって、エンジン決定も遅くなりました。

─サービス開始に向け、早めに一本化しようと思わなかった?

西本:むしろ逆です。ギリギリまで競争してもらって少しでも精度を高めて欲しいと思っていました。一社に絞ると、その後の開発のモチベーションが低下してしまう気がして…。よいものを選ぶというスタンスを貫き、早めに決定しないようにしていましたね。

─確かにそうかも知れませんね。では精度の高いエンジンが登場すれば、それに入れ替えることも?

西本:もちろん。「はなして翻訳」のシステムは、エンジン部分を簡単に入れ替えられるように設計しています。精度の高いエンジンが登場すれば、そちらを使います。

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
  • 3
バックナンバー
ザ・プロジェクト一覧へ
関連キーワード

NTTドコモ / スマートフォン / 翻訳 / プロジェクト管理 / 通信事業者 / 音声合成

関連記事

トピックス

[Sponsored]

NTTドコモ「はなして翻訳」開発の軌跡─技術競わせ翻訳精度を向上、細かな改善を重ねて本サービスへ日本語しか話せなくても外国人と会話できる─。そんな夢物語を可能にしたのがNTTドコモの「はなして翻訳」だ。スマートフォンを使い、日本語と英語、中国語、韓国語など10言語をほぼリアルタイムに翻訳する。果たしてどのように実用化したのか。サービス開始までの道のりを聞く。聞き手は本誌副編集長・川上潤司 Photo:陶山 勉

PAGE TOP