NTTコミュニケーションズは2019年1月23日、音声通話やビデオ通話の機能をWebサイトやスマートフォンアプリに容易に実装できるクラウドサービス「Enterprise Cloud WebRTC Platform SkyWay」(以下、SkyWay)を強化した。SkyWayを通じてクラウドにアップロードした音声やビデオを、翻訳サービスなどの外部サービスと連携させられる機能「Media Pipeline Factory」を新たに用意した。
SkyWayは、音声通話やビデオ通話の機能を、Webサイトやスマートフォンアプリに容易に実装できるクラウドサービスである(図1)。最大の特徴は、HTML5規格に含まれる映像・音声通信の規格で、Web会議システムなどのリアルタイムなコミュニケーションを実現できる「WebRTC」(Web Real-Time Communication)の仕組みを使うことである。
拡大画像表示
WebRTCは、HTML5に準拠したWebブラウザ同士を直接ピアツーピアで接続し、リアルタイムに音声/ビデオで対話できるようにする規格である。WebRTCの実装では、Webブラウザのほかに、Webブラウザ同士をマッチングさせる通信制御のための仲介サーバーが必要になる。仲介サーバーによってマッチングが成立した後は、Webブラウザ同士で直接通信し合う形になる。
SkyWayでは、WebRTCを運営するために必要な仲介サーバーを、ユーザーに代わってオンラインサービス(Web API)として提供する。さらに、WebRTC機能をWebサイトやスマートフォンアプリに組み込むためのSDK(ソフトウェア開発キット)を提供する。JavaScriptベースのサンプルアプリケーションや、すぐに使えるサービスとしてリアルタイムチャットサービスも運営している。
SkyWayは、2013年12月からβ版を、2017年9月から正式版のサービスを開始している(関連記事:NTT Com、WebRTCビデオチャットサービス「SkyWay」の有料プランを開始)。2018年6月からは、ネットワークカメラなどの映像をWebRTCプロトコルに変換して中継するIoTゲートウェイソフト「WebRTC Gateway」のβ版も提供している。
今回、WebRTCを介して取り扱う音声やビデオを、翻訳サービスなどの外部サービスと連携させるための基盤として、新たにMedia Pipeline Factoryを用意した(図2)。これまでのSkyWayはリアルタイムチャット専用の機能群しか提供しておらず、音声やビデオをクラウド側で録画することや、クラウドに転送した音声やビデオを翻訳などの外部サービスに連携させることができていなかった。これを改善した。
拡大画像表示
Media Pipeline Factoryでは、GUIを使ってノンプログラミングでデータ連携のパイプライン処理を定義できる(画面1)。あらかじめ用意してある処理機能のコンポーネントを並べてつなぐ、というやり方でパイプラインのフローを構築できる。コンポーネントは、Media Pipeline Factory側で最初から用意しているものもあるが、ユーザーみずからカスタムコンポーネントを開発することもできる。
拡大画像表示
拡大画像表示
記者発表会では、Media Pipeline Factoryのデモンストレーションとして、自動翻訳機能付きの音声レコーダアプリケーションを作ってみせた。WebRTCを介して日本語の音声データを受け取り、音声をテキスト化し、Googleの翻訳APIを使って英語に翻訳し、Amazon DynamoDBに保存する、という処理を作ってみせた。個々のコンポーネントはコンテナとして立ち上がる形になる。同時アクセス数が増えると同時に立ちあがるコンテナの数も増える。
Media Pipeline Factoryの応用例は広いとNTTコミュニケーションズはアピールする(写真1)。例えば、AI機能と連携させることで、音声認識や画像認識、機械翻訳などが可能になる。ストレージ機能と連携させれば、音声やビデオを録音・録画できる。SIPサーバーと連携させれば、VoIPとWebRTCを相互接続してコミュニケーションがとれる。CDNサービスと連携させれば、映像のライブ配信ができる。