[新製品・サービス]
シスコのWeb会議システム「Webex」にマルチモーダルAI機能、テキスト/音声/動画をリアルタイム処理
2024年1月31日(水)日川 佳三(IT Leaders編集部)
シスコシステムズは2024年1月31日、説明会を開き、Web会議システム「Cisco Webex Meetings」の機能アップデートについて説明した。最近のリリースで離席中の会議内容要約や復帰時に取るべきアクションを促す機能など、生成AI/大規模言語モデル(LLM)によるマルチモーダルAIなどによる新機能を追加している(日本語未対応)。2024年春にビデオの超解像機能、2024年夏までに狭帯域でもクリアな音声を実現する音声コーデック「Webex AI Codec」を追加する予定である。
シスコシステムズのWeb会議システム「Cisco Webex Meetings」に生成AI機能が加わっている。最近のアップデートで、離席中の会議内容要約や復帰時に取るべきアクションを促す機能など、生成AI/大規模言語モデル(LLM)によるマルチモーダルAIなどによる新機能を追加している(日本語未対応)。
拡大画像表示
シスコはWebexの提供において従業員の業務体験を重視している。リモートワーク/オフィスワークのハイブリッド型の勤務形態が主流になる中で、現在の会議やコラボレーションの体験は決して満足できるものではないと指摘。「リモートから会議に参加するメンバーがいるのに、Web会議ができる会議室は全体の15%しかない」(米シスコシステムズのサンディープ・メフラ〈Sandeep Mehra〉氏、写真1)。
この状況を受けてシスコは、ハイブリッドワークを機能させるために、Web会議システムや会議室用デバイスなどの機能向上に注力している。その1つが、AIによるイマーシブ(没入感のある)な体験の提供である。言語処理(翻訳、要約、取るべきアクションの抽出)や音声/ビデオ機能(話者中のメンバーの声や顔へのフォーカス、カメラワーク自動制御、音声/ビデオ品質の改善などにAIを活用している。
テキスト/音声/動画をマルチモーダルAIでリアルタイム処理
テキストだけでなく音声やビデオの情報を含んだデータを処理する、生成AI/LLMベースのマルチモーダルAIを、シスコは「リアルタイムメディアモデル(RMM)」として提供する。音声やビデオ自体の内容、それらに含まれる話者の情報(リアクション、ジェスチャー、声のトーンなど)をリアルタイムに処理できるようにする。
例えば、リモート会議中に届いた荷物を受け取るなどで一時離席したとき、映像から判断してマイクを自動でミュートにし、戻ってきたときに解除する。その際、離席中の会議内容が要約表示され、取るべきアクションがあればそれも提示する、といった具合だ。「生成AIによる会議の要約だけではない、リッチな体験が可能になる」(同社)という。
●Next:生成AIを用いた音声コーデック、カメラワーク機能搭載の会議デバイス
会員登録(無料)が必要です
- 1
- 2
- 次へ >