[市場動向]
IBMが生成AIへの取り組みを加速、AIモデル/ツールをオープンソースで公開、自社製品に実装
2024年6月3日(月)日川 佳三(IT Leaders編集部)
日本IBMは2024年6月3日、説明会を開き、同年5月に開催したプライベートイベント「Think 2024」のハイライトを紹介した。AIを世の中に浸透させるための手段として、AIモデルのオープンソース化と、自社製品への組み込み、以上2つの取り組みを説明した。
日本IBMは説明会で、2024年5月に開催したプライベートイベント「Think 2024」のハイライトを紹介した。AIを世の中に浸透させるための手段として、AIモデルのオープンソース化と、自社製品への組み込み、以上2つの取り組みを説明した。
LLMをコミュニティベースのオープンソースに
AIを浸透させる手段の1つとして同社は、大規模言語モデル(LLM)群「Granite」をオープンソース化して公開している。
そもそも、オープンソースとしてLLMのソースを入手できることは、ユーザーにとってメリットである。自社に合わせて改造できる。また、他のオープンソースプロジェクトと比べても、「コミュニティに参加することで、誰でもモデル本体の開発・拡張に携われる」(同社)メリットがあるという。
ベンダー主導型のオープンソースプロジェクトの場合、ユーザーはソースを自社向けに改造することはできても、モデル本体を開発・拡張していけるわけではない。一方、IBMのオープンソースプロジェクトはコミュニティ主導であり、誰でも開発メンバーになれる。
学習用データをAIが生成し、データ準備期間を削減
LLMに対する事後学習の時間を短縮するソフトウェアツールの開発プロジェクト「InstructLab」も、成果物をオープンソースとして公開している。企業独自の知識を反映したQ&A(よくある質問と、その回答)をLLMに追加学習させる、といったケースに役立つ。
InstructLabのツールを使うと、学習データを収集するハードルが下がる。タクソノミー(分類学)の活用により、数件のサンプルと知識データから大量の学習用データを生成する。生成した学習用データの品質を担保するために別のLLMを使ってチェックし、適切な学習用データだけを残し、これを使って追加学習する。
InstructLabの実例として同社は、COBOLのコードをJavaのコードに変換するLLMを挙げた(図1)。以前はLLMのファインチューニングに9カ月間、14イテレーション(一連の工程からなる開発サイクル)を要していたが、InstructLabを使ったところ1週間1イテレーションで学習できた。しかも、精度は従来方法を上回ったという。
拡大画像表示
Javaアップデートに伴う作業をAIで支援
AIを浸透させるもう1つの手段は、IBM自社製品へのAIの組み込みである。2024年10月に一般提供開始を予定する「watsonx Code Assistant for Enterprise Java Applications」では、Java環境のバージョンアップにともなうJavaコードの修正を支援する(図2)。コードの生成だけでなく、修正したコードのテストも生成する。何をしているコードなのかの説明も生成する。
拡大画像表示
2024年10月には、BI(ビジネスインテリジェンス)支援ツール「watsonx BI Assistant」も一般提供を開始する。「BIダッシュボードを簡単に作れるといったことには注目していない。何が要因で売り上げが下がっているのか、どんなアクションをとるべきか、が分かるようにした」(同社)。
watsonx BI Assistantでは、ユーザーの情報(各種データへのアクセス権限など)をもとに、該当ユーザーが知りたいであろうKPI(業績評価指標)やダッシュボードを提示し、アクションが必要になる異常を検出し、ユーザーに教える。グラフなどの結果については、どこからデータを持ってきたのかといった根拠も示す。