日本IBMは2023年9月20日、米IBM開発の大規模言語モデル「Granite(グラナイト)」の日本語版を2024年第1四半期(1~3月)に提供開始すると発表した。2023年12月に先行リリース版を提供する。AIモデル作成・運用ツール「watsonx.ai」で利用できる。現在、watsonx.aiではIBM独自の基盤モデルとして情報抽出や分類などを実行する「Slate」を利用可能だが、GraniteではGPTのように生成タスクを実行できるようになる。
IBMのAIモデル作成・運用ツール「watsonx.ai」では、既存の基盤モデルをチューニングしたAIモデルを作成できる。また、作成したAIモデルをAPIとして公開し、外部の業務アプリケーションから利用可能である(図1、関連記事:AIモデル作成ツール「IBM watsonx」、基盤モデルをベースに追加学習でチューニング)。
拡大画像表示
図2は、watsonx.aiで利用可能な基盤モデルである。同社開発の基盤モデルのほか、オープンソースの基盤モデルや他社製の基盤モデル(コーディング用のStarCoderや、米メタ開発のLlama 2など)が使える。
拡大画像表示
IBMが開発した既存の基盤モデルに、情報の抽出や分類などのタスクを実行する「Slate」がある。今回発表した「Granite(グラナイト)」は、watsonx.aiで米OpenAIのGPTのように生成タスクを実行できる。日本語版のリリースは2024年第1四半期(1~3月)で、2023年12月に先行リリース版を提供する(図3)。
拡大画像表示
Graniteは130億パラメータと軽量で、シングルGPU(NVIDIA V100 32GB)でも使える。また、オープンソースの基盤モデルとは異なり、法務や財務など企業に特化したデータセットを学習している。IBMによると、学習させたデータセットは合計7TB(前処理後は2.4TB)に及び、以下の領域のデータが含まれている。
- インターネット:公共のインターネットから取得した一般的な非構造化言語データ
- 学術:科学技術に特化した技術的な非構造化言語データ
- コード:各種のプログラミング言語をカバーする非構造化コードのデータセット
- 法務: 法律意見書やその他の公的提出書類から取得した企業関連の非構造化言語データ
- 財務:一般に公開された財務文書や報告書から取得した企業関連の非構造化データ