日本IBMは2024年2月27日、大規模言語モデル「Granite(グラナイト)」の日本語版「granite-8b-japanese」を同年2月29日(米国現地時間)から提供すると発表した。IBM watsonxのAIモデル作成・運用ツール「watsonx.ai」で利用できる。日本語対応/性能向上のほか、日本語トークナイザーを構築・利用することで長い文脈を高速に推論できるという。また、130億パラメータの英語版より軽量な80億パラメータで、英語版と同様にシングルGPU(NVIDIA V100 32GB)でも動作する。
IBMの「Granite(グラナイト)」は、同社が開発した大規模言語モデル(LLM)/基盤モデルである。2023年9月に英語版(granite-13b-instructおよびgranite-13b-chat)をリリースしている。
AI/データプラットフォーム「IBM watsonx」のAIモデル作成・運用ツール「watsonx.ai」で利用できる。英語版は130億パラメータと軽量で、シングルGPU(NVIDIA V100 32GB)でも動作することをアピールしている。
LLMとしての特徴は、軽量さに加えて、企業での事業・業務用途に特化したデータを学習ソースにしていること。財務、法務、コード、学術、インターネットの各領域から、IBMがビジネス用途向けにキュレーションを行ったビジネス関連のデータセットで学習し、それらを同社定義のガバナンス、リスク、コンプライアンス(GRC)評価を経て提供しているという。その際、ビジネス上好ましくないコンテンツの除去、社内外のモデルとのベンチマーク評価を行っている。
また、RAG(Retrieval-Augmented Generation:検索拡張生成)への対応、モデル学習に用いたデータソースを公開するなど、企業ユーザーが安心してAIを使えるようにしている。
拡大画像表示
IBMは、2024年2月29日(米国現地時間)に、Graniteの日本語版(granite-8b-japanese)をリリースする。英語版と同じ設計で、新たに日本語、英語、コードのデータセットを学習させている。パラメータ数は英語版の130億よりも軽量な80億で、英語版と同様にシングルGPUで動作する(関連記事:IBM、大規模言語モデル「Granite」日本語版を2024年第1四半期に提供、シングルGPUで動作)。
また、日本語トークナイザー(注1)を構築・利用することで、英語版よりも長い日本語の文章・文脈に対応して、高速に推論できるようにしているという。(図2)。
注1:トークナイザー(Tokenizer)は、トークナイゼーションを実行するモデルのこと。トークナイゼーションは、自然言語処理における処理単位であるトークン(1つの意味をなす文字列)の単位で分割する処理のこと。
拡大画像表示
●Next:watsonx.aiで利用可能な生成AI基盤モデル
会員登録(無料)が必要です
- 1
- 2
- 次へ >