[新製品・サービス]

IBM、大規模言語モデル「Granite」日本語版を提供、英語版より軽量な80億パラメータ

2024年2月28日(水)IT Leaders編集部

日本IBMは2024年2月27日、大規模言語モデル「Granite(グラナイト)」の日本語版「granite-8b-japanese」を同年2月29日(米国現地時間)から提供すると発表した。IBM watsonxのAIモデル作成・運用ツール「watsonx.ai」で利用できる。日本語対応/性能向上のほか、日本語トークナイザーを構築・利用することで長い文脈を高速に推論できるという。また、130億パラメータの英語版より軽量な80億パラメータで、英語版と同様にシングルGPU(NVIDIA V100 32GB)でも動作する。

 IBMの「Granite(グラナイト)」は、同社が開発した大規模言語モデル(LLM)/基盤モデルである。2023年9月に英語版(granite-13b-instructおよびgranite-13b-chat)をリリースしている。

 AI/データプラットフォーム「IBM watsonx」のAIモデル作成・運用ツール「watsonx.ai」で利用できる。英語版は130億パラメータと軽量で、シングルGPU(NVIDIA V100 32GB)でも動作することをアピールしている。

 LLMとしての特徴は、軽量さに加えて、企業での事業・業務用途に特化したデータを学習ソースにしていること。財務、法務、コード、学術、インターネットの各領域から、IBMがビジネス用途向けにキュレーションを行ったビジネス関連のデータセットで学習し、それらを同社定義のガバナンス、リスク、コンプライアンス(GRC)評価を経て提供しているという。その際、ビジネス上好ましくないコンテンツの除去、社内外のモデルとのベンチマーク評価を行っている。

 また、RAG(Retrieval-Augmented Generation:検索拡張生成)への対応、モデル学習に用いたデータソースを公開するなど、企業ユーザーが安心してAIを使えるようにしている。

図1:IBMの大規模言語モデル「Granite」に追加した日本語版(granite-8b-japanese)の概要(出典:日本IBM)
拡大画像表示

 IBMは、2024年2月29日(米国現地時間)に、Graniteの日本語版(granite-8b-japanese)をリリースする。英語版と同じ設計で、新たに日本語、英語、コードのデータセットを学習させている。パラメータ数は英語版の130億よりも軽量な80億で、英語版と同様にシングルGPUで動作する(関連記事IBM、大規模言語モデル「Granite」日本語版を2024年第1四半期に提供、シングルGPUで動作)。

 また、日本語トークナイザー(注1)を構築・利用することで、英語版よりも長い日本語の文章・文脈に対応して、高速に推論できるようにしているという。(図2)。

注1:トークナイザー(Tokenizer)は、トークナイゼーションを実行するモデルのこと。トークナイゼーションは、自然言語処理における処理単位であるトークン(1つの意味をなす文字列)の単位で分割する処理のこと。

図2:日本語トークナイザーを構築・利用することで、英語版よりも長い日本語の文章・文脈に対応して、高速に推論できる(出典:日本IBM)
拡大画像表示

●Next:watsonx.aiで利用可能な生成AI基盤モデル

この記事の続きをお読みいただくには、
会員登録(無料)が必要です
  • 1
  • 2
関連キーワード

IBM / 大規模言語モデル / Granite / watsonx / 生成AI / Watson / Llama

関連記事

トピックス

[Sponsored]

IBM、大規模言語モデル「Granite」日本語版を提供、英語版より軽量な80億パラメータ日本IBMは2024年2月27日、大規模言語モデル「Granite(グラナイト)」の日本語版「granite-8b-japanese」を同年2月29日(米国現地時間)から提供すると発表した。IBM watsonxのAIモデル作成・運用ツール「watsonx.ai」で利用できる。日本語対応/性能向上のほか、日本語トークナイザーを構築・利用することで長い文脈を高速に推論できるという。また、130億パラメータの英語版より軽量な80億パラメータで、英語版と同様にシングルGPU(NVIDIA V100 32GB)でも動作する。

PAGE TOP