日本IBMは2024年2月27日、大規模言語モデル「Granite(グラナイト)」の日本語版「granite-8b-japanese」を同年2月29日(米国現地時間)から提供すると発表した。IBM watsonxのAIモデル作成・運用ツール「watsonx.ai」で利用できる。日本語対応/性能向上のほか、日本語トークナイザーを構築・利用することで長い文脈を高速に推論できるという。また、130億パラメータの英語版より軽量な80億パラメータで、英語版と同様にシングルGPU(NVIDIA V100 32GB)でも動作する。
IBMの「Granite(グラナイト)」は、同社が開発した大規模言語モデル(LLM)/基盤モデルである。2023年9月に英語版(granite-13b-instructおよびgranite-13b-chat)をリリースしている。
AI/データプラットフォーム「IBM watsonx」のAIモデル作成・運用ツール「watsonx.ai」で利用できる。英語版は130億パラメータと軽量で、シングルGPU(NVIDIA V100 32GB)でも動作することをアピールしている。
LLMとしての特徴は、軽量さに加えて、企業での事業・業務用途に特化したデータを学習ソースにしていること。財務、法務、コード、学術、インターネットの各領域から、IBMがビジネス用途向けにキュレーションを行ったビジネス関連のデータセットで学習し、それらを同社定義のガバナンス、リスク、コンプライアンス(GRC)評価を経て提供しているという。その際、ビジネス上好ましくないコンテンツの除去、社内外のモデルとのベンチマーク評価を行っている。
また、RAG(Retrieval-Augmented Generation:検索拡張生成)への対応、モデル学習に用いたデータソースを公開するなど、企業ユーザーが安心してAIを使えるようにしている。
図1:IBMの大規模言語モデル「Granite」に追加した日本語版(granite-8b-japanese)の概要(出典:日本IBM)拡大画像表示
IBMは、2024年2月29日(米国現地時間)に、Graniteの日本語版(granite-8b-japanese)をリリースする。英語版と同じ設計で、新たに日本語、英語、コードのデータセットを学習させている。パラメータ数は英語版の130億よりも軽量な80億で、英語版と同様にシングルGPUで動作する(関連記事:IBM、大規模言語モデル「Granite」日本語版を2024年第1四半期に提供、シングルGPUで動作)。
また、日本語トークナイザー(注1)を構築・利用することで、英語版よりも長い日本語の文章・文脈に対応して、高速に推論できるようにしているという。(図2)。
注1:トークナイザー(Tokenizer)は、トークナイゼーションを実行するモデルのこと。トークナイゼーションは、自然言語処理における処理単位であるトークン(1つの意味をなす文字列)の単位で分割する処理のこと。
図2:日本語トークナイザーを構築・利用することで、英語版よりも長い日本語の文章・文脈に対応して、高速に推論できる(出典:日本IBM)拡大画像表示
●Next:watsonx.aiで利用可能な生成AI基盤モデル
会員登録(無料)が必要です
- 1
- 2
- 次へ >
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-





