[新製品・サービス]
富士通、日本語能力を高めたLLM「Takane」を提供開始、業種特化のカスタマイズが可能
2024年9月30日(月)日川 佳三(IT Leaders編集部)
富士通は2024年9月30日、大規模言語モデル(LLM)「Takane(高嶺:タカネ)」を、PaaS型のデータ活用基盤「Fujitsu Data Intelligence PaaS(DI PaaS)」を通じてグローバルに提供開始した。Takaneは、カナダCohereのLLM「Command R+」をベースに日本語処理を強化したものであり、日本語言語理解ベンチマーク「JGLUE」の結果も公表している。
富士通の「Takane(高嶺:タカネ)」は、カナダCohereの大規模言語モデル(LLM)「Command R+」をベースに日本語を強化するための追加学習を施したLLMである。PaaS型データ活用基盤「Fujitsu Data Intelligence PaaS(DI PaaS)」を通じてグローバルに提供する(図1、関連記事:富士通、企業向けLLM「Takane:高嶺」をCohereと共同開発、2024年9月に提供))。
拡大画像表示
特徴は、日本語の処理能力を高めたこと。表1は、富士通とCohereが測定した日本語言語理解ベンチマーク「JGLUE」の結果である。自然言語推論「JNLI」(前提文が仮説文に対してもつ推論関係を認識するタスク)など主要な項目で他社LLMを凌ぐとしている。また、Command R+の多言語対応(10言語)や業務プロセス自動化などの機能を継承した。
Takane | Command R+ | GPT-4 | GPT-4o | Sonnet 3.5 | |
---|---|---|---|---|---|
JSTS(Pearson) | 0.93 | 0.88 | 0.91 | 0.89 | 0.90 |
JCoLA(Bal. acc.) | 0.84 | 0.71 | 0.65 | 0.82 | 0.66 |
JNLI(Bal. acc.) | 0.94 | 0.77 | 0.83 | 0.84 | 0.90 |
JCommonsenseQA(Exact Mach) | 0.98 | 0.96 | 0.95 | 0.98 | 0.97 |
JSQuAD(Accuracy) | 0.93 | 0.86 | 0.84 | 0.86 | 0.87 |
JGLUE Average | 0.92 | 0.84 | 0.84 | 0.88 | 0.86 |
企業独自のデータを用いたファインチューニングやカスタマイズにより、ユーザーの業務に特化したLLMも作成可能。さらに、知識をナレッジグラフとして表現して多くの知識をヒントとして生成AIに渡せる「ナレッジグラフ拡張RAG」や、法規制や企業ルールに準拠した出力が可能な「生成AI監査技術」と組み合わせることで、専門用語が多く頻繁に法規制が改正される金融業界などでも活用しやすいとしている。
プライベート環境で利用可能である。これにより、データ漏洩の懸念からLLMの導入が難しい業種・業務でも活用可能だとしている。例えば、各種審査業務において顧客の個人情報を扱う金融業界、設計や開発など秘匿性の高いデータを扱う製造業、機密性の高いデータを扱う安全保障分野などを挙げている。
「クラウドサービスで提供されている汎用LLMは、金融や安全保障分野などのように、データを外部に出せず、かつ法規制や業界ルールへの準拠が求められる業務では活用が難しい。しかも、日本語は文字種の混在や主語の省略、敬語表現など特有の難しさがあり、汎用LLMの出力精度には課題がある。こうした中、日本語能力を高めた業種・業務特化型のLLMが求められている」(富士通)