AI学習データの作成サービスを提供するバオバブは2024年1月17日、生成AI/大規模言語モデル(LLM)をRAG(Retrieval-Augmented Generation)構成で利用するためのデータセットを構築するSIサービスを開始した。RAG用データセットのサンプルデータ配布と合わせて提供する。
バオバブは、生成AI/大規模言語モデル(LLM)をRAG(Retrieval-Augmented Generation:検索拡張生成)構成で利用するためのデータセットを構築するSIサービスを開始した。
RAGは、LLMと外部のナレッジベースを組み合わせて得る情報を、ユーザーのコンテキストや入力するプロンプトと併用する手法である。生成AIの誤回答を回避しながら、適切な情報が存在しない場合はその事実を回答できるようになる。
「LLMには、専門知識や非公開情報、事実性が重要視されるコンテキストにおいて、時に作話や不正確な情報を提示してしまうハルシネーションの問題がある。これは生成AIの導入を検討する企業にとって懸念点で、RAGはこれを解決する有効策である」(バオバブ)
バオバブのサービスでは、RAG実行のためのプロンプト設計とデータセットを構築する。合わせて、LLM構築のコンサルティングを提供する。RAG用データセットには以下の要素が含まれている。
- ユーザーの質問文
- 知識源からユーザーの質問に合致する情報を抽出するクエリー
- 知識源から抽出された情報
- 言語モデルの回答文
画面1:RAG用データセットのサンプル表示画面(出典:バオバブ)拡大画像表示
RAG用データセット構築サービスの提供開始に合わせて、RAG用データセットのサンプルデータを無料で配布する。WikipediaをナレッジベースにしたQ&Aデータセットで回答数は1150件。12日間かけて作成したという(画面1)。
- 業務システム 2027年4月強制適用へ待ったなし、施行迫る「新リース会計基準」対応の勘所【IT Leaders特別編集版】
- 生成AI/AIエージェント 成否のカギは「データ基盤」に─生成AI時代のデータマネジメント【IT Leaders特別編集号】
- フィジカルAI AI/ロボット─Society 5.0に向けた社会実装が広がる【DIGITAL X/IT Leaders特別編集号】
- メールセキュリティ 導入のみならず運用時の“ポリシー上げ”が肝心[DMARC導入&運用の極意]【IT Leaders特別編集号】
- ゼロトラスト戦略 ランサムウェア、AI詐欺…最新脅威に抗するデジタル免疫力を![前提のゼロトラスト、不断のサイバーハイジーン]【IT Leaders特別編集号】
-
VDIの導入コストを抑制! コストコンシャスなエンタープライズクラスの仮想デスクトップ「Parallels RAS」とは
-
AI時代の“基幹インフラ”へ──NEC・NOT A HOTEL・DeNAが語るZoomを核にしたコミュニケーション変革とAI活用法
-
加速するZoomの進化、エージェント型AIでコミュニケーションの全領域を変革─「Zoom主催リアルイベント Zoomtopia On the Road Japan」レポート
-
14年ぶりに到来したチャンスをどう活かす?企業価値向上とセキュリティ強化・運用効率化をもたらす自社だけの“ドメイン”とは
-
-
-
-
生成AIからAgentic AIへ―HCLSoftware CRO Rajiv Shesh氏に聞く、企業価値創造の課題に応える「X-D-Oフレームワーク」
-
-
-
「プラグアンドゲイン・アプローチ」がプロセス変革のゲームチェンジャー。業務プロセスの持続的な改善を後押しする「SAP Signavio」
-
BPMとプロセスマイニングで継続的なプロセス改善を行う仕組みを構築、NTTデータ イントラマートがすすめる変革のアプローチ
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-



