生成AIの基礎

生成AI用語集 ビジネスで出る30の基本語

生成AI用語集 ビジネスで出る30の基本語

この記事の要点

LLM・RAG・プロンプト・ハルシネーション・トークンなど、ビジネスシーンで頻繁に登場する生成AI用語30語を簡潔に解説します。会議・資料・ニュースで出てくる用語の意味をすぐに確認できる辞書として使えます。

この記事の結論

生成AIに関する会議や資料では、専門用語が頻繁に登場します。意味が分からないまま話が進むと、判断を誤ります。この用語集は、ビジネスシーンで実際に使われる30語を、現場で必要な範囲で簡潔に説明しています。


A〜F の用語

API(エーピーアイ)

Application Programming Interfaceの略。異なるシステム間でデータや機能をやり取りするための入口です。生成AIのAPIを使うと、自社のシステムにAI機能を組み込めます。「ChatGPTのAPIで社内ツールを作る」という使い方がビジネスでは一般的です。

エンベディング

テキストを数値のベクトルに変換する技術です。「意味が近い言葉は数値が近くなる」ように変換されます。検索や文書の類似度判定に使われ、RAGの仕組みの中心技術でもあります。

コンテキスト(文脈長)

AIが1回の会話・指示で処理できる情報量の上限です。トークンで管理され、上限を超えると古い情報が忘れられます。長い文書を扱う場合は、コンテキスト長が長いモデルを選ぶことが重要です。

ファインチューニング

既存のモデルを、特定のデータや用途に合わせて追加学習させる手法です。自社の専門用語や回答スタイルをモデルに覚えさせる場合に使います。学習データの準備と計算コストが必要で、RAGより導入ハードルが高い手法です。

FoundationModel(基盤モデル)

大量のデータで学習された、汎用的な能力を持つ大規模モデルです。GPT-4、Claude、Geminiなどが該当します。基盤モデルをそのまま使うか、ファインチューニングして特化させるかを選べます。


G〜L の用語

GPT

Generative Pre-trained Transformerの略。OpenAIが開発したLLMのシリーズ名です。ChatGPTの中核技術で、GPT-4以降は高度な文章生成・推論が可能です。「GPT」はOpenAIの固有技術名ですが、一般に生成AIの文章モデルを指す言葉として使われることもあります。

グラウンディング

AIの出力を、信頼できる事実や一次情報に基づかせる手法の総称です。ハルシネーション対策の一つで、「この資料の内容だけを根拠に答えてください」という指示も広義のグラウンディングです。

ハルシネーション

AIが事実と異なる内容を、自信を持って出力する現象です。生成AIはもっともらしい文章を生成するため、存在しない人名・数値・引用を作り出すことがあります。数字・固有名詞・法制度は特に発生しやすく、必ず一次情報で確認する習慣が必要です。詳細はハルシネーションとはを参照してください。

推論

学習済みのモデルが、入力に対して出力を生成するプロセスです。「学習」が過去のデータからパターンを覚える段階であるのに対し、「推論」は実際に使う段階を指します。AIをビジネスで活用する場面のほぼすべてが推論の段階です。

LLM

Large Language Modelの略で、大規模言語モデルと訳されます。テキストの生成・要約・翻訳・分類などを担う中核技術です。ChatGPTやClaudeの内部エンジンに相当します。詳細はLLMとはで説明しています。


M〜P の用語

マルチモーダル

テキストだけでなく、画像・音声・動画など複数の種類のデータを同時に扱えるAIの性質を指します。「この画像の内容を説明して」「この音声を文字に起こして」といった処理が可能なモデルがマルチモーダル対応です。

モデル

AIの学習・推論を行うシステム全体を指す言葉です。ビジネスの文脈では、「どのモデルを使うか」という選択肢として登場します。GPT-4、Claude 3、Gemini Ultraなど、各社が複数のモデルを提供しています。料金・性能・機能は最新の公式情報で確認してください。

モデルの重み

学習の結果として得られた、モデル内部のパラメータです。「重みを公開する」とは、モデルの内部構造を外部に公開することを指します。オープンソースモデル(LlamaなどはMetaが重みを公開)は自社サーバーで動かすことが可能で、クローズドモデル(GPT-4、Claudeなど)はAPIを通じてのみ利用できます。

プロンプト

AIへの指示文のことです。「誰として答えるか」「何をするか」「どんな形式で出力するか」などを明記するほど、品質が上がります。プロンプトの書き方はプロンプトの書き方で詳しく解説しています。

プロンプトエンジニアリング

AIから目的の出力を引き出すための指示文(プロンプト)を設計・改善する技術です。特別なプログラミング知識は不要で、ビジネスパーソンでも習得できます。良いプロンプトを作る能力は、AIを使いこなすうえで最も実用的なスキルの一つです。


R〜T の用語

RAG

Retrieval-Augmented Generationの略で、外部データベースから関連情報を検索し、その情報をAIの回答生成に組み込む手法です。社内マニュアルや製品情報など、AIが学習していない情報を参照させるために使われます。ファインチューニングよりも導入コストが低く、情報を更新しやすい利点があります。

強化学習

AIが試行錯誤を通じて行動方針を改善していく学習手法です。ChatGPTの開発に使われた「人間のフィードバックによる強化学習」は、より自然で有用な回答を生成するためのアプローチとして広く知られています。

システムプロンプト

AIの動作ルールや役割を事前に設定する指示文です。「あなたは法律専門家です」「丁寧な敬語で回答してください」「社外秘情報は回答しないでください」といった設定をシステムプロンプトで定義します。ビジネスでAIを組み込む際に、動作を一定にするために使います。

テキスト生成

文章を自動で作り出す生成AIの機能です。プロンプトに対して文章を返す、要約する、翻訳する、書き直すなど、テキストに関わるほぼすべての作業がテキスト生成の範囲に含まれます。生成AIの中でビジネスで最も広く使われる機能です。

トークン

AIがテキストを処理する最小単位です。英語は1単語が1〜2トークン程度ですが、日本語は1文字が1〜2トークン以上になるため、同じ文字数でも英語より多くのトークンを消費します。APIの料金計算と、処理できる文章の上限(コンテキスト長)の両方で使われる単位です。


T〜Z の用語

転移学習

大規模データで学習した基盤モデルの知識を、別の特定タスクや少ないデータで微調整する手法です。ゼロから学習するより大幅に低コストで、特定用途向けのモデルを作れます。ファインチューニングも転移学習の一種です。

チューニング

広義には、モデルや設定を特定の目的に合わせて調整することを指します。狭義にはファインチューニングと同義で使われます。「パラメータをチューニングする」「モデルをチューニングする」という使い方が一般的です。

ベクトルデータベース

エンベディングで変換した数値ベクトルを格納・検索するためのデータベースです。RAGの仕組みでは、ベクトルデータベースに社内文書を格納し、質問と意味が近い文書を高速で取り出すために使います。


ビジネスで特に頻出する10語まとめ

用語1行要約
LLMChatGPT等の中核となる大規模言語モデル
プロンプトAIへの指示文
ハルシネーションAIが事実と異なる内容を自信を持って出力する現象
RAG外部情報をAIの回答に組み込む仕組み
トークンAIの処理・料金計算の最小単位
コンテキスト1回で処理できる情報量の上限
ファインチューニング自社データでモデルを追加学習させる手法
APIシステム間でAI機能を連携させる入口
マルチモーダルテキスト・画像・音声を同時に扱える性質
エージェント目標を与えると自律的に複数手順を実行する仕組み

エージェントの詳細はAIエージェントとはで、生成AIの基本は生成AIとはで解説しています。


用語が増え続ける領域への対処

生成AI分野は進化が速く、新しい用語が次々と登場します。今年よく聞いた用語が来年は使われなくなることもあります。

対処のコツは2つです。まず、新しい用語が出たとき「これは既存の何に近いか」を確認することです。多くの新用語は、既存概念の組み合わせや改良版です。基本30語を押さえておくと、新しい用語の理解が速くなります。

次に、「定義よりも使い方」を先に理解することです。用語の正確な定義より、「業務でどう使われるか」「自社への影響は何か」を把握するほうが、意思決定に直結します。

生成AIのさらに詳しい基礎知識は生成AIとは生成AIと従来AIの違いで確認できます。


まとめ

この用語集では、ビジネスシーンで頻繁に登場する生成AI関連の30語を解説しました。最も押さえておくべき10語は、LLM・プロンプト・ハルシネーション・RAG・トークン・コンテキスト・ファインチューニング・API・マルチモーダル・エージェントです。

用語を覚えることが目的ではなく、会議や資料で出てきたときに「これがどう業務に関係するか」を判断できることが目的です。必要に応じてこの用語集に立ち返り、各用語の詳細記事へ進んでください。詳細な仕様や最新の定義は各ベンダーの公式ドキュメントで確認してください。

よくある質問

LLMとは何ですか

Large Language Modelの略で、大量のテキストデータで学習した大規模な言語モデルのことです。ChatGPTやClaudeの中核技術であり、文章の生成・要約・翻訳といったタスクをこなします。

トークンとは何ですか

AIがテキストを処理する最小単位です。日本語では1文字が複数トークンになることが多く、おおよそ1,000文字≒1,000〜2,000トークンが目安です。APIの料金計算や、1回に処理できる文章量(コンテキスト長)の単位として使われます。

RAGとは何ですか

Retrieval-Augmented Generationの略で、外部データベースから関連情報を検索してAIの回答に組み込む技術です。社内文書や最新情報をAIに参照させる仕組みとして活用されます。

ファインチューニングとRAGの違いは何ですか

ファインチューニングはモデル自体を自社データで再学習させる手法で、コストと時間がかかります。RAGは既存のモデルに外部知識を都度渡す手法で、導入が比較的容易です。最初はRAGで試し、不十分な場合にファインチューニングを検討するのが一般的です。