コンテキストウィンドウとは何ですか

AIが一度の会話や処理で参照できるテキストの最大量です。トークン数で表され、上限を超えた部分はAIが参照できなくなります。

コンテキストウィンドウの上限を超えるとどうなりますか

チャット形式では古い会話が切り捨てられ、最初に設定した前提や指示をAIが参照できなくなります。APIでは上限超過でエラーになることがあります。

128,000トークンとは何文字ですか

日本語の場合、1文字あたり1〜2トークン程度になるため、128,000トークンはおよそ64,000〜128,000字に相当します。A4用紙では約80〜160ページ分が目安です。

長い資料をAIに渡すにはどうすればいいですか

必要な章や段落だけを抽出して渡す方法が最も手軽です。ファイル全体を渡せるツールを使う場合でも、何を重視して答えてほしいかを明示すると精度が上がります。

コンテキストウィンドウとは？長文を扱うコツと実践的な使い方

結論

コンテキストウィンドウとは、生成AIが一度の処理で参照できるテキストの上限のことです。トークン数で表され、会話のやり取り、添付ファイル、プロンプトすべてを合わせた量がこの範囲に収まる必要があります。

上限を超えると、古い会話や渡した情報の一部がAIから見えなくなります。「会話の途中でAIが前提を忘れた」という体験は、大抵この現象が原因です。逆に言えば、コンテキストウィンドウの仕組みを理解すれば、長い資料を扱うときの失敗を減らせます。

コンテキストウィンドウとは

生成AIは、会話や指示を丸ごと記憶しているわけではありません。毎回、一定の範囲のテキストを読み込み、その範囲を手がかりに返答を作ります。この「読み込める範囲の最大量」がコンテキストウィンドウです。

ノートに例えると分かりやすいです。コンテキストウィンドウはノートの大きさです。そこに書ける量には限りがあり、新しい情報を書き足すと古い内容が上書きされていきます。どれだけ長い会話をしても、AIはそのノートに収まっている分しか参照できません。

コンテキストウィンドウのサイズはモデルによって違います。2024〜2025年時点の主要モデルを比較すると、数万トークンから100万トークン超まで幅があります。

モデル（目安、変更される場合あり）	コンテキストウィンドウのサイズ
小型・廉価モデル	8,000〜32,000トークン
主要な標準モデル	128,000〜200,000トークン
長文特化モデル	100万トークン超

最新のモデル情報と正確なサイズは公式で確認してほしいです。

コンテキストウィンドウに何が入るか

コンテキストウィンドウには、1つの処理に関わるすべてのテキストが含まれます。次の要素が合計されます。

システムプロンプト（AIへの基本的な役割や指示）
会話の全履歴（過去のやり取りすべて）
今回のユーザーの入力
添付したファイルや資料

これらを足した量が、コンテキストウィンドウの上限以内に収まらなければなりません。だから、長い会話を続けながら大きなファイルも渡す、という操作は特にトークンを消費します。

また、AIの回答（出力）もトークンを消費することがあります。次のやり取りに回答内容が引き継がれる形式では、長い回答が積み重なるほど残りのコンテキストが減っていきます。

上限を超えたときに起きること

コンテキストウィンドウの上限に達すると、主に2種類の問題が起きます。

古い情報が失われる

チャット形式では、ウィンドウに入り切らなくなった古いメッセージが自動的に切り捨てられます。会話の冒頭で「この会話はAIスタートアップのブログ記事を書くためのものです」と指定していても、その部分がウィンドウから外れると、AIは指定を参照できなくなります。

これが原因で起きる典型的な症状があります。

最初に伝えた条件や制約をAIが無視する
前半の会話の内容について聞いても覚えていない
途中から別人のように指示との整合性が崩れる

エラーが返る

APIを直接使うシステムでは、上限を超えた入力に対してエラーが返ることがあります。大きなPDFをまとめて処理しようとするシステムで起きやすい問題です。

業務で長文を扱う実践的なコツ

コンテキストウィンドウの制約を踏まえたうえで、長い資料や長い会話を扱うためのコツを紹介します。

必要な部分だけを渡す

100ページのPDFをそのまま貼り付けるのではなく、質問に関係する章や段落だけを切り出して渡す方法が効果的です。

具体的な手順です。まず自分でPDFの目次を見て、関係する章を特定します。次にその章のテキストだけをコピーし、「以下の文章を踏まえて〜を答えてください」という形で渡します。渡す量が減るとトークン消費が下がり、的外れな情報に引っ張られない効果もあります。

長い会話では前提を再確認する

会話が20〜30回を超えてきたら、重要な前提を改めて書き込む習慣を作ると品質が安定します。

「この会話では一貫して〜を前提にしています。引き続きその前提で回答してください」と挿入するだけで、AIが前提を取り直せます。毎回全部書く必要はなく、重要度の高い1〜2点だけで十分です。

会話を新しく始める

長い会話を続けるより、必要に応じて新しい会話を始め直すほうが安定することがあります。前の会話から必要な部分だけをコピーし、新しい会話の冒頭に貼り付けて再スタートする方法です。

長い会話のすべてをAIが読み込むより、整理された情報を最初から渡す方が精度が上がる場合があります。

要約してから渡す

大きな資料をそのまま渡す前に、まずAIに要約させるという方法があります。ただし、要約に使うためのトークンがかかるため、複数の巨大ファイルを扱う場合は別のツールで前処理する方が現実的なこともあります。

要約の精度を上げるコツは、何の目的のための要約かを明示することです。「議事録として決定事項とアクションアイテムに絞って要約してください」のように目的を添えると、余分な情報が入りにくくなります。

プロンプトの書き方の基本はプロンプトの書き方を参考にしてください。

モデルごとのコンテキストサイズの選び方

コンテキストウィンドウが大きいほど常に良いわけではありません。選ぶときの考え方を整理します。

扱う資料の長さで選ぶ：法律文書・財務報告書・技術仕様書など100ページを超える資料を頻繁に扱う場合は、大きなコンテキストのモデルが役立ちます。日常的なメール・議事録程度なら32,000トークンで十分です。

コストとのバランス：コンテキストが大きいモデルは単価が高い傾向があります。使用量が多い場合は、必要最低限のサイズのモデルを選ぶほうがコストを抑えられます。

処理速度：コンテキストに大量のテキストが詰め込まれていると、回答が返るまでの時間が長くなる場合があります。速度が重要な業務では、不要な情報を削ぎ落としてコンテキストを小さく保つことが有効です。

コンテキストウィンドウとRAGの違い

最近、RAGという言葉も聞かれるようになりました。コンテキストウィンドウとは別の概念なので、整理しておきます。

コンテキストウィンドウは、AIが1回の処理で参照できる量の上限です。RAGは、大量の文書の中から質問に関係する部分だけを検索し、コンテキストウィンドウに入れる仕組みです。

社内の膨大なドキュメントすべてをコンテキストウィンドウに詰め込むことはできません。RAGを使えば、質問に関係する文書だけをリアルタイムで取り出してコンテキストに入れることができます。社内の問い合わせ対応やナレッジベース検索などで使われる方式です。

生成AIの基本的な仕組みについては生成AIとは？で詳しく解説しています。

よくある誤解

「コンテキストウィンドウが大きければ精度が上がる」：コンテキストウィンドウに大量の情報を詰め込んでも、それだけで精度が上がるわけではありません。関係の薄い情報が多いと、かえって回答がぼやけることがあります。質問に必要な情報を選んで渡す方が、大量に渡すより効果的な場合が多いです。

「過去の会話をAIは覚えている」：生成AIには学習という意味での長期記憶はなく、コンテキストウィンドウの範囲だけを参照します。会話を終了すれば、次の会話には引き継がれません。同じ前提で続きをするには、毎回その前提を渡し直す必要があります。

「トークンは文字数と同じ」：日本語では1文字が1〜2トークンになることが多く、文字数そのままとはズレます。詳しくはトークンとは？文字数制限と料金の関係をご覧ください。

コンテキストウィンドウを意識した業務フロー

実際の業務でコンテキストウィンドウを意識した使い方のフローを示します。

資料分析のケース：

資料全体を自分で読み、質問に関係する章を特定する
該当部分のテキストだけを抽出する
「以下の資料を踏まえて〜を答えてください」と質問と一緒に渡す
追加質問は同じ会話の中で続け、前提が変わる場合は都度明示する

長期プロジェクトの会話管理のケース：

プロジェクト開始時に前提・制約・目的を文書化する
新しい会話を始めるたびにその文書をプロンプトの冒頭に貼り付ける
会話が長くなってきたら新しい会話に切り替え、前提文書を再貼り付けする

この方式は、プロジェクト全体の整合性を保ちながら複数回の会話を跨ぐ作業に有効です。

まとめ

コンテキストウィンドウとは、AIが一度の処理で参照できるテキストの上限です。会話履歴・添付資料・プロンプトすべてを合わせた量が、このウィンドウ内に収まる必要があります。

上限を超えると古い情報がAIから見えなくなります。これを防ぐには、渡す情報を必要な部分に絞る、長い会話では重要な前提を途中で再確認する、会話を必要に応じて新しく始める、という3つの対策が効果的です。コンテキストウィンドウが大きいモデルが常に最適ではなく、用途とコストのバランスで選ぶことが重要です。