AI / LLM / GPTとは
比喩で理解する
LLMは「超高速の文章完成マシン」です。膨大な本を読んだ人が、「次に来そうな言葉」を予測し続けているようなもの。一文字ずつ「次はこの言葉だろう」と推測を繰り返して文章を生成しています。
3つのキーワード
Artificial Intelligence
AI(人工知能)
人間の知能を模倣するコンピュータ技術の総称。画像認識、音声認識、自然言語処理などを含む広い概念。
Large Language Model
LLM(大規模言語モデル)
大量のテキストデータで学習した言語AI。ChatGPT、Claude、Geminiなどが代表例。
Generative Pre-trained Transformer
GPT
OpenAI社が開発したLLMシリーズの名称。Transformerという仕組みを使い、事前学習で汎用能力を獲得。
仕組み図解
📝
Input
テキスト入力
→
✂️
Tokenize
トークン分割
→
⚡
Process
パターン処理
→
🔮
Generate
次の語を予測
→
💬
Output
回答生成
よくある誤解
「AIは考えている」 → 実際には統計的パターンマッチングです。
AIは意味を「理解」しているのではなく、膨大なデータから学習したパターンに基づいて、もっともらしい回答を生成しています。意識や感情はありません。
AIは意味を「理解」しているのではなく、膨大なデータから学習したパターンに基づいて、もっともらしい回答を生成しています。意識や感情はありません。
トークンとコンテキストウィンドウ
トークンとは
文章をAIが処理する最小単位。日本語は1文字あたり約1〜2トークン、英語は1単語あたり約1トークンに分割されます。
トークン区切りを見てみよう
東京は
日本の
首都
です
。
→ 「東京は日本の首都です。」= 約7トークン
コンテキストウィンドウ比較
コンテキストウィンドウ = AIが一度に処理できるトークン数の上限。大きいほど長い文章を扱えます。
トークン数ミニ計算機
0
文字数
0
推定トークン数
-
参考コスト (GPT-5)
ハルシネーションと対策
ハルシネーションとは
AIが事実に基づかない情報を、もっともらしく生成してしまう現象のこと。「幻覚」を意味する英語が語源です。AIの回答は必ずしも正確ではないことを理解しておく必要があります。
実例
ハルシネーションの例
Q: 「量子コンピュータの発明者は誰ですか?」
「量子コンピュータは1985年にジョン・スミス博士によって発明されました。彼はMIT量子研究所の所長として...」
→ 実際には特定の「発明者」は存在せず、リチャード・ファインマンの提唱やデイヴィッド・ドイッチュの理論など、多くの研究者の貢献によるもの。架空の人物名を自信ありげに回答するのがハルシネーションの典型例。
5つの対策
-
1🔍 事実確認を必ず行う重要な情報は必ず一次ソース(公式サイト、論文、公式ドキュメント)で確認しましょう。
-
2📎 ソースを要求する「参考URLを教えて」「出典を示して」と聞くことで、回答の根拠を確認できます。
-
3❓ 確信度を聞く「この情報はどの程度確かですか?」と質問し、AI自身に不確実性を表明させましょう。
-
4✂️ 範囲を限定する特定の文書やデータに基づいて回答するよう指示し、推測の余地を減らします。
-
5🔄 クロスチェック複数のAI(ChatGPT、Claude、Geminiなど)で同じ質問を試し、回答の一貫性を確認します。
AIモデル比較
主要モデル一覧
| モデル | 提供元 | 特徴 | コスト感 | 日本語力 |
|---|---|---|---|---|
| GPT-5 | OpenAI | マルチモーダル、高速、推論力向上 | ★★★ | ◎ |
| Claude Opus 4.6 | Anthropic | 長文処理、安全性重視、コーディング最強 | ★★☆ | ◎ |
| Gemini 2.5 Pro | 超長文、Google連携、100万トークン思考 | ★★☆ | ○ | |
| Llama 4 | Meta | オープンソース最強、マルチモーダル対応 | ★☆☆ | △ |
性能比較グラフ
GPT-5
Claude Opus 4.6
Gemini 2.5 Pro
Llama 4
推論力
創造性
コーディング
日本語
プライバシーと安全
入力してはいけない情報
個人情報(氏名、住所、電話番号、マイナンバー)
パスワード、認証情報、APIキー
社外秘の業務情報、内部文書
顧客の個人データ、取引先情報
未公開の決算情報、インサイダー情報
安全に使うコツ
固有名詞を仮名に置換して入力する(例: 山田太郎 → Aさん)
API版を利用する(データが学習に使われない設定が可能)
社内のAI利用ポリシーを確認してから使う
機密度に応じてツールを使い分ける(高機密 → ローカルLLM推奨)
各サービスのデータポリシー比較
| サービス | Free / 無料版 | 有料 / API版 |
|---|---|---|
| ChatGPT | 学習利用あり(オプトアウト可) | Plus + API版は学習利用なし |
| Claude | 学習利用あり(可能性) | Pro + API版は学習利用なし(オプトイン方式) |
| Gemini | 学習利用あり | Workspaceプランは学習利用なし |
※ 各サービスのポリシーは変更される場合があります。最新情報は公式サイトをご確認ください。