AI基礎知識ガイド - NewMe AI Demo

🤖

AI / LLM / GPTとは

比喩で理解する

LLMは「超高速の文章完成マシン」です。膨大な本を読んだ人が、「次に来そうな言葉」を予測し続けているようなもの。一文字ずつ「次はこの言葉だろう」と推測を繰り返して文章を生成しています。

3つのキーワード

Artificial Intelligence

AI（人工知能）

人間の知能を模倣するコンピュータ技術の総称。画像認識、音声認識、自然言語処理などを含む広い概念。

Large Language Model

LLM（大規模言語モデル）

大量のテキストデータで学習した言語AI。ChatGPT、Claude、Geminiなどが代表例。

Generative Pre-trained Transformer

GPT

OpenAI社が開発したLLMシリーズの名称。Transformerという仕組みを使い、事前学習で汎用能力を獲得。

仕組み図解

📝

Input

テキスト入力

→

✂️

Tokenize

トークン分割

→

⚡

Process

パターン処理

→

🔮

Generate

次の語を予測

→

💬

Output

回答生成

よくある誤解

「AIは考えている」 → 実際には統計的パターンマッチングです。
AIは意味を「理解」しているのではなく、膨大なデータから学習したパターンに基づいて、もっともらしい回答を生成しています。意識や感情はありません。

📊

トークンとコンテキストウィンドウ

トークンとは

文章をAIが処理する最小単位。日本語は1文字あたり約1〜2トークン、英語は1単語あたり約1トークンに分割されます。

トークン区切りを見てみよう

東京は

日本の

首都

です

。

→ 「東京は日本の首都です。」= 約7トークン

コンテキストウィンドウ比較

コンテキストウィンドウ = AIが一度に処理できるトークン数の上限。大きいほど長い文章を扱えます。

GPT-3.5

16K

GPT-5

1M

Claude Opus 4.6

200K

Gemini 2.5 Pro

2M

トークン数ミニ計算機

テキストを入力してください

0

文字数

0

推定トークン数

-

参考コスト (GPT-5)

⚠️

ハルシネーションと対策

ハルシネーションとは

AIが事実に基づかない情報を、もっともらしく生成してしまう現象のこと。「幻覚」を意味する英語が語源です。AIの回答は必ずしも正確ではないことを理解しておく必要があります。

実例

ハルシネーションの例

Q: 「量子コンピュータの発明者は誰ですか？」

「量子コンピュータは1985年にジョン・スミス博士によって発明されました。彼はMIT量子研究所の所長として...」

→ 実際には特定の「発明者」は存在せず、リチャード・ファインマンの提唱やデイヴィッド・ドイッチュの理論など、多くの研究者の貢献によるもの。架空の人物名を自信ありげに回答するのがハルシネーションの典型例。

5つの対策

1

🔍 事実確認を必ず行う

重要な情報は必ず一次ソース（公式サイト、論文、公式ドキュメント）で確認しましょう。
2

📎 ソースを要求する

「参考URLを教えて」「出典を示して」と聞くことで、回答の根拠を確認できます。
3

❓ 確信度を聞く

「この情報はどの程度確かですか？」と質問し、AI自身に不確実性を表明させましょう。
4

✂️ 範囲を限定する

特定の文書やデータに基づいて回答するよう指示し、推測の余地を減らします。
5

🔄 クロスチェック

複数のAI（ChatGPT、Claude、Geminiなど）で同じ質問を試し、回答の一貫性を確認します。

📈

AIモデル比較

主要モデル一覧

モデル	提供元	特徴	コスト感	日本語力
GPT-5	OpenAI	マルチモーダル、高速、推論力向上	★★★	◎
Claude Opus 4.6	Anthropic	長文処理、安全性重視、コーディング最強	★★☆	◎
Gemini 2.5 Pro	Google	超長文、Google連携、100万トークン思考	★★☆	○
Llama 4	Meta	オープンソース最強、マルチモーダル対応	★☆☆	△

性能比較グラフ

GPT-5

Claude Opus 4.6

Gemini 2.5 Pro

Llama 4

推論力

GPT-5

92%

Claude Opus 4.6

96%

Gemini 2.5 Pro

90%

Llama 4

82%

創造性

GPT-5

92%

Claude Opus 4.6

94%

Gemini 2.5 Pro

85%

Llama 4

78%

コーディング

GPT-5

90%

Claude Opus 4.6

97%

Gemini 2.5 Pro

88%

Llama 4

80%

日本語

GPT-5

92%

Claude Opus 4.6

95%

Gemini 2.5 Pro

88%

Llama 4

70%

🔒

プライバシーと安全

入力してはいけない情報

❌ 個人情報（氏名、住所、電話番号、マイナンバー）

❌ パスワード、認証情報、APIキー

❌ 社外秘の業務情報、内部文書

❌ 顧客の個人データ、取引先情報

❌ 未公開の決算情報、インサイダー情報

安全に使うコツ

✅ 固有名詞を仮名に置換して入力する（例: 山田太郎 → Aさん）

✅ API版を利用する（データが学習に使われない設定が可能）

✅ 社内のAI利用ポリシーを確認してから使う

✅ 機密度に応じてツールを使い分ける（高機密 → ローカルLLM推奨）

各サービスのデータポリシー比較

サービス	Free / 無料版	有料 / API版
ChatGPT	学習利用あり（オプトアウト可）	Plus + API版は学習利用なし
Claude	学習利用あり（可能性）	Pro + API版は学習利用なし（オプトイン方式）
Gemini	学習利用あり	Workspaceプランは学習利用なし

※ 各サービスのポリシーは変更される場合があります。最新情報は公式サイトをご確認ください。