AI開発のデータベース選定ガイド

🗃 AI開発とデータベース

なぜAIアプリにデータベースが必要なのか

AIモデル（Claude、GPT等）はステートレスです。ユーザーの履歴を記憶せず、独自データを持ちません。データベースを組み合わせることで、ユーザーごとの会話履歴の保存、企業独自のナレッジベースを活用したRAG（検索拡張生成）、利用ログの分析・改善サイクルが初めて実現します。

🔍 AIアプリにDBが必要になる4つの場面

👤

ユーザーデータの永続化

ユーザープロフィール、設定情報、サブスクリプション状態の保存。認証・認可と連携したアクセス制御。マルチテナント対応のデータ分離。SaaSモデルでは必須のデータ層です。

🔎

RAGのベクトルストア

テキストや画像をベクトル（エンベディング）に変換して保存し、意味的に類似したコンテンツを高速検索します。RAG（検索拡張生成）の基盤として不可欠な機能。ハルシネーション削減の切り札です。

💬

チャット履歴の管理

AIチャットの会話履歴を保存し、コンテキストの継続性を実現。セッション管理、スレッド管理、メッセージの検索・フィルタリング。ユーザー体験の向上に直結する重要な機能です。

📊

分析ログ・改善サイクル

AIの入出力ログ、ユーザー行動データ、フィードバック（いいね/悪いね）の蓄積。プロンプトの改善、モデルの微調整、A/Bテストの基盤。データドリブンなAI改善に不可欠です。

📈 2026年のDB市場トレンド

Postgres

+pgvector がデファクト

リレーショナルDB + ベクトル検索を1つのDBで実現。専用ベクトルDBの必要性が大幅に低下

Serverless

サーバーレスDBの急成長

Neon、PlanetScale等がゼロからのスケーリングとコスト最適化を実現。使わない時はゼロコスト

Edge

エッジDBの台頭

Turso等がユーザー最寄りのロケーションでクエリ実行。レイテンシー1ms未満の世界へ

RAG

検索拡張生成が主流に

独自データ x AIモデルのRAGパターンが本番環境の標準アーキテクチャに定着

📋 DB選定の3つの基準

🚀

スケーラビリティ

ユーザー数やデータ量の増加に伴い、性能を維持できるか。サーバーレス型はオートスケーリングが標準。垂直スケーリング（マシンスペックUP）と水平スケーリング（レプリカ追加）の両方を評価しましょう。

💰

コスト

無料枠の充実度、従量課金の単価、予測可能性を比較。MVP段階では無料枠で十分か。スケール後のコスト推移をシミュレーション。ベクトル検索のコンピュートコストも見落とさないように。

⚡

開発速度とベクトル検索対応

SDKの充実度、ドキュメントの質、コミュニティの活発さ。そしてベクトル検索（pgvector等）のネイティブ対応。AIアプリでは後者が特に重要です。後付けよりネイティブ対応を選びましょう。

選定のポイント

2026年のAI開発では「PostgreSQL + pgvector」を起点にするのが最も合理的です。Supabaseを使えば認証・ストレージ・Edge Functionsも統合されるため、1サービスでAIアプリのバックエンド全体を構築できます。専用ベクトルDB（Pinecone等）は100万件超のベクトルデータを扱う場合に検討しましょう。

☰ サービス比較

Supabase オープンソース

オープンソースのFirebase代替として急成長中のBaaS。PostgreSQLをベースに、pgvectorによるベクトル検索、RLS（Row Level Security）による細かなアクセス制御、Edge Functionsによるサーバーレス関数、リアルタイムサブスクリプション、認証・ストレージを統合的に提供します。AI開発のフルスタックバックエンドとして最も人気の高い選択肢です。

Free / $25/月 PostgreSQL pgvector Auth統合リアルタイム

Neon Neon Inc.

サーバーレスPostgreSQLのパイオニア。ストレージとコンピュートを分離したアーキテクチャにより、使用していない時はゼロにスケールダウン。ブランチング機能でDBのコピーを瞬時に作成でき、プレビュー環境やCI/CDとの統合が容易。pgvector対応でAI開発にも最適です。

Free / $19/月 PostgreSQL サーバーレスブランチングオートスケール

PlanetScale PlanetScale Inc.

Vitess（YouTube開発のMySQL互換分散DB）を基盤としたサーバーレスDBプラットフォーム。Gitのようなスキーマブランチング、ゼロダウンタイムのマイグレーション、自動シャーディングが特徴。大規模なMySQLワークロードに最適化されており、エンタープライズ利用で高い実績があります。

$39/月〜 MySQL互換スキーマブランチ大規模対応自動シャーディング

Firebase / Firestore Google

Google製のNoSQLドキュメントDB。リアルタイム同期が最大の強みで、クライアント-サーバー間のデータ変更を即座に反映。Firebase Authenticationによる認証統合、Cloud Functionsとの連携、優れたモバイルSDKを提供。プロトタイピングの速度は随一です。

Free / 従量課金 NoSQL リアルタイム同期 Google統合モバイルSDK

Turso Turso Inc.

libSQL（SQLiteのフォーク）をベースにしたエッジデータベース。世界中のエッジロケーションにレプリカを配置し、ユーザーに最も近い場所からデータを提供。超低レイテンシーを実現します。SQLite互換のためローカル開発との親和性が高く、組み込みリプリカでオフライン対応も可能です。

Free / $29/月 SQLite互換 (libSQL) エッジDB 超低レイテンシー組み込みリプリカ

📊 比較表

項目	Supabase	Neon	PlanetScale	Firebase	Turso
スケーラビリティ	○ 良好	◎ 自動スケール	◎ 自動シャーディング	◎ Google基盤	○ エッジ分散
ベクトル検索	◎ pgvector	◎ pgvector	△ 非対応	△ 非対応	△ 非対応
リアルタイム同期	○ 対応	△ 非対応	△ 非対応	◎ 最強	△ 非対応
無料枠	◎ 充実	◎ 充実	○ なし	◎ 充実	◎ 充実
学習コスト	◎ 低い	○ 普通	○ 普通	◎ 低い	○ 普通
日本語ドキュメント	○ コミュニティ	△ 少ない	△ 少ない	◎ 充実	△ 少ない

◎ 非常に優秀 ○ 対応 △ 制限あり / 非対応

選定の目安

AI機能を含むフルスタックアプリにはSupabaseが最もバランスが良く推奨です。コスト最適化とブランチング重視ならNeon、大規模MySQLワークロードならPlanetScale、リアルタイム同期が最優先ならFirebase、エッジ配信と超低レイテンシーが必要ならTursoを選択しましょう。

S Supabase + pgvector 実践ガイド

1 RAG構築: エンベディングの保存とコサイン類似度検索

RAG（検索拡張生成）の仕組み

RAGは、ユーザーの質問に対してまずデータベースから関連情報をベクトル検索で取得し、その情報をコンテキストとしてAIモデルに渡すことで、正確で最新の回答を生成する手法です。ハルシネーション（幻覚）を削減し、独自データの活用を両立する本番運用の標準アーキテクチャです。

SQL - pgvector有効化 & ドキュメントテーブル作成

-- pgvector 拡張を有効化
CREATE EXTENSION IF NOT EXISTS vector;

-- エンベディングを保存するテーブルを作成
CREATE TABLE documents (
  id          bigserial PRIMARY KEY,
  user_id     uuid REFERENCES auth.users(id),
  content     text NOT NULL,
  metadata    jsonb DEFAULT '{}',
  embedding   vector(1536),  -- OpenAI text-embedding-3-small の次元数
  created_at  timestamptz DEFAULT now()
);

-- HNSW インデックスを作成（IVFFlatより高速・高精度）
CREATE INDEX ON documents
  USING hnsw (embedding vector_cosine_ops)
  WITH (m = 16, ef_construction = 64);

SQL - コサイン類似度検索の関数

-- ベクトル類似検索用のRPC関数を作成
CREATE OR REPLACE FUNCTION match_documents(
  query_embedding vector(1536),
  match_threshold float DEFAULT 0.7,
  match_count     int DEFAULT 5
)
RETURNS TABLE (
  id         bigint,
  content    text,
  metadata   jsonb,
  similarity float
)
LANGUAGE plpgsql AS $$
BEGIN
  RETURN QUERY SELECT
    documents.id,
    documents.content,
    documents.metadata,
    1 - (documents.embedding <=> query_embedding) AS similarity
  FROM documents
  WHERE 1 - (documents.embedding <=> query_embedding) > match_threshold
  ORDER BY documents.embedding <=> query_embedding
  LIMIT match_count;
END;
$$;

TypeScript - ドキュメント保存 & 検索

import { createClient } from '@supabase/supabase-js';

const supabase = createClient(
  process.env.SUPABASE_URL,
  process.env.SUPABASE_ANON_KEY
);

// ドキュメントをエンベディングに変換して保存
async function storeDocument(content: string, metadata: object) {
  const embeddingRes = await openai.embeddings.create({
    model: 'text-embedding-3-small',
    input: content,
  });

  const { data, error } = await supabase
    .from('documents')
    .insert({
      content,
      metadata,
      embedding: embeddingRes.data[0].embedding,
    });
  return { data, error };
}

// ベクトル類似検索を実行
async function searchDocuments(query: string) {
  const embeddingRes = await openai.embeddings.create({
    model: 'text-embedding-3-small',
    input: query,
  });

  const { data } = await supabase.rpc('match_documents', {
    query_embedding: embeddingRes.data[0].embedding,
    match_threshold: 0.7,
    match_count: 5,
  });
  return data;
}

2 ハイブリッド検索（全文検索 + ベクトル検索）

ハイブリッド検索で精度を最大化

キーワード検索（全文検索）は正確な用語のマッチに強く、セマンティック検索（ベクトル検索）は意味的な類似性に強い。両者を組み合わせることで、検索精度を大幅に向上させます。PostgreSQLのtsvector + pgvectorで実現可能です。

SQL - ハイブリッド検索関数

-- 全文検索用のカラムを追加
ALTER TABLE documents
  ADD COLUMN fts tsvector
  GENERATED ALWAYS AS (to_tsvector('japanese', content)) STORED;

CREATE INDEX ON documents USING gin(fts);

-- ハイブリッド検索関数（キーワード30% + セマンティック70%）
CREATE OR REPLACE FUNCTION hybrid_search(
  search_query     text,
  query_embedding  vector(1536),
  match_count      int DEFAULT 5,
  keyword_weight   float DEFAULT 0.3,
  semantic_weight  float DEFAULT 0.7
)
RETURNS TABLE (
  id bigint, content text, metadata jsonb, score float
)
LANGUAGE plpgsql AS $$
BEGIN
  RETURN QUERY SELECT
    d.id, d.content, d.metadata,
    (keyword_weight * ts_rank(d.fts, websearch_to_tsquery(search_query))) +
    (semantic_weight * (1 - (d.embedding <=> query_embedding))) AS score
  FROM documents d
  ORDER BY score DESC
  LIMIT match_count;
END;
$$;

3 Row Level Security (RLS) の設定

SQL - RLS ポリシー設定

-- RLSを有効化（必須！これなしではデータが全公開になります）
ALTER TABLE documents ENABLE ROW LEVEL SECURITY;

-- ユーザーは自分のドキュメントのみ閲覧可能
CREATE POLICY "Users can view own documents"
  ON documents FOR SELECT
  USING (auth.uid() = user_id);

-- ユーザーは自分のドキュメントのみ作成可能
CREATE POLICY "Users can insert own documents"
  ON documents FOR INSERT
  WITH CHECK (auth.uid() = user_id);

-- ユーザーは自分のドキュメントのみ更新可能
CREATE POLICY "Users can update own documents"
  ON documents FOR UPDATE
  USING (auth.uid() = user_id);

-- ユーザーは自分のドキュメントのみ削除可能
CREATE POLICY "Users can delete own documents"
  ON documents FOR DELETE
  USING (auth.uid() = user_id);

4 Edge Functions で RAG APIエンドポイントを構築

TypeScript - Supabase Edge Function (RAG Endpoint)

import { serve } from 'https://deno.land/std/http/server.ts';
import { createClient } from 'https://esm.sh/@supabase/supabase-js';

serve(async (req) => {
  const { query } = await req.json();

  // 1. クエリをエンベディングに変換
  const embeddingRes = await fetch('https://api.openai.com/v1/embeddings', {
    method: 'POST',
    headers: {
      'Authorization': `Bearer ${Deno.env.get('OPENAI_API_KEY')}`,
      'Content-Type': 'application/json',
    },
    body: JSON.stringify({
      model: 'text-embedding-3-small',
      input: query,
    }),
  });
  const { data } = await embeddingRes.json();

  // 2. ベクトル検索で関連ドキュメントを取得
  const supabase = createClient(
    Deno.env.get('SUPABASE_URL'),
    Deno.env.get('SUPABASE_SERVICE_ROLE_KEY')
  );
  const { data: docs } = await supabase.rpc('match_documents', {
    query_embedding: data[0].embedding,
    match_count: 5,
  });

  // 3. Claude APIで回答を生成
  const context = docs.map(d => d.content).join('\n---\n');
  const claudeRes = await fetch('https://api.anthropic.com/v1/messages', {
    method: 'POST',
    headers: {
      'x-api-key': Deno.env.get('ANTHROPIC_API_KEY'),
      'content-type': 'application/json',
      'anthropic-version': '2023-06-01',
    },
    body: JSON.stringify({
      model: 'claude-sonnet-4-20250514',
      max_tokens: 1024,
      messages: [{
        role: 'user',
        content: `以下のコンテキストを参考に回答してください。\n\nContext:\n${context}\n\nQuestion: ${query}`,
      }],
    }),
  });

  const answer = await claudeRes.json();
  return new Response(JSON.stringify({
    answer: answer.content[0].text,
    sources: docs,
  }));
});

Supabase実践のまとめ

Supabase + pgvector + Edge Functionsの組み合わせで、ベクトル検索・認証・APIエンドポイントをワンストップ構築できます。RLSによるデータ分離を必ず有効にし、マルチテナント対応のセキュアなAIアプリを構築しましょう。本番運用ではコネクションプーリング（Supavisor）の活用、HNSWインデックスのパラメータチューニング、エンベディングの定期再生成も検討してください。

★ アーキテクチャパターン

🛠 推奨スタック: Next.js + Supabase + Claude API

🌐

フロントエンド

Next.js（App Router）+ TypeScript + Tailwind CSS。Server Componentsで初回ロード高速化、Client ComponentsでインタラクティブなチャットUI。

Next.js 15

🚀

APIレイヤー

Next.js Route Handlers または Supabase Edge Functions。Claude API呼び出し、エンベディング生成、認証チェック、ストリーミングレスポンスを処理。

Edge Functions

🗃

データベース

Supabase（PostgreSQL + pgvector）。ユーザーデータ、会話履歴、ドキュメントエンベディングを一元管理。RLSでアクセス制御。

Supabase

🔒

認証

Supabase Auth。メール/パスワード、Google、GitHub等のソーシャルログイン。JWTベースのセッション管理とRLS自動連携。

Supabase Auth

📊

AI / LLM

Claude API（Anthropic）。テキスト生成・分析・要約。Tool Useで外部サービス連携。ストリーミング対応でリアルタイムチャット体験。

Claude API

🔄 データモデル設計パターン

💬

チャット履歴

conversationsテーブル（id, user_id, title, created_at）とmessagesテーブル（id, conversation_id, role, content, tokens_used, created_at）の1対多リレーション。roleはuser/assistantのenum型。トークン数の記録でコスト管理も可能に。

📄

ドキュメント管理

collections（ナレッジベースの単位）、documents（元ファイル情報）、chunks（分割されたテキスト + embedding）の3層構造。チャンクにはsource_url、page_numberなどのメタデータを付与してソース追跡を実現。

👤

ユーザー設定

profilesテーブルにdisplay_name、avatar_url、preferences（JSONB）を格納。preferencesにはAIモデル選択、温度パラメータ、言語設定などをJSON形式で柔軟に保存。スキーマ変更なしで設定項目を追加可能。

🔄 RAGパイプラインの全体像

Document

PDF・Webページ
等の元データ

Chunk

500-1000トークン
に分割（20%重複）

Embed

ベクトルに
変換（1536次元）

Store

pgvectorに
保存 + HNSW

Query

類似検索で
関連文書を取得

Generate

Claude APIで
回答を生成

🔄 マイグレーション戦略

📋

Supabase CLI マイグレーション

supabase migration newでSQLマイグレーションファイルを生成し、Gitで管理。supabase db pushで本番環境に適用。ローカルのSupabase CLI環境でテスト後に本番デプロイするのが安全なワークフローです。

🔄

ブランチング戦略

Supabase Branchingを使い、PR ごとにプレビューDBを自動生成。スキーマ変更の影響をプレビュー環境で事前検証できます。マージ時に本番へ自動適用。Neonの場合はブランチ機能で同様のワークフローが可能です。

🚦

ゼロダウンタイム移行

カラム追加はALTER TABLE一発ですが、カラム削除やリネームは注意が必要。まず新カラムを追加 → アプリを両方対応に更新 → 旧カラムを削除の3段階で実施。CONCURRENTLY付きのインデックス作成でロックを回避。

🛡 バックアップと監視

💾

自動バックアップ

Supabaseは全プランでデイリーバックアップを提供。Proプランではポイントインタイムリカバリ（PITR）が可能。重要データはpg_dumpで定期エクスポートし、S3やGCSに外部保存することも推奨します。

📈

パフォーマンス監視

Supabaseダッシュボードでクエリ実行時間、接続数、ストレージ使用量を監視。pg_stat_statementsでスロークエリを特定。ベクトル検索のレイテンシーはインデックスパラメータのチューニングで改善できます。

🚦

障害対応計画

RPO（目標復旧時点）とRTO（目標復旧時間）を事前に定義。リードレプリカによる読み取りワークロードの分散、フェイルオーバー手順の文書化、定期的な復旧訓練を実施しましょう。

アーキテクチャのまとめ

AI開発のDBアーキテクチャは「シンプルに始めて、必要に応じてスケール」が鉄則です。まずはNext.js + Supabase + Claude APIの3層構成でMVPを構築し、ユーザー数やデータ量の増加に応じてキャッシュ層（Upstash Redis）やリードレプリカを追加しましょう。マルチテナントはRLSベースから始め、エンタープライズ要件が出た時点でスキーマ分離への移行を検討するのが合理的です。