マルチエージェント構築入門：構成の全体像と実装アプローチ

マルチエージェントは「司令塔（オーケストレーター）」が「専門家チーム（サブエージェント）」にタスクを振り分ける構成です。フレームワークなしでもClaude CodeのTaskツールで構築可能ですが、エージェント間連携（ハーネス）の設計は必要です。AIツールの進化で自作の必要性は変わる可能性があります。

マルチエージェントとは何か

マルチエージェントとは、複数のAIエージェントが協調してタスクを遂行するシステムです。1つのLLMにすべてを任せるのではなく、役割を分担することで複雑なタスクに対応します。

シングルエージェントとの違い

シングルエージェントは1つのAI（例：ChatGPT、Claude）が単独でタスクを処理します。ユーザーの指示を受け、思考し、回答を返す一連の流れを1つのエージェントが担当します。

マルチエージェントでは、この流れを複数のエージェントで分担します。

項目	シングルエージェント	マルチエージェント
構成	1つのLLM	複数のLLM（役割別）
得意領域	単純〜中程度のタスク	複雑・多段階のタスク
コンテキスト	1つの会話で完結	分散して管理
専門性	汎用的	役割ごとに特化可能

なぜマルチエージェントが注目されているのか

AIエージェントの性能向上に伴い、「1つのエージェントに全部やらせる」アプローチの限界が見えてきました。

コンテキスト長の制約: 1つの会話に詰め込める情報には限界がある
専門性の限界: 汎用モデルはすべての領域で最高性能ではない
複雑なワークフロー: 計画→実装→レビューのような多段階処理は分業が効率的

人間のチーム開発と同様に、AIも役割分担することで複雑なタスクに対応できるようになります。

マルチエージェントの基本構成

マルチエージェントシステムは3つの要素で構成されます。

オーケストレーター（司令塔）

オーケストレーターは全体を統括するエージェントです。ユーザーからの指示を受け、適切なサブエージェントにタスクを振り分け、結果を統合します。

役割:

タスクの分解と振り分け
サブエージェントの選択
結果の統合と最終回答の生成
エラー時のリトライ判断

サブエージェント（専門家）

サブエージェントは特定の役割に特化したエージェントです。オーケストレーターからタスクを受け取り、専門領域の処理を担当します。

例:

planner: タスク分解・計画立案
researcher: 情報収集・調査
coder: コード実装
reviewer: コードレビュー・品質チェック
tester: テスト作成・実行

ツール連携（外部API・CLI）

エージェントは外部ツールと連携して能力を拡張します。ファイル操作、Web検索、API呼び出しなど、LLM単体では不可能な処理を実行します。

例:

ファイル読み書き（Read, Write, Edit）
コマンド実行（Bash）
Web検索（WebSearch）
外部API呼び出し

【図】基本構成図

flowchart TB
    User[ユーザー] --> Orchestrator[オーケストレーター]

    Orchestrator --> Planner[planner<br/>計画]
    Orchestrator --> Researcher[researcher<br/>調査]
    Orchestrator --> Coder[coder<br/>実装]
    Orchestrator --> Reviewer[reviewer<br/>レビュー]

    Planner --> Tools[ツール群]
    Researcher --> Tools
    Coder --> Tools
    Reviewer --> Tools

    Tools --> Files[ファイル操作]
    Tools --> CLI[CLI実行]
    Tools --> Web[Web検索]
    Tools --> API[外部API]

代表的なアーキテクチャパターン

マルチエージェントの構成にはいくつかのパターンがあります。

階層型（Hierarchical）

オーケストレーターを頂点とした階層構造です。指示は上から下へ流れ、結果は下から上へ返ります。

特徴:

制御が明確
デバッグしやすい
オーケストレーターがボトルネックになりやすい

適した用途: 明確なワークフローがある場合（計画→実装→レビュー）

ピアツーピア型（Peer-to-Peer）

エージェント同士が直接やり取りする構成です。中央の司令塔を持たず、必要に応じてエージェント間で協調します。

特徴:

柔軟性が高い
スケールしやすい
制御が複雑になりやすい

適した用途: 動的にタスクが変化する場合、エージェント数が多い場合

ハイブリッド型

階層型とピアツーピア型を組み合わせた構成です。基本は階層型で、特定のサブグループ内ではピアツーピアで連携します。

特徴:

柔軟性と制御のバランス
設計が複雑

適した用途: 大規模で複雑なシステム

【表】パターン比較

パターン	制御のしやすさ	柔軟性	実装難易度	適した規模
階層型	高	低	低	小〜中規模
ピアツーピア型	低	高	高	中〜大規模
ハイブリッド型	中	中	高	大規模

個人開発や小規模チームでは、階層型から始めることを推奨します。

構築アプローチの選択肢

マルチエージェントを構築する方法は3つあります。

自作する

LLMのAPIを直接呼び出し、オーケストレーションのロジックを自分で実装します。

メリット:

完全なカスタマイズが可能
依存関係が少ない
内部構造を深く理解できる

デメリット:

実装コストが高い
エラーハンドリング、リトライ等を自前で実装する必要がある

フレームワークを使う（LangChain, AutoGen等）

既存のフレームワークを利用して構築します。

メリット:

実装コストが低い
ベストプラクティスが組み込まれている
コミュニティのサポートがある

デメリット:

フレームワークの学習コスト
抽象化による制約
バージョンアップへの追従が必要

参考: LangChain Multi-agent / LangGraph / AutoGen

既存ツールを活用する（Claude Code, Cursor）

AIコーディングツールが提供するサブエージェント機能を活用します。

メリット:

追加実装がほぼ不要
ツール側でハーネスが整備済み
すぐに試せる

デメリット:

ツールの仕様に依存
カスタマイズに限界がある

参考: Claude Code Subagents

【表】アプローチ比較

アプローチ	実装コスト	カスタマイズ性	学習コスト	保守性
自作	高	高	中	自己責任
フレームワーク	中	中	高	フレームワーク依存
既存ツール活用	低	低	低	ツール依存

Claude Codeでの構築例

Claude Codeでは、Taskツールを使ってサブエージェントを呼び出せます。

Taskツールによるサブエージェント呼び出し

Taskツールは専門エージェントを起動し、特定のタスクを委譲するための機能です。

Task(subagent_type="planner", prompt="タスク分解: ユーザー認証機能の実装")

このように呼び出すと、plannerエージェントが起動し、タスク分解を実行して結果を返します。

エージェントの役割定義

Claude Codeでは以下のようなサブエージェントが利用可能です（一部抜粋）。

Agent	役割
planner	タスク分解・マイルストーン計画
researcher	調査・情報収集
architect	システムアーキテクチャ設計
frontend-dev	フロントエンド実装
backend-python-dev	Pythonバックエンド実装
code-reviewer	コードレビュー
tester	テスト作成

コンテキスト管理の工夫

マルチエージェントではコンテキスト（会話履歴）の管理が重要です。

課題: メインのオーケストレーターに情報を集中させると、コンテキスト長の制約に達しやすい

対策:

大きな出力が予想されるタスクはサブエージェント経由で実行
サブエージェントからは要約を返してもらう
詳細が必要な場合のみ全文を取得

Task(subagent_type="general-purpose", prompt="""
調査を実行し、結果を要約してください（5-7ポイント）。
詳細はファイルに保存してください。
""")

【コード例】基本的な呼び出しパターン

計画フェーズ

Task(subagent_type="planner", prompt="計画: ユーザー認証機能")
Task(subagent_type="researcher", prompt="調査: OAuth 2.0の実装パターン")

設計フェーズ

Task(subagent_type="architect", prompt="設計: 認証システムのアーキテクチャ")
Task(subagent_type="api-designer", prompt="API設計: 認証エンドポイント")

実装フェーズ

Task(subagent_type="backend-python-dev", prompt="実装: 認証API")
Task(subagent_type="tester", prompt="テスト作成: 認証APIのユニットテスト")

レビューフェーズ

Task(subagent_type="code-reviewer", prompt="レビュー: 認証APIの実装")
Task(subagent_type="security-reviewer", prompt="セキュリティレビュー: 認証フロー")

構築して分かった課題と限界

マルチエージェントを自作してみると、いくつかの課題が見えてきます。

ハーネス設計の難しさ

ハーネスとは、エージェント間の連携部分（タスクの受け渡し、結果の統合、エラーハンドリング等）を指します。

課題:

どのエージェントにどのタスクを振るか判断ロジックが必要
失敗時のリトライ・フォールバック戦略
エージェント間のデータフォーマット統一

既存ツール（Claude Code等）を使う場合、この部分はツール側で整備されていますが、カスタマイズしたい場合は自前での実装が必要です。

コンテキスト長の制約

各エージェントが持てるコンテキスト（会話履歴）には上限があります。

課題:

長いタスクでは途中で情報が欠落する可能性
サブエージェント間で情報を共有する仕組みが必要

対策例:

ファイルベースでの情報共有
要約を活用したコンテキスト圧縮

エージェント間の情報共有

サブエージェントAの結果をサブエージェントBで使いたい場合、情報の受け渡し方法を設計する必要があります。

方法例:

オーケストレーター経由で受け渡し
共有ファイルに書き出し
専用のメモリ（状態管理）を用意

運用・デバッグの複雑さ

複数のエージェントが動くため、問題発生時の原因特定が難しくなります。

課題:

どのエージェントで問題が起きたか特定しにくい
ログが分散する
再現が難しい

今後の展望と判断基準

マルチエージェントは発展途上の技術です。今後の動向を踏まえて、自作するか判断する必要があります。

AIツール自体の進化

Claude Code、Cursor、GitHub Copilotなどのツールは急速に進化しています。

現状の流れ:

サブエージェント機能の標準搭載
ハーネス部分の自動化
より高度なオーケストレーション機能

この流れが続けば、自作する必要性は低下する可能性があります。学習目的では価値がありますが、実用目的なら既存ツールの進化を見守る選択肢もあります。

自作すべきか判断するポイント

以下の場合は自作を検討する価値があります:

特殊なワークフローがある: 既存ツールでは対応できない独自の処理フロー
深いカスタマイズが必要: エージェントの振る舞いを細かく制御したい
学習目的: 内部構造を理解したい
既存ツールに依存したくない: ベンダーロックインを避けたい

【チェックリスト】自作判断フロー

[ ] 既存ツール（Claude Code, Cursor等）で実現できないか確認した
[ ] 必要なカスタマイズの範囲を明確にした
[ ] ハーネス設計に必要な工数を見積もった
[ ] 保守・運用の体制を考慮した
[ ] AIツールの進化による陳腐化リスクを許容できる

すべてにチェックが入る場合は自作を検討してください。1つでも不明な点があれば、まず既存ツールで試すことを推奨します。

まとめ

マルチエージェントは「司令塔＋専門家チーム」の構成で複雑なタスクに対応するシステムです。

ポイント:

基本構成は「オーケストレーター」「サブエージェント」「ツール連携」の3要素
Claude CodeのTaskツールを使えばフレームワークなしで構築可能
ハーネス（エージェント間連携）の設計は避けられない
現時点では発展途上。AIツールの進化で状況は変わる可能性がある

次のステップ:

まずはClaude CodeやCursorでサブエージェント機能を試す
構成のイメージをつかんでから、自作するか判断する
自作する場合は、小さな構成（2-3エージェント）から始める

マルチエージェントは「作れば終わり」ではなく、継続的な改善が必要な領域です。まずは全体像を理解し、自分の用途に合ったアプローチを選択してください。

FAQ

Q1: マルチエージェントとRAGの違いは何ですか？

RAGは「検索＋生成」で外部データを参照して回答を生成する仕組みです。マルチエージェントは「複数エージェントの協調」で複雑なタスクを分業する仕組みです。RAGをマルチエージェントの1ツールとして組み込むことも可能です。

Q2: フレームワークなしでマルチエージェントを構築できますか？

可能です。Claude CodeのTaskツールやCursorのエージェントモードを使えば、サブエージェント呼び出しが標準機能として提供されています。ただし、エージェント間連携（ハーネス）の設計は必要です。

Q3: マルチエージェントは個人開発でも意味がありますか？

タスクの複雑さによります。単純なタスクならシングルエージェントで十分です。計画→実装→レビューのような多段階ワークフローを自動化したい場合はマルチエージェントが有効です。

Q4: どの程度のプログラミングスキルが必要ですか？

基本的なプログラミング知識と、AIツールのドキュメントを読める程度のスキルが必要です。既存ツール活用なら複雑なコーディングは不要ですが、自作する場合はAPI呼び出しやエラーハンドリングの知識が求められます。

Q5: 今から自作を始めるべきですか？

学習目的なら価値があります。実用目的なら、まず既存ツール（Claude Code、Cursor等）で試すことを推奨します。AIツール自体がマルチエージェント機能を強化しており、自作の必要性は変わる可能性があります。

マルチエージェント構築入門｜構成の全体像と3つの実装アプローチ

マルチエージェント構築入門：構成の全体像と実装アプローチ

マルチエージェントとは何か

シングルエージェントとの違い

なぜマルチエージェントが注目されているのか

マルチエージェントの基本構成

オーケストレーター（司令塔）

サブエージェント（専門家）

ツール連携（外部API・CLI）

【図】基本構成図

代表的なアーキテクチャパターン

階層型（Hierarchical）

ピアツーピア型（Peer-to-Peer）

ハイブリッド型

【表】パターン比較

構築アプローチの選択肢

自作する

フレームワークを使う（LangChain, AutoGen等）

既存ツールを活用する（Claude Code, Cursor）

【表】アプローチ比較

Claude Codeでの構築例

Taskツールによるサブエージェント呼び出し

エージェントの役割定義

コンテキスト管理の工夫

【コード例】基本的な呼び出しパターン

構築して分かった課題と限界

ハーネス設計の難しさ

コンテキスト長の制約

エージェント間の情報共有

運用・デバッグの複雑さ

今後の展望と判断基準

AIツール自体の進化

自作すべきか判断するポイント

【チェックリスト】自作判断フロー

まとめ

FAQ

Q1: マルチエージェントとRAGの違いは何ですか？

Q2: フレームワークなしでマルチエージェントを構築できますか？

Q3: マルチエージェントは個人開発でも意味がありますか？

Q4: どの程度のプログラミングスキルが必要ですか？

Q5: 今から自作を始めるべきですか？

関連記事

ハーネスエンジニアリングとは何か：プロンプト→コンテキスト→ハーネスへ至るAIエージェント設計の変遷

Auth.js v5 でJWT二重タイムアウトを実装する：BFF + Django連携の設計パターン

仕様書を「渡す」からCLAUDE.mdを「育てる」へ — Claude Codeの使い方が変わった話

Comments