AIに仕事を分担させてみた:Claude・Gemini・Codexで開発チームをつくる

なかま活動

今日はコードを書くより、「AIにどう仕事をさせるか」を考えていた一日でした。気がついたらかなりの時間が過ぎていて、でも不思議と充実感がある。そういう日です。

🤖 Claudeだけに頼るのをやめた話

在庫管理アプリの開発を進めているのですが、Claude(このAI)に全部やらせていると、だんだん「重く」なってくることに気づきました。会話が長くなるほど、前に決めたことを忘れ始める。微修正にも高性能モデルを使ってしまう。コスト効率が悪い。そして、使用限度枠も迫ってくる。

🤖 それぞれのAIの特徴を確認

担当を決定するにあたり、Claude、Gemini、ChatGPTの三者に、Webアプリ開発に使うならどれがいいかを聞いています。ちょっと長くなりますが、それぞれの回答を添付します:

【Claudeの回答】

Webアプリ開発でのAI CLI比較

Claude CodeGemini CLICodex CLI
コードの品質◎ 高品質・一貫性あり△ やや古い
日本語対応
長いコンテキスト◎ 200K tokens◎ 1M tokens
ファイル操作◎ 自律的に編集
PHP+SQLite理解
料金Pro $20/月に含む無料枠ありAPI従量課金
Issue Workflow連携◎ gh CLI と相性◎

結論

Claude Code が最も適しています。

特に弊社の開発環境との相性として:

  • CLAUDE.md・AGENTS.md を読んでプロジェクト文脈を把握する設計になっている
  • Issue Workflow(gh CLI連携)がそのまま使える
  • PHP・SQLite・Tesseract.js など今回のスタックへの理解が深い
  • すでに Pro プランで使えるので追加コストゼロ

Gemini CLI は無料枠が大きく・コンテキストが長い点は魅力ですが、CLAUDE.md のようなプロジェクト設定ファイルの読み込み機能が弱く、毎回背景を説明し直す手間があります。

Codex CLIはOpenAI製で現在はあまり積極的に開発されていません。

【Geminiの回答】

Webアプリ開発に最も適しているAIは、圧倒的に Claude Code です。

これら3つのツールは、一見すると「ターミナルから使えるAI」として似ているように思えますが、「自律性のレベル」と「開発への特化度」が全く異なります。

現在のWebアプリ開発において、なぜClaude Codeが最強なのか、それぞれのツールの特徴と比較を交えて解説します。

3つのAIツールの比較

特徴Claude Codegemini-cli@openai/codex
開発スタイル自律型エージェント(勝手に直す)対話型チャット(指示待ち)コード補完(過去の技術)
ファイル操作 複数ファイルを自ら書き換え× 提案のみ(コピー&ペースト必要)× 提案のみ
テスト・ビルド コマンドを実行してバグを自己修正× できない× できない
Webアプリ適性特大(★★★★★)中(★★★☆☆)低(★☆☆☆☆)

各ツールの特徴とWebアプリ開発での位置づけ

🥇 1位:Claude Code(Webアプリ開発の本命)

Anthropic社が開発した、ターミナル内で動く「AIエンジニア」そのものです。

単にコードを提案するだけでなく、あなたの代わりに手を動かして開発を進めてくれます。

  • 何が凄いの?: 「Next.jsでログイン画面を作って」と頼むと、コンポーネント、APIルート、スタイルシートなど複数のファイルを自動で作成・修正します。さらに、自分でテストコマンド(npm test など)を叩き、エラーが出たらそのエラーログを読んで自分でコードを修正するという自律性を持っています。
  • Webアプリ開発に向く理由: 現代のWebアプリは多くのファイルが複雑に絡み合っています。Claude Codeはプロジェクト全体(ディレクトリ構造)を理解する能力が非常に高いため、「こっちのファイルを直したから、あっちのインポート文も直しておこう」といった一連の作業を丸投げできます。

🥈 2位:gemini-cli(相談役・スクリプト作成向き)

あなたが今PCにインストールしているツールです。非常に優秀な「対話型AI」ですが、開発特化型のエージェントではありません。

  • 特徴: 「この関数を最適化して」「このバグの原因は何?」といった、単発の質問やピンポイントなコード生成は得意です。
  • 弱点: Webアプリ全体を勝手に構築してはくれません。AIが出した答えを、あなたが手動でVS Codeなどにコピペしてファイルを保存する必要があります。また、自分でテストを実行して挙動を確認することもできません。

🥉 3位:@openai/codex(過去の遺物)

あなたのPCのリストにあった codex ですが、これは現在、実戦で使うのは難しいです。

  • 背景: OpenAIの「Codex」は、初期のGitHub Copilotの裏側で動いていた古いモデルです。現在、OpenAIはこのモデルの単体APIを事実上廃止、あるいは gpt-4 系へ移行させています。
  • 結論: モデル自体が数年前の知識で止まっているため、最新のWebフレームワーク(Next.jsやVue.jsの最新仕様)についていけず、Webアプリ開発には使えません。

🛠️ 結論:どう使い分けるべきか?

Webアプリをガリガリ開発していくなら、Claude Codeをメインに据えるのが現代の最適解です。

  1. 基本開発(Claude Code):ターミナルで claude を起動し、「〇〇の機能を追加して、テストが通るか確認して」 と指示して、ガシガシコードを自動生成・修正させる。
  2. ピンポイントな相談(gemini-cli):開発中、特定の複雑なアルゴリズムの解説や、Google Cloud等の連携で迷った時に、gemini -p "〇〇の挙動について教えて" とサクッと質問する。

もし本格的にフロントエンドやバックエンドのWebアプリを作る予定なら、新PCには Claude Code(@anthropic-ai/claude-code を追加でインストールすることを強くおすすめします!

【Chat GPTの回答】

🎯 結論

🥇 Webアプリ開発なら現状トップ評価は Claude Code

特に👇が強いです。

  • 大規模コード理解
  • 複数ファイル編集
  • リファクタ
  • 指示追従
  • 自律的作業
  • MCP連携
  • VSCode連携
  • git/worktree運用

かなり「実務向け」です。


ただし用途で変わります

比較するとこんな感じ

項目Claude CodeCodex CLIGemini CLI
コード理解
指示追従○〜◎△〜○
大規模リポジトリ
Webアプリ実装
自律実行
VSCode親和性
MCP
長文コンテキスト
日本語安定性
ハルシネーション少なめ少なめやや多い傾向
無料で強い

各AIの特徴


🥇 Claude Code

一番「人間の上級エンジニアっぽい」

特に強い:

  • アーキテクチャ理解
  • React
  • Laravel
  • Node
  • リファクタ
  • UI修正
  • 既存コード改修

強い理由

Claude系は:

  • 長い文脈保持
  • ファイル横断理解
  • 推論

がかなり強い。


あなた向けに特に良い点

あなたは今👇をやっているので:

  • WordPress
  • PHP
  • XAMPP
  • DB
  • VSCode
  • ドキュメント整理
  • MCP
  • schema設計

👉 Claude Codeとかなり相性良いです。


🥈 Codex CLI

「堅実な開発者」タイプ

良い点:

  • OpenAI系らしく安定
  • 編集安全性高い
  • 指示理解かなり良い
  • UI/画像からコード生成強い

ただし

Claudeほど:

  • 自律的
  • 大規模横断
  • “空気読む”

感じは弱め。


向いてる用途

  • 小〜中規模
  • 堅実改修
  • 既存コード修正
  • 安全重視

🥉 Gemini CLI

最大の武器

👉 コンテキスト量

めちゃくちゃ長い。


強い用途

  • 巨大コードベース解析
  • ドキュメント読ませる
  • ログ解析
  • 調査
  • 横断検索

弱点

実際かなり言われてる👇

  • 指示無視
  • 暴走
  • ハルシネーション
  • 中途半端な修正

🎯 あなたにおすすめの現実解

正直かなりおすすめなのは:


🚀 「Claude Code + Gemini CLI」

これ。

実際かなり流行ってます。


役割分担

Claude Code
  • 実装
  • 修正
  • リファクタ
  • 判断

Gemini CLI
  • 大規模検索
  • 全体解析
  • ログ読み
  • 長文投入

Codexは?

もし:

  • ChatGPT Plus中心
  • OpenAI好き
  • 安全第一
  • シンプル

ならかなり良いです。


🎯 あなたなら多分こう

現状最適

第一候補

👉 Claude Code


補助

👉 Gemini CLI


ChatGPT活用

👉 設計相談
👉 ドキュメント
👉 方針決定


🔥 一番現実的な評価

2026時点では、開発者界隈ではかなり👇です。

  • Claude Code → 実装最強寄り
  • Gemini → 調査最強寄り
  • Codex → 安定バランス型

あなたの今の用途だと

特に👇

  • WordPress/PHP
  • DB
  • VSCode
  • XAMPP
  • ローカル編集
  • docs整理
  • MCP

👉 Claude Codeがかなりハマると思います。

予想では、それぞれが自社AIを推してくると思ったんですが、意外にも3社とも1位はClaudeでした。総じて、Claudeは優秀、Geminiは無料枠が多い、Codexは古い、という評価だったようです。ただ、ここでもGeminiの回答は間違いが多く、任せられないことを再認識することになりました。codexは古い認識が多かったですが、実際には最新ではClaude Codeに近いですし、無料枠もあります。

これを見たらチャットの性格的に、Claudeは必要なことを端的に回答する、ChatGPTは丁寧に回答する、Geminiは知ったかぶり、という立ち位置がわかります。ポイントは「労働単価が安くてお調子者のGeminiをどうやって使うか?」になりそうです。

📋 役割分担はこんな感じ

AI担当
Claude Desktop(チャット)設計・方針決め・ドキュメント作成。会話が自動保存されるので設計経緯が残る
Claude Code(CLI)骨格コード生成・複雑なバグ修正・レビュー
Gemini CLI単純な修正・横断調査・日報生成。無料枠が大きいのでコスト節約に最適
Codex CLImd修正・小規模リファクタ(Geminiがハルシネーション起こした時のバックアップ)

📁 AIの「記憶」をファイルに外部化する

一番大事にしたのが「AIの記憶に頼らず、ファイルに頼る」という考え方です。リポジトリの中に docs/AI/ というフォルダを作って、設計書・ルール・現在の作業状況をすべてファイルとして管理することにしました。

特に AI/PROJECT_RULE.md というファイルがキモで、「PHPは7.4互換で書くこと」「画像処理はブラウザ側でやること」「指定されたファイルだけ触ること」など、どのAIに渡しても守ってほしいルールをここに集約しています。GeminiにもCodexにも、指示の冒頭に必ずこのファイルを読ませます。

✅ Gemini CLIに実際にお仕事してもらった

実験として「SQLインジェクション対策」という小さな修正タスクをGemini CLIに渡してみました。指示はシンプルに「このファイルを読んでから、この関数だけ直して。他は触らないこと」。

結果は見事でした。対象の1箇所を修正し、ファイル全体を走査して他に問題がないか確認し、構文チェックまで実施して「コミットはしません、確認をお願いします」と報告してきました。指示通りの動きで、思わず「優秀じゃないか」とつぶやいてしまいました。

ポイントは、この指示がClaudeと十分検討した結果であるということ。指示通り作業すれば間違いが起きないという粒度まで、Claudeと検討した結果なので、後の作業をハルシネーション(AIの思い込みによる間違い)の多いGeminiにも任せられるのです。

💡 今日の気づき

AIに「全部理解して修正して」と渡すのをやめて、「このファイルのこの関数だけ直して」に変えるだけで、ハルシネーションが激減します。AIを優秀な「修正専門担当」として使うイメージです。

設計の判断はClaudeと対話しながら、実装の手作業はGeminiに任せる。この分業がうまく回り始めると、今まで「AIにどうやって思い通りの動きをさせればいいのか」といった疑問が減ってくると気がします。合同会社の代表兼エンジニアとしては、なかなか心強い体制になってきました。


今後は動作確認をAIにやらせる方法を検討する予定です。Claude CoWorkを使えば、ブラウザ操作してテストできるんですが、マウス操作などが現状では使い物にならないくらい遅い。ちょっと考えてみようと思ってます。

コメント

タイトルとURLをコピーしました