AIを分業させて開発効率アップした話

今日はコードを書くより、「AIにどう仕事をさせるか」を考えていた一日でした。気がついたらかなりの時間が過ぎていて、でも不思議と充実感がある。そういう日です。

🤖 Claudeだけに頼るのをやめた話

在庫管理アプリの開発を進めているのですが、Claude（このAI）に全部やらせていると、だんだん「重く」なってくることに気づきました。会話が長くなるほど、前に決めたことを忘れ始める。微修正にも高性能モデルを使ってしまう。コスト効率が悪い。そして、使用限度枠も迫ってくる。

🤖 それぞれのAIの特徴を確認

担当を決定するにあたり、Claude、Gemini、ChatGPTの三者に、Webアプリ開発に使うならどれがいいかを聞いています。ちょっと長くなりますが、それぞれの回答を添付します：

【Claudeの回答】

Webアプリ開発でのAI CLI比較

	Claude Code	Gemini CLI	Codex CLI
コードの品質	◎ 高品質・一貫性あり	○	△ やや古い
日本語対応	◎	◎	△
長いコンテキスト	◎ 200K tokens	◎ 1M tokens	△
ファイル操作	◎ 自律的に編集	○	○
PHP+SQLite理解	◎	○	△
料金	Pro $20/月に含む	無料枠あり	API従量課金
Issue Workflow連携	◎ gh CLI と相性◎	△	△

結論

Claude Code が最も適しています。

特に弊社の開発環境との相性として：

CLAUDE.md・AGENTS.md を読んでプロジェクト文脈を把握する設計になっている
Issue Workflow（gh CLI連携）がそのまま使える
PHP・SQLite・Tesseract.js など今回のスタックへの理解が深い
すでに Pro プランで使えるので追加コストゼロ

Gemini CLI は無料枠が大きく・コンテキストが長い点は魅力ですが、CLAUDE.md のようなプロジェクト設定ファイルの読み込み機能が弱く、毎回背景を説明し直す手間があります。

Codex CLIはOpenAI製で現在はあまり積極的に開発されていません。

【Geminiの回答】

Webアプリ開発に最も適しているAIは、圧倒的に Claude Code です。

これら3つのツールは、一見すると「ターミナルから使えるAI」として似ているように思えますが、「自律性のレベル」と「開発への特化度」が全く異なります。

現在のWebアプリ開発において、なぜClaude Codeが最強なのか、それぞれのツールの特徴と比較を交えて解説します。

3つのAIツールの比較

特徴	Claude Code	gemini-cli	@openai/codex
開発スタイル	自律型エージェント（勝手に直す）	対話型チャット（指示待ち）	コード補完（過去の技術）
ファイル操作	◯ 複数ファイルを自ら書き換え	× 提案のみ（コピー＆ペースト必要）	× 提案のみ
テスト・ビルド	◯ コマンドを実行してバグを自己修正	× できない	× できない
Webアプリ適性	特大（★★★★★）	中（★★★☆☆）	低（★☆☆☆☆）

各ツールの特徴とWebアプリ開発での位置づけ

🥇 1位：Claude Code（Webアプリ開発の本命）

Anthropic社が開発した、ターミナル内で動く「AIエンジニア」そのものです。

単にコードを提案するだけでなく、あなたの代わりに手を動かして開発を進めてくれます。

何が凄いの？: 「Next.jsでログイン画面を作って」と頼むと、コンポーネント、APIルート、スタイルシートなど複数のファイルを自動で作成・修正します。さらに、自分でテストコマンド（npm test など）を叩き、エラーが出たらそのエラーログを読んで自分でコードを修正するという自律性を持っています。
Webアプリ開発に向く理由: 現代のWebアプリは多くのファイルが複雑に絡み合っています。Claude Codeはプロジェクト全体（ディレクトリ構造）を理解する能力が非常に高いため、「こっちのファイルを直したから、あっちのインポート文も直しておこう」といった一連の作業を丸投げできます。

🥈 2位：gemini-cli（相談役・スクリプト作成向き）

あなたが今PCにインストールしているツールです。非常に優秀な「対話型AI」ですが、開発特化型のエージェントではありません。

特徴: 「この関数を最適化して」「このバグの原因は何？」といった、単発の質問やピンポイントなコード生成は得意です。
弱点: Webアプリ全体を勝手に構築してはくれません。AIが出した答えを、あなたが手動でVS Codeなどにコピペしてファイルを保存する必要があります。また、自分でテストを実行して挙動を確認することもできません。

🥉 3位：@openai/codex（過去の遺物）

あなたのPCのリストにあった codex ですが、これは現在、実戦で使うのは難しいです。

背景: OpenAIの「Codex」は、初期のGitHub Copilotの裏側で動いていた古いモデルです。現在、OpenAIはこのモデルの単体APIを事実上廃止、あるいは gpt-4 系へ移行させています。
結論: モデル自体が数年前の知識で止まっているため、最新のWebフレームワーク（Next.jsやVue.jsの最新仕様）についていけず、Webアプリ開発には使えません。

🛠️ 結論：どう使い分けるべきか？

Webアプリをガリガリ開発していくなら、Claude Codeをメインに据えるのが現代の最適解です。

基本開発（Claude Code）:ターミナルで claude を起動し、「〇〇の機能を追加して、テストが通るか確認して」 と指示して、ガシガシコードを自動生成・修正させる。
ピンポイントな相談（gemini-cli）:開発中、特定の複雑なアルゴリズムの解説や、Google Cloud等の連携で迷った時に、gemini -p "〇〇の挙動について教えて" とサクッと質問する。

もし本格的にフロントエンドやバックエンドのWebアプリを作る予定なら、新PCには Claude Code（@anthropic-ai/claude-code） を追加でインストールすることを強くおすすめします！

【Chat GPTの回答】

🎯 結論

🥇 Webアプリ開発なら現状トップ評価は Claude Code

特に👇が強いです。

大規模コード理解
複数ファイル編集
リファクタ
指示追従
自律的作業
MCP連携
VSCode連携
git/worktree運用

かなり「実務向け」です。

ただし用途で変わります

比較するとこんな感じ

項目	Claude Code	Codex CLI	Gemini CLI
コード理解	◎	◎	○
指示追従	◎	○〜◎	△〜○
大規模リポジトリ	◎	○	◎
Webアプリ実装	◎	◎	○
自律実行	◎	◎	○
VSCode親和性	◎	◎	○
MCP	◎	○	◎
長文コンテキスト	○	○	◎
日本語安定性	◎	◎	○
ハルシネーション	少なめ	少なめ	やや多い傾向
無料で強い	△	△	◎

各AIの特徴

🥇 Claude Code

一番「人間の上級エンジニアっぽい」

特に強い：

アーキテクチャ理解
React
Laravel
Node
リファクタ
UI修正
既存コード改修

強い理由

Claude系は：

長い文脈保持
ファイル横断理解
推論

がかなり強い。

あなた向けに特に良い点

あなたは今👇をやっているので：

WordPress
PHP
XAMPP
DB
VSCode
ドキュメント整理
MCP
schema設計

👉 Claude Codeとかなり相性良いです。

🥈 Codex CLI

「堅実な開発者」タイプ

良い点：

OpenAI系らしく安定
編集安全性高い
指示理解かなり良い
UI/画像からコード生成強い

ただし

Claudeほど：

自律的
大規模横断
“空気読む”

感じは弱め。

向いてる用途

小〜中規模
堅実改修
既存コード修正
安全重視

🥉 Gemini CLI

最大の武器

👉 コンテキスト量

めちゃくちゃ長い。

強い用途

巨大コードベース解析
ドキュメント読ませる
ログ解析
調査
横断検索

弱点

実際かなり言われてる👇

指示無視
暴走
ハルシネーション
中途半端な修正

🎯 あなたにおすすめの現実解

正直かなりおすすめなのは：

🚀 「Claude Code + Gemini CLI」

これ。

実際かなり流行ってます。

役割分担

Claude Code

実装
修正
リファクタ
判断

Gemini CLI

大規模検索
全体解析
ログ読み
長文投入

Codexは？

もし：

ChatGPT Plus中心
OpenAI好き
安全第一
シンプル

ならかなり良いです。

🎯 あなたなら多分こう

現状最適

第一候補

👉 Claude Code

補助

👉 Gemini CLI

ChatGPT活用

👉 設計相談
👉 ドキュメント
👉 方針決定

🔥 一番現実的な評価

2026時点では、開発者界隈ではかなり👇です。

Claude Code → 実装最強寄り
Gemini → 調査最強寄り
Codex → 安定バランス型

あなたの今の用途だと

特に👇

WordPress/PHP
DB
VSCode
XAMPP
ローカル編集
docs整理
MCP

👉 Claude Codeがかなりハマると思います。

予想では、それぞれが自社AIを推してくると思ったんですが、意外にも3社とも1位はClaudeでした。総じて、Claudeは優秀、Geminiは無料枠が多い、Codexは古い、という評価だったようです。ただ、ここでもGeminiの回答は間違いが多く、任せられないことを再認識することになりました。codexは古い認識が多かったですが、実際には最新ではClaude Codeに近いですし、無料枠もあります。

これを見たらチャットの性格的に、Claudeは必要なことを端的に回答する、ChatGPTは丁寧に回答する、Geminiは知ったかぶり、という立ち位置がわかります。ポイントは「労働単価が安くてお調子者のGeminiをどうやって使うか？」になりそうです。

📋 役割分担はこんな感じ

AI	担当
Claude Desktop（チャット）	設計・方針決め・ドキュメント作成。会話が自動保存されるので設計経緯が残る
Claude Code（CLI）	骨格コード生成・複雑なバグ修正・レビュー
Gemini CLI	単純な修正・横断調査・日報生成。無料枠が大きいのでコスト節約に最適
Codex CLI	md修正・小規模リファクタ（Geminiがハルシネーション起こした時のバックアップ）

📁 AIの「記憶」をファイルに外部化する

一番大事にしたのが「AIの記憶に頼らず、ファイルに頼る」という考え方です。リポジトリの中に docs/ と AI/ というフォルダを作って、設計書・ルール・現在の作業状況をすべてファイルとして管理することにしました。

特に AI/PROJECT_RULE.md というファイルがキモで、「PHPは7.4互換で書くこと」「画像処理はブラウザ側でやること」「指定されたファイルだけ触ること」など、どのAIに渡しても守ってほしいルールをここに集約しています。GeminiにもCodexにも、指示の冒頭に必ずこのファイルを読ませます。

✅ Gemini CLIに実際にお仕事してもらった

実験として「SQLインジェクション対策」という小さな修正タスクをGemini CLIに渡してみました。指示はシンプルに「このファイルを読んでから、この関数だけ直して。他は触らないこと」。

結果は見事でした。対象の1箇所を修正し、ファイル全体を走査して他に問題がないか確認し、構文チェックまで実施して「コミットはしません、確認をお願いします」と報告してきました。指示通りの動きで、思わず「優秀じゃないか」とつぶやいてしまいました。

ポイントは、この指示がClaudeと十分検討した結果であるということ。指示通り作業すれば間違いが起きないという粒度まで、Claudeと検討した結果なので、後の作業をハルシネーション（AIの思い込みによる間違い）の多いGeminiにも任せられるのです。

💡 今日の気づき

AIに「全部理解して修正して」と渡すのをやめて、「このファイルのこの関数だけ直して」に変えるだけで、ハルシネーションが激減します。AIを優秀な「修正専門担当」として使うイメージです。

設計の判断はClaudeと対話しながら、実装の手作業はGeminiに任せる。この分業がうまく回り始めると、今まで「AIにどうやって思い通りの動きをさせればいいのか」といった疑問が減ってくると気がします。合同会社の代表兼エンジニアとしては、なかなか心強い体制になってきました。

今後は動作確認をAIにやらせる方法を検討する予定です。Claude CoWorkを使えば、ブラウザ操作してテストできるんですが、マウス操作などが現状では使い物にならないくらい遅い。ちょっと考えてみようと思ってます。