ChatGPT / Claude / Gemini に同じプロンプトを投げて比べた - 日本語ライティング編
共働き子育て世代向けの記事執筆という実用視点で、3 大 LLM に同じ日本語ライティングのプロンプト(夕飯の献立記事)を投げ、出力の違いを実例ベースで比較。用途別の使い分け指針を整理します。
この記事のもくじ (11)
注意: 本記事は 個人運営者の主観評価 です。各モデルにつき同一プロンプトを 1 回ずつ試行した結果に基づく定性比較で、厳密な定量ベンチマークではありません。また、当サイトは Claude Code を主力で使っているため、評価には利害関係があります。客観的データは各社の公式ベンチマークも併せてご確認ください。
2026-06-01 更新: 当初は海外の個人開発者プロフィール記事を題材にしていましたが、当サイトの方針(共働き子育て世代 × AI)に合わせ、「夕飯の献立記事を書かせる」題材で各社の最新モデルに再テストし、出力サンプルと評価を入れ替えました。
なぜこの比較が必要か
「ChatGPT / Claude / Gemini どれがいい?」は、共働きで時間のない我が家でもよく出る疑問です。ベンチマーク表は山ほどありますが、「日本語で、家事や子育ての実用記事を、落ち着いたトーンで書かせる」という生活視点の比較 はほぼ見当たりません。
本記事では、子育て世代向けの記事執筆という用途で、同じプロンプトを 3 つの LLM に投げ、出力の違いを観察した結果をまとめます。
テスト方法
同一プロンプトを 2026 年 6 月時点の各社最新モデルに投げ、出力を観察:
- Claude Opus 4.8(Anthropic / high モード)
- GPT-5.5(OpenAI、拡張思考)
- Gemini 3.1 Pro(Google、拡張)
モデルバージョン・各社の名称変更があるため、本記事の評価は 2026 年 6 月 1 日時点 のものです。今後のアップデートで結論が変わる可能性があります(実際、後述のとおり ChatGPT は前回テスト時より誇張表現が減っていました)。
投げたプロンプトは以下。誇張を避けた編集トーンへの追従を見るため、わざと「持ち上げ表現は避けて」と条件に入れています:
あなたは共働き子育て世代向けメディアの編集者です。「AIで夕飯の
献立を考える」をテーマに、ですます調・800字の実用記事を書いて
ください。「神アプリ」「驚異的」のような誇張・持ち上げは避け、
具体例と手順を淡々と。最後に読者がすぐ試せる一文を添えてください。
結果(主観評価)
Claude Opus 4.8(high)
- 強み: 見出しを使わない端正な本文。「誇張を避けて淡々と」という編集トーン指示への追従が高い。とくに 加熱・食中毒・アレルギーへの注意を「鵜呑みにせず自分で確認」と最も手厚く 添えてきた点が、子育て向け記事として安心感がある
- 弱み: 箇条書き・見出しでの構造化は控えめで、流し読みのしやすさ(スキャナブルさ)は Gemini に劣る
- 総合: 編集メディアの本文 + 読者の安全に配慮した実用記事に最も向く
サンプル出力(抜粋):
「仕事を終えて帰宅したあと、献立を決めるのは意外と負担の大きい作業です。冷蔵庫の中身を思い浮かべ、家族の好みや栄養バランスを考え、調理時間も計算する。この一連の判断を、AIに肩代わりしてもらう方法を紹介します。(中略)AIの提案する分量や加熱時間は、必ずしも正確ではありません。食中毒に関わる加熱の目安や、アレルギー対応については、提案を鵜呑みにせず、ご自身で確認してください。」
GPT-5.5(OpenAI)
- 強み: タイトルに自分でサブコピー(「AIで夕飯の献立を考える|共働き家庭で無理なく使うコツ」)を付けてくる のが上手い。文章のリズムが良く、「忙しい日は一汁三菜より主菜+汁物で」など現実的な落としどころの提案が読み物として滑らか
- 弱み(前回からの変化): 以前のテストでは「驚異的」「天才的」等のハイプ表現が混じりがちでしたが、今回はほぼ見られず、誇張回避の指示にきちんと追従していました。モデル更新で改善した印象
- 総合: タイトル・キャッチコピー・リード文 に強い。誇張癖も以前ほど気にならなくなった
サンプル出力(抜粋):
「AIで夕飯の献立を考える|共働き家庭で無理なく使うコツ 仕事終わりの夕飯づくりでいちばん悩むのは、「何を作るか」が決まらない時間かもしれません。(中略)忙しい日は完璧な一汁三菜を目指すより、「主菜+汁物」「丼+副菜」くらいにすると続けやすくなります。」
Gemini 3.1 Pro
- 強み: 見出し(##・###)・番号付きリスト・引用ブロックでの構造化が突出。手順を整理して見せるのが速く、スキャナブルで「あとから見返しやすい」記事になる
- 弱み: 導入がやや説明的・教科書的。「800字の実用記事」という指示に対し、見出し構成でしっかり記事化する分、長めになりやすい
- 総合: 構成・手順の構造化、データ整理 に強い
サンプル出力(抜粋):
「## 毎日の「今日のご飯どうしよう」を減らす。AIを使った献立作成の手順 (中略)以下の要素を組み合わせて入力(プロンプト)を作成します。1. 手持ちの食材 2. 調理時間の制限 3. 対象者の条件…」
用途別の使い分け(子育て世代の実用視点)
| 作業 | 第一候補 | 補助 | 理由 |
|---|---|---|---|
| 長文ライティング(800 字以上) | Claude | — | 編集トーンへの追従性、安全注意の手厚さ、日本語の自然さ |
| タイトル / キャッチコピー / リード | GPT-5.5 | Claude | サブコピーの付け方・言い回しのリズムが良い |
| 手順の構造化 / 表・リスト化 | Gemini | Claude | 見出し・箇条書きへの整理が速い |
| コード生成 / リファクタ | Claude Code | — | コード変更を実ファイルに書き込めるエージェント体験 |
| 翻訳(英 → 日) | Claude | GPT-5.5 | 自然な日本語の語感、文化的補足が入る |
| 要約 / 抜粋 | Claude | Gemini | 編集者目線で重要箇所を残す |
個人運営での実際の使い方

gashan.net の運営では、以下の組み合わせで使っています:
- 記事の下書き・本文: Claude Code(エージェント的に対話しながら書く)
- タイトル・キャッチコピー候補出し: GPT-5.5(複数案を投げて選ぶ)
- 手順・数値の構造化: Gemini(箇条書きや表に変換が早い)
- コードベース修正: Claude Code(プロジェクト全体を理解する)
3 つ全部を併用すると 1 つの作業時間が増える ので、基本は Claude で、必要な瞬間だけ他社に切り替える、が運用上のバランスです。
注意点
- 各社のモデルは 数ヶ月単位で更新 されます。本記事の評価は 2026 年 6 月時点の主観です(GPT の誇張癖が減ったように、結論は変わります)
- 同じプロンプトでも温度パラメータで出力が変わる。公平な比較には複数回試行が必要です
- 献立のように 加熱・食中毒・アレルギーが絡む情報 は、AI の答えを鵜呑みにせず公式情報やかかりつけ医で確認を。AI はあくまで「たたき台」を素早く出す道具です
- 個人運営の用途では「最高性能」より 「サブスク内で使えるか」 が重要。Claude Code は月額固定で使い放題なのが大きい
結論
「どれが最強か」は問いとして筋が悪く、「どの作業に、どれを当てるか」が個人運営者にとっての実用論です。当面の私の構成は:
- メインの執筆・本文 = Claude Code
- タイトル・キャッチコピー候補 = GPT-5.5
- 手順の構造化・表化 = Gemini
これで月額固定で運営しつつ、用途別に最適な出力を得ています。今後の各社アップデートで構成は変わる可能性があるため、数ヶ月ごとに本記事は更新する予定です。
関連記事
- ChatGPT / Claude / Gemini を全部課金している双子パパの本音 — 同じ 3 つの AI を「料金と家庭での使い分け」の視点で比べた本音編
- ChatGPT Pro は要る? 全課金の双子パパが Plus のままな理由 — 比較した 3 社のうち ChatGPT だけ、高い Pro ではなく Plus($20)に留めている課金判断の深掘り
- Claude Code Max を月 $220 払って使う双子パパの正直レビュー — 本記事で執筆の主力とした Claude Code に、実際いくら払って元が取れているか
- Claude Code もブログ運営も、全部「音声入力」で回す — 比較した AI を、時間のない子育て中にどう実運用しているか
本記事のモデル名・評価は更新時点(2026-06-01)の主観です。各社のモデルは数ヶ月単位で更新されます。
参考にしたページ
※ 本記事は、運営者(双子パパ)本人の一次体験をもとに、AI(Claude)との対話で記事化しています。
こちらの記事もどうぞ
実践ガイド共働きの家事、AI に任せられるのは「考える家事」だけ — 双子パパが時短した 6 場面
AI で皿洗いは減りません。でも献立・調べ物・比較・段取りといった「考える家事」は、かなり肩代わりできます。共働きで双子を育てるパパが、ChatGPT や Gemini に家事を時短させた 6 場面を、任せていい家事・ダメな家事の線引きごとにまとめます。
実践ガイド高い家電は、AI に「型番の違いを全部整理」させてから買う — 炊飯器選びで消耗しなくなった話
炊飯器を買い替えようとしたら、同じシリーズでも型番の枝番が多すぎて選べない。そこで「似た型番の違いを表で整理する」作業を AI(Gemini)に丸ごと任せてみました。比較表づくりは AI に外注し、人間は生活要件での判断に集中する。子育て中で家電をじっくり調べる時間がない双子パパの、後悔しない家電選びの段取りをまとめます。
- 運営ジャーナル
AI に月 4 万円は高いのか — 双子パパの『今月の本音収支』と、解約を迷った AI(2026 年 6 月)
ChatGPT・Gemini・Claude Code に毎月約 4 万円課金している双子パパが、2026 年 6 月に『元が取れた AI・微妙だった AI』を正直に公開。AI サブスクに課金して後悔したくない人向けに、何にいくら払い、何で元を取っているかの定点観測です。
運営ジャーナルChatGPT / Claude / Gemini を全部課金している双子パパの本音 — 月 4 万円で見えた 3 つの AI の最適配置
サイト運営者本人が ChatGPT Plus / Gemini Pro / Claude Code Max に月 4 万円課金している実体験を、Claude のインタビュー形式で記事化。1 年前との比較、妻の遊び場活用、双子の記憶問題まで、課金者だからこそ書ける一次情報を整理しました。