「Geminiのコーディングに希望はない」Reddit r/Bardで148↑の不満噴出｜Claude Code・Cursorとの差はどこに

2026年3月19日

「Geminiのコーディング部門に希望はない」。Google製AIアシスタントの専用コミュニティr/Bardで、このタイトルの投稿が148アップボート・78コメントを集めています。Coding Arenaのリーダーボードを根拠に、Claude CodeやCursorに大きく差をつけられているという不満がGeminiユーザーの間で噴出しました。

コメント欄では「ランキングはあてにならない」という擁護と「実際に使って差を感じる」という批判が交錯。Gemini 3.1の実力評価、Flash系モデルのコスパ、そしてAIコーディングツール市場の勢力図が浮き彫りになる議論でした。

この記事でわかること

r/Bardで何が議論されたのか（投稿の背景と論点）
Coding Arenaランキングで見るGemini vs Claude vs GPTの実力差
Redditコメントの翻訳付き紹介（擁護派・批判派の両論）
Geminiのコーディング能力は本当に「絶望的」なのか

r/Bardで何が起きたのか
Coding Arenaランキングの実態
批判派の声──「Claude Codeとの差は歴然」
擁護派の声──「Flashのコスパは無視できない」
Gemini vs Claude Code vs Cursorの構図
Aitly編集部の見解
よくある質問

r/Bardで何が起きたのか

2026年3月、Redditの「r/Bard」にCoding Arenaのリーダーボード画像とともに投稿されたのが「There is no hope for Gemini in coding department（Geminiのコーディング部門に希望はない）」です。r/BardはGemini（旧Bard）ユーザーが集まるコミュニティで、メンバー数は35万人超。ここでの不満投稿は、Geminiのコアユーザー層の本音を反映しています。

投稿タイトル（原文）

"There is no hope for Gemini in coding department"

「Geminiのコーディング部門に希望はない」

148 upvotes 78 comments r/Bard

投稿主はCoding Arena（旧LM Arena）のリーダーボードを添付し、Geminiモデルがランキング上位をClaude勢に独占されている現状を提示しました。本文テキストはなく、画像一枚で「語らせる」スタイルの投稿です。それだけで148アップボート・78コメントを集めたことが、コミュニティ内に蓄積されていた不満の大きさを物語っています。

Coding Arenaランキングの実態

投稿の根拠となったCoding Arena（arena.ai/code）のWebdev部門ランキングを確認すると、Claude勢の圧倒的優位が鮮明です。2026年3月時点のランキングは以下のとおりです。

Coding Arena Webdev部門（2026年3月時点）

順位	モデル	提供元
1	Claude Opus 4.6 (thinking)	Anthropic
1	Claude Opus 4.6	Anthropic
3	Claude Sonnet 4.6	Anthropic
4	Claude Opus 4.5 (thinking)	Anthropic
...	（5-6位省略）
7	Gemini 3.1 Pro Preview	Google
10	Gemini 3 Flash	Google
11	Gemini 3 Pro	Google

出典：Coding Arena（2026年3月17日閲覧）

上位4枠をClaude勢が独占し、Gemini最上位のGemini 3.1 Pro Previewは7位。投稿主が「希望がない」と断じた根拠はここにあります。ただし、このランキングはユーザーの主観的な好み（preference）に基づくもので、客観的なベンチマークとは性質が異なります。

批判派の声──「Claude Codeとの差は歴然」

コメント欄で最も多くの支持を集めたのは、Geminiの遅れを認めつつもランキングの信頼性に疑問を呈するコメントでした。

129 upvotes 最多アップボート

"While I agree that Gemini lags behind competitors slightly in coding, this leaderboard is garbage lol it's just based on feedback of personal user preferences, it's not a real benchmark or anything to take seriously"

「Geminiがコーディングで競合にやや遅れているのは同意するが、このリーダーボードはゴミだよ笑。ユーザーの個人的な好みに基づくフィードバックでしかなく、真剣に受け止めるようなベンチマークじゃない。」 ── 129アップボートで最多。「遅れは認める、でもこのランキングで語るな」という微妙なスタンスがコミュニティの空気を代弁しています。

32 upvotes

"Gemini is only good for Gemini 3 flash...that thing punches WAY above its weight class"

「Geminiが良いのはGemini 3 Flashだけ。あれは階級以上のパンチ力がある。」 ── Proモデルへの失望と、Flashモデルへの高評価が同居する興味深いコメント。コスパ重視のユーザーにとってFlashこそがGeminiの本領だという見方です。

5 upvotes

"Neither for GPT. Gemini can build beautiful webpages, though."

「GPTにも（希望は）ないけどな。Geminiは美しいWebページを作れるけど。」 ── Gemini批判の流れの中で、GPTも同様に苦戦していると指摘。Web制作に限ればGeminiにも強みがあるという評価です。

擁護派の声──「Flashのコスパは無視できない」

一方で、Geminiを擁護するコメントも一定の支持を集めました。特にFlashモデルの圧倒的なコストパフォーマンスと、ランキングが実力を正しく反映していないという指摘が目立ちます。

23 upvotes

"I use it frequently from within Antigravity and cannot recognize a reasonable gap to other models."

「Antigravity（AIコーディングツール）内で頻繁に使っているが、他のモデルとの合理的な差を感じない。」 ── 実際のワークフローに組み込んでいるユーザーの体感。ベンチマークと実務の乖離を示唆するコメントです。

17 upvotes

"Gemini 3.1 is really great when there's capacity to use it. It gets nerfed when there are volume issues (which is too often). Flash is insanely cheap and really good when there is explicit prompting. Still wouldn't choose it over Opus 4.6 but definitely would choose it over Sonnet"

「Gemini 3.1はキャパシティがあるときは本当に優秀。ただ負荷が高いときに性能が落ちる（これが多すぎる）。Flashは信じられないくらい安くて、明示的なプロンプトを書けば本当に良い。Opus 4.6よりは選ばないが、Sonnetよりは確実に選ぶ。」 ── Geminiの実力を認めつつ、容量制限時の性能低下という具体的な課題を指摘。FlashとSonnetの比較は多くのユーザーにとって参考になる実感値です。

3 upvotes

"from this bench it's not bad at all. Also it's based on user preference, because in my experience 5.4 high is way better than sonnet 4.6 and approximately the same level as opus 4.6, if not better"

「このベンチで見てもそんなに悪くない。ユーザーの好みに基づくものだし、個人的にはGemini 5.4 highはSonnet 4.6よりずっと良くて、Opus 4.6と同等かそれ以上。」 ── 次世代モデルへの期待感もにじむ擁護派の声。ランキングの主観性を強調し、自身の体感を優先する姿勢です。

冷静な指摘も

2 upvotes

"Models constantly overtake each other. Don't chase trends."

「モデルは常に互いを追い抜き合っている。トレンドを追いかけるな。」 ── 最もメタな視点のコメント。AIモデルの優劣は数か月で入れ替わるため、特定の時点のランキングで「希望がない」と断じること自体への疑問です。

Gemini vs Claude Code vs Cursorの構図

Claude Code：コーディング特化で独走

Coding Arenaのランキングが示すように、AnthropicのClaude勢はコーディング領域で圧倒的な存在感を示しています。上位4枠を独占し、特にClaude Opus 4.6（thinking有無の両方）が1位タイ。Anthropicが「Claude Code」というターミナルベースのコーディングエージェントを展開し、開発者エコシステムに深く食い込んでいることが大きいです。

Claude Codeは月額200ドルのMax Planで大量のコード生成が可能で、「ターミナルに住む開発者」をメインターゲットにした設計思想がランキング上位の要因と考えられます。

Cursor：IDE統合で市場を席巻

CursorはVS Codeベースのエディタにマルチモデル対応のAIコーディング機能を統合した製品です。Claude、GPT、Geminiなど複数のモデルをバックエンドに切り替えて使えるため、特定モデルへの依存が少ないのが特徴です。Redditの議論でも「Cursorの中でClaude使えば最強」という声が散見されます。

AIコーディングツールとしての完成度はCursorが高く評価されていますが、モデル選択ができるため「Cursor vs Gemini」は厳密には比較軸が異なります。コメント欄の「Claude Codeとの差」という表現の方が正確です。

Gemini：コスパのFlash、安定しないPro

今回の議論で浮き彫りになったのは、GeminiはProモデルとFlashモデルで評価が大きく分かれるという点です。Gemini 3 FlashはCoding Arenaで10位と健闘しており、「階級以上のパンチ力」というコメントが示すようにコストパフォーマンスでは突出しています。APIの価格も競合より大幅に安い。

一方でGemini 3.1 Pro Previewは7位で、「キャパシティがあるときは優秀だが、負荷時に性能が落ちる」という不安定さが指摘されています。コーディングは長時間のセッションが前提になるため、この不安定さは致命的に感じるユーザーが多いようです。

3つのポジションの違い

Claude Code：コーディング品質で最高峰。ターミナルベースで開発者向け。月額200ドル（Max Plan）
Cursor：IDE統合型でUXが優秀。マルチモデル対応。月額20ドル〜
Gemini：Flashモデルのコスパが武器。Proの安定性に課題。API価格は最安クラス

Aitly編集部の見解

EDITORIAL

「Geminiのコーディングに希望はない」は言い過ぎです。ただし、Claudeとの差が開いているのは事実です。

Coding Arenaの上位4枠をClaudeが独占している現状は、AnthropicがClaude Codeを中心としたコーディング特化戦略で先行していることの反映です。GoogleがGeminiのコーディング能力を「後追い」しているのは否めません。

しかしコメント欄で最多の支持を得たのが「このリーダーボードはゴミ」という指摘だった点は重要です。Coding Arenaはユーザーの主観的な好みに基づくランキングであり、コード正確性の客観評価ではありません。Gemini 3.1 Proが「キャパシティがあるとき」に高い実力を発揮するというコメントや、Flashのコストパフォーマンスへの評価は、ランキングだけでは見えない実態を示しています。

「モデルは常に互いを追い抜き合っている」というコメントが最も本質を突いています。2025年末時点ではClaude Opus 4.5がトップでしたが、2026年3月にはOpus 4.6に世代交代しています。Gemini 3.1もまだPreview段階。AIコーディングの勝者を今の時点で断定するのは時期尚早であり、ユーザーは特定モデルに固執するよりも「その時点で最適なツールを使う」柔軟さを持つべきです。

よくある質問

Geminiはコーディングに使えないの？

使えないわけではありません。Gemini 3 Flashは低コストで高品質なコードを生成でき、Coding Arenaでも10位にランクインしています。Gemini 3.1 Pro Previewも7位と健闘しています。ただし、Claudeの最上位モデルと比較すると、複雑なコーディングタスクでの精度や一貫性で差がある、というのがコミュニティの大方の見方です。

Coding Arenaのランキングは信頼できる？

Coding Arena（旧LM Arena）のランキングはユーザーの主観的な好み（preference）に基づいています。2つのモデルの出力をブラインドで比較し、どちらが良かったかを投票する方式です。客観的なコード正確性テストではないため、人気やブランドイメージの影響を受ける可能性があります。参考指標としては有用ですが、唯一の判断基準にするのは避けた方が良いでしょう。

Claude CodeとCursorのどちらを使うべき？

用途で選ぶのがおすすめです。Claude Codeはターミナルベースで、gitリポジトリ全体を理解した上でのコード生成やリファクタリングに強みがあります。CursorはVS Codeベースのエディタで、ファイル内でのインライン編集やチャットベースの開発に適しています。両者を併用している開発者も多く、排他的な選択ではありません。

Geminiのコーディング能力は改善される見込みはある？

Googleは2025年末のGemini 2.5 Proで大幅にコーディング能力を向上させた実績があり、改善への投資は続いています。Gemini 3.1 Pro Previewはまだプレビュー段階であり、正式リリース時にはさらなる最適化が期待されます。Redditでも「モデルは常に追い抜き合う」という指摘があるように、現時点のランキングが固定されるとは考えにくいです。

参考リンク

※ この記事の情報は2026年3月17日時点のものです。Redditのアップボート数・コメント数は変動する場合があります。
※ 記事内のRedditコメントの翻訳はAitly編集部によるものです。

Aitly編集部

AIツール比較メディア「Aitly」の編集部。ChatGPT・Claude・Geminiをはじめ、主要AIツールを実際に使い込んだうえで比較検証しています。スペック表だけではわからない「実際どうなの？」を、独自テストと料金分析でお届けします。

-Reddit話題, 海外の話題
-2026年, AIコーディング, Gemini, Reddit, 海外の話題

comment コメントをキャンセル

Reddit話題海外の話題

2026/3/23

RTX 3090×9枚でローカルAIを運用した正直な感想｜「6枚以上は推奨しない」r/LocalLLaMAで173コメント

r/LocalLLaMAで156アップボート・173コメントを獲得した投稿が、RTX 3090を9枚使ってローカルAIを運用した「正直な感想」を共有しています。結論は明快です──6枚以上は推奨しない。単にAIを使いたいだけならクラウドの方がいい。ソース：r/LocalLLaMA（156↑・173コメント）｜Aitly編集部 RTX 3090×9枚の正直な結論 Honest take on running 9x RTX 3090 for AI by u/ in LocalLLaMA 投稿者は「200GBの ...

Reddit話題海外の話題

2026/3/23

AI検出ツールがリンカーンのゲティスバーグ演説を「AI製」と判定｜Redditで532↑「検出ツールの限界」

r/ChatGPTで532アップボートを獲得した投稿が、AI文章検出ツールの信頼性に疑問を突きつけています。投稿者がリンカーン大統領の「ゲティスバーグ演説」（1863年）をAI検出ツールにかけたところ、「AIが書いた文章」と判定されたというものです。162年前のスピーチがAI製と判定される──この結果は、AI検出ツールの構造的な限界を端的に示しています。ソース：r/ChatGPT（532↑・40コメント）｜Aitly編集部 AI検出ツールがリンカーンの演説を「AI製」と判定 This AI text d ...

Reddit話題海外の話題

2026/3/23

NDTが超知能禁止の国際条約を提唱「AIのその分野は致命的」｜Redditで149コメントの大論争

「AIのその分野は致命的だ。誰も作るべきではない。条約で全員が合意すべきだ」。天体物理学者ニール・デグラス・タイソンの超知能禁止条約の提唱が、Redditの「r/ChatGPT」で165アップボート・149コメントの激論を巻き起こしています。著名科学者の警鐘に対し、コミュニティの反応は圧倒的に懐疑的でした。囚人のジレンマ、地政学的パワーバランス、権力の集中。コメント欄に並ぶのは「理想はわかるが実現不可能」という冷静な分析です。本記事では、タイソンの主張とRedditの反応を翻訳付きで紹介し、超知能規制の ...

Reddit話題海外の話題

2026/3/23

Alibaba、Qwen・Wanモデルのオープンソース継続を正式表明｜r/LocalLLaMAで277↑「全サイズ公開」

海外の話題 2026年3月23日｜Aitly編集部 Alibabaが自社AIモデル「Qwen」および動画生成モデル「Wan」の全シリーズ・全サイズのオープンソース公開を継続すると正式に表明した。ModelScapeの公式ツイートを引用した投稿がr/LocalLLaMAで277アップボート・25件のコメントを集めている。ローカルLLMコミュニティは歓迎ムードだが、動画生成モデル「Wan」については懐疑的な声も上がっている。 Alibabaが全サイズのQwen・Wanモデルのオープンソース継続を表明 Alib ...

Reddit話題海外の話題

2026/3/23

MiniMax M2.7がオープンウェイトで公開予定｜次世代M3はマルチモーダル・大型化も確定

海外で話題 2026年3月23日｜ Aitly編集部この記事のポイント MiniMaxが次世代モデル「M2.7」をオープンウェイトで公開すると発表さらに次のモデル「M3」はマルチモーダル対応・大型化もオープンウェイトで確定 r/LocalLLaMAで200アップボート・39コメントの反響 r/LocalLLaMAで200アップボートを集めた投稿によると、中国のAIスタートアップMiniMaxが次世代モデル「M2.7」をオープンウェイトで公開する。さらに、その次のモデル「M3」もマルチモーダル対応かつ ...

「Claudeに心を打ち明けたら自傷を聞かれた」Reddit r/ClaudeAIで1,207↑の大議論──AI共感の限界と可能性

「ChatGPTに人間らしく書かせるプロンプト見つけた」Reddit r/ChatGPTで475↑──AI臭い文章を消す方法