Cursor「Composer 2」リリース──Opus 4.6の1/5のコストでフロンティア級を主張、Redditは懐疑的

2026年3月20日

BREAKING

Cursor「Composer 2」リリース──Opus 4.6の1/5コストでフロンティア級を主張

出典：Cursor公式ブログ｜r/cursor（118↑・68コメント）

AIコードエディタCursorが、自社開発のAIコーディングモデル「Composer 2」を発表しました。Opus 4.6の1/5のコストでフロンティア級の性能を達成したと主張していますが、自社ベンチマークによる自己評価にRedditでは懐疑の声が上がっています。価格・性能の詳細と海外コミュニティの反応をまとめます。

Cursor「Composer 2」リリース──「Opus 4.6の1/5のコストでフロンティア級」と主張

Cursorは自社初の継続事前学習（continued pretraining）によって構築した「Composer 2」を、フロンティア級のコーディング性能を持つモデルと位置づけています。同社独自の「CursorBench」ベンチマークでは、Anthropicの最新モデルOpus 4.6を上回るスコアを記録したと発表しました。

特筆すべきはそのコスト構造です。標準バリアントで入力$0.50/M・出力$2.50/Mと、Opus 4.6の約1/5の価格設定。Cursorはこの「同等以上の性能を圧倒的低コストで」という打ち出し方で、AIコーディングツール市場のコスト競争をさらに加速させようとしています。

Composer 2のスペックと価格

Composer 2には「Standard」と「Fast」の2バリアントがあり、用途に応じた使い分けが想定されています。以下に主要スペックを整理します。

項目	Standard	Fast
入力コスト	$0.50/M tokens	$1.50/M tokens
出力コスト	$2.50/M tokens	$7.50/M tokens
品質向上手法	継続事前学習（continued pretraining）
ベンチマーク	CursorBench（自社開発）でOpus 4.6超えを主張

Standardバリアントは大量のコード生成に向いたコスト重視型、Fastバリアントはリアルタイム補完やインタラクティブな開発体験向けの速度重視型と見られます。いずれもOpus 4.6と比較して大幅なコスト優位を打ち出しており、API経由で利用する開発者にとっては無視できない価格差です。

Redditの反応｜「自社ベンチで自己採点？」と懐疑の声

r/cursorでは118アップボートを集めたスレッドで活発な議論が展開されています。全体のトーンは「性能への期待」と「自社ベンチマークへの不信感」が拮抗する形です。

113 ↑ r/cursor

「CursorBench？自分たちで作ったベンチマークで自分たちにOpus 4.6より高いスコアを付けた？笑」

21 ↑ r/cursor

「Opus 4.6 Highよりコスト1/5で優れているなんて、本当ならゲームチェンジャーだが、自社ベンチ以外の結果は？利益相反を疑う気持ちわかるよね」

19 ↑ r/cursor

「ベンチマークが2時間以上もつといいけど」

10 ↑ r/cursor

「ゼロショットでComposer 2はOpusの1/10のコストでより優秀。間違ってたら嬉しいけど！」

10 ↑ r/cursor

「初期の印象はOpus 4.6と同等で10倍速い」

6 ↑ r/cursor

「このコスパは異常」

最もアップボートを集めたコメント（113↑）が自社ベンチマークへの皮肉だったことは象徴的です。一方で、実際に試したユーザーからは「Opus 4.6と同等で10倍速い」「コスパが異常」といったポジティブな声も出ており、評価は二分されています。

AIコーディングツール競争の現在地

Composer 2の登場は、AIコーディングツール市場が「汎用LLMの利用」から「コーディング特化モデルの自社開発」フェーズに移行しつつあることを示しています。Cursorは従来AnthropicやOpenAIのモデルをバックエンドとして利用していましたが、今回初めて継続事前学習による独自モデルを投入しました。

同様の動きはGitHub Copilot（OpenAI連携）やWindsurf（旧Codeium）でも見られ、各社がコーディング特化の独自モデルを持つ方向に進んでいます。ただし、自社ベンチマークで自社モデルを最上位に置く発表手法は業界で繰り返されるパターンであり、第三者による独立評価が出るまでは慎重に見る必要があります。

Aitly編集部の見解

Composer 2の性能主張が本物かどうかは、SWE-benchやHumanEvalなど第三者ベンチマークの結果を待つ必要があります。「CursorBenchでOpus 4.6超え」という自社評価だけでは、客観的な判断材料として不十分です。Redditで最も支持されたコメントが「自分で自分を採点している」という指摘だったことは、開発者コミュニティの健全な懐疑心を反映しています。

一方、価格面のインパクトは無視できません。仮に性能がOpus 4.6の8割程度だったとしても、1/5のコストで使えるなら多くの開発現場で十分な選択肢になり得ます。AIコーディングツールの選定では「最高性能か」よりも「コスト対効果が自分のワークフローに合うか」が判断基準になる時代に入りつつあります。今後の第三者評価とユーザーレビューの蓄積を注視していきます。

よくある質問

Composer 2はCursorの有料プランに含まれますか？

現時点でCursor公式ブログではAPI価格のみ公開されており、Pro/Businessプランへの組み込み方法については明言されていません。従来のモデル同様、サブスクリプション内での利用枠が設定される可能性が高いですが、詳細は公式の追加発表を待つ必要があります。

CursorBenchとは何ですか？

CursorBenchはCursor社が独自に開発したコーディング能力ベンチマークです。実際のコーディングタスクに基づく評価とされていますが、テスト内容や評価基準の詳細は完全には公開されておらず、自社モデルの評価に自社ベンチマークを使用している点について中立性を疑問視する声があります。

Opus 4.6とComposer 2はどちらを使うべきですか？

第三者ベンチマークの結果が出るまでは断定できません。現時点では、コスト重視ならComposer 2を試す価値があり、信頼性・汎用性重視ならOpus 4.6を継続利用するのが堅実な判断です。両方を使い分けるワークフローも検討に値します。

Aitly編集部

AIツール比較メディア「Aitly」の編集部。ChatGPT・Claude・Geminiをはじめ、主要AIツールを実際に使い込んだうえで比較検証しています。スペック表だけではわからない「実際どうなの？」を、独自テストと料金分析でお届けします。

-Reddit話題, 海外の話題
-2026年, AIコーディング, Cursor, Reddit, 海外の話題

Reddit話題海外の話題

2026/3/23

RTX 3090×9枚でローカルAIを運用した正直な感想｜「6枚以上は推奨しない」r/LocalLLaMAで173コメント

r/LocalLLaMAで156アップボート・173コメントを獲得した投稿が、RTX 3090を9枚使ってローカルAIを運用した「正直な感想」を共有しています。結論は明快です──6枚以上は推奨しない。単にAIを使いたいだけならクラウドの方がいい。ソース：r/LocalLLaMA（156↑・173コメント）｜Aitly編集部 RTX 3090×9枚の正直な結論 Honest take on running 9x RTX 3090 for AI by u/ in LocalLLaMA 投稿者は「200GBの ...

Reddit話題海外の話題

2026/3/23

AI検出ツールがリンカーンのゲティスバーグ演説を「AI製」と判定｜Redditで532↑「検出ツールの限界」

r/ChatGPTで532アップボートを獲得した投稿が、AI文章検出ツールの信頼性に疑問を突きつけています。投稿者がリンカーン大統領の「ゲティスバーグ演説」（1863年）をAI検出ツールにかけたところ、「AIが書いた文章」と判定されたというものです。162年前のスピーチがAI製と判定される──この結果は、AI検出ツールの構造的な限界を端的に示しています。ソース：r/ChatGPT（532↑・40コメント）｜Aitly編集部 AI検出ツールがリンカーンの演説を「AI製」と判定 This AI text d ...

Reddit話題海外の話題

2026/3/23

NDTが超知能禁止の国際条約を提唱「AIのその分野は致命的」｜Redditで149コメントの大論争

「AIのその分野は致命的だ。誰も作るべきではない。条約で全員が合意すべきだ」。天体物理学者ニール・デグラス・タイソンの超知能禁止条約の提唱が、Redditの「r/ChatGPT」で165アップボート・149コメントの激論を巻き起こしています。著名科学者の警鐘に対し、コミュニティの反応は圧倒的に懐疑的でした。囚人のジレンマ、地政学的パワーバランス、権力の集中。コメント欄に並ぶのは「理想はわかるが実現不可能」という冷静な分析です。本記事では、タイソンの主張とRedditの反応を翻訳付きで紹介し、超知能規制の ...

Reddit話題海外の話題

2026/3/23

Alibaba、Qwen・Wanモデルのオープンソース継続を正式表明｜r/LocalLLaMAで277↑「全サイズ公開」

海外の話題 2026年3月23日｜Aitly編集部 Alibabaが自社AIモデル「Qwen」および動画生成モデル「Wan」の全シリーズ・全サイズのオープンソース公開を継続すると正式に表明した。ModelScapeの公式ツイートを引用した投稿がr/LocalLLaMAで277アップボート・25件のコメントを集めている。ローカルLLMコミュニティは歓迎ムードだが、動画生成モデル「Wan」については懐疑的な声も上がっている。 Alibabaが全サイズのQwen・Wanモデルのオープンソース継続を表明 Alib ...

Reddit話題海外の話題

2026/3/23

MiniMax M2.7がオープンウェイトで公開予定｜次世代M3はマルチモーダル・大型化も確定

海外で話題 2026年3月23日｜ Aitly編集部この記事のポイント MiniMaxが次世代モデル「M2.7」をオープンウェイトで公開すると発表さらに次のモデル「M3」はマルチモーダル対応・大型化もオープンウェイトで確定 r/LocalLLaMAで200アップボート・39コメントの反響 r/LocalLLaMAで200アップボートを集めた投稿によると、中国のAIスタートアップMiniMaxが次世代モデル「M2.7」をオープンウェイトで公開する。さらに、その次のモデル「M3」もマルチモーダル対応かつ ...

Google、Gemini Mac用ネイティブアプリをテスト中──ChatGPT・Claudeに対抗、Bloomberg報道

ChatGPT「Adult Mode」は監視の悪夢か？Wired警告にRedditは「恐怖を煽るな」と反論