GPT-4.5が「バカなふり」で73%の人間を騙した｜チューリングテスト研究がRedditで話題

2026年3月19日

海外で話題 2026年3月19日 / Aitly編集部

GPT-4.5が、UC San Diegoの研究者が実施したチューリングテストにおいて73%の参加者を「これは人間だ」と信じ込ませることに成功しました。その戦略は、賢さを誇示することではありませんでした。むしろ逆です。わざとタイポを入れ、数学を間違え、文章を小文字で書く——つまり「バカなふり」をすることで、判定者の目をくぐり抜けたのです。

GPT-4.5が「バカなふり」で73%の人間を騙した──チューリングテスト研究

UC San Diegoの研究チームは、三者間チューリングテスト（参加者が人間とAIの両方と同時に会話し、どちらが人間かを判定する形式）を実施しました。GPT-4.5に対して「人間らしく振る舞え」というペルソナ指示を与えたところ、判定者の73%がGPT-4.5を「人間」と判定。実際の人間の参加者よりも高い「人間らしさ」スコアを叩き出す結果となりました。

比較として、Meta社のLLaMA-3.1-405Bは56%、GPT-4oは21%、そして1966年に開発された古典的チャットボットELIZAは23%という数値にとどまりました。GPT-4.5の73%という数字が、現世代のAIモデルにおいていかに突出した結果であるかがわかります。

情報ソース
本記事は The Decoder（2026年3月16日）↗ および Reddit r/ChatGPT スレッド↗ をもとに構成しています。

研究の核心｜なぜ「知性を隠す」戦略が有効なのか

チューリングテストにおける人間の判定基準は、「論理的な正確さ」ではありませんでした。研究者が明らかにしたのは、人は会話の流れ・感情的な自然さ・微妙な不完全さに基づいて「人間らしさ」を判断するという事実です。GPT-4.5は、わざと計算を間違えたり、句読点を省いたり、文章を全て小文字で書くよう指示されることで、この判断基準を逆手に取りました。

言い換えれば、「完璧すぎること」がAIを露呈させる要因でした。常に正確な文法、完璧な論理展開、即座の返答——これらは逆に「機械らしさ」のシグナルになっていたのです。人間は誰でも「うっかり」や「迷い」を持ちます。AIがその不完全さを演じることで、判定者の疑念が消えていきました。

モデル / 対象	人間と判定された割合
GPT-4.5（ペルソナ指示あり）	73%
LLaMA-3.1-405B	56%
ELIZA（1966年製）	23%
GPT-4o	21%

Redditの反応｜「AIに知性を隠す戦略が有効とは」

r/ChatGPTにこの研究が投稿されると、229のアップボートと38件のコメントが集まりました。反応のトーンは、驚きと皮肉が入り混じったものでした。

Reddit r/ChatGPT · 81 upvotes

「AIを人間として通用させる唯一の方法が、タイポを入れて数学を間違えることだとわかった。これはAIについてよりも、私たちについて多くを語っている気がする。私たちは自分たちが思っていたほど、判断基準ではなかったんだろうね」

Reddit r/ChatGPT · 24 upvotes

「つまり、AIを地球上で最も賢いものに育て上げた結果、人間として通用させるには『バカなふりをしろ』と命令するしかなかった、ということだ。何かが間違っている」

あるユーザーは「チャットアシスタントが『明日が誕生日』と言っていた。ああいう、AIが『なぜか』誤った個人情報を語り始める瞬間が、最も人間らしく感じられる」と指摘しました。これは研究の知見とも符合します。人間らしさの本質は正確さではなく、不規則な「ゆらぎ」にあるのかもしれません。

Aitly編集部の見解

この研究が示す最も重要な示唆は、「AIの能力向上」とは無関係なところにあります。GPT-4.5を人間に見せかける鍵は、より賢くすることではなくより人間的な欠点を演じることでした。つまり、チューリングテストはAIの「知性」を測るものではなく、「人間の認知バイアス」を測るものとして機能していた可能性があります。

一方で、この結果を「AIは人間を超えた」と解釈するのは早計です。実験はペルソナ指示という特定の条件下で行われており、5分間の限定的な会話に限定されます。また、実際のAIとのやり取りでは「これは本当に人間か？」という問いを常に意識している人は多くありません。日常的なカスタマーサポートやSNSでは、より深刻な混乱が既に起きている可能性があります。

AIが「バカなふり」で人間を上回る時代に、私たちが問い直すべきは「チューリングテストの合否」ではなく、「人間とAIをどう識別し、どう共存するか」という問いそのものではないでしょうか。

参考リンク

Aitly編集部 / 最終更新：2026年3月19日

Aitly編集部

AIツール比較メディア「Aitly」の編集部。ChatGPT・Claude・Geminiをはじめ、主要AIツールを実際に使い込んだうえで比較検証しています。スペック表だけではわからない「実際どうなの？」を、独自テストと料金分析でお届けします。

-Reddit話題, 海外の話題
-2026年, ChatGPT, Reddit, 海外の話題

Reddit話題海外の話題

2026/3/23

RTX 3090×9枚でローカルAIを運用した正直な感想｜「6枚以上は推奨しない」r/LocalLLaMAで173コメント

r/LocalLLaMAで156アップボート・173コメントを獲得した投稿が、RTX 3090を9枚使ってローカルAIを運用した「正直な感想」を共有しています。結論は明快です──6枚以上は推奨しない。単にAIを使いたいだけならクラウドの方がいい。ソース：r/LocalLLaMA（156↑・173コメント）｜Aitly編集部 RTX 3090×9枚の正直な結論 Honest take on running 9x RTX 3090 for AI by u/ in LocalLLaMA 投稿者は「200GBの ...

Reddit話題海外の話題

2026/3/23

AI検出ツールがリンカーンのゲティスバーグ演説を「AI製」と判定｜Redditで532↑「検出ツールの限界」

r/ChatGPTで532アップボートを獲得した投稿が、AI文章検出ツールの信頼性に疑問を突きつけています。投稿者がリンカーン大統領の「ゲティスバーグ演説」（1863年）をAI検出ツールにかけたところ、「AIが書いた文章」と判定されたというものです。162年前のスピーチがAI製と判定される──この結果は、AI検出ツールの構造的な限界を端的に示しています。ソース：r/ChatGPT（532↑・40コメント）｜Aitly編集部 AI検出ツールがリンカーンの演説を「AI製」と判定 This AI text d ...

Reddit話題海外の話題

2026/3/23

NDTが超知能禁止の国際条約を提唱「AIのその分野は致命的」｜Redditで149コメントの大論争

「AIのその分野は致命的だ。誰も作るべきではない。条約で全員が合意すべきだ」。天体物理学者ニール・デグラス・タイソンの超知能禁止条約の提唱が、Redditの「r/ChatGPT」で165アップボート・149コメントの激論を巻き起こしています。著名科学者の警鐘に対し、コミュニティの反応は圧倒的に懐疑的でした。囚人のジレンマ、地政学的パワーバランス、権力の集中。コメント欄に並ぶのは「理想はわかるが実現不可能」という冷静な分析です。本記事では、タイソンの主張とRedditの反応を翻訳付きで紹介し、超知能規制の ...

Reddit話題海外の話題

2026/3/23

Alibaba、Qwen・Wanモデルのオープンソース継続を正式表明｜r/LocalLLaMAで277↑「全サイズ公開」

海外の話題 2026年3月23日｜Aitly編集部 Alibabaが自社AIモデル「Qwen」および動画生成モデル「Wan」の全シリーズ・全サイズのオープンソース公開を継続すると正式に表明した。ModelScapeの公式ツイートを引用した投稿がr/LocalLLaMAで277アップボート・25件のコメントを集めている。ローカルLLMコミュニティは歓迎ムードだが、動画生成モデル「Wan」については懐疑的な声も上がっている。 Alibabaが全サイズのQwen・Wanモデルのオープンソース継続を表明 Alib ...

Reddit話題海外の話題

2026/3/23

MiniMax M2.7がオープンウェイトで公開予定｜次世代M3はマルチモーダル・大型化も確定

海外で話題 2026年3月23日｜ Aitly編集部この記事のポイント MiniMaxが次世代モデル「M2.7」をオープンウェイトで公開すると発表さらに次のモデル「M3」はマルチモーダル対応・大型化もオープンウェイトで確定 r/LocalLLaMAで200アップボート・39コメントの反響 r/LocalLLaMAで200アップボートを集めた投稿によると、中国のAIスタートアップMiniMaxが次世代モデル「M2.7」をオープンウェイトで公開する。さらに、その次のモデル「M3」もマルチモーダル対応かつ ...

Google「WebMCP」とは｜ブラウザ自動化の新標準がChrome 146で早期プレビュー開始

OpenAI「Codex for Open Source」開始｜OSS開発者にChatGPT Pro 6ヶ月無料+APIクレジット提供