EFF警告「Internet Archiveのブロックでウェブの歴史が消える」｜AI対策の巻き添え被害がLemmyで527↑

2026年3月18日

電子フロンティア財団（EFF）が2026年3月、衝撃的な警告を発した。ニュースパブリッシャーがAIスクレイピング対策としてInternet Archiveをブロックしているが、それはAIを止められない一方で、ウェブの歴史的記録を永遠に消去するという。この問題はLemmyで527↑の反響を呼んだ。

EFF「Internet Archiveをブロックしても、AIスクレイピングは止まらない」

EFFの主張は明快だ。AIトレーニングに本当に使われているのはGoogleやOpenAIなどの商業クローラーであり、非営利の図書館であるInternet Archiveをブロックしても、AIへのデータ流入はほとんど変わらない。しかし失われるものは計り知れない。

Internet Archiveには現在1兆ページを超えるウェブページがアーカイブされている。Wikipediaだけでも249言語にわたって260万件以上のニュース記事のリンク先としてInternet Archiveを参照している。これらが将来アクセス不能になれば、研究者・ジャーナリスト・裁判所が依拠してきた「ウェブの記憶」が丸ごと消えることになる。

何が起きているのか｜AIスクレイピングへの過剰反応

発端は大手ニュースパブリッシャーの相次ぐブロックだ。ニーマンラボの調査によると、9カ国241のニュースサイトがInternet Archiveの4種類のクローラーbot（archive.org_bot など）を robots.txt で明示的に拒否している。主な例を挙げると以下の通りだ。

パブリッシャー	対応内容
New York Times	archive.org_bot を robots.txt に追加。ハードブロック実施
The Guardian	Archive API・Wayback Machine URLからの記事ページを除外
Reddit	2025年8月にInternet Archiveのアクセスをブロック
Le Monde系列	3種類のクローラーを拒否（データセット中で最も厳格）
Gannett / USA Today	傘下87%のサイトがブロック。CEOは「月7500万botをブロック」と発言

NYTは理由をこう説明している。「Wayback Machineは、AI企業を含む誰もが無制限にTimeのコンテンツにアクセスできる状態を、無断で提供している」。つまり、Internet Archiveが「AIへの抜け穴」になっているという認識だ。

Internet Archiveブロックの「巻き添え被害」

EFFが問題視するのは、この判断がもたらす構造的な損害だ。Internet Archiveは商業的なAI企業ではなく、非営利の図書館として機能している。アーカイブされたページは「元の記事がどう書かれていたか」を記録するほぼ唯一の手段であり、記事の改ざん・削除・書き換えを後から検証できる証拠として機能してきた。

裁判所もこの価値を認識している。Googleのブック検索を巡る判決では、コンテンツを検索・発見可能にすることは「変形的使用（transformative use）」として著作権法上のフェアユースに該当すると確立された。EFFはInternet Archiveの活動が同様の保護を受けるべきだと主張する。

Wayback Machineディレクター Mark Graham の反論：
「私たちはウェブ上の他のサービスと同様に、悪用を防ぐために多大な時間とリソースを投じている。Internet ArchiveをAIスクレイピングの温床と見なすのは事実に反する。」

Internet Archive創設者のBrewster Kahleも「パブリッシャーが図書館へのアクセスを制限すれば、市民が歴史的記録にアクセスできなくなる」と警告する。EFFが強調するのは、パブリッシャーの懸念はAI企業に向けるべきであり、図書館に向けるべきではないという点だ。

Lemmyコミュニティの反応（527↑）

このEFF記事はLemmyで527↑の支持を集め、分散型SNSのテック系コミュニティで大きな話題となった。Redditのr/technologyでも同様の反応が見られ、最もスコアされたコメントはこう要約される。

"Punishing the Internet Archive for AI scraping is like burning down the library because someone photocopied a book."

（AIスクレイピングのせいでInternet Archiveを罰するのは、誰かが本をコピーしたからといって図書館を焼き払うようなものだ）

コミュニティの反応に共通するのは、パブリッシャーの真の動機への疑念だ。「AI対策」を口実に、過去記事の検証・アーカイブそのものを封じたいのではないかという見方が多く見受けられた。Hacker Newsでも同記事が取り上げられ、「メディアが自分たちの歴史を隠す手段として使われている」というコメントが注目を集めた。

Aitly編集部の見解

AIをめぐる著作権問題は複雑だが、Internet Archiveのブロックは明らかに標的を誤っている。GPT-4やGeminiのトレーニングに使われているのは商業クローラーであり、Wayback Machineのarchive.org_botではない。NYTやGannettが守りたいのは著作権よりも、「過去の報道が検索・検証されること」への警戒感ではないかという疑念は拭えない。

ウェブは本質的に揮発性の高いメディアだ。リンク切れ、記事削除、ドメイン失効——Internet Archiveがなければ、2000年代初頭のニュースの大半はすでに存在しない。AIへの正当な懸念は、AI企業に直接向けるべきだ。その矛先を非営利図書館に向けることは、将来世代のための情報インフラを自ら破壊する行為に等しい。

参考リンク

Aitly編集部／ 2026年3月18日

Aitly編集部

AIツール比較メディア「Aitly」の編集部。ChatGPT・Claude・Geminiをはじめ、主要AIツールを実際に使い込んだうえで比較検証しています。スペック表だけではわからない「実際どうなの？」を、独自テストと料金分析でお届けします。

-テック速報, 海外の話題
-2026年, AI規制, 海外の話題

Reddit話題海外の話題

2026/3/23

RTX 3090×9枚でローカルAIを運用した正直な感想｜「6枚以上は推奨しない」r/LocalLLaMAで173コメント

r/LocalLLaMAで156アップボート・173コメントを獲得した投稿が、RTX 3090を9枚使ってローカルAIを運用した「正直な感想」を共有しています。結論は明快です──6枚以上は推奨しない。単にAIを使いたいだけならクラウドの方がいい。ソース：r/LocalLLaMA（156↑・173コメント）｜Aitly編集部 RTX 3090×9枚の正直な結論 Honest take on running 9x RTX 3090 for AI by u/ in LocalLLaMA 投稿者は「200GBの ...

Reddit話題海外の話題

2026/3/23

AI検出ツールがリンカーンのゲティスバーグ演説を「AI製」と判定｜Redditで532↑「検出ツールの限界」

r/ChatGPTで532アップボートを獲得した投稿が、AI文章検出ツールの信頼性に疑問を突きつけています。投稿者がリンカーン大統領の「ゲティスバーグ演説」（1863年）をAI検出ツールにかけたところ、「AIが書いた文章」と判定されたというものです。162年前のスピーチがAI製と判定される──この結果は、AI検出ツールの構造的な限界を端的に示しています。ソース：r/ChatGPT（532↑・40コメント）｜Aitly編集部 AI検出ツールがリンカーンの演説を「AI製」と判定 This AI text d ...

Reddit話題海外の話題

2026/3/23

NDTが超知能禁止の国際条約を提唱「AIのその分野は致命的」｜Redditで149コメントの大論争

「AIのその分野は致命的だ。誰も作るべきではない。条約で全員が合意すべきだ」。天体物理学者ニール・デグラス・タイソンの超知能禁止条約の提唱が、Redditの「r/ChatGPT」で165アップボート・149コメントの激論を巻き起こしています。著名科学者の警鐘に対し、コミュニティの反応は圧倒的に懐疑的でした。囚人のジレンマ、地政学的パワーバランス、権力の集中。コメント欄に並ぶのは「理想はわかるが実現不可能」という冷静な分析です。本記事では、タイソンの主張とRedditの反応を翻訳付きで紹介し、超知能規制の ...

Reddit話題海外の話題

2026/3/23

Alibaba、Qwen・Wanモデルのオープンソース継続を正式表明｜r/LocalLLaMAで277↑「全サイズ公開」

海外の話題 2026年3月23日｜Aitly編集部 Alibabaが自社AIモデル「Qwen」および動画生成モデル「Wan」の全シリーズ・全サイズのオープンソース公開を継続すると正式に表明した。ModelScapeの公式ツイートを引用した投稿がr/LocalLLaMAで277アップボート・25件のコメントを集めている。ローカルLLMコミュニティは歓迎ムードだが、動画生成モデル「Wan」については懐疑的な声も上がっている。 Alibabaが全サイズのQwen・Wanモデルのオープンソース継続を表明 Alib ...

Reddit話題海外の話題

2026/3/23

MiniMax M2.7がオープンウェイトで公開予定｜次世代M3はマルチモーダル・大型化も確定

海外で話題 2026年3月23日｜ Aitly編集部この記事のポイント MiniMaxが次世代モデル「M2.7」をオープンウェイトで公開すると発表さらに次のモデル「M3」はマルチモーダル対応・大型化もオープンウェイトで確定 r/LocalLLaMAで200アップボート・39コメントの反響 r/LocalLLaMAで200アップボートを集めた投稿によると、中国のAIスタートアップMiniMaxが次世代モデル「M2.7」をオープンウェイトで公開する。さらに、その次のモデル「M3」もマルチモーダル対応かつ ...

TencentがOpenClawをWeChatミニプログラムで公開｜10億人基盤でAIエージェントが本格展開

Anthropicが「Dispatch」発表｜スマホからClaude Coworkをリモート操作できる新機能