Anthropic「Claude Fable 5」の過剰な安全対策が物議

Anthropic「Claude Fable 5」の過剰な安全対策が物議

AI開発大手のAnthropicが発表した最新の最先端AIモデル「Claude Fable 5」において、基本的な生物学や化学に関する質問に対して回答を拒否したり、旧世代のモデルへ自動的に処理を切り替えたりする挙動が確認され、ユーザーの間で議論を呼んでいます。非常に高度な処理能力を持つ一方で、設定された安全ガードレールが広範すぎるため、一般的な学習や研究に支障が出ている状況です。

これまで、AIモデルの安全性向上と実用性の両立は業界全体の大きな課題となってきました。今回の事象は、高度な二面性(デュアルユース)のリスクを持つAIを一般公開するにあたり、開発企業が直面している過渡期的なジレンマを浮き彫りにしています。

ニュースソースに記載されている内容

米ITメディア「The Verge」などの報道によると、確認されている主な事実および各所の主張は以下の通りです。

  • 基本的な科学質問の制限大学生レベルの一般的な生物学の課題や、生分解性プラスチックの予測、分子に関する単純な化学質問など、危険性のない基本レベルのコンテンツに対しても、Fable 5が回答を制限する事例が多発しています。
  • 旧モデルへの自動ルーティング生物学、化学、サイバーセキュリティに関連するプロンプトが入力された際、AIが危険性を過剰に検知(偽陽性)し、自動的に前世代のモデル(Claude Opus 4.8など)へリダイレクトして処理を行う仕様になっていることが確認されました。
  • Anthropic側の見解と今後の対応Anthropic側は、最先端モデル「Fable 5」を早期に安全にリリースすることを最優先した結果、安全ガードレールが一時的に過度に広範な設定になっていることを認めています。この制限は意図的なものであり、今後は分類器をチューニングして不要な拒否を減らしていく方針です。また、信頼された一部の研究者や企業向けには、制限の少ない上位版「Mythos 5」へのアクセスを提供する信頼プログラムを準備しているとしています。

外部情報による補足・背景

本件をより深く理解するために、現在のAI業界の動向を踏まえた背景および周辺情報を補足します。

  • 「Fable 5」と「Mythos 5」の位置づけAnthropicが新たに展開を開始した「Mythos」世代のモデルのうち、一般ユーザーや企業向けに安全対策(セーフガード)を組み込んで提供されているのが「Claude Fable 5」です。これに対して、より制限が少なく、軍事・政府機関や最先端の科学研究に特化した最上位モデルが「Claude Mythos 5」とされています。
  • デュアルユース(二面性)リスクへの警戒最先端のAIは、高度なサイバーセキュリティの脆弱性診断や、生物兵器・化学物質の合成といった「悪用が可能な知識」を生成できるリスク(デュアルユーリスク)を孕んでいます。今回の厳しい制限の背景には、こうした最悪のシナリオを回避するための安全ファーストな思想があります。
  • ユーザーコミュニティでの反応開発者や研究者が集まるコミュニティ(Reddit等)では、従来のOpus 4.8などで問題なく動作していたプログラムコードや学術的な議論が、Fable 5では「分子(molecule)」という単語が含まれるだけで拒否されるといった不満が報告されています。安全性を重視するあまり、ユーザー体験や透明性が犠牲になっているという批判も一部で上がっています。

まとめ

今回のClaude Fable 5における生物学・化学質問の制限は、フロンティアAIモデルのリリースにおいて「安全性」と「有用性」のバランスを取ることがいかに困難であるかを示しています。

Anthropicは今後数週間をかけて、過剰に反応している分類器の精度を向上させ、一般ユーザーにとっても実用的なレベルへ安全ガードレールを狭めていくとしています。また、悪用リスクの高い領域を扱う検証プログラムの運用を通じて、段階的に専門的な科学研究への活用パスを整える見通しです。

AIが人間と同等以上の知能を持つようになる中で、このような「見えない制限」や安全策のあり方は、今後のAI利用における重要な議論の焦点であり続けると考えられます。

Claude Fable is too scared to teach you about the powerhouse of the cell
Good luck asking Anthropic’s Fable about biology.