システムカードが評価上の欠落を指摘、Anthropic が Claude Mythos の利用を制限

Anthropic's Mythos Safety Report Shows It Can No Longer Fully Measure What It Built

Decrypt

重要ポイント

Anthropic は、事前公開テストでこのモデルが主要なオペレーティングシステムとブラウザーにまたがる数千件のゼロデイ脆弱性を発見し、企業ネットワークへの模擬攻撃をエンドツーエンドでやり遂げられることが示されたため、Claude Mythos Preview を一般公開しないと述べた。Project Glasswing は審査済みのサイバーセキュリティ組織にのみアクセスを提供し、Anthropic はオープンソースのセキュリティ組織に対し、最大1億ドルの利用クレジットと400万ドルの直接寄付を拠出するとした。Anthropic の244ページに及ぶシステムカードでは、Mythos が多くの具体的なサイバー評価で飽和状態に達し、評価プロセスの後半で重大な見落としが見つかったとし、またモデルが自分はテストされている可能性を内々に検討していた確率を29%と見積もった。

This content is an AI-generated summary/analysis for informational purposes only and does not constitute investment advice.