Anthropic 推安全版 Fable 5 AI模型 效能超越對手

商傳媒|何映辰/台北報導
人工智慧新創公司 Anthropic 於週二(6月9日)正式向大眾發布其新一代 AI 模型 Claude Fable 5。這款模型是 Anthropic 旗下最強大「Mythos」系列的首款公眾版本,主打卓越效能並內建嚴格的安全防護措施,能有效回應複雜指令,但在敏感議題上會進行引導。
Claude Fable 5 在多項評測中表現亮眼,尤其在軟體工程、知識工作及影像辨識任務上展現超群能力。根據分析公司 Hex 的數據,Claude Fable 5 在其複雜、長時間分析任務的核心基準測試中,首次突破九成得分,較先前的 Opus 模型高出 10 個百分點。此外,該模型在衡量 AI 模型程式碼撰寫能力的 SWE-Bench-Pro 測試中,得分達 80.3%,大幅領先競爭對手 OpenAI 的 GPT-5.5(58.6%)及 Google Deepmind 的 Gemini 3.1 Pro(54.2%)。有測試者指出,Fable 5 展現了「強大的判斷力與對細微之處的關注」。
為確保模型的安全性,Claude Fable 5 內建了嚴格的防護措施。Anthropic 表示,面對網路資安、生物學及化學相關的敏感查詢,該模型會自動將約 5% 的請求轉導至效能較低的 Opus 4.8 模型回應,藉此避免潛在的濫用風險。Anthropic 委託外部專家進行了超過一千小時的「紅隊演練」(red-teaming),嘗試繞過這些限制,同時也執行錯誤懸賞計畫,但最終無人能完全解除模型的安全鎖定。即使 Anthropic 產品管理、研究與實驗室主管 Dianne Penn 舉例說明,若有大學生試圖利用 Fable 5 尋找軟體漏洞,模型將會拒絕並轉導至 Opus 4.8。
Anthropic 最初於今年四月推出代號為「Mythos Preview」的 AI 模型,並僅提供給美國聯邦政府及關鍵基礎設施相關的網路資安專業人士進行預覽測試。當時,該模型因其強大的資安漏洞識別能力,引起了科技、金融與政府領袖的高度關注,甚至引發了對於潛在金融安全風險的討論。美國聯邦政府機構儘管與 Anthropic 存在法律糾紛,也參與了對 Mythos 的測試。此前,Anthropic 曾與特朗普政府發生爭執,因拒絕解除對大規模監控和自主致命武器的限制,導致五角大廈終止了與該公司的合約。
目前,Anthropic 也向參與「Project Glasswing」計畫(Project Glasswing)的合作夥伴提供無限制版本的 Claude Mythos 5,該計畫在六月初已擴展至全球超過 15 個國家的約 200 個組織。Anthropic 計劃未來透過「更系統化的信任存取計畫」擴大更多個人和組織的存取權限。不過,高昂的運算成本是 Anthropic 面臨的挑戰之一。Fable 5 的定價為每百萬個輸入 Token(人工智慧模型處理資訊的基本單位)10 美元、每百萬個輸出 Token 50 美元,是 Opus 4.8 的兩倍。Anthropic 為了滿足運算需求,近期以每月 12.5 億美元的價格,向馬斯克(Elon Musk)旗下的 xAI(SpaceX 的一部分)租賃資料中心。Anthropic 和其主要競爭對手 OpenAI 都在過去一週內宣布已提交首次公開募股(IPO)計畫,而 SpaceX 也預計將於本週五(6月13日)首次公開發行股票,預期將打破市場紀錄。