熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
xAI 在沒有任何安全測試文檔的情況下推出了 Grok 4。這是魯莽的,並且違反了其他主要 AI 實驗室遵循的行業最佳實踐。
如果 xAI 要成為前沿 AI 開發者,他們應該表現得像一個。🧵
但 xAI 相較於其他前沿 AI 開發者實在是太過分了,這需要被指出。
Anthropic、OpenAI 和 Google 的發布實踐存在問題。但他們至少會做一些事情,任何事情來評估部署前的安全性並記錄發現。xAI 則沒有。
系統卡中包含什麼?首先是危險能力(DC)評估。這些評估衡量模型在協助執行可能對國家安全構成威脅的任務(如駭客攻擊或合成生物武器)方面的表現。例如,這些是Claude 4系統卡中報告的生物DC評估。

648.14K
熱門
排行
收藏