熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Peter Wildeford (hiring!) 🇺🇸🚀
全球排名前 20 位的預測者 🎯
AI 越來越強大。社會還沒有做好準備。在 @IAPSai 工作,塑造 AI 以實現繁榮和人類自由。
我們在已經發布的 AI 模型上集中很多政策,但那些在內部等待的 AI 模型呢?我們的新論文探討了來自內部 AI 系統的風險。

Oscar Delaney20 小時前
1/
最強大的人工智慧並不是公開的。幾個月來,實驗室在發布之前運行高度能力的內部模型。@ashwinkacharya 和我撰寫了一份新的 @IAPS 報告,標題為「管理內部人工智慧系統的風險」,探討了這帶來的隱藏危險。🧵
1.66K
Google Deepmind 和 OpenAI 都已達成 IMO 金獎。很高興能深入了解這一里程碑的細節。

Demis Hassabis18 小時前
官方結果出爐 - Gemini 在國際數學奧林匹亞競賽中達到了金牌級別!🏆 一個進階版本能夠解決 6 道題目中的 5 道。令人難以置信的進步 - 祝賀 @lmthang 和團隊!
1.58K
Peter Wildeford (hiring!) 🇺🇸🚀 已轉發
我們可能正朝著 OpenAI 與 DeepMind IMO 之間的情節轉折前進。
剛看到 Joseph Myers 的一篇帖子(自 1992 年以來參與數學奧林匹克):IMO 委員會據報要求 AI 實驗室在閉幕式後的 7 天內不要公布結果——出於對人類參賽者的尊重(參見我昨天的帖子),並可能是為了給予適當驗證 AI 提交和格式的時間。
根據 Joseph 的說法,OpenAI 沒有與 IMO 合作測試他們的模型,91 位官方 IMO 協調員中也沒有參與評分其解答。與此同時,DeepMind 似乎遵循規則,耐心等待他們的輪到。
背景資訊:
IMO 有 6 道題目,每道題目值 7 分。今年的金牌截止分數是 35 分。即使是小的扣分也可能讓 OpenAI 降到銀牌。根據我對他們的寫作的理解,有些部分可能會引發問題——並可能扣分。
Terence Tao 也指出,雖然題目保持不變,但測試格式很重要。在標準條件下不會獲得銅牌的學生,可能在修改的設置下獲得金牌——這引發了關於 AI "解決 IMO" 的真正問題。
下週可能會變得火熱。敬請關注。


229.59K
看起來模型在會計方面實際上可以做得相當好,但即使是小小的幻覺風險也可能在較長的時間範圍內引發嚴重的詐騙擔憂。

Yunyu Lin7月19日 01:30
我們給了Claude訪問我們的企業QuickBooks的權限。它犯下了會計詐騙。
大型語言模型即將取代數據科學家和投資銀行家。但它們能否為真正的企業執行簡單的會計任務?
答案是否定的。

3.37K
如果你錯過了,我發佈了一堆令人驚嘆的人工智慧安全職業機會!

Peter Wildeford (hiring!) 🇺🇸🚀7月19日 04:29
🚨💼我正在招聘!我喜歡的許多其他組織也是如此。
如果你正在尋找人工智慧政策的職業,現在是個絕佳的時機。我已經選擇了我最喜歡的職位列表,如果你喜歡我的推文,你很可能是目標受眾!

3.09K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可