跳轉至主要內容
行情
熱門代幣
探索熱門代幣排名,掌握最新市場動態
掃鏈
跟蹤由 Pump.Fun 等平臺推出的最新熱門 Meme 幣
牛人榜
排行、跟蹤並分析熱門交易地址
信號
獲取實時信號,解鎖市場洞察
追蹤
追蹤你最喜歡的代幣和錢包地址
DEX
幣幣兌換
交易聚合器,多路徑選擇,自由換幣
專業交易
深度數據分析,進階交易設置,為鏈上玩家打造
DeFi
市場
發現
洞察中心
Web3 世界全知道
Cryptoverse
探索不同網絡的 DApp,贏取各種獎勵
交易競技場
Cryptopedia
Giveaway
獎勵中心
Eco Hub
探索公鏈生態,鏈接無限未來
開發者中心
DEX API
通往鏈上流動性的入口
探索 DEX API
DEX API 文檔
API Key 管理
區塊鏈瀏覽器
搜索地址、交易、區塊、代幣或 ENS
X Layer
一起探索和建設 X Layer
探索 X Layer
X Layer 瀏覽器
跨鏈橋
開發者文檔
測試網水龍頭
GitHub
DApp 連接錢包
App、網頁端插件、Mini 錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
公告
返回
繁體中文
简体中文
English
Tiếng Việt
Русский
Español (Latinoamérica)
Bahasa Indonesia
Français
Deutsch
Italiano
Polski
Čeština
Română
Português (Portugal)
Português (Brasil)
Українська
Español (España)
Nederlands
العربية
日本語
Norsk (bokmål)
Suomi
Svenska
返回
返回
使用教程
學院
行情
熱門代幣
掃鏈
牛人榜
信號
追蹤
DEX
幣幣兌換
專業交易
DeFi
市場
發現
洞察中心
Cryptoverse
Eco Hub
開發者中心
DEX API
區塊鏈瀏覽器
X Layer
DApp 連接錢包
語言
貨幣
下載 OKX Wallet
Web3 指南
洞察中心
Cryptoverse
交易競技場
Cryptopedia
Giveaway
Eco hub
探索 Web3 Giveaway 活動,每週豐厚獎勵等您來領取
熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
Hosico
+4.35%
USELESS
-3.9%
IKUN
+33.87%
gib
+21.44%
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
Bonk
+1.85%
ALON
+5.4%
LAUNCHCOIN
+5.28%
GOONC
+4.03%
KLED
+2.05%
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
BOOP
+13.7%
Boopa
+4.92%
PORK
+37.7%
主頁
Misha Laskin
@reflection_ai 聯合創始人兼首席執行官。 上一篇: 特約研究科學家 @DeepMind. 雙子座RL團隊。
更多
以上內容由 AI 進行翻譯,點擊顯示原文。
Misha Laskin
7月16日 23:08
工程師花70%的時間在理解代碼,而不是編寫代碼。 這就是為什麼我們在@reflection_ai建立了Asimov。 這是為團隊和組織打造的最佳代碼研究代理。
查看討論
281.01K
1.35K
Misha Laskin 已轉發
Quentin Anthony
7月12日 16:21
我曾是這項研究中的16位開發者之一。我想談談我對開發者減速的原因和緩解策略的看法。 我會說作為一個「為什麼要聽你的?」的引子,我在我負責的問題上經歷了-38%的AI加速。我認為透明度有助於社區。
更多
1.72M
3.89K
Misha Laskin
7月10日 04:48
強化學習研究中最大的問題一直是 - 你在什麼環境中進行訓練? 過去是視頻(Atari)和棋盤(圍棋/象棋)遊戲。 但現在強化學習與大型語言模型(LLMs)一起工作,只有一個環境是重要的。那就是你的產品。
更多
Kevin Lu
7月10日 00:01
為什麼你應該停止從事強化學習研究,而應該專注於產品 // 解鎖人工智慧大規模擴展轉變的技術是互聯網,而不是變壓器 我想大家都知道數據在人工智慧中是最重要的東西,但研究人員卻選擇不去研究它。... 在可擴展的方式上,研究數據意味著什麼? 互聯網提供了豐富的數據來源,這些數據不僅豐富多樣,還提供了自然的課程,代表了人們真正關心的能力,並且是一種經濟上可行的技術,可以大規模部署——它成為了下一個標記預測的完美補充,並且是人工智慧起飛的原始湯。 如果沒有變壓器,任何數量的方法都可能起飛,我們可能會有 CNN 或狀態空間模型達到 GPT-4.5 的水平。但自從 GPT-4 以來,基礎模型並沒有顯著改善。推理模型在狹窄的領域中表現出色,但並不像 GPT-4 在 2023 年 3 月(兩年多前)那樣有巨大的飛躍。 我們在強化學習方面有一些偉大的東西,但我深深擔心我們會重蹈過去的覆轍(2015-2020 年代的強化學習),進行不重要的強化學習研究。 就像互聯網是監督預訓練的對偶一樣,什麼將是強化學習的對偶,將導致像 GPT-1 -> GPT-4 這樣的重大進展?我認為這看起來像是研究-產品共同設計。
10.62K
108
Misha Laskin 已轉發
Kasey Zhang
7月4日 01:31
使用 RL 微調小型模型很容易,以便在垂直任務上優於基礎模型。 我們開源了 Osmosis-Apply-1.7B:一個小模型,它比基礎模型更好地合併代碼(類似於 Cursor 的即時應用)。 下載和試用以下模型的連結!
更多
111.34K
1.13K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可
Uniswap
DEX
daos.fun
DeFi
PumpSwap
DEX
4
Pancake Swap
DeFi
DEX
質押
Yield
5
AutoShark Finance
DeFi
6
Beefy Finance
DeFi
7
Obric
DEX
8
KLAYswap
DeFi
DEX
質押
Yield
9
1inch Network
DeFi
DEX
流動性池
10
LayerZero
其他