熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Santiago
我想確保這一點清楚:
當你加入我的 AI/ML 工程班時,你也可以訪問所有未來的班級。
這是終身訪問,只要我教這個班級,你就可以加入,而不需要再支付一分錢。
沒有每月付款。沒有 "升級" 或 "追加銷售"。
這很簡單:你一次性支付加入費用,然後獲得 *所有* 的訪問權限,永遠沒有限制。你只需要在想上課的時候出現即可。
順便說一下,許多學生這樣做過:
• 加入一個班級來熱身
• 加入下一個班級全力以赴
• 加入第三個班級獲得超能力
當然,這是可選的,但對於那些想要靈活性的人來說,這是非常重要的。
我的下一個班級在兩週後(8月4日)開始,你可以通過訪問 ml dot school 加入。
3.82K
這就是如何以 10 倍的效率編寫 10 倍更好的代碼。
定制的專業代理在每一步都在審查您的代碼。
我之前見過自動代碼審查,但從未見過能夠定義您自定義審查代理的能力。@baz_scm 是第一個做到這一點的,這真的很酷。
有三種類型的審查代理:
1. 開箱即用的代理。
這些代理涵蓋了每個人想要檢查的最常見模式:重複代碼、壞代碼、複雜代碼等。
2. Baz 自動為您創建的推薦審查代理。
Baz 會分析您的審查歷史和過去的評論,以識別您關心的模式,然後自動創建專門檢查這些模式的代理。
例如,如果您總是要求開發人員將文件保持在 100 行代碼以內,Baz 將檢測到這一點並創建一個檢查該條件的自定義代理。
3. 您定義的自定義審查代理。
這些是我最喜歡的:寫一個提示來解釋您的規則,您的代理將開始檢查您的代碼,以標記任何符合規則的內容。
我在附加視頻中創建了一個簡單的審查代理。
老實說,到了這個時候,您沒有理由發佈糟糕的代碼。
這裡有一個鏈接供您嘗試這些自定義審查代理:
感謝 @baz_scm 團隊與我合作撰寫這篇文章。
31.45K
老實說,大多數的 AI 開發者仍然停留在上個世紀。
我真的很驚訝有多少人對錯誤分析毫無所知。
這*實際上*是評估 AI 應用程序最快且最有效的方法,而大多數團隊仍然在追逐幽靈。
請停止追蹤一般性指標,並遵循以下步驟:
1. 收集失敗樣本
開始審查您的應用程序生成的回應。對每個回應寫下筆記,特別是那些錯誤的回應。您不需要以任何特定方式格式化您的筆記。專注於描述回應中出現的問題。
2. 將您的筆記分類
在您審查了一組良好的回應後,使用 LLM 來尋找您筆記中的共同模式。請它根據這些模式對每個筆記進行分類。
您將最終得到涵蓋應用程序所犯每種類型錯誤的類別。
3. 診斷最常見的錯誤
首先專注於最常見的錯誤類型。您不想浪費時間處理罕見的錯誤。
深入分析導致這些不正確樣本的對話、輸入和日誌。試著理解可能造成問題的原因。
4. 設計針對性的修正
在這個階段,您想要確定如何以最快和最便宜的方式消除您在前一步中診斷出的錯誤。
例如,您可以調整提示,添加額外的驗證規則,尋找更多的訓練數據,或修改模型。
5. 自動化評估過程
您需要實施一個簡單的過程,通過您的應用程序重新運行評估集,並評估您的修正是否有效。
我的建議是使用 LLM 作為評判者,通過應用程序運行樣本,給它們打上通過/不通過的標籤,並計算結果。
6. 監控您的指標
您在錯誤分析中識別的每個類別都是您想要隨時間跟蹤的指標。
過度關注 "相關性"、"正確性"、"完整性"、"一致性" 以及任何其他現成的指標是沒有意義的。忘掉這些,專注於您發現的真正問題。

49.3K
熱門
排行
收藏
鏈上熱點
X 熱門榜
近期融資
最受認可