Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Chci, aby bylo jasné, že:
Když se připojíte k mé kohortě AI/ML Engineering, získáte přístup i ke každé budoucí kohortě.
Je to doživotní přístup, takže pokud budu učit kohortu, můžete se k ní připojit, aniž byste museli platit další cent.
Neexistují žádné měsíční platby. Neexistují žádné "upgrady" nebo "upselly".
Je to jednoduché: Za připojení zaplatíte jednou a získáte přístup ke *všemu*, navždy. Žádné limity. Stačí se jen ukázat ve třídě, kdykoli budete chtít.
Mimochodem, mnoho studentů to udělalo:
• Připojte se k jedné kohortě, abyste se zahřáli
• Připojte se k další kohortě, abyste šli do toho naplno
• Připojit se ke třetí kohortě se superschopnostmi
Samozřejmě, že je to volitelné, ale je to obrovské pro ty z vás, kteří chtějí flexibilitu.
Moje další kohorta začíná za 2 týdny (4. srpna) a můžete se připojit tím, že půjdete do školy ml dot.
3,82K
Takto můžete napsat 10x lepší kód s 10x menším úsilím.
Vlastní specializovaní agenti, kteří kontrolují váš kód na každém kroku.
Viděl jsem automatické kontroly kódu již dříve, ale nikdy s možností definovat vlastní agenty pro recenzenty. @baz_scm je první, komu se to podařilo, a je to docela v pohodě.
Existují tři typy agentů pro recenzenty:
1. Ty, které vyjdou z krabice.
Tito agenti pokrývají nejběžnější vzory, které chce každý zkontrolovat: duplicitní kód, poškozený kód, složitý kód atd.
2. Doporučení agenti recenzentů, které pro vás Baz automaticky vytváří.
Baz analyzuje vaši historii recenzí a minulé komentáře, aby identifikoval vzorce, které vás zajímají, a poté automaticky vytvoří agenty specializované na kontrolu těchto vzorců.
Pokud například vždy požádáte své vývojáře, aby soubory uchovávali pod 100 řádků kódu, Baz to zjistí a vytvoří vlastního agenta, který to zkontroluje.
3. Vlastní agenti recenzentů, které definujete.
Toto jsou moje oblíbené: Napište výzvu vysvětlující vaše pravidla a váš agent začne kontrolovat váš kód, aby označil vše, co odpovídá pravidlům.
Jednoduchého agenta recenzenta jsem vytvořil v přiloženém videu.
Upřímně řečeno, v tuto chvíli nemáte žádnou omluvu pro zasílání špatného kódu.
Zde je odkaz, kde můžete vyzkoušet tyto vlastní agenty pro recenzenty:
Děkuji týmu @baz_scm za spolupráci se mnou na tomto příspěvku.
31,44K
Upřímně řečeno, většina vývojářů AI je stále zaseknutá v minulém století.
Udivuje mě, jak málo lidí ví o analýze chyb.
Jedná se *doslova* o nejrychlejší a nejefektivnější způsob hodnocení aplikací umělé inteligence a většina týmů se stále honí za duchy.
Přestaňte prosím sledovat obecné metriky a postupujte podle následujících kroků:
1. Sbírejte vzorky poruch
Začněte kontrolovat odpovědi vygenerované vaší aplikací. Ke každé odpovědi si napište poznámky, zejména k těm, které byly chybné. Poznámky nemusíte formátovat žádným konkrétním způsobem. Zaměřte se na popis toho, co se v odpovědi pokazilo.
2. Kategorizujte své poznámky
Poté, co jste zkontrolovali dobrou sadu odpovědí, vezměte si LLM a požádejte ho, aby ve vašich poznámkách našel společné vzory. Požádejte ho, aby každou notu na základě těchto vzorů klasifikoval.
Skončíte s kategoriemi pokrývajícími všechny typy chyb, které vaše aplikace udělala.
3. Diagnostikujte nejčastější chyby
Začněte tím, že se zaměříte na nejčastější typ chyby. Nechcete ztrácet čas prací se vzácnými chybami.
Přejděte k podrobnostem o konverzacích, vstupech a protokolech, které vedou k těmto nesprávným ukázkám. Pokuste se pochopit, co by mohlo být příčinou problémů.
4. Navrhněte cílené opravy
V tomto okamžiku chcete zjistit, jak co nejrychleji a nejlevněji odstranit chyby, které jste diagnostikovali v předchozím kroku.
Můžete například upravit výzvy, přidat další ověřovací pravidla, najít další trénovací data nebo upravit model.
5. Automatizujte proces hodnocení
Je třeba implementovat jednoduchý proces, který znovu spustí sadu vyhodnocení prostřednictvím vaší aplikace a vyhodnotí, zda byly vaše opravy účinné.
Doporučuji použít LLM-as-a-Judge k prohnání vzorků aplikací, jejich ohodnocení pomocí tagu PASS/FAIL a výpočtu výsledků.
6. Sledujte své metriky
Každá kategorie, kterou jste identifikovali během analýzy chyb, je metrika, kterou chcete sledovat v průběhu času.
Nikam se nedostanete, pokud budete posedlí "relevancí", "správností", "úplností", "koherencí" a dalšími nestandardními metrikami. Zapomeňte na ně a zaměřte se na skutečné problémy, které jste našli.

49,3K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější