Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Vreau să mă asigur că acest lucru este clar:
Când vă alăturați cohortei mele de inginerie AI/ML, aveți acces și la fiecare cohortă viitoare.
Este acces pe viață, așa că atâta timp cât predau cohortei, te poți alătura fără să plătești vreodată un cent.
Nu există plăți lunare. Nu există "upgrade-uri" sau "vânzări suplimentare".
Este simplu: plătiți o dată pentru a vă alătura și aveți acces la *orice*, pentru totdeauna. Fără limite. Trebuie doar să te prezinți la clasă oricând vrei.
Apropo, mulți studenți au făcut asta:
• Alăturați-vă unei cohorte pentru a vă încălzi
• Alăturați-vă următoarei cohorte pentru a merge all-in
• Să se alăture unei a treia cohorte cu superputeri
Desigur, acest lucru este opțional, dar este uriaș pentru cei dintre voi care doresc flexibilitate.
Următoarea mea cohortă începe în 2 săptămâni (4 august) și vă puteți alătura mergând la școala ml dot.
3,83K
M-am dus la culcare aseară după ce am părăsit Gemeni făcând cercetări profunde despre câteva servicii la domiciliu de care am nevoie.
M-am trezit astăzi cu zile de muncă pregătite pentru mine. Profunzimea analizei a fost "Doamne, asta este minunat!"
Nu cred că înțelegem. Nu cred că suntem pregătiți.
10,27K
Nu mai sunt sigur ce să cred despre această carte.
A fost o carte fantastică într-o perioadă în care majoritatea acestor idei păreau valoroase, dar este și responsabilă pentru unele dintre cele mai mari atrocități la care am fost martor.
Nu mai recomand oamenilor să-l citească. Nu am mai fost de ceva vreme.

28,72K
Acesta este modul în care scrii cod de 10 ori mai bun cu 10 ori mai puțin efort.
Agenți personalizați, specializați, vă revizuiesc codul la fiecare pas.
Am mai văzut revizuiri automate de cod înainte, dar niciodată cu capacitatea de a defini agenții de revizuire personalizați. @baz_scm este primul care reușește acest lucru și este destul de tare.
Există trei tipuri de agenți de evaluare:
1. Cele care ies din cutie.
Acești agenți acoperă cele mai comune modele pe care toată lumea dorește să le verifice: cod duplicat, cod defect, cod complex etc.
2. Agenți de recenzori recomandați pe care Baz îi creează automat pentru tine.
Baz analizează istoricul recenziilor și comentariile anterioare pentru a identifica modelele care vă interesează și apoi creează automat agenți specializați în verificarea acestor modele.
De exemplu, dacă le cereți întotdeauna dezvoltatorilor să păstreze fișierele sub 100 de linii de cod, Baz îl va detecta și va crea un agent personalizat care verifică acest lucru.
3. Agenți de revizuire personalizați pe care îi definiți.
Acestea sunt preferatele mele: Scrieți o solicitare în care să vă explicați regulile, iar agentul va începe să vă verifice codul pentru a semnala orice se potrivește cu regulile.
Am creat un agent recenzor simplu în videoclipul atașat.
Sincer, în acest moment, nu aveți nicio scuză pentru a trimite cod prost.
Iată un link pentru a încerca acești agenți de revizuire personalizați:
Mulțumesc echipei @baz_scm pentru colaborarea cu mine la această postare.
31,45K
Sincer, majoritatea dezvoltatorilor de inteligență artificială sunt încă blocați în ultimul secol.
Mă uimește cât de puțini oameni sunt conștienți de analiza erorilor.
Acesta este *literalmente* cel mai rapid și mai eficient mod de a evalua aplicațiile AI, iar majoritatea echipelor sunt încă blocate în urmărirea fantomelor.
Vă rugăm să opriți urmărirea valorilor generice și să urmați acești pași:
1. Colectați probe de eșec
Începeți să revizuiți răspunsurile generate de aplicația dvs. Scrieți notițe despre fiecare răspuns, în special despre cele care au fost greșeli. Nu trebuie să vă formatați notele într-un mod specific. Concentrați-vă pe descrierea a ceea ce a mers prost cu răspunsul.
2. Clasificați-vă notele
După ce ați revizuit un set bun de răspunsuri, luați un LLM și cereți-i să găsească modele comune în notele dvs. Cereți-i să clasifice fiecare notă pe baza acestor modele.
Veți ajunge la categorii care acoperă fiecare tip de greșeală pe care a făcut-o aplicația dvs.
3. Diagnosticați cele mai frecvente greșeli
Începeți prin a vă concentra pe cel mai frecvent tip de greșeală. Nu vrei să pierzi timpul lucrând cu greșeli rare.
Detaliați conversațiile, intrările și jurnalele care duc la acele eșantioane incorecte. Încercați să înțelegeți ce ar putea cauza problemele.
4. Proiectați remedieri țintite
În acest moment, doriți să determinați cum să eliminați greșelile pe care le-ați diagnosticat în pasul anterior cât mai repede și mai ieftin posibil.
De exemplu, puteți modifica solicitările, puteți adăuga reguli de validare suplimentare, puteți găsi mai multe date de antrenament sau puteți modifica modelul.
5. Automatizați procesul de evaluare
Trebuie să implementați un proces simplu pentru a rula din nou un set de evaluare prin aplicația și pentru a evalua dacă remedierile au fost eficiente.
Recomandarea mea este să utilizați un LLM-as-a-Judge pentru a rula eșantioane prin aplicație, a le evalua cu o etichetă PASS/FAIL și a calcula rezultatele.
6. Fii cu ochii pe valorile tale
Fiecare categorie pe care ați identificat-o în timpul analizei erorilor este o valoare pe care doriți să o urmăriți în timp.
Nu veți ajunge nicăieri dacă sunteți obsedat de "relevanță", "corectitudine", "completitudine", "coerență" și orice alte valori predefinite. Uită de acestea și concentrează-te pe problemele reale pe care le-ai găsit.

49,31K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante