Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Santiago
Jeg vil være sikker på at dette er klart:
Når du blir med i AI/ML Engineering-kohorten min, får du også tilgang til alle fremtidige kohorter.
Det er livstidstilgang, så så lenge jeg underviser kohorten, kan du bli med uten å betale en krone til.
Det er ingen månedlige betalinger. Det er ingen "oppgraderinger" eller "mersalg".
Det er enkelt: Du betaler én gang for å bli med, og får tilgang til *alt*, for alltid. Ingen grenser. Du trenger bare å møte opp til timen når du vil.
Forresten, mange studenter har gjort dette:
• Bli med i en kohort for å varme opp
• Bli med i neste kohort for å gå all in
• Bli med i en tredje kohort med superkrefter
Dette er selvfølgelig valgfritt, men det er stort for de av dere som ønsker fleksibiliteten.
Mitt neste kull starter om 2 uker (4. august), og du kan bli med ved å gå på ml dot skole.
3,82K
Jeg er ikke lenger sikker på hva jeg skal tenke om denne boken.
Det var en fantastisk bok i en tid da de fleste av disse ideene virket verdifulle, men den er også ansvarlig for noen av de største grusomhetene jeg har vært vitne til.
Jeg anbefaler ikke lenger folk å lese den. Jeg har ikke vært på en stund.

28,71K
Slik skriver du 10 ganger bedre kode med 10 ganger mindre innsats.
Tilpassede, spesialiserte agenter som gjennomgår koden din hvert trinn på veien.
Jeg har sett automatiserte kodegjennomganger før, men aldri med muligheten til å definere dine tilpassede anmelderagenter. @baz_scm er den første som klarer dette, og det er ganske kult.
Det finnes tre typer anmelderagenter:
1. De som kommer ut av esken.
Disse agentene dekker de vanligste mønstrene alle ønsker å sjekke: duplisert kode, ødelagt kode, kompleks kode, etc.
2. Anbefalte anmelderagenter som Baz oppretter for deg automatisk.
Baz analyserer gjennomgangshistorikken og tidligere kommentarer for å identifisere mønstre du bryr deg om, og oppretter deretter automatisk agenter som er spesialisert på å sjekke disse mønstrene.
Hvis du for eksempel alltid ber utviklerne dine om å holde filer under 100 linjer med kode, vil Baz oppdage det og opprette en tilpasset agent som ser etter det.
3. Tilpassede anmelderagenter som du definerer.
Dette er mine favoritter: Skriv en melding som forklarer reglene dine, og agenten din vil begynne å sjekke koden din for å flagge alt som samsvarer med reglene.
Jeg opprettet en enkel anmelderagent i den vedlagte videoen.
Ærlig talt, på dette tidspunktet har du ingen unnskyldning for å sende dårlig kode.
Her er en lenke for deg å prøve disse tilpassede anmelderagentene:
Takk til @baz_scm-teamet for å samarbeide med meg om dette innlegget.
31,44K
Ærlig talt, de fleste AI-utviklere sitter fortsatt fast i forrige århundre.
Det forbløffer meg hvor få mennesker som er klar over feilanalyse.
Dette er *bokstavelig talt* den raskeste og mest effektive måten å evaluere AI-applikasjoner på, og de fleste lag sitter fortsatt fast og jager spøkelser.
Slutt å spore generiske beregninger og følg disse trinnene:
1. Samle feilprøver
Begynn å gjennomgå svarene som genereres av søknaden din. Skriv notater om hvert svar, spesielt de som var feil. Du trenger ikke å formatere notatene dine på noen bestemt måte. Fokuser på å beskrive hva som gikk galt med responsen.
2. Kategoriser notatene dine
Etter at du har gjennomgått et godt sett med svar, ta en LLM og be den om å finne vanlige mønstre i notatene dine. Be den klassifisere hver tone basert på disse mønstrene.
Du vil ende opp med kategorier som dekker alle typer feil søknaden din har gjort.
3. Diagnostiser de vanligste feilene
Begynn med å fokusere på den vanligste typen feil. Du vil ikke kaste bort tid på å jobbe med sjeldne feil.
Drill ned i samtalene, inndataene og loggene som fører til de feilaktige eksemplene. Prøv å forstå hva som kan forårsake problemene.
4. Design målrettede rettelser
På dette tidspunktet vil du finne ut hvordan du kan eliminere feilene du diagnostiserte i forrige trinn så raskt og billig som mulig.
Du kan for eksempel justere ledetekstene, legge til ekstra valideringsregler, finne flere opplæringsdata eller endre modellen.
5. Automatiser evalueringsprosessen
Du må implementere en enkel prosess for å kjøre et evalueringssett på nytt gjennom applikasjonen din og evaluere om rettelsene dine var effektive.
Min anbefaling er å bruke en LLM-as-a-Judge til å kjøre prøver gjennom applikasjonen, score dem med en PASS/FAIL-kode og beregne resultatene.
6. Hold øye med beregningene dine
Hver kategori du identifiserte under feilanalysen er en beregning du ønsker å spore over tid.
Du kommer ingen vei ved å være besatt av «relevans», «korrekthet», «fullstendighet», «sammenheng» og andre ut-av-boksen-beregninger. Glem disse og fokuser på de virkelige problemene du fant.

49,3K
Topp
Rangering
Favoritter
Trendende onchain
Trendende på X
Nylig toppfinansiering
Mest lagt merke til