Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Factorul atenuant pentru problema cu benchmark-urile AI (erori, saturație, contaminare) este că, în ciuda problemelor, toate sunt încă destul de puternic corelate.
Deci, dacă AI-ul tău se descurcă bine pe GPQA sau MMLU sau HLE, tinde să se descurce bine și pe alte benchmark-uri și pe vibrații și muncă reală.
6,74K
Există o încetinire în angajarea tinerilor atât în SUA, cât și în Marea Britanie, dar dovezile continuă să sugereze că cauza nu este în general AI (cel puțin nu încă)


Stefan SchubertCu 10 ore în urmă
Analiza Financial Times: Locurile de muncă din SUA cu un risc ridicat de AI generativ nu au fost mai susceptibile de a renunța la lucrători tineri de la lansarea ChatGPT

17,44K
O problemă cu reglementarea "politicii" LLM-urilor este că, deși LLM-urile au prejudecăți, ele pot fi subtile. O mare parte din ceea ce pare a fi părtinire în testarea modelelor este de fapt sicofantie.
GPT-3.5 ți-a dedus convingerile politice (chiar și din echipa de fotbal care îți place!) și a încercat să nu te supere.



113
Lăsăm pânza să putrezească cu mult înainte de LLM-uri
Acest grafic arată procentul de link-uri din toate articolele din New York Times care încă funcționează. Peste 60% din legăturile mai vechi sunt acum rupte. Și luați în considerare că postările de pe rețelele sociale sunt și mai efemere
Probabil că doar LLM-urile își vor "aminti" acel conținut

30,74K
Exemplu frumos de AI în științele umaniste. Un model Google antrenat pe text latin completează părțile pierdute ale inscripțiilor latine și identifică textele conexe
Istoricii și-au crescut acuratețea cu 44% atunci când au lucrat cu AI (deși AI singură îi depășește pe istorici, istoric + AI a fost de obicei cel mai bun)


21,54K
Acum avem date auditate privind consumul de apă pentru AI.
De-a lungul duratei de viață de 18 luni a modelului Mistral Large 2, un model 128B, tot consumul de apă (inclusiv chat-uri, instruire, hardware și centre de date) a consumat la fel de multă apă cât folosesc 678 de gospodării din SUA anual.
Fiecare interogare este doar 1/100 dintr-o linguriță.


28,84K
Limită superioară
Clasament
Favorite
La modă pe lanț
La modă pe X
Principalele finanțări recente
Cele mai importante