Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ethan Mollick
Een probleem met het reguleren van de "politiek" van LLM's is dat, hoewel LLM's vooroordelen hebben, deze subtiel kunnen zijn. Veel van wat eruitziet als vooringenomenheid bij het testen van modellen is eigenlijk slijmerigheid.
GPT-3.5 inferde jouw politieke overtuigingen (zelfs van welk voetbalteam je leuk vindt!) en probeerde je niet van streek te maken.



76
Ik gaf ChatGPT-agenten toegang tot ChatGPT en vroeg het om de andere ChatGPT-modellen te evalueren.
Hier is wat het zei (interessant genoeg, het "haatte" het om de denkstappen van o4-mini-high te zien, omdat die "niet rechtstreeks met de gebruiker gedeeld zouden moeten worden"). En het wilde niet wachten op o3-pro.


12,46K
We laten het web al ver voor LLM's wegrotten
Deze grafiek toont het percentage links van alle artikelen van de New York Times die nog werken. Meer dan 60% van de oudere links zijn nu kapot. En bedenk dat sociale media-berichten nog vluchtiger zijn
Waarschijnlijk zullen alleen LLM's die inhoud "onthouden"

18,46K
Ik gaf Claude het Mistral-rapport over de milieu-impact van zijn AI en de opdracht: "visualiseer dit op twee verschillende manieren, één die de cijfers positief laat lijken, één die ze negatief laat lijken, met behulp van levendige vergelijkingen"
(Ik liet het daarna wat foutcontroles en correcties uitvoeren)


11,54K
We hebben nu geauditeerde gegevens over waterverbruik voor AI.
Gedurende de 18 maanden levensduur van Mistral Large 2, een 128B-model, verbruikte al het water (inclusief chats, training; hardware & datacenters) evenveel water als 678 Amerikaanse huishoudens jaarlijks gebruiken.
Elke query is slechts 1/100 van een theelepel.


28,81K
Voor wat het waard is, nemen enkele leiders in de industrie, minder dan een half dozijn bedrijven en geen beleidsorganen, acties die suggereren dat ze verwachten dat AGI echt binnen een paar jaar zal komen.
Dit kan zijn omdat ze het niet geloven of omdat ze denken dat het op de middellange termijn niet veel zal uitmaken.
30,09K
Het was niet alleen OpenAI.
Google gebruikte ook een algemeen model om de zeer moeilijke wiskundeproblemen van de Internationale Wiskunde Olympiade in gewone taal op te lossen. Vorig jaar gebruikten ze gespecialiseerde hulpmiddelen.
Steeds meer bewijs van het vermogen van LLM's om te generaliseren naar nieuwe probleemoplossing.

Google DeepMind22 jul, 00:32
Een geavanceerde versie van Gemini met Deep Think heeft officieel een gouden medaille-niveau prestatie behaald op de Internationale Wiskunde Olympiade. 🥇
Het heeft 5️⃣ van de 6️⃣ uitzonderlijk moeilijke problemen opgelost, waaronder algebra, combinatoriek, geometrie en getaltheorie. Hier is hoe 🧵

54,23K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste