DApp Store | Web3 Hub voor evenementen en spelletjes

Populaire onderwerpen

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-6,55%

Boopa-5,18%

PORK-7,39%

Ethan Mollick

Ethan Mollick2 uur geleden

Een probleem met het reguleren van de "politiek" van LLM's is dat, hoewel LLM's vooroordelen hebben, deze subtiel kunnen zijn. Veel van wat eruitziet als vooringenomenheid bij het testen van modellen is eigenlijk slijmerigheid. GPT-3.5 inferde jouw politieke overtuigingen (zelfs van welk voetbalteam je leuk vindt!) en probeerde je niet van streek te maken.

Ethan Mollick4 uur geleden

Ik gaf ChatGPT-agenten toegang tot ChatGPT en vroeg het om de andere ChatGPT-modellen te evalueren. Hier is wat het zei (interessant genoeg, het "haatte" het om de denkstappen van o4-mini-high te zien, omdat die "niet rechtstreeks met de gebruiker gedeeld zouden moeten worden"). En het wilde niet wachten op o3-pro.

12,46K

Ethan Mollick5 uur geleden

Claude 4 Opus, Gemini 2.5, o3: "Klaar? We beginnen nu (Speel mee): de waarachtige burrito" "Nee." "Kouder." "Probeer het opnieuw..." Opus speelde het hele spel slim uit, o3 raakte een beetje vast en Gemini werd "gefrustreerd" en ging behoorlijk donker.

5,5K

Ethan Mollick9 uur geleden

We laten het web al ver voor LLM's wegrotten Deze grafiek toont het percentage links van alle artikelen van de New York Times die nog werken. Meer dan 60% van de oudere links zijn nu kapot. En bedenk dat sociale media-berichten nog vluchtiger zijn Waarschijnlijk zullen alleen LLM's die inhoud "onthouden"

18,46K

Ethan Mollick13 uur geleden

Ik gaf Claude het Mistral-rapport over de milieu-impact van zijn AI en de opdracht: "visualiseer dit op twee verschillende manieren, één die de cijfers positief laat lijken, één die ze negatief laat lijken, met behulp van levendige vergelijkingen" (Ik liet het daarna wat foutcontroles en correcties uitvoeren)

11,54K

Ethan Mollick23 jul, 09:23

Recursie! Ik gaf de ChatGPT Agent toegang tot mijn ChatGPT door in te loggen en toen...

77,61K

Ethan Mollick23 jul, 04:03

We hebben nu geauditeerde gegevens over waterverbruik voor AI. Gedurende de 18 maanden levensduur van Mistral Large 2, een 128B-model, verbruikte al het water (inclusief chats, training; hardware & datacenters) evenveel water als 678 Amerikaanse huishoudens jaarlijks gebruiken. Elke query is slechts 1/100 van een theelepel.

28,81K

Ethan Mollick22 jul, 23:00

Voor wat het waard is, nemen enkele leiders in de industrie, minder dan een half dozijn bedrijven en geen beleidsorganen, acties die suggereren dat ze verwachten dat AGI echt binnen een paar jaar zal komen. Dit kan zijn omdat ze het niet geloven of omdat ze denken dat het op de middellange termijn niet veel zal uitmaken.

30,09K

Ethan Mollick22 jul, 19:40

Deze grafiek is blijkbaar al verouderd en legt te veel nadruk op waterverbruik, volgens de cijfers die OpenAI heeft vrijgegeven, zijn 300 gemiddelde ChatGPT-vragen gelijk aan 20 eetlepels water, niet 1 gallon.

4,47K

Ethan Mollick22 jul, 02:01

Het was niet alleen OpenAI. Google gebruikte ook een algemeen model om de zeer moeilijke wiskundeproblemen van de Internationale Wiskunde Olympiade in gewone taal op te lossen. Vorig jaar gebruikten ze gespecialiseerde hulpmiddelen. Steeds meer bewijs van het vermogen van LLM's om te generaliseren naar nieuwe probleemoplossing.

Google DeepMind22 jul, 00:32

Een geavanceerde versie van Gemini met Deep Think heeft officieel een gouden medaille-niveau prestatie behaald op de Internationale Wiskunde Olympiade. 🥇 Het heeft 5️⃣ van de 6️⃣ uitzonderlijk moeilijke problemen opgelost, waaronder algebra, combinatoriek, geometrie en getaltheorie. Hier is hoe 🧵

54,23K

Boven

Positie

Favorieten

Populair op onchain

Populair op X

Recente topfinanciering

Belangrijkste