DApp Store | Piattaforma Web3 per eventi e giochi

Argomenti di tendenza

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP+4,68%

Boopa+0,85%

PORK+20,25%

samsja

Condurre la ricerca presso @PrimeIntellect

samsja ha ripubblicato

will brown20 lug, 18:32

Sono molto più propenso a dire che il *sistema* RL all'interno di OpenAI è AGI piuttosto che qualsiasi checkpoint di modello fisso che ne deriva.

4,55K

samsja19 lug, 23:25

Mi sono reso conto durante il nostro evento a Berlino che ci sono molti giovani talentuosi e ambiziosi in Europa. Solo (quasi) nessuna azienda ispiratrice per costruire il futuro né VC che abbiano il coraggio di dare loro una possibilità. Non c'è da meravigliarsi se tutti vogliono venire a sf|

Lazarz19 lug, 00:41

Berlino, sono in te

43,84K

samsja19 lug, 23:13

Open ai sarà ricordata come una delle aziende più ispiratrici di tutti i tempi

Noam Brown19 lug, 15:52

Oggi, noi di @OpenAI abbiamo raggiunto un traguardo che molti consideravano lontano anni: prestazioni da medaglia d'oro al 2025 IMO con un LLM di ragionamento generale—sotto gli stessi limiti di tempo degli esseri umani, senza strumenti. Per quanto straordinario possa sembrare, è ancora più significativo di quanto riportato nel titolo 🧵

8,27K

samsja17 lug, 17:27

Non vedo il senso di definire la dimensione del batch a livello di singola GPU nel codice. Questo significa che è necessario cambiare manualmente il parametro della dimensione del batch quando si scala l'esperimento verso l'alto o verso il basso. Immagino che storicamente sia stato fatto in codici che non hanno l'accumulo dei gradienti?

1,53K

samsja17 lug, 00:06

Dovremmo essere più preoccupati per il fatto che Thinky stia assumendo tutte le persone di PyTorch piuttosto che per Zuck che ruba talenti da OpenAI.

14K

samsja ha ripubblicato

Max Ryabinin16 lug, 07:34

Se sei all'ICML e sei interessato all'inferenza verificabile, assicurati di passare dal nostro poster! Presenteremo TOPLOC, un metodo di hashing delle attivazioni efficiente che funziona in una varietà di contesti, ad esempio cambiando le configurazioni di inferenza o anche i modelli. 16 luglio, 16:30, E-1106

1,34K

samsja ha ripubblicato

Benjamin Clavié15 lug, 19:46

Nuovo post sul blog e nuova libreria sono disponibili ora! Il BP riguarda MaxSim, perché è *ordini di grandezza* molto più esigente rispetto alla normale similarità coseno, e perché le GPU non se ne preoccupano, ma le CPU sì! La libreria è maxsim-cpu, che consente alle CPU di essere veloci e di mantenere la calma, anche.

16,86K

samsja11 lug, 22:58

vittoria assoluta @kellerjordan0

clem 🤗11 lug, 22:55

1T parameters, open-weights, just released on @huggingface!

10,2K

samsja11 lug, 03:09

Curioso di provare questo con diloco, farei comunque bs=1 sull'ottimizzatore interno e otterrei comunque i benefici del parallelismo dei dati.

Micah Goldblum10 lug, 22:12

🚨 Did you know that small-batch vanilla SGD without momentum (i.e. the first optimizer you learn about in intro ML) is virtually as fast as AdamW for LLM pretraining on a per-FLOP basis? 📜 1/n

1,86K

samsja5 lug, 22:29

anche la seniority nell'ingegneria significa essere in grado di lavorare con il debito tecnico degli altri

samsja5 lug, 21:13

Unpopular opinion but technical debt is good, it's needed to accelerate and shrink timeline

2,25K

Principali

Ranking

Preferiti

On-chain di tendenza

Di tendenza su X

Principali fondi recenti

Più popolari