DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-0,45 %

Boopa-7,87 %

PORK-0,07 %

Nathan Lambert

Descubrir @allen_ai de IA, modelos abiertos, RLHF, ajustes, etc. Contacto vía email. Escribe @interconnectsai Escribió el libro de la RLHF Corredor de montaña

Nathan LambertHace 3 horas

Mucha gente con la que he hablado no está tan preocupada por lo que esté haciendo Grok porque saben que los modelos de Grok siempre son olvidados un par de semanas después de su lanzamiento 🪦 💀

632

Nathan LambertHace 3 horas

No caer en la exageración de OpenAI sobre el nuevo modelo de oro IMO con "RL de propósito general" y cualquier otra "innovación". Google también obtuvo el oro IMO (más difícil que dominar AIME), pero recuerda, las ideas simples son las que mejor escalan.

18,67K

Nathan Lambert republicó

Krishna KaasyapHace 6 horas

¿Ha logrado OpenAI el RL de episodios muy largos con este modelo experimental? Captura de pantalla del artículo de @natolambert sobre "Qué viene después con el aprendizaje por refuerzo". Nathan dice en este artículo: donde los métodos actuales están generando de 10K a 100K tokens por respuesta para problemas de matemáticas o código durante el entrenamiento, el tipo de problemas que la gente discute aplicar al entrenamiento de RL de próxima generación serían de 1M a 100M tokens por respuesta. Esto implica envolver múltiples llamadas de inferencia, indicaciones e interacciones con un entorno dentro de un episodio contra el cual se actualiza la política. ¡Quizás este avance sea una combinación de ambos: RL de episodios muy largos y escalado de TTC a 1M-100M tokens por respuesta!

3,2K

Nathan Lambert18 jul, 05:32

¿Es "malo" que todos estén destilando / entrenando modelos chinos? Si bien no es directamente malo, hay un gran componente de poder blando. Muchas conclusiones que hacen un discurso sobre los ideales socialistas chinos / los valores de la RPC que se filtran en futuros modelos de IA / se difunden por toda la internet.

8,9K

Nathan Lambert18 jul, 00:26

hahahahahahaha los mejores modelos abiertos de EE. UU. son gemma 3 27b y el ajuste fino de @nvidia de llama 3.1

lmarena.ai17 jul, 23:21

🚨 ÚLTIMA HORA: ¡Kimi-K2 de @Kimi_Moonshot es ahora el modelo abierto número 1 en la Arena! Con más de 3K votos de la comunidad, ocupa el puesto #5 en general, superando a DeepSeek como el mejor modelo abierto. ¡Felicitaciones enormes al equipo de Moonshot por este impresionante hito! La tabla de clasificación ahora presenta 7 proveedores diferentes en el top 15, ¡la más competitiva que ha sido nunca! Más información en el hilo 🧵

24,86K

Nathan Lambert17 jul, 07:53

Es un gran fracaso de política que EE. UU. no pueda acoger las principales conferencias de IA debido a problemas de visado.

312,64K

Nathan Lambert17 jul, 01:32

Estoy totalmente de acuerdo con Ross. Es mucho más fácil reunir talento que crear una organización que produzca modelos de primer nivel uno tras otro. Tuve un montón de conversaciones a principios de este año específicamente sobre los compromisos y escribí un artículo detallado al respecto.

Ross Taylor16 jul, 11:42

Es gracioso que la gente en este sitio piense que los esfuerzos de LLM importantes están limitados por el talento en lugar de por la organización. La diferencia de talento nunca ha sido grande entre las organizaciones principales. La mayor parte de la diferencia en los resultados se debe a factores organizacionales, como asignar recursos de computación a las apuestas correctas y permitir que una buena investigación y ingeniería triunfen sobre la política destructiva. Sin embargo, esto hace que la historia sea menos atractiva. A la gente le gusta creer que los avances son realizados por genios solitarios, en lugar del esfuerzo acumulativo de muchas personas anónimas, reacias a las redes sociales, apoyadas por una organización que permite que las mejores ideas triunfen y gestiona grandes egos. Si no me crees, considera cómo algunos investigadores de repente ganan o pierden impacto y productividad cuando cambian de organización. ¿Fue porque ganaron o perdieron puntos de CI? 🙂 (Lo siento, esto es súper obvio para cualquiera que realmente haya trabajado en estos laboratorios, ¡pero no lo creerías basándote en el feed de X en este momento!)

17,56K

Nathan Lambert15 jul, 12:15

Kimi K2 sigue siendo subestimado fuera del Twitterverse.

29,43K

Nathan Lambert15 jul, 02:13

Interconnects AI también adquirió windsurf.

10,73K

Nathan Lambert14 jul, 23:27

Contratando "ingenieros motivados por una misión"... MechaHitler... Posición de Relaciones Gubernamentales... Parodia máxima

xAI14 jul, 23:11

Anunciando Grok para el Gobierno - un conjunto de productos que hacen que nuestros modelos de frontera estén disponibles para los clientes del Gobierno de los Estados Unidos. Estamos especialmente emocionados por dos nuevas asociaciones para nuestros socios del Gobierno de EE. UU. 1) un nuevo contrato del Departamento de Defensa de EE. UU. 2) nuestros productos disponibles para su compra a través del programa de la Administración de Servicios Generales (GSA). Esto permite que cada departamento, agencia u oficina del gobierno federal compre productos de xAI. Estamos contratando ingenieros motivados por la misión que quieran unirse a la causa.

Parte superior

Clasificación

Favoritos

En tendencia on-chain

En tendencia en X

Principales fondos recientes

Más destacado