Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
Descubrir @allen_ai de IA, modelos abiertos, RLHF, ajustes, etc.
Contacto vía email.
Escribe @interconnectsai
Escribió el libro de la RLHF
Corredor de montaña
Nathan Lambert republicó
¿Ha logrado OpenAI el RL de episodios muy largos con este modelo experimental?
Captura de pantalla del artículo de @natolambert sobre "Qué viene después con el aprendizaje por refuerzo".
Nathan dice en este artículo: donde los métodos actuales están generando de 10K a 100K tokens por respuesta para problemas de matemáticas o código durante el entrenamiento, el tipo de problemas que la gente discute aplicar al entrenamiento de RL de próxima generación serían de 1M a 100M tokens por respuesta. Esto implica envolver múltiples llamadas de inferencia, indicaciones e interacciones con un entorno dentro de un episodio contra el cual se actualiza la política.
¡Quizás este avance sea una combinación de ambos: RL de episodios muy largos y escalado de TTC a 1M-100M tokens por respuesta!

3,2K
¿Es "malo" que todos estén destilando / entrenando modelos chinos? Si bien no es directamente malo, hay un gran componente de poder blando.
Muchas conclusiones que hacen un discurso sobre los ideales socialistas chinos / los valores de la RPC que se filtran en futuros modelos de IA / se difunden por toda la internet.

8,9K
hahahahahahaha los mejores modelos abiertos de EE. UU. son gemma 3 27b y el ajuste fino de @nvidia de llama 3.1


lmarena.ai17 jul, 23:21
🚨 ÚLTIMA HORA: ¡Kimi-K2 de @Kimi_Moonshot es ahora el modelo abierto número 1 en la Arena!
Con más de 3K votos de la comunidad, ocupa el puesto #5 en general, superando a DeepSeek como el mejor modelo abierto.
¡Felicitaciones enormes al equipo de Moonshot por este impresionante hito! La tabla de clasificación ahora presenta 7 proveedores diferentes en el top 15, ¡la más competitiva que ha sido nunca!
Más información en el hilo 🧵

24,86K
Estoy totalmente de acuerdo con Ross. Es mucho más fácil reunir talento que crear una organización que produzca modelos de primer nivel uno tras otro.
Tuve un montón de conversaciones a principios de este año específicamente sobre los compromisos y escribí un artículo detallado al respecto.


Ross Taylor16 jul, 11:42
Es gracioso que la gente en este sitio piense que los esfuerzos de LLM importantes están limitados por el talento en lugar de por la organización.
La diferencia de talento nunca ha sido grande entre las organizaciones principales. La mayor parte de la diferencia en los resultados se debe a factores organizacionales, como asignar recursos de computación a las apuestas correctas y permitir que una buena investigación y ingeniería triunfen sobre la política destructiva.
Sin embargo, esto hace que la historia sea menos atractiva. A la gente le gusta creer que los avances son realizados por genios solitarios, en lugar del esfuerzo acumulativo de muchas personas anónimas, reacias a las redes sociales, apoyadas por una organización que permite que las mejores ideas triunfen y gestiona grandes egos.
Si no me crees, considera cómo algunos investigadores de repente ganan o pierden impacto y productividad cuando cambian de organización. ¿Fue porque ganaron o perdieron puntos de CI? 🙂
(Lo siento, esto es súper obvio para cualquiera que realmente haya trabajado en estos laboratorios, ¡pero no lo creerías basándote en el feed de X en este momento!)
17,56K
Contratando "ingenieros motivados por una misión"...
MechaHitler...
Posición de Relaciones Gubernamentales...
Parodia máxima

xAI14 jul, 23:11
Anunciando Grok para el Gobierno - un conjunto de productos que hacen que nuestros modelos de frontera estén disponibles para los clientes del Gobierno de los Estados Unidos.
Estamos especialmente emocionados por dos nuevas asociaciones para nuestros socios del Gobierno de EE. UU.
1) un nuevo contrato del Departamento de Defensa de EE. UU.
2) nuestros productos disponibles para su compra a través del programa de la Administración de Servicios Generales (GSA). Esto permite que cada departamento, agencia u oficina del gobierno federal compre productos de xAI.
Estamos contratando ingenieros motivados por la misión que quieran unirse a la causa.
82
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado