Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
Descifrar @allen_ai de IA, modelos abiertos, RLHF, ajustes, etc
Contacto vía email.
Escribe @interconnectsai
Escribió el libro de RLHF
Corredor de montaña
Nathan Lambert reposteó
¿OpenAI ha logrado RL de episodios muy largos con este modelo experimental?
Captura de pantalla del artículo de @natolambert sobre "Qué viene después con el aprendizaje por refuerzo".
Nathan dice en este artículo: Donde los métodos actuales generan tokens de 10K-100K por respuesta para problemas matemáticos o de código durante el entrenamiento, el tipo de problemas a los que las personas discuten la aplicación del entrenamiento de RL de próxima generación serían de 1M-100M tokens por respuesta. Esto implica envolver varias llamadas de inferencia, mensajes e interacciones con un entorno dentro de un episodio en el que se actualiza la política.
Tal vez este avance sea una combinación de ambos: RL de episodios muy largos y escalando TTC a 1M-100M tokens por respuesta!

2.28K
¿Es "malo" que todo el mundo esté destilando o entrenando en modelos chinos? Si bien no es directamente malo, hay un gran componente de poder blando.
Muchas finalizaciones que hablan de los ideales socialistas chinos / valores de la RPC que se filtran en futuros modelos de IA / se extienden por todo Internet.

8.9K
jajajajajajaja los mejores modelos del US Open son gemma 3 27b y @nvidia's finetune de llama 3.1


lmarena.ai17 jul, 23:21
🚨 ÚLTIMA HORA: ¡El Kimi-K2 de @Kimi_Moonshot es ahora el modelo abierto #1 en la Arena!
Con más de 3K votos de la comunidad, ocupa el puesto # 5 en general, superando a DeepSeek como el mejor modelo abierto.
¡Enhorabuena al equipo de Moonshot por este impresionante hito! La tabla de clasificación ahora cuenta con 7 proveedores diferentes entre los 15 primeros, el más competitivo de todos los tiempos.
Más información en el hilo 🧵

24.85K
Estoy totalmente de acuerdo con Ross. Es mucho más fácil reunir talento que crear una organización que produzca top models una tras otra.
Tuve un montón de conversaciones a principios de este año específicamente sobre las compensaciones y escribí un artículo detallado al respecto.


Ross Taylor16 jul, 11:42
Es curioso que la gente en este sitio piense que los grandes esfuerzos de LLM están ligados al talento en lugar de a la organización.
La diferencia de talento nunca ha sido grande entre las principales organizaciones. La mayor parte de la diferencia en los resultados se debe a factores organizativos, como asignar el cálculo a las apuestas correctas y permitir que la buena investigación e ingeniería triunfen sobre la política destructiva.
Sin embargo, esto hace que la historia sea menos sexy. La gente prefiere creer que los avances son hechos por genios solitarios, en lugar del esfuerzo acumulativo de muchas personas anónimas y reacias a las redes sociales, respaldadas por una organización que permite que ganen las mejores ideas y maneja grandes egos.
Si no me cree, considere cómo algunos investigadores de repente ganan o pierden impacto y productividad cuando cambian de organización. ¿Fue porque ganaron o perdieron puntos de coeficiente intelectual? 🙂
(Lo siento, esto es muy obvio para cualquiera que haya trabajado en estos laboratorios, ¡pero no lo creerías basándote en el feed X en este momento!)
17.56K
La contratación de "ingenieros impulsados por la misión"...
MechaHitler...
Posición de Relaciones Gubernamentales...
Parodia de pico

xAI14 jul, 23:11
Anunciamos Grok for Government, un conjunto de productos que hacen que nuestros modelos de frontera estén disponibles para los clientes del gobierno de los Estados Unidos
Estamos especialmente entusiasmados con dos nuevas asociaciones para nuestros socios del gobierno de EE. UU
1) un nuevo contrato del Departamento de Defensa de EE.UU.
2) que nuestros productos estén disponibles para su compra a través del horario de la Administración de Servicios Generales (GSA). Esto permite que todos los departamentos, agencias u oficinas del gobierno federal compren productos xAI
Estamos contratando ingenieros motivados por la misión que quieran unirse a la causa
76
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas