Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Bonk Eco continues to show strength amid $USELESS rally

Pump.fun to raise $1B token sale, traders speculating on airdrop

Boop.Fun leading the way with a new launchpad on Solana.

BOOP-1.21 %

Boopa-9.25 %

PORK-1.18 %

Nathan Lambert

Descifrar @allen_ai de IA, modelos abiertos, RLHF, ajustes, etc Contacto vía email. Escribe @interconnectsai Escribió el libro de RLHF Corredor de montaña

Nathan Lamberthace 2 horas

Mucha gente con la que he hablado no está tan preocupada por lo que sea que esté haciendo Grok porque saben que los modelos de Grok siempre se olvidan un par de semanas después del lanzamiento 🪦 💀

626

Nathan Lamberthace 2 horas

No caer en la publicación exagerada de OpenAI sobre el nuevo modelo de oro de la OMI con "RL de propósito general" y cualquier otra cosa "avance". Google también obtuvo oro en mi opinión (más difícil que dominar AIME), pero recuerde, las ideas simples escalan mejor.

8.69K

Nathan Lambert reposteó

Krishna Kaasyaphace 5 horas

¿OpenAI ha logrado RL de episodios muy largos con este modelo experimental? Captura de pantalla del artículo de @natolambert sobre "Qué viene después con el aprendizaje por refuerzo". Nathan dice en este artículo: Donde los métodos actuales generan tokens de 10K-100K por respuesta para problemas matemáticos o de código durante el entrenamiento, el tipo de problemas a los que las personas discuten la aplicación del entrenamiento de RL de próxima generación serían de 1M-100M tokens por respuesta. Esto implica envolver varias llamadas de inferencia, mensajes e interacciones con un entorno dentro de un episodio en el que se actualiza la política. Tal vez este avance sea una combinación de ambos: RL de episodios muy largos y escalando TTC a 1M-100M tokens por respuesta!

2.28K

Nathan Lambert18 jul, 05:32

¿Es "malo" que todo el mundo esté destilando o entrenando en modelos chinos? Si bien no es directamente malo, hay un gran componente de poder blando. Muchas finalizaciones que hablan de los ideales socialistas chinos / valores de la RPC que se filtran en futuros modelos de IA / se extienden por todo Internet.

8.9K

Nathan Lambert18 jul, 00:26

jajajajajajaja los mejores modelos del US Open son gemma 3 27b y @nvidia's finetune de llama 3.1

lmarena.ai17 jul, 23:21

🚨 ÚLTIMA HORA: ¡El Kimi-K2 de @Kimi_Moonshot es ahora el modelo abierto #1 en la Arena! Con más de 3K votos de la comunidad, ocupa el puesto # 5 en general, superando a DeepSeek como el mejor modelo abierto. ¡Enhorabuena al equipo de Moonshot por este impresionante hito! La tabla de clasificación ahora cuenta con 7 proveedores diferentes entre los 15 primeros, el más competitivo de todos los tiempos. Más información en el hilo 🧵

24.85K

Nathan Lambert17 jul, 07:53

Es un gran fracaso político que Estados Unidos no pueda albergar las principales conferencias de IA debido a problemas de visado.

312.64K

Nathan Lambert17 jul, 01:32

Estoy totalmente de acuerdo con Ross. Es mucho más fácil reunir talento que crear una organización que produzca top models una tras otra. Tuve un montón de conversaciones a principios de este año específicamente sobre las compensaciones y escribí un artículo detallado al respecto.

Ross Taylor16 jul, 11:42

Es curioso que la gente en este sitio piense que los grandes esfuerzos de LLM están ligados al talento en lugar de a la organización. La diferencia de talento nunca ha sido grande entre las principales organizaciones. La mayor parte de la diferencia en los resultados se debe a factores organizativos, como asignar el cálculo a las apuestas correctas y permitir que la buena investigación e ingeniería triunfen sobre la política destructiva. Sin embargo, esto hace que la historia sea menos sexy. La gente prefiere creer que los avances son hechos por genios solitarios, en lugar del esfuerzo acumulativo de muchas personas anónimas y reacias a las redes sociales, respaldadas por una organización que permite que ganen las mejores ideas y maneja grandes egos. Si no me cree, considere cómo algunos investigadores de repente ganan o pierden impacto y productividad cuando cambian de organización. ¿Fue porque ganaron o perdieron puntos de coeficiente intelectual? 🙂 (Lo siento, esto es muy obvio para cualquiera que haya trabajado en estos laboratorios, ¡pero no lo creerías basándote en el feed X en este momento!)

17.56K

Nathan Lambert15 jul, 12:15

Kimi K2 sigue infravalorado fuera del universo de Twitter.

29.42K

Nathan Lambert15 jul, 02:13

Interconnects AI también adquirió windsurf.

10.72K

Nathan Lambert14 jul, 23:27

La contratación de "ingenieros impulsados por la misión"... MechaHitler... Posición de Relaciones Gubernamentales... Parodia de pico

xAI14 jul, 23:11

Anunciamos Grok for Government, un conjunto de productos que hacen que nuestros modelos de frontera estén disponibles para los clientes del gobierno de los Estados Unidos Estamos especialmente entusiasmados con dos nuevas asociaciones para nuestros socios del gobierno de EE. UU 1) un nuevo contrato del Departamento de Defensa de EE.UU. 2) que nuestros productos estén disponibles para su compra a través del horario de la Administración de Servicios Generales (GSA). Esto permite que todos los departamentos, agencias u oficinas del gobierno federal compren productos xAI Estamos contratando ingenieros motivados por la misión que quieran unirse a la causa

Populares

Ranking

Favoritas

Onchain en tendencia

Tendencia en X

Principales fondos recientes

Más destacadas