la razón por la que el análisis de llm (y la regulación, y el PMing) es difícil* es que las DIMENSIONES relevantes siguen cambiando con cada generación de modelos de frontera; no es suficiente con simplemente poner tu eje x o y en escala logarítmica y rastrear las leyes de escalado, tienes que hacer el trabajo de pensar en cómo los modelos son estructuralmente diferentes en 2025 frente a 2024 frente a 2023 y así sucesivamente. eg todos se centraron en elo durante 2 años, elo es manipulado y pierde credibilidad todos se centraron en el precio por tokens durante 3 años, los modelos de razonamiento tienen una variación de 10 a 40 veces en los tokens de salida por tarea, el precio por token pierde significado. recoge datos todo lo que quieras, pero si solo estás recopilando series temporales prístinas, puedes perder de vista el panorama general. *(y por qué afirmaciones como “el ingeniero de IA no es una cosa porque todos los ingenieros de software son ingenieros de IA” son una justificación y nunca estarán en lo correcto excepto en el sentido más trivial)
Scott Huston
Scott Huston22 jul, 08:30
¿Hay una hoja de cálculo pública de todos los modelos LLM líderes de diferentes empresas que muestre sus precios, puntuaciones de referencia, puntuaciones de elo en arena, etc.?
9,91K