热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
llm 分析(以及监管和 PMing)之所以困难,是因为相关的维度随着每一代前沿模型的出现而不断变化;仅仅将 x 或 y 轴设置为对数刻度并跟踪缩放法则是不够的,你必须真正努力思考模型在 2025 年、2024 年、2023 年等结构上的不同。
例如,
每个人关注 elo 两年,elo 被利用并失去信誉;
每个人关注代币价格三年,推理模型在每个任务的输出代币上有 10-40 倍的变化,代币价格失去意义。
你可以尽情收集数据,但如果你只是收集原始的时间序列,你可能会失去更大的视野。
(以及为什么像“ai 工程师并不存在,因为所有软件工程师都是 ai 工程师”这样的说法是自我安慰,除了在最琐碎的意义上永远不会正确)

7月22日 08:30
是否有一个公开的电子表格,列出不同公司所有领先的LLM模型,包括它们的定价、基准分数、竞技场ELO分数等?
9.72K
热门
排行
收藏