Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Nathan Lambert
З'ясування AI @allen_ai, відкритих моделей, RLHF, тонке налаштування тощо
Звертайтеся через електронну пошту.
Пише @interconnectsai
Написав книгу RLHF
Гірський бігун
Користувач Nathan Lambert поділився
Чи досягла OpenAI дуже довгого епізоду RL з цією експериментальною моделлю?
Скріншот зі статті @natolambert на тему "Що буде далі з навчанням з підкріпленням".
У цій статті Натан каже: «Там, де поточні методи генерують 10K-100K токенів за відповідь для задач з математики або коду під час навчання, проблеми, які люди обговорюють, застосовуючи навчання RL наступного покоління, будуть 1M-100M токенів за відповідь. Це передбачає обгортання кількох викликів висновків, підказок і взаємодій із середовищем у межах одного епізоду, проти якого оновлено політику.
Можливо, цей прорив є поєднанням обох - дуже довгого епізоду RL і масштабування TTC до 1M-100M токенів за відповідь!

3,2K
Це "погано", що всі переганяють/тренуються на китайських моделях? Незважаючи на те, що це не дуже погано, є велика складова м'якої сили.
Багато доповнень, які мильниці про китайські соціалістичні ідеали / цінності КНР, які фільтруються в майбутні моделі штучного інтелекту / розлетілися по всьому Інтернету.

8,9K
ха-ха-ха-ха-ха топовими відкритими моделями США є Gemma 3 27b і @nvidia's finetune of Llama 3.1


lmarena.ai17 лип., 23:21
🚨 BREAKING: Kimi-K2 @Kimi_Moonshot тепер є відкритою моделлю #1 на Арені!
Набравши понад 3 тисячі голосів спільноти, вона посідає #5 місце в загальному заліку, обігнавши DeepSeek як найкращу відкриту модель.
Величезні вітання команді Moonshot з цією вражаючою віхою! У таблиці лідерів тепер є 7 різних провайдерів у топ-15 - найконкурентніший з усіх, що коли-небудь були.
Більше інсайтів у гілці 🧵

24,85K
Я повністю згоден з Россом. Набагато простіше зібрати таланти, ніж створити організацію, яка штампує топ-моделей одну за одною.
На початку цього року я провів купу розмов саме про компроміси і написав детальну статтю про це.


Ross Taylor16 лип., 11:42
Забавно, що люди на цьому сайті думають, що основні зусилля LLM пов'язані з талантами, а не з організаціями.
Різниця в талантах ніколи не була великою між великими організаціями. Більша частина різниці в результатах пов'язана з організаційними факторами - наприклад, розподілом обчислювальних потужностей між правильними ставками і дозволом хорошим дослідженням і інженерії перемогти руйнівну політику.
Однак це робить історію менш сексуальною. Люди вважають за краще вірити, що прориви роблять генії-одинаки, а не сукупні зусилля багатьох безіменних людей, які не схильні до соціальних мереж — за підтримки організації, яка дозволяє найкращим ідеям перемагати і керує великим его.
Якщо ви мені не вірите, то подумайте, як деякі дослідники раптом набирають або втрачають вплив і продуктивність, коли змінюють організацію. Це було тому, що вони набрали чи втратили бали IQ? 🙂
(Вибачте, це надзвичайно очевидно для будь-кого, хто насправді працював у цих лабораторіях, але ви не повірите, виходячи з X-каналу прямо зараз!)
17,56K
Наймання «інженерів, орієнтованих на місію»...
МехаГітлер...
Позиція щодо відносин з державними органами...
Пікова пародія

xAI14 лип., 23:11
Анонс Grok for Government - набір продуктів, які роблять наші передові моделі доступними для клієнтів уряду Сполучених Штатів
Ми особливо раді двом новим партнерствам для наших партнерів з Уряду США
1) новий контракт від Міністерства оборони США
2) наші продукти доступні для покупки за графіком Адміністрації загальних послуг (GSA). Це дозволяє кожному федеральному урядовому департаменту, агентству чи офісу купувати продукти xAI
Ми наймаємо інженерів, які хочуть долучитися до справи
77
Найкращі
Рейтинг
Вибране
Актуальне ончейн
Популярні в X
Нещодавнє найкраще фінансування
Найбільш варте уваги