Loja DApp | Hub Web3 para eventos e jogos

Tópicos populares

outra fuga de alpha. a mesma técnica que usamos para o KernelBench. é uma abordagem universal na sua forma mais simples. exemplos são tudo o que você precisa: obtenha um bom resultado ou uma única melhoria, adicione ao contexto, obtenha mais bons resultados com o contexto melhorado, adicione esses ao contexto, ad inf...

não faz sentido treinar modelos pequenos, realmente... é melhor encontrar o programa ideal para alimentar as máquinas maiores. se você quer a melhor distribuição de saída, precisa encontrar a distribuição de entrada ideal, como a prática. você pode chegar lá do nada, desde que tenha uma maneira de classificar suas saídas. a técnica desses caras parece superdimensionada, pode ser muito mais simples.

A primeira geração do KernelBench no o3-mini. Nós apenas chamamos isso de "autoaperfeiçoamento."

2,9K

Top

Classificação

Favoritos

Tendências on-chain

Popular no X

Principais financiamentos atuais

Mais notável