Lanseringseventet för Grok4 kan bara beskrivas som mediokert, och den specifika prestandan är lite otillfredsställande efter att ha provat den Här är en sammanfattning av 👇 presentationen 1. Prestanda: Grok 4 presterar bra i multidomäntester, med en mycket högre noggrannhetsgrad än liknande modeller i svåra frågor som "Ultimate Human Exam", en bättre multiagentversion och full poäng i programmering, matematik och andra tester, och dess akademiska förmåga har nått forskarnivå och överträffar de flesta människor. 2. Träningsutveckling: Från Grok 2 till 4 ökar mängden träning med storleksordningar, och den 4:e generationen är 100 gånger högre än den 2:a generationen. Generation 3 till 4 fokuserar på resonemang och förstärkningsinlärning, med hjälp av dataförstärkning och annan teknik och superdatorer för att uppnå principresonemang och självkorrigering. 3. Funktionell tillämpning: Fördröjningen av röstinteraktion halveras och naturlig röst läggs till; Efter att API:et har öppnats används det i stor utsträckning inom affärssimulering, vetenskaplig forskning, spelutveckling och andra områden, som att öka nettovärdet av varuautomatverksamheten, påskynda vetenskaplig forskning och snabb spelutveckling. 4. Framtidsplaner: Lansera kodningsmodeller om några veckor för att förbättra den multimodala kapaciteten; Under de kommande 3-4 veckorna kommer utbildning i videogenerering att lanseras, med målet att bygga snabbare och smartare modeller och främja uppgraderingen av den mänskliga civilisationen.
8,5K