Hva er AskSim? - AI-først med betinget søk - Åpen kildekode-modellorkestrering (systemet bruker en rekke modeller - Llama, Qwen, DeepSeek og andre) - Parallell progressiv prosessering AI-assistent som begynner å svare på 200 ms, forbedres gradvis og henter sanntidsdata bare når det er nødvendig.
dndNGMI
dndNGMI15. juli, 06:33
Hvordan AskSim-systemet fungerer - AI-forskningsassistent Oversikt over arkitektur Brukerspørring → orkestrering av progressivt svar ├── Fase 1: Øyeblikkelig respons (200–300 ms) │ └── Raske modeller (Llama-3.1-8B-fast) ├── Fase 2: Forbedret respons (parallell) │ └── Kraftige modeller (Lama-3.3-70B), DeepSeek └── Fase 3: Søkeforbedring (betinget) └── Serper/Exa API → syntese med sitater I dette eksemplet: 🔧 Progressiv forbedring forklart: Fase 1: Lama-3.1-8B-Instruksjon-rask - 8 milliarder parametere - Optimalisert for hastighet - 200 ms responstid - Dekker 80 % av svarkvaliteten Fase 2: Lama-3.3-70B-Instruksjon - 70 milliarder parametere - 8,75 ganger større modell - Legger til nyanser, eksempler, dybde - Fullfører de resterende 20 % Resultat: 100 % kvalitet, 10 ganger bedre brukeropplevelse. Det er som å ha en rask assistent som svarer umiddelbart, mens en professor forbereder en detaljert forelesning i bakgrunnen. Spesielle funksjoner 1. Lynraske progressive svar - 200 ms til første token - Brukere ser svar umiddelbart, ikke etter 3+ sekunder - Parallell utførelse av faser - forbedret og søkekjøring samtidig - Progressiv forbedring (øyeblikkelig → forbedret → søk) 2. Intelligent søkeintegrasjon - Automatisk gjenkjenning av tidssensitive spørringer - Doble søkeleverandører (Serper + Exa) 3. Kostnadsoptimalisert multimodellsystem - Nivåbasert modellvalg @nebiusaistudio - Kvalitetsnivåer: øyeblikkelig → forbedret → premium - Betalinger med x402 etter @CoinbaseDev @yugacohler og @Sagaxyz__ @solana $CLSTR $DND
3,36K