Ce este AskSim? - AI-first cu căutare condiționată - Orchestrarea modelelor open source (sistemul folosește o gamă largă de modele - Llama, Qwen, DeepSeek și altele) - Prelucrare progresivă paralelă Asistentul AI care începe să răspundă în 200 ms, se îmbunătățește progresiv și preia date în timp real numai atunci când este necesar.
dndNGMI
dndNGMI15 iul., 06:33
Cum funcționează sistemul AskSim - AI Research Assistant Prezentare generală a arhitecturii Interogare utilizator → Progressive Response Orchestrator ├── Faza 1: Răspuns instantaneu (200-300 ms) │ └── Modele rapide (Llama-3.1-8B-fast) ├── Faza 2: Răspuns îmbunătățit (paralel) │ └── Modele puternice (Llama-3.3-70B), DeepSeek └── Faza 3: Îmbunătățirea căutării (condiționată) └── Serper/Exa API → Sinteză cu citate În acest exemplu special: 🔧 Îmbunătățirea progresivă explicată: Faza 1: Llama-3.1-8B-Instruire-rapid - 8 miliarde de parametri - Optimizat pentru viteză - Timp de răspuns de 200 ms - Acoperă 80% din calitatea răspunsurilor Faza 2: Llama-3.3-70B-Instruire - 70 de miliarde de parametri - Model de 8,75 ori mai mare - Adaugă nuanțe, exemple, profunzime - Finalizează restul de 20% Rezultat: 100% calitate, UX de 10 ori mai bun. Este ca și cum ai avea un asistent rapid care răspunde imediat, în timp ce un profesor pregătește o prelegere detaliată în fundal. Caracteristici speciale 1. Răspunsuri progresive fulgerătoare - 200 ms la primul token - Utilizatorii văd răspunsurile instantaneu, nu după 3+ secunde - Execuție paralelă a fazelor - îmbunătățit și rulare simultană a căutării - Îmbunătățire progresivă (căutare instantanee → îmbunătățită →) 2. Integrare inteligentă a căutării - Detectarea automată a interogărilor sensibile la timp - Furnizori de căutare duală (Serper + Exa) 3. Sistem multi-model optimizat din punct de vedere al costurilor - @nebiusaistudio de selecție a modelelor pe bază de niveluri - Niveluri de calitate: instantaneu → îmbunătățit → premium - Plăți folosind x402 prin @CoinbaseDev @yugacohler și @Sagaxyz__ @solana $CLSTR $DND
3,39K