Что такое AskSim? - AI-первый с условным поиском - Открытая модель оркестрации (система использует ряд моделей - Llama, Qwen, DeepSeek и другие) - Параллельная прогрессивная обработка AI-ассистент, который начинает отвечать за 200 мс, постепенно улучшает свои ответы и получает данные в реальном времени только по мере необходимости.
dndNGMI
dndNGMI15 июл., 06:33
Как работает система AskSim - AI Research Assistant Обзор архитектуры Запрос пользователя → Оркестратор прогрессивного ответа ├── Фаза 1: Мгновенный ответ (200-300 мс) │ └── Быстрые модели (Llama-3.1-8B-fast) ├── Фаза 2: Улучшенный ответ (параллельно) │ └── Мощные модели (Llama-3.3-70B), DeepSeek └── Фаза 3: Улучшение поиска (условно) └── Serper/Exa API → Синтез с цитированием В этом конкретном примере: 🔧 Объяснение прогрессивного улучшения: Фаза 1: Llama-3.1-8B-Instruct-fast - 8 миллиардов параметров - Оптимизировано для скорости - Время ответа 200 мс - Охватывает 80% качества ответа Фаза 2: Llama-3.3-70B-Instruct - 70 миллиардов параметров - Модель в 8.75 раз больше - Добавляет нюансы, примеры, глубину - Завершает оставшиеся 20% Результат: 100% качество, в 10 раз лучшее UX. Это как иметь быстрого помощника, который отвечает мгновенно, в то время как профессор готовит подробную лекцию на заднем плане. Особые функции 1. Молниеносные прогрессивные ответы - 200 мс до первого токена - пользователи видят ответы мгновенно, а не через 3+ секунды - Параллельное выполнение фаз - улучшенные и поисковые процессы работают одновременно - Прогрессивное улучшение (мгновенно → улучшено → поиск) 2. Интеллектуальная интеграция поиска - Автоматическое обнаружение времязависимых запросов - Два поставщика поиска (Serper + Exa) 3. Оптимизированная по стоимости многомодельная система - выбор модели на основе уровней @nebiusaistudio - Уровни качества: мгновенно → улучшено → премиум - Платежи с использованием x402 от @CoinbaseDev @yugacohler и @Sagaxyz__ @solana $CLSTR $DND
3,35K