Demo di QVAC di Tether che esegue inferenze locali su un dispositivo mobile a una velocità incredibile, tramite llama.cpp + LLAMA 3.2 1B parametri. QVAC è un runtime di inferenza e fine-tuning generalizzato in grado di adattarsi a qualsiasi dispositivo, dagli smartphone ai laptop e server. Già supportati molti modelli. Altri arriveranno. Nessun limite. Intelligenza infinita. In arrivo presto.
31,66K