Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Andrej Karpathy
Membangun @EurekaLabsAI. Sebelumnya Direktur AI @ Tesla, tim pendiri @ OpenAI, CS231n/PhD @ Stanford. Saya suka melatih jaring 🧠🤖💥 saraf dalam yang besar
Model video difusi tetapi sekarang - **realtime**!
Filter video sederhana bersifat real-time tetapi hanya dapat melakukan pewarnaan ulang dan gaya dasar. Model difusi video (Veo dan teman-teman) adalah ajaib, tetapi membutuhkan banyak detik/menit untuk dihasilkan. MirageLSD adalah sihir waktu nyata. Tidak seperti filter video sederhana, model difusi sebenarnya *memahami* apa yang mereka lihat, sehingga mereka dapat menata semua bagian umpan dengan cerdas (misalnya meletakkan topi di kepala, atau pedang cahaya ke tangan, dll.). Dan mereka dapat dikendalikan secara sewenang-wenang, misalnya dengan petunjuk teks.
Filter video cerdas yang dapat disesuaikan membuka banyak ide keren dari waktu ke waktu:
- Mengubah umpan kamera menjadi realitas alternatif
- Arahkan dan rekam film Anda sendiri, memerankan adegan dengan alat peraga. Realtime => umpan balik/tinjauan instan.
- Permainan kode getaran hanya di sekitar bola/blok sederhana, lalu gunakan model difusi waktu nyata untuk tekstur game Anda agar indah.
- Gaya dan sesuaikan umpan video apa pun: game, video, ... misalnya Skyrim tetapi "LEBIH EPIK"? DOOM II tetapi kualitas Unreal Engine modern hanya dengan cepat? Film horor tapi "lucu, merah muda dan kelinci saja"? Saya tidak tahu!
- Latar belakang panggilan zoom+++
- Coba pakaian secara real-time secara virtual
- Kacamata: misalnya kartunkan visi Anda secara real time?
- kita sekarang dapat membangun Harry Potter Mirror of Erised, menunjukkan "umpan mentah" Anda di cermin tetapi ditambah dengan keinginan terdalam Anda (seperti yang disimpulkan oleh AI).
- Entahlah, saya mungkin kehilangan yang terbesar, begitu banyak hal!
(Pengungkapan Saya adalah investor malaikat (sangat kecil) di Decart, saya senang karena imo teknologi ini akan menjadi sangat bagus sangat cepat dan terasa umum, kuat tetapi secara teknis juga sangat sulit. Selamat atas peluncuran untuk tim!)

Decart18 Jul, 04.44
Memperkenalkan MirageLSD: Model AI Difusi Live-Stream (LSD) Pertama
Masukkan aliran video apa pun, mulai dari kamera atau obrolan video ke layar komputer atau game, dan ubah menjadi dunia apa pun yang Anda inginkan, secara real-time (latensi <40ms).
Begini cara kerjanya (dengan demo yang dapat Anda gunakan!):
326,62K
Saya sering mengoceh tentang bagaimana 99% perhatian akan menjadi perhatian LLM, bukan perhatian manusia. Seperti apa makalah penelitian untuk LLM, bukan manusia? Ini jelas bukan pdf. Ada ruang besar untuk "aplikasi penelitian" yang sangat berharga yang mencari tahu ini.

Michael Levin10 Jul, 22.47
Saya terus-menerus kesal karena saya tidak punya waktu untuk membaca semburan makalah keren yang datang lebih cepat dan lebih cepat dari orang-orang luar biasa di bidang yang relevan. Ilmuwan lain memiliki masalah yang sama dan juga tidak punya waktu untuk membaca sebagian besar makalah konseptual saya yang panjang. Jadi untuk siapa kami menulis makalah ini?
Saya kira, setidaknya sampai mereka jatuh ke masalah yang sama dari pekerjaan mereka sendiri, AI akan menjadi satu-satunya yang benar-benar memiliki bandwidth untuk membaca semua hal ini. Saya tidak secara khusus berbicara tentang model bahasa saat ini - mari kita asumsikan yang kita maksud adalah apa pun AI yang tak terelakkan muncul, yang mampu membaca literatur dan berdampak pada penelitian (baik dengan berbicara dengan manusia atau dengan menjalankan platform otomatisasi laboratorium / robot ilmuwan).
Jadi: bagaimana kita harus menulis, mengetahui bahwa banyak audiens kita akan menjadi AI (ditambah cyborg, hybrot, manusia yang ditambah, dll.)? Mungkin terlalu dini untuk mengetahui apa yang harus dilakukan, tetapi sebaiknya kita mulai memikirkannya karena berasumsi audiens kita akan selalu menjadi manusia saat ini tampaknya tidak dapat dipertahankan. Menganggap serius gagasan bahwa suatu hari nanti audiens yang berdampak akan sangat berbeda, dan bahwa hal-hal yang kita tulis sekarang dalam arti tertentu adalah set pelatihan untuk makhluk masa depan yang benar-benar beragam, bagaimana tulisan kita berubah? atau apakah itu?
apa yang Anda katakan @danfaggella @mpshanahan @Plinz @blaiseaguera ?
498,04K
Cara membangun komunitas open source yang berkembang dengan menulis kode seperti yang dilakukan 🦠 bakteri . Kode bakteri (genom) adalah:
- kecil (setiap baris kode membutuhkan energi)
- modular (diatur ke dalam kelompok operon yang dapat ditukar)
- mandiri (mudah "menyalin tempel" melalui transfer gen horizontal)
Jika potongan kode kecil, modular, mandiri dan sepele untuk disalin dan ditempel, komunitas dapat berkembang melalui transfer gen horizontal. Untuk fungsi (gen) atau kelas (operon) apa pun yang Anda tulis: dapatkah Anda membayangkan seseorang pergi "yoink" tanpa mengetahui sisa kode Anda atau harus mengimpor sesuatu yang baru, untuk mendapatkan keuntungan? Mungkinkah kode Anda menjadi inti GitHub yang sedang tren?
Panduan gaya pengkodean ini telah memungkinkan bakteri untuk menjajah setiap sudut ekologis dari dingin hingga panas hingga asam atau basa di kedalaman Bumi dan ruang hampa ruang, bersama dengan keragaman anabolisme karbon, metabolisme energi, dll. Ini unggul dalam pembuatan prototipe cepat tetapi... itu tidak dapat membangun kehidupan yang kompleks. Sebagai perbandingan, genom eukariotik adalah monorepo yang jauh lebih besar, lebih kompleks, terorganisir, dan digabungkan. Secara signifikan kurang inventif tetapi diperlukan untuk kehidupan yang kompleks - untuk membangun seluruh organ dan mengoordinasikan aktivitasnya. Dengan keunggulan desain cerdas kita, seharusnya dimungkinkan untuk memanfaatkan keduanya. Bangun tulang punggung monorepo eukariotik jika perlu, tetapi maksimalkan DNA bakteri.

538,7K
Perlombaan untuk "inti kognitif" LLM - model beberapa miliar parameter yang secara maksimal mengorbankan pengetahuan ensiklopedia untuk kemampuan. Itu hidup selalu aktif dan secara default di setiap komputer sebagai inti komputasi pribadi LLM.
Fitur-fiturnya perlahan mengkristal:
- Teks/visi/audio multimodal asli di input dan output.
- Arsitektur gaya Matryoshka yang memungkinkan tombol kemampuan naik dan turun pada waktu pengujian.
- Penalaran, juga dengan dial. (sistem 2)
- Menggunakan alat secara agresif.
- Penyempurnaan slot LoRA di perangkat untuk pelatihan, personalisasi, dan penyesuaian waktu pengujian.
- Delegasikan dan periksa kembali bagian yang tepat dengan oracle di cloud jika internet tersedia.
Ia tidak tahu bahwa pemerintahan William the Conqueror berakhir pada 9 September 1087, tetapi samar-samar mengenali namanya dan dapat mencari tanggalnya. Itu tidak dapat melafalkan SHA-256 dari string kosong sebagai e3b0c442..., tetapi dapat menghitungnya dengan cepat jika Anda benar-benar menginginkannya.
Apa yang tidak dimiliki komputasi pribadi LLM dalam pengetahuan dunia yang luas dan kemampuan pemecahan masalah tingkat atas, itu akan dibuat dalam latensi interaksi super rendah (terutama saat multimoda matang), akses langsung / pribadi ke data dan negara, kontinuitas offline, kedaulatan ("bukan bobot Anda, bukan otak Anda"). yaitu banyak alasan yang sama kita menyukai, menggunakan dan membeli komputer pribadi alih-alih memiliki thin client mengakses cloud melalui desktop jarak jauh atau sebagainya.
1,03M
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal