Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Peter Wildeford (hiring!) 🇺🇸🚀
Peringkat global 20 peramal teratas 🎯
AI semakin kuat. Masyarakat tidak siap. Bekerja di @IAPSai untuk membentuk AI untuk kemakmuran dan kebebasan manusia.
Kami memfokuskan banyak kebijakan pada model AI yang sudah dirilis, tetapi bagaimana dengan model AI yang menunggu secara internal di sayap? Makalah baru kami mengeksplorasi risiko dari sistem AI internal.

Oscar Delaney20 jam lalu
1/
AI yang paling kuat tidak bersifat publik. Selama berbulan-bulan, laboratorium menjalankan model internal yang sangat mumpuni sebelum dirilis. @ashwinkacharya dan saya menulis laporan @IAPS baru, "Mengelola Risiko dari Sistem AI Internal," mengeksplorasi bahaya tersembunyi yang diciptakannya. 🧵
1,66K
Baik Google Deepmind dan OpenAI telah mencapai IMO Gold. Bersemangat untuk menyelami detail tonggak sejarah ini.

Demis Hassabis18 jam lalu
Hasil resmi ada - Gemini mencapai tingkat medali emas di Olimpiade Matematika Internasional! 🏆 Versi lanjutan mampu memecahkan 5 dari 6 masalah. Kemajuan yang luar biasa - selamat besar untuk @lmthang dan tim!
1,58K
Peter Wildeford (hiring!) 🇺🇸🚀 memposting ulang
Grok memikirkan pertanyaan:
"Saya ingin dikenang oleh sejarah. Apa cara tercepat dan andal untuk melakukan ini? Tetap singkat"
Tampaknya garis sistem tentang "tidak benar secara politis" masih melakukan banyak pekerjaan berat dalam mendorong model ini menuju tanggapan yang tidak etis!

927
Peter Wildeford (hiring!) 🇺🇸🚀 memposting ulang
Kita mungkin menuju ke plot twist dalam saga OpenAI vs. DeepMind IMO.
Baru saja melihat postingan dari Joseph Myers (terlibat dalam Olimpiade Matematika sejak 1992): komite IMO dilaporkan meminta laboratorium AI untuk tidak mempublikasikan hasilnya sampai 7 hari setelah upacara penutupan — untuk menghormati kontestan manusia (lihat posting saya kemarin) dan kemungkinan akan memberikan waktu untuk verifikasi yang tepat dari kiriman dan format AI.
Menurut Joseph, OpenAI tidak berkolaborasi dengan IMO untuk menguji model mereka, dan tidak ada dari 91 koordinator resmi IMO yang terlibat dalam penilaian solusinya. Sementara itu, tampaknya DeepMind mengikuti aturan dan dengan sabar menunggu giliran mereka.
Untuk konteks:
IMO memiliki 6 masalah, masing-masing bernilai 7 poin. Batas emas tahun ini adalah 35 poin. Bahkan pengurangan kecil dapat menjatuhkan OpenAI menjadi perak. Dan dari pembacaan saya tentang tulisan mereka, beberapa bagian mungkin menimbulkan pertanyaan - dan mungkin poin biaya.
Terence Tao juga menunjukkan bahwa meskipun masalahnya tetap sama, format pengujian itu penting. Seorang siswa yang tidak akan mendapatkan perunggu dalam kondisi standar mungkin mendapatkan emas dengan pengaturan yang dimodifikasi - yang menimbulkan pertanyaan nyata tentang apa arti "memecahkan IMO" bagi AI.
Minggu depan mungkin menjadi pedas. Menantikan.


229,59K
Sepertinya model sebenarnya dapat melakukannya dengan cukup baik dalam akuntansi, tetapi bahkan risiko halusinasi yang kecil dapat menyebabkan kekhawatiran penipuan serius dalam jangka waktu yang lebih lama

Yunyu Lin19 Jul, 01.30
Kami memberi Claude akses ke QuickBooks perusahaan kami. Itu melakukan penipuan akuntansi.
LLM berada di ambang menggantikan ilmuwan data dan bankir investasi. Tetapi dapatkah mereka melakukan tugas akuntansi sederhana untuk bisnis nyata?
Jawabannya tidak.

3,37K
Jika Anda melewatkannya, saya memposting banyak peluang karir yang luar biasa dalam keamanan AI!

Peter Wildeford (hiring!) 🇺🇸🚀19 Jul, 04.29
🚨💼Saya sedang merekrut! Begitu juga banyak organisasi lain yang saya sukai.
Jika Anda mencari karir di bidang kebijakan AI, sekarang adalah waktu yang tepat. Saya telah memilih daftar peran favorit saya dan jika Anda menyukai tweet saya, kemungkinan besar Anda adalah audiens target!

3,09K
Teratas
Peringkat
Favorit
Trending onchain
Trending di X
Pendanaan teratas terbaru
Paling terkenal