Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya “mencengangkan: biasa saja dan rawan kesalahan” dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.
Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.
Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin “secara sengaja melemahkan bagian ini.”
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Musk Mempertimbangkan Menggabungkan OpenAI ke Dalam Tesla pada Akhir 2017, Persidangan Mendengar
Menurut kesaksian dalam sidang federal di Oakland, California, Elon Musk mempertimbangkan untuk menggabungkan OpenAI ke dalam Tesla pada akhir 2017 dan awal 2018, menurut Shivon Zilis, eksekutif Neuralink dan mantan anggota dewan OpenAI. Zilis bersaksi bahwa Musk menelusuri opsi untuk menawarkan Sam Altman kursi dewan Tesla
GateNews7menit yang lalu
Pertumbuhan Pengguna Gemini dan Claude Meningkat Pesat pada April, sementara Pertumbuhan ChatGPT Melambat ke 30% YoY
Menurut laporan terbaru Bank of America, Gemini dan Claude mengalami pertumbuhan pengguna yang kuat pada bulan April, sementara ekspansi ChatGPT melambat. Dalam kunjungan web di AS, ChatGPT tumbuh 30% year-over-year menjadi 34 juta kunjungan (setara dengan 6% dari lalu lintas Google), sedangkan Claude melonjak 715% year-over-year menjadi 7,1 miliar
GateNews14menit yang lalu
OpenAI Meluncurkan Protokol MRC dengan AMD, Broadcom, Intel, Microsoft, dan Nvidia
OpenAI mengumumkan telah berkolaborasi dengan AMD, Broadcom, Intel, Microsoft, dan Nvidia untuk meluncurkan Multipath Reliable Connection (MRC), sebuah protokol jaringan open-source. MRC dirancang untuk mempercepat klaster pelatihan AI skala besar, meningkatkan keandalan, dan secara signifikan mengurangi waktu GPU menganggur
GateNews16menit yang lalu
Pendapatan Pusat Data AI SK Telecom Melonjak 89% pada Kuartal 1 2026
Menurut SK Telecom, bisnis pusat data berbasis kecerdasan buatan dari perusahaan telekomunikasi Korea Selatan tersebut membukukan pendapatan sebesar 131,4 miliar won (89,4 juta dolar AS) pada kuartal pertama 2026, naik 89,3% year on year. Perusahaan menyebut lonjakan itu disebabkan oleh pemanfaatan pusat data yang lebih tinggi dan
GateNews27menit yang lalu
Arm Memperingatkan Kelemahan Smartphone, Mengincar Pertumbuhan Chip AI untuk Mengimbangi
Arm Holdings memperingatkan bahwa kelemahan pasar smartphone sedang menekan sumber pendapatan utama bagi perusahaan perancang chip, meskipun pertumbuhan bisnis chip AI diperkirakan akan mengimbangi dampaknya, kata CEO Rene Haas dalam konferensi pendapatan. Pengiriman ponsel pada kuartal sebelumnya turun, dengan kerugian terkonsentrasi pada
CryptoFrontier37menit yang lalu
DeepSeek Menggalang Pendanaan pada $45B Penilaian di Tengah Persaingan AI
Lab AI China DeepSeek sedang dalam pembicaraan untuk menggalang putaran pendanaan pertamanya dengan valuasi yang dilaporkan senilai 45 miliar dolar AS, menurut TechCrunch. Valuasi tersebut menandai peningkatan besar dari valuasi estimasi senilai 20 miliar dolar AS hanya beberapa minggu sebelumnya, menyusul perhatian yang tertarik pada model-model AI perusahaan untuk
CryptoFrontier56menit yang lalu