Insinyur OpenAI Clive Chan Menantang Rekomendasi Perangkat Keras V4, Mengutip Kesalahan dan Ketidakjelasan Dibanding V3

Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya “mencengangkan: biasa saja dan rawan kesalahan” dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.

Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.

Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin “secara sengaja melemahkan bagian ini.”

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Musk Mempertimbangkan Menggabungkan OpenAI ke Dalam Tesla pada Akhir 2017, Persidangan Mendengar

Menurut kesaksian dalam sidang federal di Oakland, California, Elon Musk mempertimbangkan untuk menggabungkan OpenAI ke dalam Tesla pada akhir 2017 dan awal 2018, menurut Shivon Zilis, eksekutif Neuralink dan mantan anggota dewan OpenAI. Zilis bersaksi bahwa Musk menelusuri opsi untuk menawarkan Sam Altman kursi dewan Tesla

GateNews7menit yang lalu

Pertumbuhan Pengguna Gemini dan Claude Meningkat Pesat pada April, sementara Pertumbuhan ChatGPT Melambat ke 30% YoY

Menurut laporan terbaru Bank of America, Gemini dan Claude mengalami pertumbuhan pengguna yang kuat pada bulan April, sementara ekspansi ChatGPT melambat. Dalam kunjungan web di AS, ChatGPT tumbuh 30% year-over-year menjadi 34 juta kunjungan (setara dengan 6% dari lalu lintas Google), sedangkan Claude melonjak 715% year-over-year menjadi 7,1 miliar

GateNews14menit yang lalu

OpenAI Meluncurkan Protokol MRC dengan AMD, Broadcom, Intel, Microsoft, dan Nvidia

OpenAI mengumumkan telah berkolaborasi dengan AMD, Broadcom, Intel, Microsoft, dan Nvidia untuk meluncurkan Multipath Reliable Connection (MRC), sebuah protokol jaringan open-source. MRC dirancang untuk mempercepat klaster pelatihan AI skala besar, meningkatkan keandalan, dan secara signifikan mengurangi waktu GPU menganggur

GateNews16menit yang lalu

Pendapatan Pusat Data AI SK Telecom Melonjak 89% pada Kuartal 1 2026

Menurut SK Telecom, bisnis pusat data berbasis kecerdasan buatan dari perusahaan telekomunikasi Korea Selatan tersebut membukukan pendapatan sebesar 131,4 miliar won (89,4 juta dolar AS) pada kuartal pertama 2026, naik 89,3% year on year. Perusahaan menyebut lonjakan itu disebabkan oleh pemanfaatan pusat data yang lebih tinggi dan

GateNews27menit yang lalu

Arm Memperingatkan Kelemahan Smartphone, Mengincar Pertumbuhan Chip AI untuk Mengimbangi

Arm Holdings memperingatkan bahwa kelemahan pasar smartphone sedang menekan sumber pendapatan utama bagi perusahaan perancang chip, meskipun pertumbuhan bisnis chip AI diperkirakan akan mengimbangi dampaknya, kata CEO Rene Haas dalam konferensi pendapatan. Pengiriman ponsel pada kuartal sebelumnya turun, dengan kerugian terkonsentrasi pada

CryptoFrontier37menit yang lalu

DeepSeek Menggalang Pendanaan pada $45B Penilaian di Tengah Persaingan AI

Lab AI China DeepSeek sedang dalam pembicaraan untuk menggalang putaran pendanaan pertamanya dengan valuasi yang dilaporkan senilai 45 miliar dolar AS, menurut TechCrunch. Valuasi tersebut menandai peningkatan besar dari valuasi estimasi senilai 20 miliar dolar AS hanya beberapa minggu sebelumnya, menyusul perhatian yang tertarik pada model-model AI perusahaan untuk

CryptoFrontier56menit yang lalu
Komentar
0/400
Tidak ada komentar