Peneliti OpenAI: Sistem AI Bisa Menangani Sebagian Besar Pekerjaan Riset dalam Dua Tahun

Pengumuman Gate News, 29 April — Peneliti OpenAI Sébastien Bubeck dan Ernest Ryu mengatakan bahwa sistem AI dapat melakukan sebagian besar pekerjaan riset manusia dalam dua tahun, dengan menyajikan matematika sebagai ukuran kemajuan AI yang jelas. Tidak seperti tes performa yang masih samar, masalah matematika menawarkan verifikasi yang presisi: jawaban bisa benar atau salah, tanpa ruang untuk ambiguitas.

Bubeck mencatat bahwa pemikiran AI yang sejati membutuhkan kemampuan bertahan melalui rangkaian penalaran yang panjang. Satu kesalahan dalam argumen berisi banyak langkah dapat meruntuhkan seluruh pembuktian, sehingga deteksi dan koreksi kesalahan di tengah proses menjadi tujuan utama bagi model tingkat lanjut. Laboratorium internal OpenAI telah menghasilkan lebih dari sepuluh teorema benar-benar baru yang dapat dipublikasikan di jurnal-jurnal teratas bidang kombinatorika, yang menunjukkan bahwa AI kini menghasilkan karya yang benar-benar orisinal dan terobosan, bukan sekadar menyusun ulang makalah yang sudah ada.

Namun, terobosan ilmiah yang berkelanjutan menuntut fokus yang konsisten selama berminggu-minggu pengujian. Sistem yang ada saat ini masih memerlukan pengawasan manusia yang ketat untuk memandu dan memverifikasi setiap perubahan arah. Bubeck menggunakan “AGI time” untuk mengukur berapa lama sebuah model dapat meniru pemikiran manusia secara independen; sistem yang ada saat ini bekerja kira-kira selama beberapa hari hingga satu minggu, sementara target industri adalah berminggu-minggu atau berbulan-bulan agar memungkinkan kerja otonom di bidang seperti biologi.

Memori jangka panjang sangat penting untuk masa depan ini. Jendela chat standar membatasi kedalaman—pembuktian matematika yang kompleks sering kali melebihi 50 halaman—sementara repositori kode menunjukkan bagaimana sesi kerja yang lebih panjang memungkinkan pemecahan masalah yang lebih mendalam. Ketika AI memperoleh kemandirian dan memori, keahlian manusia menjadi semakin berharga, bukan semakin tidak. Para pekerja harus mempertahankan pengetahuan fondasional yang mendalam untuk menantang dan memverifikasi jawaban mesin, dan organisasi perlu sistem filter otomatis serta sistem reputasi baru untuk menjaga kepercayaan di tengah banjir riset yang dibantu AI.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

CZ Mengatakan YZi Labs Mengalokasikan 70% untuk Blockchain, 20% untuk AI di Consensus Miami 2026

Menurut ChainCatcher, pada Consensus Miami 2026, Zhao Changpeng (CZ) menyatakan bahwa YZi Labs mengalokasikan 70% pendanaan ke blockchain, 20% ke AI, dan 10% ke bioteknologi. CZ menambahkan bahwa BNB harus diposisikan sebagai mata uang asli untuk agen AI, dan semua blockchain perlu menjadi “AI ready” untuk mendukung

GateNews2jam yang lalu

Public Mengakuisisi Aplikasi Treasury Platform Investasi AI untuk Memperluas Perdagangan Kripto

Menurut ChainCatcher, Public mengumumkan akuisisi platform layanan investasi AI Treasury App untuk memperkuat bisnis brokeragenya berbasis AI. Nilai akuisisi tidak diungkapkan. Public saat ini mendukung perdagangan saham, obligasi, dan mata uang kripto termasuk Bitcoin, Ethereum, a

GateNews4jam yang lalu

Blitzy Menyelesaikan $200M Putaran Pendanaan yang Dipimpin oleh Northzone

Menurut ChainCatcher, Blitzy, perusahaan pengkodean berbasis AI yang didirikan bersama oleh mantan arsitek Nvidia Sid Pardeshi, telah menyelesaikan putaran pendanaan senilai 200 juta dolar AS yang dipimpin oleh Northzone. Battery Ventures, Jump Capital, dan Morgan Creek Digital turut berpartisipasi dalam putaran tersebut. Platform ini dapat mengurai sistem yang kompleks dengan

GateNews5jam yang lalu

Uni Eropa Melarang Pornografi Deepfake yang Dihasilkan AI pada 7 Mei

Menurut Xinhua News Agency, pada 7 Mei anggota Parlemen Eropa dan negara anggota mencapai kesepakatan untuk melarang sistem kecerdasan buatan menghasilkan konten pornografi deepfake. Larangan ini akan dimasukkan ke dalam amandemen Undang-Undang Kecerdasan Buatan 2024. Parlemen Eropa

GateNews5jam yang lalu

Tether Rilis Model AI MedPsy Medis QVAC, Raih Skor 62,62 pada Versi 17B Parameter

Menurut Odaily, Tether AI Research Group merilis QVAC MedPsy, model AI medis yang dirancang untuk berjalan secara lokal di smartphone dan perangkat wearable tanpa ketergantungan pada cloud. Versi berjumlah 1,7 miliar parameter itu memperoleh skor 62,62 pada tujuh tolok ukur medis, melampaui MedGemma-1.5-4B milik Google dengan selisih 11,42 poin

GateNews5jam yang lalu

B.AI Meluncurkan Empat Model Baru Termasuk GPT-5.5 Instant dalam 48 Jam Setelah Rilis OpenAI

API B.AI telah meluncurkan empat model baru: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7, dan GLM-5.1. GPT-5.5 Instant menyelesaikan adaptasi dasar dan integrasi antarmuka dalam waktu 48 jam setelah perilisan OpenAI, sehingga memungkinkan akses tanpa penundaan ke

GateNews5jam yang lalu
Komentar
0/400
Tidak ada komentar