Tin tức Cổng, ngày 29 tháng 4 — Các nhà nghiên cứu của OpenAI, Sébastien Bubeck và Ernest Ryu, cho biết các hệ thống AI có thể thực hiện phần lớn công việc nghiên cứu của con người trong vòng hai năm, coi toán học là thước đo rõ ràng cho tiến bộ của AI. Khác với các bài kiểm tra hiệu suất mơ hồ, các bài toán mang lại khả năng xác minh chính xác: câu trả lời hoặc đúng hoặc sai, không để chỗ cho sự mơ hồ.
Bubeck cho biết suy nghĩ thật sự của AI cần có khả năng vượt qua các chuỗi suy luận dài. Chỉ một sai sót trong một lập luận nhiều bước sẽ làm sụp đổ toàn bộ chứng minh, khiến việc phát hiện và sửa lỗi ngay trong quá trình trở thành mục tiêu tối thượng đối với các mô hình tiên tiến. Các phòng thí nghiệm nội bộ của OpenAI đã tạo ra hơn mười định lý hoàn toàn mới có thể công bố trên các tạp chí hàng đầu về tổ hợp, cho thấy rằng AI hiện tạo ra các công trình thực sự nguyên bản, đột phá, thay vì chỉ tái tổ hợp các bài báo hiện có.
Tuy nhiên, các đột phá khoa học bền vững đòi hỏi sự tập trung ổn định trong nhiều tuần thử nghiệm. Các hệ thống hiện tại vẫn cần giám sát chặt chẽ của con người để dẫn dắt và xác minh từng lần đổi hướng. Bubeck dùng “thời gian AGI” để đo xem một mô hình có thể độc lập bắt chước suy nghĩ của con người trong bao lâu; hiện tại, các hệ thống hoạt động trong khoảng từ vài ngày đến một tuần, và mục tiêu của ngành là vài tuần hoặc vài tháng để có thể làm việc tự chủ trong các lĩnh vực như sinh học.
Trí nhớ dài hạn là then chốt cho tương lai này. Các cửa sổ chat tiêu chuẩn giới hạn độ sâu—các chứng minh toán học phức tạp thường vượt quá 50 trang—trong khi các kho mã cho thấy việc duy trì các phiên làm việc kéo dài giúp giải quyết vấn đề sâu hơn. Khi AI đạt được tính độc lập và trí nhớ, chuyên môn của con người trở nên có giá trị hơn, không phải ít hơn. Người lao động cần giữ lại kiến thức nền tảng sâu để thách thức và xác minh các câu trả lời của máy, và các tổ chức sẽ cần các bộ lọc tự động và hệ thống danh tiếng mới để duy trì niềm tin giữa một dòng nghiên cứu do AI hỗ trợ tràn ngập.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
CZ cho biết YZi Labs phân bổ 70% cho blockchain và 20% cho AI tại Consensus Miami 2026
Theo ChainCatcher, tại sự kiện Consensus Miami 2026, Zhao Changpeng (CZ) cho biết YZi Labs phân bổ 70% nguồn vốn cho blockchain, 20% cho AI và 10% cho công nghệ sinh học. CZ cho biết BNB nên được định vị như một loại tiền tệ bản địa cho các tác nhân AI, và tất cả các blockchain cần phải “sẵn sàng cho AI” để hỗ trợ
GateNews5giờ trước
Public mua lại ứng dụng kho bạc của nền tảng đầu tư AI để mở rộng giao dịch crypto
Theo ChainCatcher, Public đã công bố việc mua lại nền tảng dịch vụ đầu tư AI Treasury App để tăng cường mảng môi giới giao dịch dựa trên AI của mình. Chưa công bố số tiền mua lại. Hiện tại Public hỗ trợ giao dịch cổ phiếu, trái phiếu và tiền mã hóa, bao gồm Bitcoin, Ethereum, a
GateNews6giờ trước
Blitzy hoàn tất vòng $200M huy động vốn do Northzone dẫn dắt
Theo ChainCatcher, Blitzy, một công ty AI về lập trình được đồng sáng lập bởi cựu kiến trúc sư của Nvidia Sid Pardeshi, đã hoàn tất một vòng gọi vốn trị giá 200 triệu USD do Northzone dẫn dắt. Battery Ventures, Jump Capital và Morgan Creek Digital đã tham gia vào vòng này. Nền tảng có thể phân tích các hệ thống phức tạp với
GateNews7giờ trước
EU cấm nội dung khiêu dâm deepfake do AI tạo ra vào ngày 7 tháng 5
Theo Hãng Thông tấn Xinhua, vào ngày 7/5, các nghị sĩ Nghị viện châu Âu và các quốc gia thành viên đã đạt được đồng thuận để cấm các hệ thống trí tuệ nhân tạo tạo ra nội dung khiêu dâm deepfake. Lệnh cấm này sẽ được đưa vào các sửa đổi của Đạo luật Trí tuệ nhân tạo năm 2024. Nghị viện châu Âu
GateNews7giờ trước
Tether ra mắt mô hình AI y tế MedPsy QVAC, đạt điểm 62,62 trên phiên bản 17 tỷ tham số
Theo Odaily, Tether AI Research Group đã ra mắt QVAC MedPsy, một mô hình AI y tế được thiết kế để chạy cục bộ trên điện thoại thông minh và các thiết bị đeo mà không phụ thuộc vào đám mây. Phiên bản với 1,7 tỷ tham số đạt 62,62 trên bảy bộ tiêu chí y tế, vượt MedGemma-1.5-4B của Google thêm 11,42 điểm poi
GateNews8giờ trước
B.AI ra mắt 4 mô hình mới, bao gồm GPT-5.5 Instant, trong vòng 48 giờ sau khi OpenAI phát hành
API B.AI đã ra mắt 4 mẫu mới: GPT-5.5 Instant, DeepSeek-v3.2, MiniMax-M2.7 và GLM-5.1. GPT-5.5 Instant đã hoàn tất việc thích ứng nền tảng và tích hợp giao diện trong vòng 48 giờ sau khi OpenAI ra mắt, cho phép truy cập không độ trễ đến
GateNews8giờ trước