Tin tức cổng Gate, ngày 24 tháng 4 — Kỹ sư OpenAI Clive Chan đã đưa ra những phản đối chi tiết đối với chương khuyến nghị phần cứng trong báo cáo kỹ thuật V4, gọi chương này là “đáng ngạc nhiên là tầm thường và dễ gây lỗi” so với phiên bản V3 được ca ngợi. Hướng dẫn phần cứng của V3, bao gồm các buổi Q&A đã trở thành chủ đề thảo luận phổ biến nhất tại hội nghị học thuật ISCA, đưa ra các khuyến nghị cụ thể phù hợp với các tiêu chuẩn kết nối liên ngành trong ngành. Ngược lại, V4 lại còn mơ hồ hơn rất nhiều.

Chan đã phản biện có hệ thống ba khuyến nghị then chốt. Về mức tiêu thụ điện năng, báo cáo cho rằng việc tối ưu hóa phần mềm cho phép chip chạy đồng thời ở mức công suất tối đa cho tính toán, lưu trữ và truyền thông, đồng thời khuyến nghị các nhà sản xuất chip dành ra thêm phần dự trữ công suất. Chan lập luận rằng điều này phản tác dụng: tổng công suất của chip bị giới hạn bởi các hạn chế của quy trình vật lý, do đó việc dành thêm biên công suất chỉ làm giảm tần số hoạt động, cuối cùng kéo giảm hiệu suất tính toán. Đối với truyền dữ liệu GPU-GPU, báo cáo đề xuất mô hình kéo—trong đó các GPU chủ động nạp dữ liệu—thay vì mô hình đẩy, viện dẫn chi phí thông báo cao trong các thao tác đẩy. Chan phản bác điều này, cho rằng mô hình kéo thực ra còn chậm hơn và năng lực bộ điều hợp mạng được cải thiện sẽ là lựa chọn tốt hơn. Tuy nhiên, hai bên có thể đang thảo luận về những lớp khác nhau của vấn đề: báo cáo đề cập đến chi phí do cơ chế thông báo, còn Chan lại nói về độ trễ truyền tải.

Về các hàm kích hoạt, báo cáo khuyến nghị thay thế SwiGLU bằng các hàm đơn giản hơn để giảm gánh nặng tính toán. Chan không thấy có giá trị trong việc này, lưu ý rằng Sonic MoE đã chứng minh hiệu suất tối ưu khi sử dụng SwiGLU. Chan nghi ngờ DeepSeek có thể đã “cố ý làm suy yếu phần này.”

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Dự đoán của AI đến năm 2027 đã hoàn thành 65%, tốc độ phát triển phần mềm chậm lại ở mức 17%, theo đồng sáng lập Google Docs

Tin tức ngành AI

Theo Steve Newman, đồng sáng lập kiêm chủ tịch của Golden Gate Institute tại Google Docs, AI đã hoàn tất khoảng 65% các dự đoán được lượng hóa trong kịch bản dự báo năm 2027 được công bố vào năm ngoái. Tuy nhiên, chỉ số quan trọng nhất—việc AI tăng tốc phần mềm của chính nó

GateNews30phút trước

Claude/GPT có quá thích nịnh bợ? Một đoạn gợi ý trong Claude.md khiến AI đưa ra câu trả lời cứng rắn và chính xác

Tin tức ngành AI

Bài viết này giới thiệu một đoạn prompt có thể đưa vào Claude.md / Agents.md, nhằm chuyển AI từ vai trò trợ lý “khéo léo” sang một cố vấn thẳng thắn, thông qua 4 tầng điều chỉnh: thiết lập thân phận, kiểm chứng sự thật, giải phóng giọng điệu và miễn trừ sự chính xác về mặt chính trị, yêu cầu hoàn chỉnh, xác minh từng bước, tuyệt đối không bịa đặt; khi cần thiết thì có thể khiêu khích. Bài viết cũng nêu thời điểm tải prompt, các rủi ro và các tình huống phù hợp (nghiên cứu, viết lách, đánh giá kỹ thuật, thảo luận học thuật), đồng thời không phù hợp với dịch vụ chăm sóc khách hàng, giáo dục và tư vấn y tế. Nguồn gốc bài viết gốc là ABMedia.

ChainNewsAbmedia1giờ trước

OpenAI ra mắt ChatGPT Futures: 26 sinh viên khóa đầu tiên nhận học bổng 10.000 USD, trải dài trên hơn 20 trường đại học

Tin tức ngành AI

OpenAI công bố Lớp ChatGPT Futures đầu tiên của năm 2026, gồm 26 sinh viên đang học từ hơn 20 trường đại học hàng đầu, nhận 10.000 USD tiền trợ cấp cho mỗi người và quyền truy cập vào các mô hình tiên tiến. Nhóm sinh viên này bắt đầu nhập học vào mùa thu 2022, cùng lớn lên với ChatGPT; lĩnh vực nghiên cứu bao gồm lập bản đồ các vật thể trong không gian, phát hiện người sống sót sau thảm họa, bảo tồn ngôn ngữ đang đứng trước nguy cơ biến mất, chăm sóc sức khỏe, và nhiều mảng khác. Mục tiêu là dùng AI để giải quyết các nhu cầu cụ thể của con người, đồng thời kết nối với việc xây dựng hạ tầng cho thế hệ nhà sáng tạo mới.

ChainNewsAbmedia1giờ trước

FLock.io Tạo điều kiện cho hợp tác nghiên cứu giữa Trung tâm AI Sarawak và Đại học Cambridge trong tuần này

Tin tức ngành AI

Theo Foresight News, FLock.io đã hỗ trợ một hợp tác nghiên cứu mới giữa Trung tâm Nghiên cứu Trí tuệ Nhân tạo Sarawak (SAIC) của Malaysia và Đại học Cambridge trong tuần này. Quan hệ đối tác này sẽ mở rộng hợp tác từ cơ sở hạ tầng kỹ thuật sang nghiên cứu kinh tế, thiết kế chính sách và

GateNews1giờ trước

Apple 2,5 tỷ USD dàn xếp, chấm dứt vụ kiện tập thể người tiêu dùng; mỗi người có thể nhận tối đa 95 USD tiền bồi thường

Tin tức ngành AI

Apple đồng ý giải quyết các cáo buộc không đúng sự thật về quảng cáo AI, với tổng số tiền đạt 250 triệu USD. Nếu tòa án phê chuẩn, người tiêu dùng Mỹ mua iPhone được chỉ định tại Mỹ trong thời gian này có thể nhận bồi thường tối đa 95 USD cho mỗi máy, bao gồm iPhone 16, 16 Plus, 16 Pro, 16 Pro Max và cả iPhone 15 Pro/Pro Max. Nguyên đơn cho rằng việc quảng cáo biến Siri thành một bước đột phá về AI, nhưng trên thực tế chức năng không đạt như cam kết; Apple thì cho rằng tính năng được triển khai theo từng giai đoạn, đã cung cấp nhiều tính năng và không phải là tuyên bố sai sự thật.

ChainNewsAbmedia1giờ trước

Phó chủ tịch nghiên cứu của OpenAI chỉ trích quan điểm mà họ cho là của Anthropic rằng chỉ có họ mới có thể xây dựng AI

Tin tức ngành AI

Theo Aidan Clark, phó giám đốc nghiên cứu mảng huấn luyện của OpenAI, trên nền tảng X gần đây ông đã bày tỏ sự chỉ trích đối với điều mà ông nói rằng mình đã nghe từ các đồng nghiệp của Anthropic: quan điểm cho rằng chỉ mỗi Anthropic mới đủ năng lực để được tin tưởng trong việc xây dựng AI. Clark lập luận rằng việc có nhiều tổ chức

GateNews1giờ trước

Bình luận

0/400

Không có bình luận