OpenAI cắt giảm chi phí suy luận hơn 50%, việc sử dụng GPU giảm từ hàng chục nghìn xuống hàng trăm
Theo các nguồn tin được các phương tiện truyền thông trích dẫn, OpenAI đã đạt được một bước đột phá kỹ thuật lớn vào đầu tháng này, cắt giảm chi phí suy luận hơn 50% và giảm đáng kể yêu cầu về GPU. Các kỹ sư nội bộ đã trình bày bước đột phá này, tiết lộ rằng phương pháp tối ưu hóa mới đã giảm mức sử dụng GPU xuống chỉ còn hàng trăm đơn vị khi xử lý các yêu cầu truy cập của ChatGPT, so với hàng chục nghìn chip cao cấp trước đây.
GateNews·15phút trước
