DeepSeek giới thiệu phương pháp Visual Primitives để nâng cao khả năng suy luận đa phương thức vào ngày 30 tháng 4

Theo báo cáo kỹ thuật của DeepSeek, vào ngày 30/4 công ty đã giới thiệu Visual Primitives, một phương pháp nhúng các đơn vị hình ảnh cơ bản như điểm và khung giới hạn vào các chuỗi suy luận nhằm giải quyết vấn đề Reference Gap trong các tác vụ đa phương thức. Phương pháp này giúp giảm mức tiêu thụ token hình ảnh thông qua nén KV cache.

Trong các bộ benchmark đếm và suy luận không gian, cách tiếp cận đạt hiệu năng tương đương với GPT-5.4, Claude-Sonnet-4.6 và Gemini-3-Flash ở một số hạng mục được chọn. DeepSeek cho biết sẽ mở mã nguồn một phần của các benchmark và bộ dữ liệu, đồng thời các trọng số mô hình sẽ được phát hành sau khi tích hợp.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Freshworks Cắt Giảm 500 Việc Làm Trong Tái Cơ Cấu Dựa Trên AI

Freshworks, công ty phần mềm quản trị doanh nghiệp có trụ sở tại San Mateo, California, đã công bố vào ngày 5/5 rằng họ sẽ cắt giảm 11% nhân sự, tương đương khoảng 500 vị trí trên toàn cầu, khi tái cơ cấu để thích ứng với việc sử dụng AI và tự động hóa rộng rãi hơn. Giám đốc điều hành Dennis Woodside cho biết AI hiện nay viết hơn một nửa nội dung của công ty

CryptoFrontier24phút trước

OpenAI triển khai GPT-5.5 Instant cho tất cả người dùng ChatGPT bắt đầu từ hôm nay

Theo thông báo của OpenAI ngày 6 tháng 5, GPT-5.5 Instant hiện đã có sẵn cho tất cả người dùng ChatGPT. Với người dùng trả phí, GPT-5.3 Instant sẽ vẫn được truy cập thông qua cài đặt mô hình trong ba tháng tới trước khi bị loại bỏ. Tính năng bộ nhớ đang được triển khai cho tất cả người dùng thuộc gói tiêu dùng của ChatGPT trong thời gian…

GateNews30phút trước

Google Thử nghiệm tác nhân AI 'Remy' cho Gemini, đối đầu Mở OpenClaw

Theo Business Insider, Google đang thử nghiệm một tác nhân AI mới có tên Remy cho Gemini vào ngày 6 tháng 5. Tác nhân này hiện chỉ có sẵn cho nhân viên trong ứng dụng Gemini nội bộ của Google, có thể thực hiện các hành động thay mặt người dùng trên nhiều mảng như công việc, học tập và các nhiệm vụ hằng ngày, đồng thời tích hợp với các sản phẩm khác của Google

GateNews32phút trước

Meta Lên Kế Hoạch Trợ Lý AI Được Cung Cấp Bởi Mô Hình Muse Spark để Cạnh Tranh OpenClaw, Nhắm Tới 3 Tỷ Người Dùng vào Ngày 6 Tháng 5

Theo Financial Times, Meta đang xây dựng một trợ lý AI được cá nhân hóa cao, ra mắt vào ngày 6/5, nhằm cạnh tranh với OpenClaw, được cung cấp bởi mô hình Muse Spark mới của công ty. Công cụ này sẽ phục vụ hơn 3 tỷ người dùng của công ty và hiện đang trong giai đoạn thử nghiệm nội bộ. Trợ lý hướng đến việc cho phép người dùng tạo AI

GateNews32phút trước

Alphabet tiến sát vốn hóa thị trường của Nvidia ở mức 4,67 nghìn tỷ USD, tăng 24% trong năm nay

Theo Reuters, tính đến ngày 6/5, Alphabet được định giá khoảng 4,67 nghìn tỷ USD, tiến sát mức 4,79 nghìn tỷ USD của Nvidia, khi các nhà đầu tư ủng hộ chiến lược AI và tốc độ tăng trưởng cloud nhanh hơn. Cổ phiếu Alphabet đã tăng 24% trong năm nay, so với mức tăng 7% của Nvidia. Doanh thu Google Cloud đã tăng 63% trong

GateNews45phút trước

Cloudflare: Tác nhân AI thúc đẩy lưu lượng truy cập không phải của con người, x402 cung cấp giải pháp

Giám đốc Chiến lược của Cloudflare cho biết hơn một nửa lưu lượng truy cập internet hiện nay là không phải của con người, cho thấy một sự thay đổi lớn trong các mô hình sử dụng web do tác động của các tác nhân AI và hệ thống tự động. Vị điều hành cũng cho rằng x402 Foundation đang xây dựng hạ tầng để giải quyết những thách thức

CryptoFrontier2giờ trước
Bình luận
0/400
Không có bình luận