Alibaba's PAI phát hành mô hình AgenticQwen mã nguồn mở: Phiên bản 8B tiến gần hiệu năng 235B nhờ dual data flywheels

Tin tức Cổng, 27 tháng 4 — Nhóm PAI của Alibaba đã phát hành và mã nguồn mở AgenticQwen, một mô hình ngôn ngữ dạng tác nhân quy mô nhỏ được thiết kế cho các ứng dụng gọi công cụ ở mức công nghiệp. Mô hình có hai phiên bản: 8B và 30B-A3B. Được huấn luyện thông qua một khung học tăng cường “dual data flywheel” sáng tạo, AgenticQwen đạt được các năng lực cấp độ tác nhân gần tương đương mô hình hàng nghìn tỷ tham số, đồng thời giảm đáng kể chi phí suy luận.

Cơ chế dual data flywheel giải quyết vấn đề đồng nhất hóa trong dữ liệu tổng hợp truyền thống. Flywheel lý luận tự động tạo ra các biến thể khó hơn từ lỗi của mô hình, trong khi flywheel tác nhân mở rộng các quy trình tuyến tính đơn giản (như các quy trình đặt chỗ) thành các cây hành vi nhiều nhánh có ràng buộc, các tình huống bị từ chối và điều kiện đối kháng, mô phỏng các kịch bản ra quyết định phức tạp trong thực tế. Các bài benchmark cho thấy AgenticQwen-8B đạt 47.4 trên các benchmark môi trường công cụ thực tế (TAU-2 và BFCL-V4), vượt xa đáng kể Qwen3-8B gốc (23.8) và tiệm cận Qwen3-235B (52.0). AgenticQwen-30B-A3B (với chỉ 3B tham số được kích hoạt) đạt 50.2.

Mô hình đã được triển khai trong các hệ thống sản xuất nội bộ tương tự Manus, thu hẹp đáng kể khoảng cách với các mô hình 235B về thời gian suy luận end-to-end. Tuy nhiên, mô hình bị giới hạn bởi độ dài ngữ cảnh gốc 40K token, điều này hạn chế hiệu năng của nó đối với các tác vụ tìm kiếm sâu.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Các đối tác AWS của Coinbase và Stripe cho thanh toán USDC của AI Agent

Amazon Web Services hôm thứ Năm đã công bố quan hệ hợp tác với Coinbase và Stripe để cho phép các tác nhân trí tuệ nhân tạo thực hiện giao dịch bằng stablecoin, đánh dấu một bước tích hợp đáng kể về hạ tầng thanh toán dựa trên blockchain của một nhà cung cấp điện toán đám mây lớn. AWS đã giới thiệu “Amazon Bedrock Ag

CryptoFrontier7giờ trước

CZ cho biết YZi Labs phân bổ 70% cho blockchain và 20% cho AI tại Consensus Miami 2026

Theo ChainCatcher, tại sự kiện Consensus Miami 2026, Zhao Changpeng (CZ) cho biết YZi Labs phân bổ 70% nguồn vốn cho blockchain, 20% cho AI và 10% cho công nghệ sinh học. CZ cho biết BNB nên được định vị như một loại tiền tệ bản địa cho các tác nhân AI, và tất cả các blockchain cần phải “sẵn sàng cho AI” để hỗ trợ

GateNews8giờ trước

Zypher Network Tích Hợp AIDEN để Cải Thiện Khả Năng Tiếp Cận Kiến Thức Blockchain

Theo thông báo chính thức của IQ AI vào ngày 6/5, Zypher Network đã tích hợp AIDEN, một tác nhân trí tuệ nhân tạo do IQ AI phát triển, nhằm nâng cao khả năng tiếp cận kiến thức blockchain và tăng cường tính kiểm toán trong các hệ sinh thái do AI vận hành. Sự hợp tác này giới thiệu một trang wiki chuyên biệt

GateNews9giờ trước

Virtuals Protocol ra mắt OpenGradient Titan Airdrop, phân phối 500K OPG hôm nay

Theo thông báo chính thức của Virtuals Protocol, sự kiện OpenGradient Titan Launch airdrop hiện đã được kích hoạt kể từ ngày 7/5. Người dùng đủ điều kiện có thể nhận (claim) token OPG trực tiếp từ tài khoản Virtuals của mình. Tổng cộng 500.000 token OPG đang được phân phối hôm nay để thưởng cho những người đóng góp cho Virtuals

GateNews12giờ trước

NVIDIA công bố Nemotron 3 Nano Omni mã nguồn mở đa phương thức

NVIDIA công bố mô hình đa phương thức mã nguồn mở Nemotron 3 Nano Omni, tích hợp thị giác, giọng nói và ngôn ngữ trong một mô hình, đóng vai trò lớp cảm nhận cho các AI agent. Cốt lõi là 30B-A3B MoE, context 256K, thông lượng 9x, hỗ trợ đầu vào dạng văn bản, hình ảnh, âm thanh, video… và đầu ra là văn bản. Kết hợp với Nemotron 3 Super/Ultra, phù hợp cho các kịch bản như thao tác trên máy tính, trí tuệ tài liệu và hiểu biết đa phương tiện, đồng thời công khai trọng số và dữ liệu huấn luyện, triển khai trên nền tảng cục bộ, NIM và các nền tảng bên thứ ba.

ChainNewsAbmedia13giờ trước

NeoSoul và AllScale công bố quan hệ đối tác chiến lược về tín dụng tác nhân và thanh toán bằng stablecoin ngay hôm nay

Theo ChainCatcher, dự án AI Agent Economy NeoSoul hôm nay (7/5) đã công bố quan hệ đối tác chiến lược với AllScale nhằm nghiên cứu cơ chế hình thành tín dụng và thanh toán bằng stablecoin cho sự cộng tác của các Agent tự động. Quan hệ đối tác này sẽ tập trung vào việc tự động hóa các luồng thanh toán giữa các Agent—trong đó

GateNews14giờ trước
Bình luận
0/400
Không có bình luận