Mistral AI phát hành Leanstral: Agent mã nguồn mở Lean 4 đầu tiên, có thể tự động xuất bản chứng minh hình thức

Tin tức Gate News, ngày 17 tháng 3, Mistral AI đã chính thức ra mắt Leanstral, đây là mã nguồn mở đầu tiên dành riêng cho công cụ xác thực hình thức Lean 4. Mô hình này có điểm đột phá cốt lõi là khả năng sinh mã của AI đồng thời xuất ra các chứng minh hình thức có thể tự động kiểm tra bởi Lean 4, giúp vượt qua rào cản kiểm duyệt thủ công trong quá trình tạo mã AI truyền thống.

Leanstral sử dụng kiến trúc MoE thưa, có tổng cộng 120 tỷ tham số và 6 tỷ tham số kích hoạt, mở mã theo giấy phép Apache 2.0, và đã được tối ưu hóa huấn luyện đặc biệt cho lean-lsp-mcp. Người dùng có thể khởi động mà không cần cấu hình qua lệnh /leanstall trong Mistral Vibe hoặc gọi qua API miễn phí tại điểm cuối labs-leanstral-2603, đồng thời hỗ trợ tải trọng số để tự triển khai.

Mistral cũng đồng thời phát hành chuẩn đánh giá mới mang tên FLTEval, sử dụng dự án xác thực hình thức của định lý Fermat trong cộng đồng Lean 4 làm bối cảnh thử nghiệm. Kết quả so sánh hiệu suất cho thấy: Leanstral pass@2 với chi phí 36 USD đạt điểm 26.3, vượt xa Claude Sonnet 4.6 với chi phí 549 USD đạt 23.7 điểm; pass@16 với chi phí 290 USD đạt 31.9 điểm, dẫn trước Sonnet 8 điểm, trong khi Claude Opus 4.6 cần tới 1.650 USD mới đạt 39.6 điểm. Trong các mô hình mã nguồn mở, Qwen3.5-397B-A17B cần chạy 4 lần mới đạt 25.4 điểm, vẫn thấp hơn hiệu suất của Leanstral pass@2.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Người dùng Wasabi Protocol giờ đây có thể rút an toàn số tiền còn lại

Theo tuyên bố chính thức của Wasabi Protocol trên X, người dùng hiện có thể tương tác an toàn với các hợp đồng thông minh của giao thức và rút số tiền còn lại. Nhóm đang làm việc để điều tra sự cố nhưng chưa công bố thêm bất kỳ chi tiết nào tại thời điểm này, cho biết rằng các cập nhật tiếp theo sẽ được chia sẻ w

GateNews3phút trước

Cộng đồng dYdX Phê duyệt loại bỏ 4 cặp giao dịch, bao gồm AKT-USD, GNO-USD

Theo Odaily, cộng đồng dYdX đã thông qua việc xóa bốn cặp giao dịch—AKT-USD, GNO-USD, MNRY-USD và MOG-USD—thông qua bỏ phiếu quản trị. Đề xuất nhận được 90,96% ủng hộ từ 16 trình xác thực đang hoạt động và 124 tài khoản tham gia, tương ứng tỷ lệ bỏ phiếu chung là 46,86%. Không có nội dung nào khác

GateNews34phút trước

Arbitrum chuẩn bị phát hành $71M ETH sau khi KelpDAO bị tấn công

Arbitrum thúc đẩy kế hoạch phát hành 30.765 ETH thông qua bỏ phiếu DAO để hỗ trợ phục hồi và ổn định các giao thức DeFi bị ảnh hưởng. Khai thác Kelp DAO đã tạo ra tình trạng thiếu hụt rsETH đáng kể, trong đó quỹ phục hồi chỉ bù đắp được một phần sự mất cân đối thanh khoản. Nhiều giao thức cam kết 43.000 ETH, nhấn mạnh

CryptoFrontNews1giờ trước

Bakkt hoàn tất thương vụ mua lại DTR trong bối cảnh tăng trưởng doanh thu và tái cơ cấu chiến lược

Bakkt đã hoàn tất việc mua lại Distributed Technologies Research, một động thái nhằm tích hợp hạ tầng stablecoin bản địa AI vào các dịch vụ tài chính cốt lõi của mình. Hiện đại hóa thanh toán toàn cầu Bakkt Inc. đã hoàn tất việc mua lại Distributed Technologies

Coinpedia6giờ trước

Người dùng Wasabi Protocol giờ đây có thể tương tác an toàn với các hợp đồng và rút tiền

Theo Wasabi Protocol, người dùng hiện có thể tương tác an toàn với các hợp đồng của giao thức để rút toàn bộ số tiền còn lại. Nhóm đang điều tra sự cố và cho biết hiện không thể tiết lộ thêm chi tiết, nhưng sẽ cập nhật cho cộng đồng khi tình hình cho phép.

GateNews6giờ trước

Paul Sztorc: Nhánh Fork eCash làm dấy lên lo ngại từ các nhà phát triển

Các nhà phát triển và các nhân vật trong ngành đã nêu lo ngại về một đề xuất eCash, cho rằng có rủi ro đối với người dùng, phân bổ không đồng đều và sự căng thẳng về mặt triết lý, theo nội dung nguồn. Lo ngại của nhà phát triển Đề xuất này bị mô tả là đưa vào cho người dùng nhiều nhóm rủi ro, dù cụ thể thì…

CryptoFrontier7giờ trước
Bình luận
0/400
Không có bình luận