Cursor 揭露自動安裝訓練方法,Composer 2 效能提升 14 個百分點

根據 Cursor 近期的披露,該公司推出一種名為 autoinstall 的訓練技術,供其 Composer 模型系列使用:採用上一代模型,為下一代強化學習自動設置可執行的環境。在訓練 Composer 2 時,Cursor 使用了 Composer 1.5 來完成這項任務。該方法分兩步進行:首先,代理會閱讀程式碼倉庫的文件與設定,以產生 10 個驗證指令及其預期輸出;其次,另一名代理會使用其中 3 個指令,從零開始設定環境,直到指令能成功執行為止,最多嘗試 5 次重試。Composer 2 在衡量環境設定能力的基準測試 Terminal-Bench 上達到 61.7% 的分數,較 Composer 1.5 的 47.9% 高出 14 個百分點。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

CZ 表示 YZi Labs 在 Consensus Miami 2026 將 70% 分配給區塊鏈,20% 分配給 AI

根據 ChainCatcher 報導,在 Consensus Miami 2026 上,趙長鵬(CZ)表示 YZi Labs 將 70% 的資金投向區塊鏈、20% 投向 AI、10% 投向生物科技。CZ 進一步補充,BNB 應被定位為 AI 代理的原生貨幣,且所有區塊鏈都需要「AI ready」以支援

GateNews39分鐘前

Public 收購 AI 投資平台 Treasury App 以擴大加密貨幣交易

根據 ChainCatcher,Public 宣布收購 AI 投資服務平台 Treasury App,以強化其由 AI 驅動的經紀業務。收購金額未予披露。Public 目前支援交易股票、債券與加密貨幣,包括 Bitcoin、Ethereum、a

GateNews2小時前

Blitzy 完成 $200M 融資輪,領投方為 Northzone

根據 ChainCatcher,Blitzy(一家由前 Nvidia 架構師 Sid Pardeshi 共同創立的 AI 編碼公司)已完成一輪由 Northzone 領投的 2 億美元 融資。Battery Ventures、Jump Capital 和 Morgan Creek Digital 參與了該輪融資。該平台可以解析複雜系統,並

GateNews2小時前

歐盟在 5 月 7 日禁止 AI 生成的深偽色情內容

根據新華社,5 月 7 日,歐洲議會議員與成員國達成共識,禁止人工智慧系統生成深度偽造色情內容。該禁令將被納入對 2024 年《人工智慧法案》的修正之中。歐洲議會

GateNews3小時前

Tether 發布 QVAC MedPsy 醫療 AI 模型,並在 17B 參數版本上取得 62.62 分

根據 Odaily,Tether AI Research Group 釋出了 QVAC MedPsy,這是一款醫療 AI 模型,旨在不依賴雲端的情況下可在智慧型手機與穿戴式裝置上本地運行。這款 17 億參數版本在七項醫療基準上取得 62.62 分,表現優於 Google 的 MedGemma-1.5-4B,領先 11.42 poi

GateNews3小時前

B.AI API 推出四款新模型,包括在 OpenAI 發布後 48 小時內推出的 GPT-5.5 Instant

B.AI API 已推出四款新模型:GPT-5.5 Instant、DeepSeek-v3.2、MiniMax-M2.7 和 GLM-5.1。GPT-5.5 Instant 在 OpenAI 發布後 48 小時內完成底層適配與介面整合,實現零延遲存取以

GateNews3小時前
留言
0/400
暫無留言