Gate News 訊息,4 月 20 日 — 根據 Databricks 的 David Meyer 表示,頂級 AI 模型擅長解決奧林匹亞數學等複雜問題,但在例行企業工作上卻力有未逮。某些模型可能會把不正確的發票編號更正掉,而不是將其標記為錯誤;而像 Claude 這樣的程式碼工具在資料工程任務上也可能同樣表現不佳。
這個落差源於企業資料與用來訓練大型模型的公開網路文字之間存在基本差異。企業資料往往包含模糊的欄位標籤、大量空白欄位,並且以純文字形式存放程式碼。在一項學術研究中,某個 AI 模型的 F1 分數(在精確率與召回率之間做平衡)從公開資料的 0.94 下降到資料工程任務中企業資料的 0.07。此外,大型模型通常會預設採用訓練期間熟悉的模式;有些模型即使在收到針對公司專有查詢語言的指示與文件後,仍預設使用結構化查詢語言 (SQL)。
透過強化學習調校的小型開源模型,能以比大型通用模型更有效率的方式處理特定工作,且訓練成本大幅降低。Databricks 正在為特定工作流程打造更小的 AI 代理,例如 KARL:它使用強化學習,透過公司的文件進行多步推理。產業正從仰賴巨型模型,轉向混合式架構:由小型且高效的模型處理例行的龐大輸入量,只有在遇到不明確或複雜的情況時,才將任務上升到更大型、成本更高的系統。
Databricks 近期收購了 Quotient AI,協助大型企業更可靠地運行 AI 代理。目前在 AI 產業中,競爭重點已轉向能否完整跑完 AI 生命週期,包括用於追蹤錯誤的回饋系統,並隨時間持續改進模型;因此,評估與調校工具在部署後變得愈發重要。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
AWS 合作夥伴 Coinbase、Stripe 用於 AI 代理的 USDC 付款
亞馬遜網路服務(Amazon Web Services)週四宣布與 Coinbase 及 Stripe 建立合作夥伴關係,以便讓人工智慧代理使用穩定幣執行交易,這標誌著主要雲端供應商對區塊鏈式付款基礎設施的重大整合。AWS 揭示了「Amazon Bedrock Ag
Crypto Frontier6小時前
CZ 表示 YZi Labs 在 Consensus Miami 2026 將 70% 分配給區塊鏈,20% 分配給 AI
根據 ChainCatcher 報導,在 Consensus Miami 2026 上,趙長鵬(CZ)表示 YZi Labs 將 70% 的資金投向區塊鏈、20% 投向 AI、10% 投向生物科技。CZ 進一步補充,BNB 應被定位為 AI 代理的原生貨幣,且所有區塊鏈都需要「AI ready」以支援
GateNews7小時前
Zypher Network 導入 AIDEN 以提升區塊鏈知識的可近性
根據 IQ AI 於 5 月 6 日的官方公告,Zypher Network 已整合由 IQ AI 開發的 AIDEN,這是一款人工智慧代理,以提升區塊鏈知識的可近性,並強化 AI 驅動生態系統中的可稽核性。此次合作推出了一個專屬的維基頁面
GateNews8小時前
Virtuals Protocol 推出 OpenGradient Titan 空投,今部分發 50 萬 OPG
根據 Virtuals Protocol 的官方公告,OpenGradient Titan Launch 空投已於 5 月 7 日正式上線。符合資格的用戶可直接從其 Virtuals 帳戶領取 OPG 代幣。今天將發放總計 500,000 OPG 代幣,以獎勵對 Virtuals 的貢獻者。
GateNews11小時前
NVIDIA 發表 Nemotron 3 Nano Omni 開源多模態
NVIDIA 公布 Nemotron 3 Nano Omni 開源多模態模型,將視覺、語音與語言整合於單一模型,作為 AI 代理的感知層。核心為 30B-A3B MoE、256K context、9x 吞吐,支援文字、影像、音訊、影片等輸入,輸出為文字。與 Nemotron 3 Super/Ultra 協同,適用電腦操作、文件智慧與音畫理解等場景,並公開權重與訓練資料,部署覆蓋本地、NIM 與第三方平台。
鏈新聞abmedia12小時前
NeoSoul 與 AllScale 今日宣布在代理信貸與穩定幣結算方面的策略合作
根據 ChainCatcher,AI Agent Economy 專案 NeoSoul 於今日(5 月 7 日)宣布與 AllScale 建立策略合作夥伴關係,藉此探索用於自主 Agent 協作的信用生成與穩定幣結算機制。該合作夥伴關係將聚焦於自動化 Agent 之間的付款流程——作為
GateNews13小時前