Databricks 称:顶级 AI 模型在日常企业任务中落后,小型专业化模型表现更佳

Gate News 消息,4 月 20 日——Databricks 的 David Meyer 表示,顶级 AI 模型擅长解决奥林匹克竞赛数学等复杂问题,但在日常企业工作中却力不从心。某些模型可能会把不正确的发票号码改正掉,而不是将其标记为错误;同时,像 Claude 这样的编程工具在数据工程任务上也可能表现不佳。

这一差距源于企业数据与用于训练大型模型的公开网络文本之间存在根本差异。企业数据往往具有含糊的列名、数量众多的空字段,以及以纯文本形式存储的代码。在一项学术研究中,用于平衡精确率和召回率的 AI 模型 F1 分数,在公共数据上为 0.94,而在企业数据上则降至 0.07,用于数据工程任务。此外,大型模型往往会默认采用训练中熟悉的模式;有些即使在收到公司专有查询语言的指令和文档后,仍然默认使用结构化查询语言 (SQL)。

通过强化学习调优的小型开源模型,可以比大型通用模型更高效地完成特定工作,且培训成本显著更低。Databricks 正在为特定工作流程构建更小的 AI 代理,例如 KARL,它使用强化学习进行多步骤推理,且处理的是公司文档。行业正从依赖巨型模型转向混合架构:由小而高效的模型处理日常的海量任务,然后仅在遇到不清楚或复杂的情况时才升级到更大、更昂贵的系统。

Databricks 最近收购了 Quotient AI,帮助大型企业更可靠地运行 AI 代理。如今,AI 业务的竞争焦点在于运行完整的 AI 生命周期,包括用于跟踪错误的反馈系统,以及随着时间推移持续改进模型,使得评估和调优工具在部署之后愈发重要.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

CZ 表示 YZi Labs 在 2026 年 Consensus Miami 将 70% 分配给区块链,20% 分配给 AI

根据 ChainCatcher,在 2026 年 Consensus Miami 上,赵长鹏(CZ)表示,YZi Labs 将 70% 的资金投向区块链,20% 投向 AI,10% 投向生物技术。CZ 补充称,BNB 应被定位为 AI 代理的本币,并且所有区块链都需要“具备 AI 就绪能力”以支持

GateNews47 分钟前

Zypher Network 集成 AIDEN 以提升区块链知识的可访问性

根据 IQ AI 在 5 月 6 日的官方公告,Zypher Network 集成了由 IQ AI 开发的人工智能代理 AIDEN,以提高区块链知识的可访问性,并加强 AI 驱动生态系统中的可审计性。此次合作引入了一个专门的维基页面

GateNews49 分钟前

Virtuals Protocol 推出 OpenGradient Titan 空投,今天分发 50 万 OPG

根据 Virtuals Protocol 官方公告,OpenGradient Titan Launch 空投现已于 5 月 7 日上线。符合条件的用户可以直接从其 Virtuals 账户领取 OPG 代币。今天共将分发 50 万个 OPG 代币,以奖励为 Virtuals 做出贡献者

GateNews4小时前

NVIDIA 发布 Nemotron 3 Nano Omni 开源多模态

NVIDIA 发布 Nemotron 3 Nano Omni 开源多模态模型,将视觉、语音与语言整合于单一模型,作为 AI 代理的感知层。核心为 30B-A3B MoE、256K 上下文、9x 吞吐,支持文本、影像、音讯、影片等输入,输出为文本。与 Nemotron 3 Super/Ultra 协同,适用于电脑操作、文件智能与音画理解等场景,并公开权重与训练数据,部署覆盖本地、NIM 与第三方平台。

鏈新聞abmedia5小时前

NeoSoul 和 AllScale 今日宣布就代理信用和稳定币结算达成战略合作

据 ChainCatcher 称,AI Agent Economy 项目 NeoSoul 于今天(5 月 7 日)宣布与 AllScale 建立战略合作伙伴关系,以探索信用生成和稳定币结算机制,以实现自主 Agent 协作。该合作将重点关注自动化 Agent 之间的支付流程——此举

GateNews5小时前

FIS 和 Anthropic 开发用于反洗钱的 AI 代理,并将在 2026 年下半年向 BMO 和 Amalgamated Bank 推出

FIS 和 Anthropic 正在开发旨在自动化金融犯罪调查的 AI 代理,从反洗钱行动开始。金融犯罪 AI 代理将从银行系统中提取数据,将交易与已知作案手法进行评估,并协助调查人员审查 al

GateNews7小时前
评论
0/400
暂无评论