10,000 USDT 悬赏,寻找Gate广场跟单金牌星探!🕵️♀️
挖掘顶级带单员,赢取高额跟单体验金!
立即参与:https://www.gate.com/campaigns/4624
🎁 三大活动,奖金叠满:
1️⃣ 慧眼识英:发帖推荐带单员,分享跟单体验,抽 100 位送 30 USDT!
2️⃣ 强力应援:晒出你的跟单截图,为大神打 Call,抽 120 位送 50 USDT!
3️⃣ 社交达人:同步至 X/Twitter,凭流量赢取 100 USDT!
📍 标签: #跟单金牌星探 #GateCopyTrading
⏰ 限时: 4/22 16:00 - 5/10 16:00 (UTC+8)
详情:https://www.gate.com/announcements/article/50848
GLM-5.1让开源模型第一次在长时间工程任务上站稳脚跟
开源模型开始在长时间任务上较真了
OpenRouter宣布集成GLM-5.1,把话题从"参数有多大"拉到了"能连续干多久"。GLM-5.1在没人盯着的情况下对向量数据库优化跑了8小时,迭代600多次,性能提升6倍。这改变了开源模型的定位:不再只是便宜替代品,在工程类工作流里可能更能打——特别是Claude Opus 4.6这类闭源模型经常试几下就不再改进了。Hugging Face高层帮着宣传,但推文基本没提算力成本的事。
反应还是老样子,两极分化:
几个值得注意的点:
跑分成绩和实际落地之间的差距
"长时间任务完成率"这个说法引起了争论。Z.ai的演示(比如自己搭Linux桌面)和榜单上GLM-5.1在Terminal-Bench 2.0的63.5%(优化后69%)对不上。营销和实测之间有差距:宣传需要热度,但企业要的是能验证的案例,比如Bella Protocol的信号机器人集成。VentureBeat和Computerworld用"8小时工作日"这个角度把投资者预期抬高了。参数量在"能持续产出"面前变得没那么重要——GLM-5.1在这点上交了卷,但运维成本也更高。
这条传播路径——推文到专家转发再到媒体跟进——逼着闭源实验室解释为什么要收那么贵。Anthropic可能会推"更快版本"(比如Claude Opus 4.6 Fast)来应对。市场习惯盯着SOTA看,但低估了地缘因素可能造成的市场分裂。GLM-5.1正在测试中国AI出海策略能走多远。
结论:GLM-5.1把"能连续跑几个小时"变成了工程任务的核心指标,开源在特定工作流里开始成为默认选项。现在花精力做效率优化和混合架构验证的团队,下一阶段会更有优势。
重要性:高
分类:模型发布、行业趋势、开源
判断:对愿意自己搭建和调参的Builder、做基础设施的基金来说,这是早期红利窗口。只追通用对话能力的,相关度不高。现在不动手做长时间任务和Serving优化实验的团队,下一轮企业落地潮会落后。