10,000 USDT 悬赏,寻找Gate广场跟单金牌星探!🕵️♀️
挖掘顶级带单员,赢取高额跟单体验金!
立即参与:https://www.gate.com/campaigns/4624
🎁 三大活动,奖金叠满:
1️⃣ 慧眼识英:发帖推荐带单员,分享跟单体验,抽 100 位送 30 USDT!
2️⃣ 强力应援:晒出你的跟单截图,为大神打 Call,抽 120 位送 50 USDT!
3️⃣ 社交达人:同步至 X/Twitter,凭流量赢取 100 USDT!
📍 标签: #跟单金牌星探 #GateCopyTrading
⏰ 限时: 4/22 16:00 - 5/10 16:00 (UTC+8)
详情:https://www.gate.com/announcements/article/50848
谷歌开源Gemma 4全系MTP投机解码模型,最高提速3倍
币界网消息,谷歌发布并开源了Gemma 4系列的多token预测(MTP)草稿模型。该模型采用投机解码架构,能够在主模型保留最终验证权的基础上,实现最高3倍的推理提速,且不损耗输出质量。MTP方案利用闲置算力,提前预测多个未来token,再交由重型目标模型并行验证。若目标模型同意草稿,就会一次性接收整段序列。草稿模型共享目标模型的激活状态和KV缓存,针对E2B和E4B模型,团队在嵌入层引入聚类技术。目前,MTP模型已全面开源,支持VLLM、SGLang和Ollama等主流推理框架。这次优化显著降低了应用门槛,使开发者能在普通消费级显卡上流畅运行26B MOE和31B稠密模型,也能在移动设备上以更低功耗支撑实时AI交互。