📢 Gate 广场 TradFi 交易分享挑战上线!
晒单瓜分 $30,000 奖池,新人首帖 100% 中奖!
📌 参与方式:
带 #TradFi交易分享挑战 发帖,满足以下任一即可:
🔹 带今日指定 TradFi 币种标签发帖交流。
🔹 完成单笔大于 $10U 的 TradFi CFD 交易并挂载交易卡片。
🏷️ 今日指定标签:USDJPY、AUDUSD、US30、TSLA、JPN225
🎁 宠粉福利:
1️⃣ 卡片分享奖: 抽 50 人,每人送 $100 仓位体验券!
2️⃣ 发帖榜单奖: 冲排行榜,赢 WCTC 限定 T 恤!
3️⃣ 新粉见面礼: 新人首次发帖,100% 领 $10 体验券!
详情:https://www.gate.com/announcements/article/51221
何恺明团队ELF:语言扩散模型终于跑通
扩散模型在图像生成里已经成熟,但放到文本上一直很别扭:图像天然是连续信号,语言却由离散 token 组成。此前不少连续扩散文本模型,要么在生成轨迹中反复引入 token 级监督,要么需要额外独立解码器。ELF 的做法更干净:大部分步骤只在连续向量空间里去噪,最终一步再用共享权重网络完成离散化。
实验结果也有冲击力。在 OpenWebText 无条件生成评测中,105M 参数的 ELF-B 用 32 步采样达到约 24.1 的 Gen. PPL,优于多种离散和连续扩散语言模型基线。更关键的是,ELF-B 只用了约 45B 训练 token,而对比方法通常超过 500B,训练 token 少了约一个数量级。这个结果至少说明,连续扩散路线在语言建模里并没有被「语言离散性」堵死,之前的问题更可能出在建模接口和采样设计上。