2026-05-26 18:22:25
AudioHijack 攻击以最高 96% 的成功率劫持 AI 语音模型,研究发现
根据在旧金山举行的第 47 届 IEEE 安全与隐私研讨会(47th IEEE Symposium on Security and Privacy)上由浙江大学提交的研究,研究人员开发了 AudioHijack,该方案在音频中隐藏难以察觉的指令,以 79-96% 的成功率操纵大型音频-语言模型。 该攻击以人类难以感知的方式修改数字音频波形,但会改变 AI 对信号的解释方式,使其即使在存在合法用户指令的情况下也能覆盖模型行为。研究人员在 13 个开源语音模型以及来自微软和 Mistral 的商用系统上测试了 AudioHijack,发现它可以迫使模型拒绝请求、传播虚假信息、插入恶意链接,或执行未经授权的操作,例如网页搜索和文件下载。