AI声音造假，你听得出吗----中国科学院

AI声音造假，你听得出吗

2023-08-04 中国科学报徐锐

【字体：大中小】

语音播报

如今，人工智能（AI）合成语音经常出现在短视频或有声读物中。一项8月2日发表于《公共科学图书馆-综合》的研究指出，即使知道可能正在听AI生成的语音，但讲英语和普通话的人仍然很难准确辨识出深度造假的语音。这意味着，世界上使用这些语言的数十亿人，正面临着语音造假骗局或接收错误信息的风险。

在研究中，英国伦敦大学学院的Kimberly Mai和同事让500多名参与者，挑战在多个音频片段中识别出AI深度造假的语音。其中一些片段为女性用英语或普通话阅读的真实声音，而另一些片段则是接受女性声音训练的AI创建的深度造假语音。

参与者被随机分配到两个实验组中。其中一组听20个母语语音样本，并判断真假，参与者分辨出人声和AI合成语音的准确率约为70%。这表明，人们在现实生活中对深度造假语音的辨识能力可能更糟，因为大多数人不会事先知道他们可能在听AI生成的语音。

另一组参与者听了20组随机选择的音频。每一对音频所述内容一致，分别由真实人声和AI录制，参与者需要辨识真假。这次，准确率提高到85%以上。不过研究团队表示，这种情况的测试，给听者带来了实际生活中不存在的优势。

“这种实验设置的场景不能完全代表现实生活中的场景。”Mai说，因为听众不会被事先告知他们所听的内容可能是AI伪造的。此外，说话者的性别、年龄等因素也会对真伪的识别产生影响。

美国加利福尼亚大学伯克利分校的Hany Farid说，在现实生活中，识别特定声音的真实性很重要，因为骗子可能会通过模仿上级的声音诱骗员工转账，或者将造假的知名政客语音在社交媒体上传播。该研究为深度造假语音自动检测系统的构建设立了一个有用的基线。

相关论文信息：https://doi.org/10.1371/journal.pone.0285333

如今，人工智能（AI）合成语音经常出现在短视频或有声读物中。一项8月2日发表于《公共科学图书馆-综合》的研究指出，即使知道可能正在听AI生成的语音，但讲英语和普通话的人仍然很难准确辨识出深度造假的语音。这意味着，世界上使用这些语言的数十亿人，正面临着语音造假骗局或接收错误信息的风险。在研究中，英国伦敦大学学院的Kimberly Mai和同事让500多名参与者，挑战在多个音频片段中识别出AI深度造假的语音。其中一些片段为女性用英语或普通话阅读的真实声音，而另一些片段则是接受女性声音训练的AI创建的深度造假语音。参与者被随机分配到两个实验组中。其中一组听20个母语语音样本，并判断真假，参与者分辨出人声和AI合成语音的准确率约为70%。这表明，人们在现实生活中对深度造假语音的辨识能力可能更糟，因为大多数人不会事先知道他们可能在听AI生成的语音。另一组参与者听了20组随机选择的音频。每一对音频所述内容一致，分别由真实人声和AI录制，参与者需要辨识真假。这次，准确率提高到85%以上。不过研究团队表示，这种情况的测试，给听者带来了实际生活中不存在的优势。“这种实验设置的场景不能完全代表现实生活中的场景。”Mai说，因为听众不会被事先告知他们所听的内容可能是AI伪造的。此外，说话者的性别、年龄等因素也会对真伪的识别产生影响。美国加利福尼亚大学伯克利分校的Hany Farid说，在现实生活中，识别特定声音的真实性很重要，因为骗子可能会通过模仿上级的声音诱骗员工转账，或者将造假的知名政客语音在社交媒体上传播。该研究为深度造假语音自动检测系统的构建设立了一个有用的基线。相关论文信息：https://doi.org/10.1371/journal.pone.0285333

打印

责任编辑：梁春雨

扫一扫在手机打开当前页

院机关

派驻机构

分院

院属机构

AI声音造假，你听得出吗