随着人工智能技术的发展,越来越多成熟的人工智能技术被用于虚假信息活动。深度伪造视频、音频、图像、生成文本会对个人、社会和国家安全带来威胁。为此,2022年7月6日,兰德公司发布报告《人工智能、深度伪造和虚假信息》(Artificial Intelligence, Deepfakes, and Disinformation),旨在为政策制定者展示深度伪造威胁图景。报告分析了深度伪造视频、音频、图像和生成文本的底层技术和相关人工智能技术,深度伪造检测和应对技术进展,并为政策制定者提出了建议。
随着互联网的发展, 虚假信息战争 的主要根据可能就是一个简单的meme(网络流行语):社交媒体上分享的一张照片、一个视频或文本。计算机和人工智能技术的发展,为虚假信息生成和传播提供了新的工具和方法——deepfakes(深度伪造)。 深度伪造 最早是指利用人工智能应用程序制作的逼真的合成、虚假音视频内容,这些合成的虚假图像、声音和视频内容可以描绘人们从未做过和从未发生过的事情,而且深度伪造图像和音视频可以模仿目标的面部表情、动作和语音的音调、色调、重音和节奏,非常逼真,很难区分和检测。
1. 内容及分类
深度伪造内容分类随着人工智能技术的发展,越来越多、成熟的人工智能技术开始用于虚假信息活动。深度伪造内容包括深度伪造视频、深度伪造声音克隆、深度伪造图像、深度伪造生成文本4大类。 1. 1 深度伪造视频 深度伪造视频可以合成或修改视频中的人脸、表情、身体动作等。合成视频的图像主要是通过 生成对抗网络(GAN) 生成的。高度逼真的深度伪造视频需要大量的高端计算资源、时间、金钱和技巧。以2021年抖音国际版账户(Tom [@deeptomcruise] ) 上传的汤姆克鲁斯深度伪造视频为例,在人工智能模型上训练的时间就花费了2个月。此外,需要一对NVIDIA RTX 800 GPU处理器(单个GPU的售价为5795美元);开发人员还需要一帧一帧地检查合成视频中是否有被怀疑的标志,比如眼睛眨的频率等。 随着时间的推移,创建深度伪造视频会变得越来越便宜,所需的训练时间也会越来越少。同时,生成的视频质量也越来越高,越来越逼真,变得更加难以分辨和检测。目前,已经有大量的网站开始提供深度伪造合成服务。 1.2 深度伪造声音克隆 声音克隆是深度伪造应用的另一个方向。目前已经有许多在线网站和手机应用可以让用户模拟名人的声音。2019年,欺诈者用深度伪造语音技术合成语音从英国一家能源公司的首席执行官处诈骗了24.3万美元。2020年,美国费城一用户称接到疑似儿子的电话(深度伪造合成音频),被诈骗900美元 1. 3 深度伪造图像 相比深度伪造视频,合成深度伪造图像的成本更低。深度伪造图像一般以人脸图片为主,看起来非常逼真,目前就有网站可以生成逼真的本不存在的人脸图片。 下图是一个领英账户的个人简介,其中使用的照片就是深度伪造图片。深度伪造图片越来越多的被用于虚假社交媒体账户。 1. 4 深度伪造生成文本 通过使用自然语言模型,人工智能还可以生成文本。2020年9月,Guardian就使用OpenAI开发的GPT-3生成了一篇文章。此外,GPT-3机器人还被用于在Reddit社区发帖超过1周时间,平均每分钟发1个帖。 有专家对此表示担忧,文本生成程序可能会被外国对手利用来规模化生成基于文本的宣传材料。对手也可能使用深度伪造文本生成技术就特定主题大规模生成虚假新闻,应用于信息战中。