怎样把我的脸换成迪丽热巴的?关于AI深度合成,这篇文章干货满满
图灵奖得主杨立昆(Yann LeCun)说:“让AI向善发展的关键是开源。”
香港中文大学汤晓鸥说:“机器怎么可能超越那么有趣的灵魂。”
在7月6日开幕的世界人工智能大会中,多方专家热议AI。
(资料图片仅供参考)
在2023全球数字经济大会上,多款生成式AI产品亮相,AI音乐、AI照片玩法、AI明星带货……AI已经能够实现语音、图片、视频的深度合成。但是,AI深度合成也被用在了非法领域。近日,各地曝出多起AI诈骗案件,一些不法分子利用AI深度伪造冒充领导干部行骗。
AI深度合成是利用AI生成多媒体内容的技术,它并不是一项新鲜的技术。自2017年代码开源以来,相关应用如雨后春笋般涌现。
那么,AI深度合成的技术原理是什么?“换脸版”影视剧等相关行为违法吗?晃晃手指、说几句方言就能识别AI换脸诈骗吗?技术上如何对其进行防范?针对这些问题,《人民邮电》报记者联系了法律界、学界、业界专家进行解答。
我只是和明星换脸娱乐一下,犯什么法了?
AI换脸娱乐玩法大家一定不陌生。在图片生成应用中,用户能够通过上传自己照片的方式获得不同风格、不同种类的图片。这是最基本的AI换脸应用。在手机应用商店搜索“AI换脸”可以发现不少相关软件,其中FacePlay在苹果应用商店的下载量已达24万。
记者在短视频平台上体验了与明星换脸,上传一张照片即可快速替换明星脸,在“剧中”疯狂飙戏。
在社交平台上的“换脸版”影视剧动辄就有百万的播放量,使用开源工具进行AI换脸的教程也同样火爆。那么,我换了明星脸,发了个短视频,这犯法吗?我用开源工具训练出合成模型这也犯法吗?
上海大邦律师事务所游云庭律师对《人民邮电》报记者解释,对上传者来说,未经授权在平台上使用明星的肖像和声音,涉及侵害明星的人格权。对平台来说,平台需要对AI生成的内容做显著标识。《民法典》为网络平台设置了“通知—删除”义务,规定网络用户利用网络服务实施侵权行为的,权利人有权通知网络服务提供者采取删除、屏蔽、断开链接等必要措施,平台及时删除侵权内容的,可以免责。但若平台知晓并参与了AI换脸玩法(比如存在推荐行为),且未经明星授权的,也可能被追究责任。
游云庭进一步补充,如果上传者使用他人的肖像进行合成,涉及侵害他人的人格权,“换脸版”影视作品构成对该影视作品著作权的侵犯。
针对AI换脸诈骗,游云庭提到,《民法典》和《刑法》中都对该行为有相关规定。提取他人肖像和语音数据、训练伪造模型、编写诈骗脚本等分别涉及侵犯公民人格权的民事权利以及《刑法》中的帮信罪等。
我国在《民法典》《生成式人工智能服务管理办法(征求意见稿)》《互联网信息服务深度合成管理规定》等法律法规中已经对AI深度合成不得侵害肖像权、名誉权、知识产权等内容有所规定。
近日,中央网信办决定开展为期两个月的“清朗·2023年暑期未成年人网络环境整治”专项行动,将对网络欺凌、利用AI换脸等技术生成涉未成年人低俗色情图片视频等情况进行处置处罚。
目前已有相关案例出现。今年1月,上海市金山区人民法院审结一起AI换脸APP违法使用他人视频的肖像权纠纷案件,判决运营公司赔礼道歉并赔偿损失。能够预见,AI深度合成将在法律规定的范围内合法运行。
怎样把我的脸换成迪丽热巴的?
AI换脸背后是怎样的技术原理,经历了怎样的发展过程?
安全通用人工智能基础设施提供商瑞莱智慧(RealAI)高级产品经理张天奕对《人民邮电》报记者表示,AI深度合成目前最主要使用的技术还是生成式对抗网络(GAN),它将数据生成的逼真度推到一个新的高度,大大降低了深度合成的门槛。其生成过程简单来说就是,把A和B的人脸信息通过编码器和解码器在数字世界相互转换。
2014年,lan Goodfellow及其同事发明了生成式对抗网络(GAN),其中的生成器负责伪造图像,判别器负责鉴别图像,二者相互监督不断进步,AI伪造能力日渐强大,生成的图像越来越真实,GAN也衍生出越来越多的变体。
2017年,国外Reddit平台上名为Deepfake的用户将AI伪造图像代码开源并应用在色情产业中,自此,AI深度伪造进入大众视野并引发追捧,越来越多的换脸应用和网站出现,其应用范围也从色情产业扩展到政治演讲等,2018年“AI奥巴马”怒怼特朗普“笨蛋”“蠢货”的视频火爆全网。此后,Deepfake也逐渐成为基于深度学习的多媒体合成与篡改技术的代名词。
在国内,2019年,一款名为“ZAO”的换脸应用一时间登上榜首,但该应用“昙花一现”,上线不久后因数据安全和用户隐私问题被工信部要求整改。
如今,在社交平台上可以见到相关技术被大量应用在影视制作、广告营销、电子商务、社交娱乐等场景中。随着技术的开放开源、深度合成产品和服务的增多,深度合成内容制作的技术门槛越来越低,技术逐步“平民化”。无论是在国内还是国外,通过深度合成技术生成视频、图像、音频等内容,数量呈指数级增长,生成质量也越来越高。
镜头前晃一下手指,说几句方言,就能识别吗?
如今,AI深度合成已经可以实现一键换脸、一秒即得。对于AI换脸诈骗,用户可以从眨眼、纹理特征、五官位置、面部轮廓变化、视频连贯性、人物的面部表情与动作、声音等特征进行判别。但是,不断升级的技术已经可以弥补视觉伪影等各类图像失真。
中国信息通信研究院相关负责人表示,当前人工智能“辅助”诈骗存在四大趋势。随着人工智能技术的普及应用,不法分子实施诈骗的精准性、迷惑性、隐蔽性增强,公安、检察等政法机关办案将面临侦查破案难、电子证据调取难、认定处理难等现实困难。
专家提到,“让对方大幅度晃动”“说方言”难不倒高水平不法分子,目前方言合成方法和工具也非常丰富,音色稳定、自然度也很高。专家认为,随着深度伪造内容越来越逼真且多元,人眼和技术鉴别难度都非常高,并且在逐步提升。
对此,专家提示,用户可以追问几个只有你与好友之间才知道的私密信息,来核实对方身份。在防止自己上当受骗的同时,还要注意保护好个人图像,尽量避免在公开平台大量晒自己的照片和视频,不给不法分子提供便利。“深度伪造制作的原材料是个人音频、图片、视频,这些数据越多,训练出的视频也就越逼真、越难以鉴别。”
张天奕向《人民邮电》报记者介绍,目前技术上的鉴别方法主要是,通过真实数据和伪造数据之间的特征差异进行伪造鉴别,如频域信息、伪造痕迹、生物和物理特征等。
除此之外,通过“数字水印”的鉴别方式也较为有效。《生成式人工智能服务管理办法(征求意见稿)》中提到,利用生成式人工智能产品向公众提供服务前,应当履行算法备案和变更、注销备案手续。《互联网信息服务深度合成管理规定》中规定,应当采取技术措施添加不影响用户使用的标识,并依照法律、行政法规和国家有关规定保存日志信息。
微软首席技术官凯文·斯科特在近日接受采访时表示,微软3年来一直在研究“媒体来源系统”——在AI生成的内容里放置加密水印,可以使用软件解密水印以获取来源信息,以检测虚假信息。
张天奕提到,瑞莱智慧(RealAI)发布了生成式人工智能内容检测平台DeepReal,依托第三代人工智能技术,通过辨识伪造内容和真实内容的表征差异性、挖掘不同生成途径的合成内容一致性特征,能够快速、精准地对图像、视频、音频、文本内容进行合成鉴别,有效打击财产诈骗、色情黑产、虚假宣传、证据造假等违法行为。
深度合成和检测在不断学习攻防过程中会自我进化,规避上一代的对抗技术,加上基于深度神经网络的检测算法存在结构性缺陷等,反深伪检测技术也面临“强对抗性”,这类似于“猫鼠游戏”。未来反深伪检测技术的发展需融合多模态内容的取证分析、基于数字水印的溯源技术等多方面能力,实现伪造内容的精准识别,打造可信内容体系。
瑞莱智慧(RealAI)高级产品经理张旭东建议,对涉及政务、安防、金融、消费等重要应用的人脸识别技术漏洞进行完善和升级,防范不法分子通过后台劫持手机摄像头权限。“尤其是涉众、涉密、涉及公共利益的相关平台和技术服务提供商,需优先完成技术加固,对手机模拟器做好防范。同时,鼓励和引导更多手机厂商在系统升级时支持3D人脸识别技术。”张旭东说。
(实习生谭心琪对本文亦有贡献)
DeepReal平台
(图片来源:王怡、杨洪辰《一种AI换脸方法生成的伪造视频分析》)
7月6日,以“智联世界 生成未来”为主题的2023世界人工智能大会在上海世博中心和世博展览馆开幕。
数据显示,今年大会参展企业超400家,首发首展新品达30余款。讯飞星火、华为盘古、阿里通义、百度文心、商汤日日新等30余个大模型悉数登场,并展示大模型赋能千行百业的多元生态。
2023世界人工智能大会重点关注大模型、智能芯片、科学智能、机器人、类脑智能、元宇宙、自动驾驶、数据论坛、法治与安全、区块链等十大前沿风向,充分发挥“科技风向标、应用展示台、产业加速器、治理议事厅”重要作用,汇聚融通全球人工智能领域思想智慧、前沿技术、产业动向和人文生态,助推人工智能健康创新发展。
大会的九大“镇馆之宝”也已揭晓,包括“蚁鉴AI安全检测平台2.0”“Amazon Bedrock”“文心一格”“Graphcore100c06R C600IPU处理器PCIe卡”“昇腾AI‘大模型超级工厂’”“AI药物研发自动化解决方案”“云燧智算集群”“智能换电无人驾驶商用车Q-Truck”“腾讯多媒体实验室XMusic”九大产品。
所有入围展品都是在行业内有突出贡献及领先技术的创新成果,旨在引导和激励人工智能企业追求优秀品质,持续提升技术、产品及企业核心竞争力。
以蚂蚁科技集团股份有限公司打造的“蚁鉴AI安全检测平台2.0”为例,其融合千余项专利,自主研发,保障AI的安全性、可靠性和透明性,致力于提供AI安全可信一站式解决方案。
在安全性方面,蚁鉴2.0自研的诱导生成技术已应用于AIGC安全性检测,助力AIGC的产出符合安全规范与社会伦理;在可靠性方面,平台构建一套实战性攻击标准,对AI系统提供全面多维度的鲁棒性测评服务,有助于AI系统的改进和优化;在透明性方面,融合逻辑推理、因果推断等技术,提供涵盖完整性、准确性等7个维度及20项评估指标,对AI系统的解释性进行全面和客观的量化分析。目前,蚁鉴2.0解决方案已应用于金融、保险、安全、政务、智能客服等10多个场景,为AI系统提供全方位的安全保障。
由亚马逊云科技打造的Amazon Bedrock,是一项完全托管的生成式AI服务,通过API提供来自领先的AI初创公司和亚马逊自研的基础模型,帮助客户便捷安全地构建和扩展生成式AI应用。随着机器深度学习、大模型等关键技术的出现,新一轮科技革命和产业变革的驱动力也不断提升,推动我们加速向通用人工智能的新时代迈进。
新一轮技术创新风暴正席卷而来,在生成式人工智能应用持续渗透到我们工作、生活、娱乐等各领域的同时,也给我们带来了更多安全领域的考验和挑战。在人工智能浪潮下,如何实现新一代人工智能健康发展,仍需要产业链各端在这条赛道上凝聚共识,不断探索人工智能前沿技术,共同推进人工智能在行业走深向实,为迎接智能新时代营造更加安全、稳定、规范、有序的发展环境