正在阅读:实现与逝者跨时空对话 AI光会模仿原声还不够
首页> 科普频道> 科普头条 > 正文

实现与逝者跨时空对话 AI光会模仿原声还不够

来源:科技日报2019-11-05 09:18

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  “如果有个直达天堂的电梯,我一定不顾一切去看你。”日前火爆抖音的这首神曲唱出了不少人对已逝亲人的怀念之情。如果有可以和已逝亲人进行跨时空对话的“黑科技”,相信对活着的人不啻为一种巨大慰藉。而随着人工智能技术的发展,与逝者的跨时空对话或有可能实现。百度董事长兼CEO李彦宏曾表示,人工智能让每个人说的每句话、干的每件事,甚至记忆、情感、意识都能以数字化的形式存储下来放在网盘或者其他云端,思维方式也可以被机器学习,并且通过技术进行还原,与后人进行跨越时空的对话。

  模拟和逝者对话 国内外均有尝试

  “这种模拟已逝的人与后人进行对话的事情在国内外都有过尝试。”天津大学智能与计算学部博士生导师王龙标教授介绍,2011年3月11日日本大地震,许多人的生命就此定格在那个瞬间。由于灾难发生得非常突然,很多遇难者都没有留下只言片语,这让不少遇难者家属悲痛欲绝,情感上难以接受。日本就找了一些科研人员,收集遇难者生前保存的声音,模仿逝者的口吻写了遗书,并且通过语音合成技术,还原出逝者的声音并且读给家属听。家属听了以后都非常感动,觉得了却了自己的一个心愿,很多人也因此放下悲伤,鼓起勇气,勇敢去面对未来的人生。

  在国内比较广为人知的尝试就是2016年,在张国荣诞辰60周年纪念活动上,百度语音技术团队公布了一段“张国荣”与粉丝的对话实录视频。张国荣作为一个时代的巨星,影响了千万粉丝,当熟悉的声音响起,很多粉丝当场落泪,“张国荣”最后一句“永远站在光明的角落,我只希望你们开心快乐地生活”也一扫很多粉丝心头多年的阴霾。这段视频是百度语音技术团队通过机器和人工双重搜索全网张国荣的原声和采访资料后,合成的张国荣生前的声音,并且在录制视频之前征集粉丝想法,与粉丝一起完成的“互动”视频。这段“来自哥哥”但又“不是哥哥”的语音回复,音质完全来自于本人,但内容又并不能在任何一段张国荣生前的语音记录中找到,是一封根据逝者生前讲话风格编写的,来自2016年的“答粉丝信”。

  “以上的这些尝试都只停留在模仿逝者语音、语言方式层面。”王龙标说,已逝者说的内容基本上都是科研人员事先编辑好的内容,虽然目前在技术上计算机也能自动生成文本和文字,但是模仿的效果还不是很理想。比如像日本那个案例,目的就是鼓励生者更好的生活下去,如果内容编辑不当,反而会适得其反。因此这些尝试,都不是真正意义上和后人“对话”。

  做到原音重现 需收集大量数据

  为了让逝者原音重现,技术公司利用大数据与深度学习、语音合成技术,将张国荣在影视、电台和各种渠道留存下来的原声进行建模,并通过合成带有一定情感的声音模型合成了这封“答粉丝信”。通过语音合成技术实现了规模化的语料生产和自动化的数据标注,并充分发掘了深度学习技术在大数据上的处理能力,极大地扩展了语音合成系统所能使用的合成语料库的体积,使得语音合成系统包含了一定的情感,且更接近张国荣原声。

  “无论是已经能够实现的模拟逝者单方面的说话,还是未来要想实现的跨时空对话,目前的技术首先都离不开逝者生前大量的数据收集。”王龙标说,计算机要学习某个人,必须要先大量收集这个人的各种信息,在这个人生前就要把他写的文字、声音、图像、脑信号等通过各种形式保存下来。比如模仿写作风格,必须要收集他以前写过的书信、文章等,模仿一个人的语言,就需要通过录音了解他的口音、发音习惯、习惯用语、语言逻辑等。数据收集得越全,机器会模拟得越相似,这就和夫妻相一样,夫妻朝夕相处久了,会潜移默化地在行为方式、语言习惯等方面高度相似。百度相关负责人曾表示,张国荣的“答粉丝信”原音重现,之所以仍存在一些顿挫感,出现某些字词发音略不自然等情况,部分原因是受到相关情景语料缺失的限制。

  在收集大量数据的基础上,一般来说,模拟逝者语言需要语音合成、机器学习、自然语言处理等技术。如果要想做成更有感情的语言,还需要情感计算。具体来说,就是把情感因素通过计算机的方法识别和表达出来,比如这个人的语言、写的文字、各种肢体动作都代表什么情感,然后让机器去模仿并生成情感,写具有情感的文章,生成具有情感的语言,或者表达一些具有情感的肢体动作。

  实现隔空对话 脑科学研究不可少

  要实现对话,语音对话技术也必不可少,这就需要机器对对方的语言进行判断识别,并且理解、自动生成文本。目前比较常见的智能音箱应用的就是语音对话技术。不过很多时候,这些智能音箱回答的问题似是而非,只有回答对于那些设定好的问题,如天气预报、打开电视机、放一首歌曲等问题的时候,这些智能音箱才能准确地完成对话和指令。王龙标表示,要想实现机器和人之间良好的互动,就需要机器能模仿人的思维和情感,这样才能让机器的回答更聪明一些,更个性化,而不是千篇一律的答案。

  据报道,目前瑞典科学家正进行研究,通过在大脑植入微型装置,让使用者得以上载及下载自己的思想。王龙标表示,目前的情感计算,大部分是基于数据驱动的机器学习技术。如果想实现真正意义上的模拟人的意识、情感,还涉及到脑科学的范畴。不过人的大脑非常复杂,目前对人的意识、情感感知、理解与产生的生理机制的研究还非常粗浅,因此获取人的意识、情感并且记录保存下来目前还很难做到。此外,人的情感是非常复杂的。让机器认识情感并且能够拥有情感,并且在对话中通过对方的话语进行判断,和对方进行情感的交流,这在目前阶段还无法实现得很好,也是科研人员努力的方向。

  让逝者精神永生 或面临伦理风险

  虽然保存一个人的信息似乎可以让他精神永生,并能给生者带来极大的安慰,但是这种做法也存在一定的风险。王龙标表示,不排除有些人会恶意利用这些逝者的信息,为了达到自己的某种目的,模仿逝者的声音,同时把自己的意图加入进去,假冒逝者的想法去操控活着的人。

  此外,这种通过人工智能实现的“精神永生”还可能涉及到伦理问题。这有点像克隆技术,如果未来可以通过芯片技术达到模拟逝者思维的目的,甚至通过基因编辑的方式去保存复制人的思维,这些做法就很可能赋予机器人自主意识。机器人可能会有自己的思想、喜怒哀乐等情感,那么这种具备他人意识的机器人是否会面临伦理风险呢?而且当这些机器人被赋予了“生命”,其脱离控制又该如何处理?目前机器人的伦理标准还未明确,但当技术足够先进,这方面的伦理风险也会加剧,如何应对是我们需要充分考虑的问题。(陈 曦)

[ 责编:张蕃 ]
阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 澳门轻轨举行通车仪式

  • 中国驻新使馆确认新西兰火山喷发涉两名中国公民

独家策划

推荐阅读
如今,西方政府层面的教育改革趋势主要体现为同质化、同步化、集权化、标准化、考试化。
2019-12-11 09:53
区块链标准化、效率、安全与隐私、创新应用、底层的密码技术支撑等方面,是学界和业界共同关注的问题。
2019-12-11 09:53
以此消除人们对人脸信息收集、存储、处理等使用规范欠缺导致的信息泄露的担忧,建立伦理规范引领行业健康可持续发展。
2019-12-11 09:53
杨长风在会上透露,今年底,北斗三号将完成所有中圆地球轨道卫星发射任务,北斗全球系统核心星座部署完成。
2019-12-11 09:36
国家航天局发布了高分七号首批22幅亚米级立体影像产品,包括北京首都机场、大兴机场、雁栖湖,安徽泾县,广东阳春市,山东菏泽等多个地区的正射影像图、立体核线影像、数字表面模型产品等。
2019-12-11 09:36
西藏那曲市,1965年,陈金水和同事们在海拔4800米的安多,一镐一镐平整出一个标准气象观测场,建成世界上海拔最高的安多气象站。
2019-12-11 09:33
虽然他们目前开发的铠甲为塑料材质,但具有3D打印不同材料的潜力,意味着该研究提出的设计原理有望应用于其他功能性原型的设计。
2019-12-11 09:33
在刊载于《科学》杂志的论文中,研究团队解决了量子技术中普遍存在的一个问题:噪音。
2019-12-11 09:33
不同“姿态”的螺旋光对应着不同信息通路的门锁,只有知道入射光束的螺旋姿态,才能够成功解码出锁中的全息信息,保护了信息传递的安全性。
2019-12-11 09:33
凭借过硬的技术积淀,研究院研发出的电解质隔膜片电导率和材料密度,均接近理论值。
2019-12-11 09:31
黑素瘤起源于黑素细胞,是一种恶性程度高、侵袭转移性强、预后极差的致死性皮肤疾病,晚期患者5年生存率不足5%。
2019-12-11 09:31
总之,语音社交平台的涌现,是我国数字经济蓬勃发展的一种表现,也是我国互联网商业模式和技术创新的新探索。
2019-12-11 09:30
据周玲透露,这个基因突变体库的插入位点,已经对全球玉米研究人员开放共享。
2019-12-11 09:30
但朱运峰认为,取血量越大得到的结果越稳定,一滴血中肿瘤信息很少,会导致检测数据波动较大。
2019-12-11 09:30
专家提醒,水痘可以经呼吸道传播,家长要注意让孩子勤洗手多喝水,防止感冒,不在封闭拥挤的空间久留,如果家里有水痘患者,要注意隔离。
2019-12-11 09:23
“断舍离”提倡一种“更少但更好”的生活方式,它主张我们要选择适合自己的、有用的,能让人在做决策时更理性。
2019-12-11 09:22
屏幕更大的手机,相应地就需要更大容量的电池,这种电池的容量一般在3800毫安时到4500毫安时之间,续航时间约为24个小时。
2019-12-11 09:22
之后两年,彭桓武照常参加学术委员会会议,每次都积极发言,给理论物理所提出了不少有价值的建议。
2019-12-11 09:35
在场聆听故事并发言的中科院数学与系统科学研究院博士生陶睿身边还带着本科时的教材《数学分析教程》。
2019-12-11 09:34
设立于上海的物流信息互通共享技术及应用国家工程实验室里,这些有趣的设备和技术透露着一个趋势:形形色色的高科技,正助力物流行业从容应对物流“高峰”的挑战。
2019-12-10 21:39
加载更多