正在阅读: 靠AI阻击假新闻,或许没那么乐观

靠AI阻击假新闻,或许没那么乐观

2018-10-30 18:01来源:科技日报

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  近日,麻省理工学院计算机科学与人工智能实验室宣布与卡塔尔计算研究所合作,研究出一种可以鉴别信息来源准确性和个人政治偏见的AI系统。

  据报道,实验室研究人员利用这个AI系统创建了一个包含1000多个新闻源的开源数据集,这些新闻源均被标注了“真实性”和“偏见”的分数。并且,AI系统对其所评估的媒介有广泛的语境理解,不只单独从新闻文章中提取特征值,而是兼顾了维基百科、社交媒体,甚至根据URL和Web流量数据的结构来确定可信度。人类与假新闻的战争旷日持久,这次这个新的AI伙伴会帮助人类更快取胜吗?

  做法不难,但需要丰富数据源

  谈及AI的这个本事,中科视拓(北京)科技有限公司CEO刘昕表示:“相关做法并不难。我认为这是一个非常基础的文本分类,看介绍这个系统会标记出各类新闻是真的、假的、是否存在偏见,这是一个基础的算法,就像标记图片中的猫、狗一样,做出分类,然后可以识别一张新的图片是猫还是狗,所以这本身是一个比较简单的文本分类技术。”

  不过虽然原理不难,但实现难度不小。谈到实用性,刘昕认为,决定AI监测假新闻效率的关键在于识别数据的量级是否足够大、假新闻的来源和数量是否足够丰富。要成功判断出新闻是不是被捏造的,用来训练AI的假新闻的数据库必须够大。

  另外就是“如何抽取新闻文本中的信息”,是采用简单的分词的技术还是更高阶的文本语义理解。“有足够的假新闻用于学习,采用文本语义的信息抽取方式,可以让AI的工作更有效、准确率更有保证。”刘昕表示。

  在扩充数据量以及兼顾不同倾向的数据方面,这个新的AI系统作出有效改进:根据介绍,维基百科和推特被加入了系统的预测模型。正如研究者所说,维基百科页面的缺失也许说明了一个网站是不可信的,相关网页上也可能会提到这个问题的政治倾向如何。此外,他们还指出,没有经过验证的推特账户,或者使用新创建的没有明确标注的账户发布的消息,真实的可能性很低。

  消灭假新闻,AI也无法手到擒来

  不只这个系统,用AI阻击假新闻的尝试近年常有,不少大公司都有涉及。2017年初,Facebook曾推出Disputed标签,当网站上某些新闻被认为是错误的时,这个标签会出现在新闻下面,作为对读者的提醒。Facebook使用AI检查每天在Facebook上分享的数百万个链接,识别出其中的可疑内容,然后将它们发送给事实核查人员。当事实核查人员确定其为假时,Facebook就会减少访问范围,降低其在用户的信息流中的排序位置。听来理想,但在去年底,Facebook已经悄然放弃了这个标签功能,原因是这项努力并没有带来多大改善。追究可能的原因:确认一则消息为假需要至少两名事实核查员,这个应用过程太慢;对某些新闻给予特殊标记反而强化读者对它的印象;假新闻被标记,那部分为假或是无法证实真假的消息无法被标记等。

  虽然存在各种想象中的可能性,AI在检测假新闻方面也确实有一些优势和成效,但是,更核心的障碍或许在于连人类都无法在什么新闻是真是假、尤其是“偏见或倾向”的判断上达成一致意见。中科院自动化研究所研究员王金桥表示,AI的判断结果是训练的结果,而训练的数据来自人。如果机器学习的数据本身就是有偏见甚至偏差的,那AI的准确性很难保证。

  据了解,他们的AI系统只需检测150篇文章就可以确定一个新的源代码是否可靠,其在检测一个新闻来源是否具有高、低或中等程度的“真实性”方面的准确率为65%,在检测其政治倾向是左倾、右倾还是中立方面的准确率为70%。如何在大量含混不明、挖苦反讽、讳莫如深的政治话语中判断出倾向,目前来看,机器和人似乎一样迷惘。(崔爽)

[责编:蔡琳]

阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 巴新加强安保 迎接APEC峰会

  • 小小山楂片 铺就致富路

独家策划

推荐阅读
海洋二号卫星可全天时、全天候获取海上风、浪、流、潮汐和海温等海洋水文气象信息,将为我国的海洋观测开辟一个崭新的领域。上面搭载的定标辐射计是为海洋二号雷达高度计提供大气路径延时校正的微波辐射计。
2018-11-15 17:27
11月16日,来自60多个国家的计量科学家将汇聚在法国凡尔赛,共同见证对“修订国际单位制”的1号决议进行的表决,届时,7个基本单位中的4个或将改由物理常数重新定义。
2018-11-15 09:15
日前,国家卫健委印发《互联网诊疗管理办法(试行)》《互联网医院管理办法(试行)》《远程医疗服务管理规范(试行)》三个文件,被业界认为“靴子”终于落地。就像网购让更少的人去商场,互联网+医疗也希望让更少的人去医院,同时让不同的患者去对医院、找对医生。
2018-11-15 09:14
在北京一家IT公司上班的王骁最大的业余爱好是网络追剧,从早期追美剧到后来追英剧,直到最近迷上了国产剧。据中国网络视听节目服务协会发布的报告估算,2017年中国网络视频付费会员总数超过1.7亿。
2018-11-15 09:14
中国传统戏曲源远流长,千百年来一直是广大群众文化生活中不可或缺的重要组成部分。
2018-11-15 09:14
安全专家表示,“羊毛党”带来的危害是双向的,一方面企业付出了真金白银却丧失了真正的用户;另一方面,用户体验遭到很大破坏。除了“羊毛党”外,“寄生”在网页上的挖矿木马,也拖慢了消费者抢购的节奏。
2018-11-15 09:14
肺癌是当前中国面临的头号肿瘤威胁,有数据显示,我国每年有59万人死于肺癌。体检结果显示:共发现肺小结节(3mm以上肺内病灶)者660例,占50.00%的体检人群,并诊断出10例肺癌,其中早期9例,晚期1例。
2018-11-15 09:14
14日是“伟大的变革——庆祝改革开放40周年大型展览”向公众开放的首日,国家博物馆外寒意袭人,馆内却温暖如春,吸引了3万多名观众参观。”  在“勇攀科技高峰”单元,展览工作人员、科技部中国国际核聚变能源计划执行中心高工单子津说:“世上无难事,只要肯登攀。
2018-11-15 09:13
11月14日,亚太空间合作组织成立十周年高层论坛在北京举行。
2018-11-15 09:11
近日,中国科学院动物研究所、美国埃默里大学医学院、中国科学院干细胞与再生医学创新研究院、中国科学院大学、美国圣裘德儿童研究医院、东南大学等机构合作,首次提供了miR-137缺失导致精神疾病的在体实验证据。
2018-11-15 09:11
2018年1月28日“华龙一号”全球首堆压力容器成功吊入反应堆,意味着我国核电设备设计、制造技术水平已步入世界前列。
2018-11-15 09:10
11月14日下午,大型环形正负电子对撞机(CEPC)研究工作组正式发布了CEPC的《概念设计报告》。阮曼奇介绍,在为期十年的实验计划中, CEPC将生产超过100万个希格斯粒子,此外还将生产一亿个W玻色子和近1万亿个Z玻色子。
2018-11-15 09:10
近日,中外专家在对陕西汉中天坑群进行的一次科学考察中,在汉中的岩溶地下水调查中发现剑齿象化石。此次发现的剑齿象化石是继20世纪80年代在汉中盆地初次发现剑齿象化石之后,再次发现此类化石,也是首次在汉中天坑群溶洞中发现剑齿象化石。
2018-11-15 09:08
这是国际顶级杂志Science和世界顶尖学府MIT首次正面引用报道《半导体学报》上的原创性论文,表明了我国科技工作者在二维材料领域的原始创新能力以及《半导体学报》在国际学术界越来越重要的国际影响力。
2018-11-15 09:09
德国研究基金会日前批准柏林沙里泰大学医院新设博士研究生项目——“计算机癌症学-癌症个性化治疗的计算机方法”,目标是培养能够用计算机研究方法从事癌症研究的专业人才。
2018-11-15 09:09
来自巴西亚马孙河流域的苏瑞人携带着澳大拉西亚血统的痕迹,现在证实其祖先是在10400年前到达南美洲的。实际上,“人类在美洲的定居过程是非常复杂的”,《科学》论文第一作者、丹麦哥本哈根大学地质遗传学研究中心的Jos Vctor Moreno Mayar告诉记者。
2018-11-15 09:09
“越来越舒适的安乐窝中,人们对太空渐渐失去了兴趣。他郑重提醒:“当人工智能拥有超过人类的智力时,想象力也许是我们对于它们所拥有的惟一优势。”  短短数语,透露着的虽是一个科幻作家的忧虑,但所指向的议题却足以引起全人类的思考。
2018-11-15 09:09
11月14日下午,大型环形正负电子对撞机(CEPC)研究工作组正式发布了CEPC的《概念设计报告》。阮曼奇介绍,在为期十年的实验计划中, CEPC将生产超过100万个希格斯粒子,此外还将生产一亿个W玻色子和近1万亿个Z玻色子。
2018-11-15 09:08
近日,在自然资源部中国地质调查局组织中外专家对汉中天坑群的再一次科学考察中,在陕西汉中的岩溶地下水调查中发现剑齿象化石。
2018-11-14 17:26
题:北京生命科学研究所所长王晓东:在中国也能做世界一流科研 一路追求卓越,王晓东一直希望在中国做出影响世界的科学发现,“科学家以身作则,在中国也能做世界一流的科研”。
2018-11-14 08:54
加载更多