点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:让AI自动审稿 一共分三步
首页> 科普频道> 科普头条 > 正文

让AI自动审稿 一共分三步

来源:《中国科学报》2021-07-27 09:39

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  记者 郑金武

  谈及研究AI自动审稿系统的初衷,卡内基·梅隆大学博士后刘鹏飞说,“在不同的时代背景下,都会有一些新的、不同的发展需求;一个人如果能感受到它并且把握住,那么就会成为这个时代所在领域的弄潮儿,或者成为所在领域的领先者。”

  科学研究的快速发展,使得同行评议的科学出版物呈现指数级增长。以机器学习和计算神经科学国际会议——神经信息处理系统大会(NeurIPS)为例,2017年其投稿量有3000余篇,至2020年,上升到了1万余篇。繁重的审稿工作给现有的审稿机制带来了巨大的挑战。

  “所以我们思考自动审稿的可能性,即AI能否帮助我们从繁重的审稿工作中解放出来?”刘鹏飞于是和卡内基·梅隆大学硕士生袁玮哲、助理教授格雷厄姆·纽比格合作,着手研究AI自动审稿系统“ReviewAdvisor”。在日前的智源社区青源LIVE活动上,刘鹏飞与袁玮哲在线分享了研究该系统的历程。

  解构

  之前,也有人尝试做“自动审稿”任务,但这些工作几乎都是把AI生成的评审意见和人写的意见混在一起,让大家看看能不能区分。这些工作很难评价AI生成的评审意见是否合理以及高质量。

  可以说,AI自动审稿这项工作的第一个贡献,就是提出了一些评价指标,能够从多角度刻画“评审意见”的质量。

  “对于我们来说,首先需要回答的一个问题是,什么才是一个好的评审意见。”袁玮哲认为,否则自动审稿系统就无从谈起,“因为就算设计出了系统,没有好的指标去衡量生成的评审意见的质量,也很难去提升系统”。

  为此,3人查阅了很多顶级会议的“论文评审指南”,总结出了一个好的评审意见应该具备的特征,主要有5个方面:判断性、全面性、合理性、准确性、拟人性。例如,判断性是指评审意见对一篇论文质量好坏的评判,与这篇论文最后是否被接收之间的关联性。

  同时,“我们也希望系统生成的评审意见,与人写的评审意见相比,在书写结构、语义逻辑等方面,都应该是比较类似的。”袁玮哲说。

  建模

  评价指标的挑战解除后,随之而来的是数据集的挑战。“同行评审数据非常少,而且评审数据都是非常私人的,不愿意公开。”袁玮哲认为,之所以此前很难做“自动评审”这样的研究,数据少且不公开是重要原因。

  而后出现的“公开评审”平台,让人们有机会从中获得一些评审意见数据。但因为前几年的投稿量非常少,“公开评审”平台上只有几百或者上千条数据,这样的数据量也很难进行一些自动审稿模型的训练。但近年来恰逢AI研究非常火热,投稿量基本上是年年翻倍,研究人员能够从公开评审平台上收集到足够多的数据,保证模型训练。

  于是,3人用网络爬虫工具,获取了2017年~2020年的ICLR(国际学习表征会议)和2016年~2019年的NeurIPS会议的公开评审数据,一共收集到了8000多篇论文以及2.8万多条评审意见,一篇论文一般对应3~4条评审意见。

  但爬取的这些评审意见数据,都是纯文本形式的,AI系统是无法理解的。“我们需要对评审意见里的信息进行‘表征’定义,然后,我们采取了一种半人工半自动的方法,对数据集进行标注。”袁玮哲表示,最终得到了质量非常高的数据集。

  在其后的模型训练环节,研究人员先在论文中抽取一些非常重要的句子,用这些句子来做评审意见的生成。在这种先抽取后生成的框架下,他们综合运用了2种抽取策略以及两种生成策略,并最终成功形成了AI自动审稿系统“ReviewAdvisor”。

  伦理

  AI自动审稿系统“ReviewAdvisor”出来后,得到了很多正向的反馈。有人在试用了该系统后,表示该系统生成的评审意见,比过去他收到的一些由专家写的意见更具有建设性。

  那么,论文审稿人真的就要被替代了吗?

  在对一些客观条件识别方面,“ReviewAdvisor”具有明显的优势。例如论文违反了匿名规则,系统可以很快识别出来,直接给出“拒稿”意见。

  但是,“我们的系统也会生成带有偏见的评审意见。”袁玮哲说。

  对于英语为母语的作者的论文和非英语为母语的作者的论文,由人写的评审意见和系统生成的评审意见都认为,在论文的“清晰性”方面,英语为母语的作者表现得更好。袁玮哲认为,这或许是有一定道理的,“确实非英语为母语的作者在写文章时,用英语表达观点会有一些困难”。

  但是,系统生成的评审意见还得出“英语为母语的作者的论文更具有创新性”。袁玮哲说,这可能是系统目前在“偏见”方面存在的比较显著的问题。

  研究论文提交后,谷歌公司科学家在推特上说,“可以尝试一下这个系统,但千万不要用这个系统的结果取代审稿工作,否则也太对不起被审论文的作者了”。

[ 责编:武玥彤 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 第137届广交会第二期开幕

  • 无人驾驶插秧机助力春耕生产

独家策划

推荐阅读
从老人登山有了“赛博外挂”,到“养老机器人”成为热词,今年以来,机器人相关话题持续升温。
2025-04-24 09:40
航天诱变紫云英新品种,固氮效能更高了,综合生态效应也非常大
2025-04-24 09:34
这项研究不依赖直接改变作物的遗传背景,而是通过调控根际的微生物组来优化作物在田间的生长表现。
2025-04-24 09:26
以斑马鱼、涡虫和链霉菌作为研究对象开展生命科学实验
2025-04-24 09:24
涅槃重生的AI开口说话了——一面是口若悬河,一鸣惊人;另一面却是信口雌黄,“鬼话”连篇。
2025-04-24 09:22
春日的北京,一场充满未来感的马拉松赛事吸引了众人的目光——全球首个人形机器人半程马拉松赛在21.0975公里的赛道上展开角逐,20支机器人队伍参赛。 在制造业,目前人形机器人承担的是繁重、泛化性强、高度重复的工作,例如搬运颜色、重量、尺寸各不相同的箱子,分拣不同形状的零配件。
2025-04-24 09:19
数字技术带给阅读前所未有的便利,同时也提出了新课题。
2025-04-23 10:34
农民种粮能挣钱,粮食生产才有保障。在种粮农民收益保障机制中,农业保险是重要方面。今年中央一号文件提出:“推动扩大稻谷、小麦、玉米、大豆完全成本保险和种植收入保险投保面积”“健全多层次农业保险体系,支持发展特色农产品保险”。
2025-04-23 10:31
身高172厘米,通体银色,一台台人形机器人在产线上分拣物料、搬运料箱、安装零件……科幻电影里的场景照进现实。
2025-04-23 10:26
再接再厉、乘势而上,一步一个脚印朝着建设航天强国的目标迈进,中国的航天事业必将开拓更高境界,中国的科技创新将书写崭新篇章。
2025-04-23 09:24
天地图是自然资源部门向社会提供各类在线地理信息公共服务、推动地理信息数据开放共享的政府网站。
2025-04-23 09:22
4月22日,在北京航天飞行控制中心的统一调度下,神舟二十号载人飞船发射任务组织全区合练——酒泉卫星发射中心、西安卫星测控中心以及任务各测控点实施联调联控,全面模拟发射准备、发射以及飞行过程中的各种技术状态和工作过程。
2025-04-23 09:21
让人形机器人跑马拉松,与其说是人机竞技,不如说是机器的自我迭代。
2025-04-23 09:15
当今,百年变局中的全球价值链重构,既考验着中国的战略定力,也孕育着我国从“跟跑”到“领跑”的跃迁机遇。
2025-04-23 09:13
废旧电器回收不仅能化解生态环境和人体健康风险,还推进了数据安全治理与资源循环利用领域的双重突破,为可再生资源回收利用行业带来广阔的市场空间。
2025-04-22 10:05
建设农业强国,利器在科技。让农业插上科技的翅膀,重塑“三农”发展新优势,我们才能在加快建设农业强国的道路上展翅翱翔。
2025-04-22 10:04
最新一期《自然》发表了两项独立临床试验研究,验证了干细胞疗法对帕金森病的安全性。为检验帕金森病细胞疗法的安全性和潜在副作用,日本京都大学等机构进行了一项Ⅰ/Ⅱ期临床试验。
2025-04-22 10:03
转型不是丢掉已有禀赋和基础,而要依托技术,在推进资源精深加工、资源产业向下游延伸上下功夫
2025-04-22 09:23
空间站徜徉在浪漫星辰中,书中文字仿佛随之流淌,飘入心间。在空间站里过大年,除了欢乐祥和,更多的是一份守望——守望万家灯火团圆,守望壮美山河辽阔,守望祖国繁荣昌盛、国泰民安。
2025-04-22 09:21
山水工程交出厚厚的生态账本:截至2024年底,52个山水工程累计完成治理面积超830万公顷,其中包括255万公顷森林草原、130万公顷水土流失地、10.7万公顷矿山修复地等,累计完成生态修复面积超1.2亿亩。
2025-04-22 09:19
加载更多