点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:还有比这更狠的学霸?人工智能:我教我自己
首页> 科普频道> 科普头条 > 正文

还有比这更狠的学霸?人工智能:我教我自己

来源:《中国科学报》2021-01-21 10:08

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  如果要学的东西太简单或太难,人类可能会因此无聊或沮丧,但人工智能不会。在刚结束不久的神经信息处理系统大会(NeurIPS)上,来自美国加州大学伯克利分校和谷歌公司的研究者展示了一项新方法,让人工智能自我训练。

  这一新方法有望让自动驾驶汽车、家用机器人更快地学习,甚至可能帮助攻破悬而未决的数学难题。

  人工智能在地图导航领域已有不少研究,其中一种实验方法是让人工智能程序沿着有实心分布块的2D网格导航。为了让程序更快地熟悉复杂环境并到达目的地,科学家会对其反复训练,从而达到强化目的,进而提高人工智能的应用程度。

  新发布的研究中,加州大学伯克利分校的迈克尔·丹尼斯和谷歌科学家娜塔莎·杰奎斯考虑了两种绘制地图的方法。第一种方法是在网格中随机安排分布块,但这一方法并没有让人工智能程序有很大提升。第二种方法则让人工智能程序记住过去的尝试,并相应地提升训练难度——但这种方法的瓶颈在于有时训练模式的难度太大,程序根本无法完成。

  为此,丹尼斯和杰奎斯等人创造了一个合适的环境,让人工智能自我训练。在名为PAIRED的新训练方法中,他们先将已有的人工智能程序与另一个几乎相同的程序结合,两者的优势各不相同,但互为“对手”。在这一模式中,已有的人工智能程序是主角,但因为遇到了旗鼓相当的“对手”,挑战变得非常困难,也正因此,其解决问题的能力一直处于临界状态。

  经过一系列训练,作为主角的人工智能程序可以解决大约1/5的新问题。在NeurIPS的讨论会上,丹尼斯表示他们对新成果即将开展的大量工作感到兴奋。

  同期,在讨论会上发布的另一项研究中,杰奎斯和同事已经在用PAIRED训练其他人工智能程序,使之学会自动填写网络表单并预订航班。与传统模式相比,采用新训练模式的成功率约为50%。

  对此,人工智能促进协会主席、康奈尔大学计算机科学家巴特·塞尔曼表示,PAIRED是一种机智的人工智能训练方法。

  塞尔曼等人在讨论会上介绍的研究也与人工智能的自我训练有关。他们设计的人工智能程序需要在推箱子游戏中将方块推向目标位置。如果规划不当,方块很可能陷入死胡同。

  为训练人工智能,塞尔曼和同事创建了一组更简易的拼图。训练程序会根据人工智能的表现好坏,选择不同难度的“考题”,从而让训练计划达到合适水准。

  不过,到目前为止,考题对人工智能而言是难还是简单并不好预测。在出给人工智能的225道考题中,有80%被破解,其中约1/3的考题完全来自新的训练方法。塞尔曼表示,这一研究发现非常有趣,未来他们希望将相关成果应用到解决数学难题上。(袁柳)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平会见柬埔寨人民党主席、参议院主席洪森

  • 上海电视节揭晓白玉兰奖

独家策划

推荐阅读
当地时间24日,世界气象组织在日内瓦为中国工程院院士、中国气象局卫星气象专家许健民颁发第七十届国际气象组织奖,表彰他为天气预报、卫星气象事业以及气象业务服务作出的卓越贡献。
2026-06-26 09:28
来自英国伦敦国王学院与加拿大麦克马斯特大学衍生公司Block Biosciences等机构的科学家,正在研制一类靶向IMPDH2酶的候选药物。团队已设计并合成了数百种靶向IMPDH2的候选药物,正从中层层筛选最优化合物,力争尽快推向临床开发。
2026-06-26 09:26
6月25日,以“弘扬伟大抗疫精神 走好疾控新长征路”为主题的2026年“我和我的疾控故事”宣讲会在中国疾病预防控制中心举办。中国疾病预防控制中心性病艾滋病预防控制中心综合防治与政策室主任单多的故事,要从一双生了冻疮的手讲起。
2026-06-26 09:23
届链博会期间,贸促智库交流活动暨全球供应链报告与指数发布会在京举办。2018—2025年,促进指数、连接指数、创新指数、韧性指数均呈上行态势,表明全球供应链继续朝着更具韧性、更有效率、更富活力的方向发展。
2026-06-26 09:20
需要看到,保护耕地是推进乡村全面振兴、建设宜居宜业和美乡村的重要组成部分,广大农民是保护耕地的重要行动主体。
2026-06-26 09:19
卢宇彤介绍,“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。如今,面向科学、工程、产业各领域的大规模应用需求,“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。
2026-06-25 09:36
日内瓦时间6月24日,中国工程院院士许健民从世界气象组织秘书长塞莱丝特·绍洛手中郑重接过第70届国际气象组织奖奖章。作为我国气象卫星事业的开拓者、见证者,许健民的身影,也是中国气象人实干创新、勇攀高峰的生动写照。
2026-06-25 09:33
在中国与泰国联合倡议下,世界贸易组织信息技术协定委员会23日举办专题研讨会,围绕信息技术协定支持人工智能就绪及包容性数字化转型展开探讨。
2026-06-25 09:32
如果它们真的是宇宙中的某种全新的事物,将改变我们对宇宙的认知,正如20世纪60年代类星体(星系中心进食的黑洞)的发现彻底革新了星系演化理论一样。”  无论直接坍缩理论是否正确,小红点都可能是超大质量黑洞的前身,后者构成了现代星系的核心。
2026-06-25 09:27
绿电直连之所以能够从概念走向实践,离不开技术进步与产业协同的共同托举。随着市场机制与技术体系不断成熟,绿电直连有望从单点示范走向规模化网络发展,成为产业绿色转型的“新动脉”。
2026-06-25 09:32
事实上,天气预报从来不是一成不变的“标准答案”,而是一门在复杂大气运动中不断逼近天气真相的科学。但我们必须正视:天气预报是一门预测科学,天气系统的复杂性,是全球气象领域共同面临的世界级难题。
2026-06-25 09:28
AI的介入,正在将控制“人造太阳”从一门依赖经验和试错的手艺,提升为一门可计算、可预测、可自主优化的科学。
2026-06-25 09:31
瑞士巴塞尔大学科学家研制出一款多功能纳米递药机器人,由推进模块和有效载荷模块构成,两种模块可重复使用,并能够自行组装。
2026-06-24 09:58
从“双链贯通”升级为“四链融合”,折射出中国推动科技创新与产业创新深度融合的有力步伐。
2026-06-24 09:48
该成果通过改善帕金森患者最难治疗的行走障碍,开启了个性化神经调控新篇章。
2026-06-24 09:47
国家卫生健康委23日印发《营养指导员服务技术指南(试行)》,针对营养指导员提出营养监测与调查、膳食营养状况评价、营养咨询与指导、营养配餐、营养科普教育等五方面工作的技术能力要求。
2026-06-24 09:46
国家粮食和物资储备局23日发布的最新数据显示,随着夏粮陆续收获上市,旺季收购正逐步展开。
2026-06-24 09:44
瑞典哥德堡大学和查尔姆斯理工大学研究团队在人工智能(AI)应用方面取得新成果,教会一款名为SmartTrap的AI系统使用光学镊子,从而让光镊实现了全自动运行。光镊是一种利用高度聚焦的激光束来操控微小物体的技术,其操作对象包括单个DNA分子、活细胞以及其他直径远小于发丝的微观粒子。
2026-06-23 09:40
“十五五”规划纲要提出,建立健全数据产权、流通利用、收益分配、安全治理等数据要素基础制度。
2026-06-23 09:38
上午9时,随着小浪底水利枢纽3个闸门徐徐升起,巨大水流喷涌而出,在空中形成层叠奔涌的排浪,轰鸣着冲向水面——2026年度黄河调水调沙正式启动。
2026-06-23 09:35
加载更多