点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:决策智能:方兴未艾的人工智能新方向
首页> 科普频道> 科普头条 > 正文

决策智能:方兴未艾的人工智能新方向

来源:《中国科学报》2020-11-19 08:58

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  ■本报记者 赵广立

  近日,中国科学院自动化研究所(以下简称自动化所)宣布开放“庙算·智胜”战术兵棋即时策略人机对抗平台,旨在进一步推动人机对抗智能技术研究。据了解,该平台曾用于“先知·兵圣”智能博弈对抗系列赛事,具有平台开放、在线对抗、技术共享等特点。

  人机对抗是国际公认的探索决策智能重要途径之一。作为国家新一代人工智能的重要发展方向,决策智能的研究和发展方兴未艾。同时,由于决策智能涉及多个学科的交叉,相关的探索尚须各方共同努力。

  涉及多个学科

  到底该如何定义决策智能?在近日举办的“首届智能决策论坛”上,自动化所所长徐波认为,由于我们对人类智能的机理仍缺乏系统了解,对人工智能做内涵式、学科式的定义仍然困难重重。但他介绍说,决策智能强调智能“产生于与其所处环境的交互”,且智能应具备“对不确定性环境的探索和发现”的能力。

  他解释,决策智能要求智能体能在不确定的环境中做出合适的行动、选择和决定。而这里的“环境”,指的是人们试图用人工智能更好地了解、探索、建模和驾驭的物理世界、人类社会等系统。

  有别于感知智能,决策智能主要基于对不确定环境的探索,因此需要获取环境信息和自身的状态,从而进行自主决策,使由环境反馈的收益最大化。这一反馈形成的系统闭环,将使人工智能拥有更完整的表现形式。

  自动化所是国内率先开展人工智能与脑科学交叉研究、建立国内第一个人工智能学院的科研单位。目前,该所正将自主进化智能作为重点投入、发展和突破的方向,已组织20余个团队开展决策智能基础理论、算法、环境、评价、应用等研究。

  在上述论坛上,欧洲科学院外籍院士、北京大学前沿计算研究中心教授邓小铁,清华大学交叉信息科学院助理教授张崇洁,伦敦大学学院计算机系教授汪军等学者也对决策智能的内涵进行了探讨。学者们指出,决策智能带有强烈的“行为主义”流派的色彩,而同时又能吸收“符号主义”和“连接主义”的精华。这种特点,使得决策智能涉及计算机、控制、数学、认知心理学、神经科学等诸多学科。

  “目前基于强化学习等方法的决策智能,主要还是在学习‘状态’到‘动作’的映射,与可解释的、因果关系的、可以互动的决策还有很远距离。”邓小铁表示。

  与博弈论相互影响

  在探索决策智能的诸多路径之中,多智能体系统(以下简称多智能体)是国际上人工智能技术的前沿学科。人们寄希望于彼此通信和协调的多智能体采取协调行动,以解决大型、复杂的现实问题。但目前,很多基于强化学习的多智能体研究方法并不够成熟。

  “博弈论是刻画和分析多智能体相互之间竞争最好的理论框架。”邓小铁认为,博弈论在多智能体系统研究中将扮演理论基础的角色,同时人工智能的发展也给博弈论学科带来了深远的影响。

  “从博弈论已有的理论中借鉴想法指导设计强化学习方法,常常能够获得较优的结果;而反之,如果没有相应的理论作为指导,研究者们容易出现‘脚踩西瓜皮,滑到哪儿算哪儿’的尴尬局面。”邓小铁说,多智能体系统若想有更好的发展,需要有相应的理论基础,而博弈论正扮演这个角色。

  此外,汪军认为,机器学习系统本质上只是信息处理系统的一个子集,目前的机器学习与信息理论紧密结合,未来将有越来越多的信息学理论被应用到机器学习以及多智能体系统之中。

  应重点投入

  “强化学习”是当前互联网经济场景中,人们希望实现决策智能的核心方法之一。在工业场景下,目前的做法一般是先在平台上模拟,再到现实中进行适应。这种场景下的强化学习一般可以相对准确地进行模拟和应用。

  然而,在样本有效性问题上,一旦模拟器模拟出的数据不精确,数据的意义将大打折扣。

  上述论坛与会学者介绍说,这是因为,当前的“模拟”多数仅是机械模拟环境,且常用高斯过程的混合模型模拟,仍然处于相对初级的阶段。可以看到,当前的强化学习技术在较复杂场景中往往不能很好地工作,只有序列性强、动作空间简单的场景(如网易云、快手等的音视频推荐)才比较容易刻画。

  这也导致,相比于计算机视觉等感知智能,决策智能目前的应用落地仍不明显。针对这一现象,与会学者们认为,虚实混合、数字孪生、教育场景下的搜索推荐等场景都是强化学习有可能产生应用的地方,学术界可以主动进入工业界,一边创业一边研究,进而推动工业界变革。

  “人工智能还处在对环境没有适应、认知和学习能力的发展初级阶段。”与会学者认为,决策智能作为人工智能三个流派的融合入口,将成为研究的主流。

  “决策智能的基础理论、算法、环境、评价、应用等研究方兴未艾。我国应当将面向重大需求的决策智能作为重点投入、发展和突破的方向。”徐波表示。

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 美国数百万人感恩节假期出行

  • 湖南通道:芦笙节 展风情

独家策划

推荐阅读
近年来,直播带货的发展速度可谓是“跑步前进”,而直播中产品质量差、涉虚假宣传、流量造假等问题也逐渐显现。戳图带你了解如何避坑↓↓↓
2020-11-27 17:26
据中国信通院预测,到2025年,5G网络建设将累计投资达1.2万亿元,带动产业链上下游以及各行业的应用投资,预计到2025年将累计带动超过3.5万亿元的投资。
2020-11-27 10:16
11月26日至28日,由广东省人民政府、国家发展和改革委员会、科学技术部、工业和信息化部共同主办的2020世界5G大会在广州举行。
2020-11-27 10:13
北京市经信局近日发布《北京市“十四五”时期智慧城市发展行动纲要(公众征求意见稿)》,提出“到2025年,将北京建设成为全球新型智慧城市的标杆城市”的发展目标。
2020-11-27 10:08
美国科学家研制出了迄今最小的存储设备,其横截面积仅1平方纳米,容量约为25兆比特/平方厘米,与目前的商用闪存设备相比,每层的存储密度提高了100倍。
2020-11-27 10:07
《自然》杂志对480位从事人脸识别、人工智能和计算机科学领域研究的研究人员的调查显示,人们对人脸识别研究的伦理学普遍存在担忧,但也存在分歧。
2020-11-27 10:06
以色列兹布拉医学视觉初创公司和苏格兰斯托姆ID咨询公司通过用机器学习和人工智能技术开发的软件,帮助临床医疗组在患者骨折发生前将他们筛选出来并加以治疗。
2020-11-27 09:57
“科技的未来在青年”,青年科学家是推动科技进步的重要力量,也是最有创造潜力的群体。
2020-11-27 09:53
站在两个百年的历史交汇点,站在新征程的新起点,中国航天必须坚定不移走创新驱动发展之路,把创新作为引领中国航天发展的第一动力。
2020-11-27 09:50
在科教融合三年后,齐鲁工业大学(山东省科学院)迎来高光时刻。
2020-11-27 09:49
11月26日,2020第五届腾云峰会在北京召开,文化界和科技界人士共聚,探讨科学和文化之间“流动的边界”。
2020-11-27 09:45
“高性能超级计算机,是世界发达国家争抢的重要‘制高点’,对国家安全、经济和社会发展,具有举足轻重的支持作用。
2020-11-27 09:40
中国联合网络通信集团有限公司董事长王晓初在主旨演讲中介绍,中国联通聚焦更高品质的生活,着力打造拉动消费升级的“新引擎”。
2020-11-27 09:37
要进一步降低5G设备的能耗,这是涉及可持续发展的关键问题之一。龚克坦言,5G超越了人和人通信的概念,实现了人和物、物和物之间的联系,5G应该“热”在各种行业应用上。”  
2020-11-27 09:35
业内专家认为,面对疫情防控常态化,《指南》给出的人物并防措施,将冷链铸成了一道“安全链”。
2020-11-27 09:34
安徽省合肥市包河区《合杭梦想小镇促进产业发展专项扶持政策(试行)》日前正式出台,助力长三角一体化高质量发展的一项有力举措。
2020-11-27 09:32
“一网统管”作为城市治理的“牛鼻子”工作,江苏路街道全面加强党的领导,深度参与上海“一网统管”建设试点,以民为本,持续聚焦高效处置一件事。
2020-11-27 09:29
近期,进口冷链食品核酸阳性检出率明显增高。“涉及产品范围从海产品到畜禽肉类产品,进口物资被病毒污染范围从冷链食品扩展到集装箱。”国家卫健委新闻发言人米锋说,疫情传播呈现出“从物到人”和“从人到人”并存的特征。
2020-11-26 19:58
伴随着行业应用的不断拓展和产业协同的加速推进,正式商用一年的5G快速改变着人们的生产生活,为数众多的数字化场景围绕着5G在形成和创新发展中。
2020-11-26 10:02
告知承诺制主要涉及个人姓名、婚姻状况、疾病状况、居民身份信息证明等,由派出所、村居委会开具。
2020-11-26 09:51
加载更多