点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:平行视觉:让汽车拥有一双“慧眼”
首页> 科普频道> 科普头条 > 正文

平行视觉:让汽车拥有一双“慧眼”

来源:《中国科学报》2021-02-18 09:40

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  无人驾驶进入汽车领域以来,一直无法消除汽车上安装辅助系统对道路障碍的识别盲区。

  2005年,中国科学院自动化所复杂系统管理与控制国家重点实验室主任王飞跃提出平行驾驶的概念。这一概念针对自动驾驶构建其社会—信息—物理系统模型,从人与车、车与环境、人与车与环境等多个不同层次考虑自动驾驶的实现,并独特性地提出使用云端驾驶与地面端驾驶“平行”的方式,指导无人车实现智能驾驶,为未来无人驾驶指明了一种新的实现途径。

  日前,王飞跃带领团队在《中国图像图形学报》发表了一篇关于平行视觉感知技术的文章,提出将人工社会(Artificial societies)、计算实验(Computational experiments)和平行执行(Parallel execution)构成的ACP方法引入智能驾驶的视觉感知领域,解决了视觉模型合理训练和评估问题,有助于智能驾驶进一步走向实际应用。

  视觉感知努力向人眼看齐

  与依靠后视镜作为辅助的早期汽车相比,现代汽车早已经被摄像头、毫米波雷达、超声波雷达以及激光雷达等负责感知的智能传感器“武装”起来。“相比于雷达,视觉感知的智能之处体现在纹理信息提取和分辨率上。”王飞跃在接受《中国科学报》采访时解释道。智能驾驶需要对复杂的交通环境进行准确感知,其中就包括对交通标志、车道线等进行识别,这些交通要素的识别严重依赖色彩信息,而视觉感知可以有效地实现对这些目标的识别和判断,目前的雷达技术则无法做到。

  不仅如此,“视觉感知提取的纹理信息还能够对同一类别的不同实例进行区分,有助于完成复杂环境下的目标跟踪、轨迹预测等任务。”王飞跃表示。此外,视觉感知能够以较低成本构建高分辨率图像,因此即使是对远处目标和较小目标,视觉感知方案依然能够保证有较多的信息来对其进行识别,从而大大提升车辆对环境的智慧感知能力。

  论文结果显示,目标检测的训练阶段虚实混合数据最高精度可达60.9%,同时精度受到环境与困难程度的影响。

  “尽管我们认为在智能驾驶中视觉感知可以类比为人眼的一部分,它可以像人眼一样获取外界的视觉信息,但是目前还无法做到像人类强大视觉系统一样进行推理。”王飞跃坦言。为此,他举了个例子,比如在复杂城市道路环境中的交叉路口或者人行道上,人类可以根据当前环境推理其他车辆或者行人意图,并可以与其他车辆或者行人交互并根据情况礼让,而这一点,目前的视觉感知系统无法做到。“因为视觉感知是通过车载摄像头或雷达对自动驾驶汽车周围环境数据进行收集,利用计算机视觉为代表的深度学习技术,对收集到的数据进行图像识别、图像分类,并对有价值的信息进行检测、跟踪,将其处理成自动驾驶系统能够读懂的语言,进而为控制决策系统提供依据。”

  视觉感知是智能驾驶核心

  在这项研究中,研究人员将视觉感知应用到“长尾场景”中。该场景主要涉及日常驾驶中出现概率极低、很少遇到的复杂挑战场景,如极端恶劣天气、突发交通事故、突然出现的行人等。

  “由于长尾场景发生概率极低且危险系数高,往往难以采集到相应数据来训练和测试视觉模型,导致目前基于深度学习的视觉算法没有经过充分测试,只在简单的受约束环境下有效。一旦运用到实际复杂开放的交通环境中,算法很容易失败。”王飞跃说,因此,研究人员希望用平行视觉来解决这一问题,目标是实现一种“长尾常规化”模式,通过人工虚拟场景来仿真模拟复杂的实际场景,利用计算实验进行视觉模型的训练与评估,最后借助虚实互动的平行执行实现视觉模型的在线优化。

  “这个过程反复闭环迭代,我们希望实现视觉系统对复杂环境的智能感知与理解,让视觉感知真正走向实际应用。”王飞跃表示。

  智能驾驶中的“马粪”问题

  早在2005年,王飞跃就提出了平行驾驶的概念。为了解释这一概念,他曾在一次演讲中以马车举例。上世纪末,马作为主要的交通工具,随之而来的却是无法分解的马粪。这一问题困扰了人们很多年,甚至有专门的国际会议来研究当时面临的“马粪危机”。

  汽车的到来,成功地消除了马粪的问题。而在人工智能时代,即便给车辆安装高线束激光雷达等传感器感知,配上“足够算力”的计算单元,优化算法,将汽车改装成繁杂的智能体,仍无法避免无人车在长久时间内不出现事故。“这就像是这个时代人类面临的马粪问题。”王飞跃说,“有人驾驶、远程控制、网络车和无人车需要统一起来,成为平行驾驶,根除无人驾驶的‘马粪问题’。如果一定要将这几种因素分开,恐怕就是用马车技术解决马粪问题。”

  在平行驾驶中,视觉感知作为基础环节,处于智能驾驶车辆与外界环境信息交互的关键位置。王飞跃认为,其关键在于使智能驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。而随着自动驾驶中人为干预度的不断减小,视觉感知获取环境信息的全面性、准确性和高效性要求越来越高,其始终属于智能驾驶的核心部分。

  他同时解释道,当前视觉感知依赖相机系统实现对环境的感知,在实际任务中会产生大量冗余的数据,从而导致计算复杂度和存储负担的增加、计算效率降低。“平行视觉则更加主动,基于描述学习构建软件定义的具有可控性的人工场景、基于预测学习完成人工场景中的计算实验、基于平行执行实现虚实互动,以解决虚拟与现实差异性问题。”

  目前,王飞跃团队采用Agent建模方法,模拟北京中关村区域和常熟智能车测试区域,在图形学工作站上建立人工场景,设计丰富典型的环境条件和目标运动,生成大量带详细标注信息的图像视频数据集。同时,部分研究工作采用生成式对抗网络聚焦于虚实交互过程中存在的领域迁移等问题,并生成了具有真实驾驶场景纹理和细节的合成图像。“现在,视觉感知已经从道路感知逐步向环境认知方向发展。它已成功应用于识别交通信号、道路标志和标线等静态环境信息,以及行人、车辆和其他移动的障碍物。接下来,将会进一步理解道路目标之间的交互关系和逻辑,进行意图分析、预测和决策,有效提升无人驾驶车辆的智能认知能力。”王飞跃说,“随着深度学习技术的进步和推广应用,对车载感知计算平台的性能有了更高要求,将来会在保证算力的情况下降低计算成本。”

  “上述成果让我们有信心布局平行视觉方法在中国智能车未来挑战赛上的应用。平行视觉是平行智能体系的重要一环,结合平行驾驶、平行测试和平行学习等重要理论研究,智能车先在人工世界试开,‘要在人工世界吃多堑,物理世界长多智’。”王飞跃有信心地表示。(袁一雪)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 多聚焦第四届链博会主宾国和主宾省展台

  • 第十七届夏季达沃斯论坛“文化之夜”精彩绽放

独家策划

推荐阅读
卢宇彤介绍,“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。如今,面向科学、工程、产业各领域的大规模应用需求,“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。
2026-06-25 09:36
日内瓦时间6月24日,中国工程院院士许健民从世界气象组织秘书长塞莱丝特·绍洛手中郑重接过第70届国际气象组织奖奖章。作为我国气象卫星事业的开拓者、见证者,许健民的身影,也是中国气象人实干创新、勇攀高峰的生动写照。
2026-06-25 09:33
在中国与泰国联合倡议下,世界贸易组织信息技术协定委员会23日举办专题研讨会,围绕信息技术协定支持人工智能就绪及包容性数字化转型展开探讨。
2026-06-25 09:32
如果它们真的是宇宙中的某种全新的事物,将改变我们对宇宙的认知,正如20世纪60年代类星体(星系中心进食的黑洞)的发现彻底革新了星系演化理论一样。”  无论直接坍缩理论是否正确,小红点都可能是超大质量黑洞的前身,后者构成了现代星系的核心。
2026-06-25 09:27
绿电直连之所以能够从概念走向实践,离不开技术进步与产业协同的共同托举。随着市场机制与技术体系不断成熟,绿电直连有望从单点示范走向规模化网络发展,成为产业绿色转型的“新动脉”。
2026-06-25 09:32
事实上,天气预报从来不是一成不变的“标准答案”,而是一门在复杂大气运动中不断逼近天气真相的科学。但我们必须正视:天气预报是一门预测科学,天气系统的复杂性,是全球气象领域共同面临的世界级难题。
2026-06-25 09:28
AI的介入,正在将控制“人造太阳”从一门依赖经验和试错的手艺,提升为一门可计算、可预测、可自主优化的科学。
2026-06-25 09:31
瑞士巴塞尔大学科学家研制出一款多功能纳米递药机器人,由推进模块和有效载荷模块构成,两种模块可重复使用,并能够自行组装。
2026-06-24 09:58
从“双链贯通”升级为“四链融合”,折射出中国推动科技创新与产业创新深度融合的有力步伐。
2026-06-24 09:48
该成果通过改善帕金森患者最难治疗的行走障碍,开启了个性化神经调控新篇章。
2026-06-24 09:47
国家卫生健康委23日印发《营养指导员服务技术指南(试行)》,针对营养指导员提出营养监测与调查、膳食营养状况评价、营养咨询与指导、营养配餐、营养科普教育等五方面工作的技术能力要求。
2026-06-24 09:46
国家粮食和物资储备局23日发布的最新数据显示,随着夏粮陆续收获上市,旺季收购正逐步展开。
2026-06-24 09:44
瑞典哥德堡大学和查尔姆斯理工大学研究团队在人工智能(AI)应用方面取得新成果,教会一款名为SmartTrap的AI系统使用光学镊子,从而让光镊实现了全自动运行。光镊是一种利用高度聚焦的激光束来操控微小物体的技术,其操作对象包括单个DNA分子、活细胞以及其他直径远小于发丝的微观粒子。
2026-06-23 09:40
“十五五”规划纲要提出,建立健全数据产权、流通利用、收益分配、安全治理等数据要素基础制度。
2026-06-23 09:38
上午9时,随着小浪底水利枢纽3个闸门徐徐升起,巨大水流喷涌而出,在空中形成层叠奔涌的排浪,轰鸣着冲向水面——2026年度黄河调水调沙正式启动。
2026-06-23 09:35
2026年,发布《高端科学仪器创新发展行动计划》,推进“AI+”赋能仪器创新,鼓励建设全自动“黑灯”实验室等前沿科研新范式……灵心巧手(北京)科技有限公司联合创始人左家平举起一款灵巧手向记者介绍:“我们最轻的灵巧手只有370克,但它能提起50公斤重物。
2026-06-23 09:34
中国散裂中子源科学中心与港澳8所高校合作共建大湾区首台同步辐射光源,所有谱仪面向港澳全面开放,港澳用户完成实验课题超过100项,产出系列重要成果。据了解,2025年,“深圳-香港-广州”创新集群首次跃居全球创新指数第一,“澳门-珠海”集群连续两年入围全球百强,国际科技创新中心地位进一步凸显。
2026-06-23 09:30
准确来说,“原位纳米晶限域”是一种让晶体在生长过程中“长得好又长不大”的精细调控技术。科学家在材料结晶前,预先混入一种可聚合配体,它在晶体刚冒头时原位形成一张分子级的“网”,网眼便是晶体生长的唯一空间。
2026-06-23 09:29
这就是“管中窥豹”的困境,也是当前AI辅助荧光成像面临的核心难题。团队的解决思路颇具巧思:提出了一种全新的通用型荧光成像复原网络LargePNet。
2026-06-22 09:45
6月20日,中技船舶首批9艘新能源船舶集中试航仪式在广西南宁港举行。9艘船舶包含无人驾驶智慧船、商用作业船、民用休闲船,适配执法巡逻、景区观光等各类场景,助力内河航运绿色转型。新华社发
2026-06-22 09:44
加载更多