点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:平行视觉:让汽车拥有一双“慧眼”
首页> 科普频道> 科普头条 > 正文

平行视觉:让汽车拥有一双“慧眼”

来源:《中国科学报》2021-02-18 09:40

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  无人驾驶进入汽车领域以来,一直无法消除汽车上安装辅助系统对道路障碍的识别盲区。

  2005年,中国科学院自动化所复杂系统管理与控制国家重点实验室主任王飞跃提出平行驾驶的概念。这一概念针对自动驾驶构建其社会—信息—物理系统模型,从人与车、车与环境、人与车与环境等多个不同层次考虑自动驾驶的实现,并独特性地提出使用云端驾驶与地面端驾驶“平行”的方式,指导无人车实现智能驾驶,为未来无人驾驶指明了一种新的实现途径。

  日前,王飞跃带领团队在《中国图像图形学报》发表了一篇关于平行视觉感知技术的文章,提出将人工社会(Artificial societies)、计算实验(Computational experiments)和平行执行(Parallel execution)构成的ACP方法引入智能驾驶的视觉感知领域,解决了视觉模型合理训练和评估问题,有助于智能驾驶进一步走向实际应用。

  视觉感知努力向人眼看齐

  与依靠后视镜作为辅助的早期汽车相比,现代汽车早已经被摄像头、毫米波雷达、超声波雷达以及激光雷达等负责感知的智能传感器“武装”起来。“相比于雷达,视觉感知的智能之处体现在纹理信息提取和分辨率上。”王飞跃在接受《中国科学报》采访时解释道。智能驾驶需要对复杂的交通环境进行准确感知,其中就包括对交通标志、车道线等进行识别,这些交通要素的识别严重依赖色彩信息,而视觉感知可以有效地实现对这些目标的识别和判断,目前的雷达技术则无法做到。

  不仅如此,“视觉感知提取的纹理信息还能够对同一类别的不同实例进行区分,有助于完成复杂环境下的目标跟踪、轨迹预测等任务。”王飞跃表示。此外,视觉感知能够以较低成本构建高分辨率图像,因此即使是对远处目标和较小目标,视觉感知方案依然能够保证有较多的信息来对其进行识别,从而大大提升车辆对环境的智慧感知能力。

  论文结果显示,目标检测的训练阶段虚实混合数据最高精度可达60.9%,同时精度受到环境与困难程度的影响。

  “尽管我们认为在智能驾驶中视觉感知可以类比为人眼的一部分,它可以像人眼一样获取外界的视觉信息,但是目前还无法做到像人类强大视觉系统一样进行推理。”王飞跃坦言。为此,他举了个例子,比如在复杂城市道路环境中的交叉路口或者人行道上,人类可以根据当前环境推理其他车辆或者行人意图,并可以与其他车辆或者行人交互并根据情况礼让,而这一点,目前的视觉感知系统无法做到。“因为视觉感知是通过车载摄像头或雷达对自动驾驶汽车周围环境数据进行收集,利用计算机视觉为代表的深度学习技术,对收集到的数据进行图像识别、图像分类,并对有价值的信息进行检测、跟踪,将其处理成自动驾驶系统能够读懂的语言,进而为控制决策系统提供依据。”

  视觉感知是智能驾驶核心

  在这项研究中,研究人员将视觉感知应用到“长尾场景”中。该场景主要涉及日常驾驶中出现概率极低、很少遇到的复杂挑战场景,如极端恶劣天气、突发交通事故、突然出现的行人等。

  “由于长尾场景发生概率极低且危险系数高,往往难以采集到相应数据来训练和测试视觉模型,导致目前基于深度学习的视觉算法没有经过充分测试,只在简单的受约束环境下有效。一旦运用到实际复杂开放的交通环境中,算法很容易失败。”王飞跃说,因此,研究人员希望用平行视觉来解决这一问题,目标是实现一种“长尾常规化”模式,通过人工虚拟场景来仿真模拟复杂的实际场景,利用计算实验进行视觉模型的训练与评估,最后借助虚实互动的平行执行实现视觉模型的在线优化。

  “这个过程反复闭环迭代,我们希望实现视觉系统对复杂环境的智能感知与理解,让视觉感知真正走向实际应用。”王飞跃表示。

  智能驾驶中的“马粪”问题

  早在2005年,王飞跃就提出了平行驾驶的概念。为了解释这一概念,他曾在一次演讲中以马车举例。上世纪末,马作为主要的交通工具,随之而来的却是无法分解的马粪。这一问题困扰了人们很多年,甚至有专门的国际会议来研究当时面临的“马粪危机”。

  汽车的到来,成功地消除了马粪的问题。而在人工智能时代,即便给车辆安装高线束激光雷达等传感器感知,配上“足够算力”的计算单元,优化算法,将汽车改装成繁杂的智能体,仍无法避免无人车在长久时间内不出现事故。“这就像是这个时代人类面临的马粪问题。”王飞跃说,“有人驾驶、远程控制、网络车和无人车需要统一起来,成为平行驾驶,根除无人驾驶的‘马粪问题’。如果一定要将这几种因素分开,恐怕就是用马车技术解决马粪问题。”

  在平行驾驶中,视觉感知作为基础环节,处于智能驾驶车辆与外界环境信息交互的关键位置。王飞跃认为,其关键在于使智能驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。而随着自动驾驶中人为干预度的不断减小,视觉感知获取环境信息的全面性、准确性和高效性要求越来越高,其始终属于智能驾驶的核心部分。

  他同时解释道,当前视觉感知依赖相机系统实现对环境的感知,在实际任务中会产生大量冗余的数据,从而导致计算复杂度和存储负担的增加、计算效率降低。“平行视觉则更加主动,基于描述学习构建软件定义的具有可控性的人工场景、基于预测学习完成人工场景中的计算实验、基于平行执行实现虚实互动,以解决虚拟与现实差异性问题。”

  目前,王飞跃团队采用Agent建模方法,模拟北京中关村区域和常熟智能车测试区域,在图形学工作站上建立人工场景,设计丰富典型的环境条件和目标运动,生成大量带详细标注信息的图像视频数据集。同时,部分研究工作采用生成式对抗网络聚焦于虚实交互过程中存在的领域迁移等问题,并生成了具有真实驾驶场景纹理和细节的合成图像。“现在,视觉感知已经从道路感知逐步向环境认知方向发展。它已成功应用于识别交通信号、道路标志和标线等静态环境信息,以及行人、车辆和其他移动的障碍物。接下来,将会进一步理解道路目标之间的交互关系和逻辑,进行意图分析、预测和决策,有效提升无人驾驶车辆的智能认知能力。”王飞跃说,“随着深度学习技术的进步和推广应用,对车载感知计算平台的性能有了更高要求,将来会在保证算力的情况下降低计算成本。”

  “上述成果让我们有信心布局平行视觉方法在中国智能车未来挑战赛上的应用。平行视觉是平行智能体系的重要一环,结合平行驾驶、平行测试和平行学习等重要理论研究,智能车先在人工世界试开,‘要在人工世界吃多堑,物理世界长多智’。”王飞跃有信心地表示。(袁一雪)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2026年世界青年发展论坛在武汉开幕

  • 我国夏粮小麦收获已近九成

独家策划

推荐阅读
韩国首尔国立大学工程学院科学家研制出一款高性能有机发光二极管,集成了高导电性透明金属电极,透光率超过93%,有望在先进显示器等众多领域大显身手。所得器件兼具优异的透明度与电致发光性能,底层的有机层也安然无恙,充分彰显出该技术在下一代透明显示应用中的巨大潜力。
2026-06-16 09:27
《自然·医学》杂志15日报道了一种皮质内脑机接口(BCI)突破。该参与者累计使用该系统超过3800小时,共发出183060个句子(近200万词),平均每分钟56词,其中92%的句子被评定为“基本正确”或更佳。
2026-06-16 09:26
未来产业是科技创新和产业创新深度融合的产物,是技术突破催生的全新赛道,对于发展新质生产力具有先导性、引领性作用。未来产业的根基在于创新,没有源头创新,就没有未来产业的萌芽;没有持续创新,就没有未来产业的壮大。统筹科技自立自强与全球创新合作是夯实未来产业发展根基的关键。
2026-06-16 09:25
随着高密度发射成为常态,力箭一号火箭控制系统逐步实现软、硬件产品全链路自主可控。“目前,箭上配套设备缩减50%,地面设备削减80%,火箭电测周期由原来的1个月压缩到1周以内。
2026-06-16 09:23
作者:尚俊杰、王淑文(分别系北京大学教育学院副院长兼学习科学实验室执行主任、中国高等教育学会学习科学研究分会常务副理事长兼秘书长;将学习科学的研究成果深度融入AI教育系统的设计、开发与应用全过程,是提升教育质量、避免技术滥用的关键。
2026-06-16 09:22
数据显示,今年4月,中国汽车出口继续保持快速增长,同比增长超过70%,其中,新能源汽车表现最为亮眼,当月出口43万辆,环比增长16%,同比增长约110%。在海外社交媒体上爆火的“中国汽车”标签,以一种独特的方式为中国的全球气候治理贡献写下新注脚。
2026-06-16 09:17
随着人工智能技术的不断突破和应用场景的加速拓展,AI相关领域人才需求攀升将成为未来较长一段时间内劳动力需求的重要趋势特征。企业作为劳动力市场的需求主体,也应主动应对AI技术变革,推动内部数字化转型,提升生产效率。
2026-06-15 09:17
智能经济带来的技术提升,不是对传统产业的简单替代,而是通过“人工智能+”行动实现全方位赋能。面对全球人工智能治理规则正在形成的窗口期,我国既要在技术上对标一流,更应在治理上贡献智慧,助力全球AI治理变革。
2026-06-15 09:16
过了芒种,在河南省获嘉县照镜镇樊庄村,村民宋其文家里的麦田已开镰,但他不慌不忙,心里稳得很。宋其文感受到的智慧灌溉来源于水肥一体机搭载的作物高效用水智能决策系统,在那里,天空地数据持续搜集,不断优化生成实时灌溉决策方案。
2026-06-15 09:16
在率先落地的机器人、数字人营业性演出场景中,符合条件的经营主体可将机器人、数字人作为演职人员纳入管理范畴。”  北京经开区有关负责人表示,下一步将持续优化试点流程、稳步扩大试点范围,做到放而不乱、管而有序、服务到位,全力扶持新业态、培育新主体、壮大新产业。
2026-06-15 09:15
6月14日,国家防总办公室、应急管理部组织自然资源部、住房城乡建设部、交通运输部、水利部、中国气象局等多部门联合会商,研判近期降雨发展趋势,研究部署重点地区防汛工作。
2026-06-15 09:13
在“环保智慧大脑”的加持下,河南省重点环境问题平均存续时间从17.4小时压缩至1.09小时,生态环境监管能力显著提升。近年来,河南省生态环境厅坚持科技创新驱动、智慧化引领,生态环境监管进入全流程智能化监测、执法、应急处置的数智化时代,环境治理格局正在重塑。
2026-06-15 09:13
据英国《自然》网站9日报道,美国生命生物科学公司当天宣布,首次通过细胞“部分重编程”疗法,尝试让一名青光眼患者眼部受损的衰老细胞“返老还童”。
2026-06-12 09:32
一项发表于《科学》杂志的最新研究,绘制了首张全球菌根真菌“地下网络”分布图。这是继去年《自然》杂志发表菌根真菌多样性全球分析之后,科学家首次实现对其物理密度的全球可视化。
2026-06-12 09:29
斯坦福大学数学家贾里德·杜克尔·利希特曼在社交平台X上将这种现象类比为国际象棋中的“非常规开局”,认为AI有时能跳出人类长期形成的“审美与惯例”。
2026-06-12 09:28
在前不久举行的第三十四届哈尔滨国际经济贸易洽谈会上,哈尔滨工程大学智能海洋航行器技术全国重点实验室的展台前,围满了参观者。
2026-06-12 09:27
如今,智谱的大模型已经成为全球众多顶级云服务商和知名编程平台的“默认选项”之一,深受海外开发者的欢迎。如果说智谱代表了AI通用大模型在信息空间的实力,那么北京科学智能研究院则展示了AI征服物理和微观世界的强大力量。
2026-06-12 09:26
“在洞窟里,把冷光灯打开,面对着千年壁画的那一刻,所有的烦恼都会瞬间远离,觉得能近距离接触如此杰出的艺术品,是很震撼、很幸运又很幸福的事。遵循这一“笨规矩”,于宗仁组织完成了莫高窟与甘肃省内外多处壁画彩塑保护方案与实施工作,例如莫高窟千像塔彩塑保护修复、莫高窟第196窟壁画彩塑保护修复,以及麦积山石窟部分洞窟的塑像壁画保护修缮等。
2026-06-11 10:23
国际科技出版机构施普林格·自然10日发布的自然指数2026科研领导者榜单显示,中国继续保持全球第一,2024年至2025年科研产出增长22.4%,是全球十强中唯一实现两位数增长的国家。机构表现方面,自然指数显示,中国科学院整体排名位列榜首,在除健康科学和社会科学以外的5个学科领域位居第一。
2026-06-11 10:23
量子传感是一种利用量子效应进行高精度测量的新技术。量子传感可通过增加粒子数量来提高传感性能,然而这面临一个重要挑战——量子热化。“这不仅深化了人们对量子热化这一基础科学问题的认识,也为发展新一代高灵敏度量子传感器提供了新的思路。
2026-06-11 10:23
加载更多