点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:平行视觉:让汽车拥有一双“慧眼”
首页> 科普频道> 科普头条 > 正文

平行视觉:让汽车拥有一双“慧眼”

来源:《中国科学报》2021-02-18 09:40

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  无人驾驶进入汽车领域以来,一直无法消除汽车上安装辅助系统对道路障碍的识别盲区。

  2005年,中国科学院自动化所复杂系统管理与控制国家重点实验室主任王飞跃提出平行驾驶的概念。这一概念针对自动驾驶构建其社会—信息—物理系统模型,从人与车、车与环境、人与车与环境等多个不同层次考虑自动驾驶的实现,并独特性地提出使用云端驾驶与地面端驾驶“平行”的方式,指导无人车实现智能驾驶,为未来无人驾驶指明了一种新的实现途径。

  日前,王飞跃带领团队在《中国图像图形学报》发表了一篇关于平行视觉感知技术的文章,提出将人工社会(Artificial societies)、计算实验(Computational experiments)和平行执行(Parallel execution)构成的ACP方法引入智能驾驶的视觉感知领域,解决了视觉模型合理训练和评估问题,有助于智能驾驶进一步走向实际应用。

  视觉感知努力向人眼看齐

  与依靠后视镜作为辅助的早期汽车相比,现代汽车早已经被摄像头、毫米波雷达、超声波雷达以及激光雷达等负责感知的智能传感器“武装”起来。“相比于雷达,视觉感知的智能之处体现在纹理信息提取和分辨率上。”王飞跃在接受《中国科学报》采访时解释道。智能驾驶需要对复杂的交通环境进行准确感知,其中就包括对交通标志、车道线等进行识别,这些交通要素的识别严重依赖色彩信息,而视觉感知可以有效地实现对这些目标的识别和判断,目前的雷达技术则无法做到。

  不仅如此,“视觉感知提取的纹理信息还能够对同一类别的不同实例进行区分,有助于完成复杂环境下的目标跟踪、轨迹预测等任务。”王飞跃表示。此外,视觉感知能够以较低成本构建高分辨率图像,因此即使是对远处目标和较小目标,视觉感知方案依然能够保证有较多的信息来对其进行识别,从而大大提升车辆对环境的智慧感知能力。

  论文结果显示,目标检测的训练阶段虚实混合数据最高精度可达60.9%,同时精度受到环境与困难程度的影响。

  “尽管我们认为在智能驾驶中视觉感知可以类比为人眼的一部分,它可以像人眼一样获取外界的视觉信息,但是目前还无法做到像人类强大视觉系统一样进行推理。”王飞跃坦言。为此,他举了个例子,比如在复杂城市道路环境中的交叉路口或者人行道上,人类可以根据当前环境推理其他车辆或者行人意图,并可以与其他车辆或者行人交互并根据情况礼让,而这一点,目前的视觉感知系统无法做到。“因为视觉感知是通过车载摄像头或雷达对自动驾驶汽车周围环境数据进行收集,利用计算机视觉为代表的深度学习技术,对收集到的数据进行图像识别、图像分类,并对有价值的信息进行检测、跟踪,将其处理成自动驾驶系统能够读懂的语言,进而为控制决策系统提供依据。”

  视觉感知是智能驾驶核心

  在这项研究中,研究人员将视觉感知应用到“长尾场景”中。该场景主要涉及日常驾驶中出现概率极低、很少遇到的复杂挑战场景,如极端恶劣天气、突发交通事故、突然出现的行人等。

  “由于长尾场景发生概率极低且危险系数高,往往难以采集到相应数据来训练和测试视觉模型,导致目前基于深度学习的视觉算法没有经过充分测试,只在简单的受约束环境下有效。一旦运用到实际复杂开放的交通环境中,算法很容易失败。”王飞跃说,因此,研究人员希望用平行视觉来解决这一问题,目标是实现一种“长尾常规化”模式,通过人工虚拟场景来仿真模拟复杂的实际场景,利用计算实验进行视觉模型的训练与评估,最后借助虚实互动的平行执行实现视觉模型的在线优化。

  “这个过程反复闭环迭代,我们希望实现视觉系统对复杂环境的智能感知与理解,让视觉感知真正走向实际应用。”王飞跃表示。

  智能驾驶中的“马粪”问题

  早在2005年,王飞跃就提出了平行驾驶的概念。为了解释这一概念,他曾在一次演讲中以马车举例。上世纪末,马作为主要的交通工具,随之而来的却是无法分解的马粪。这一问题困扰了人们很多年,甚至有专门的国际会议来研究当时面临的“马粪危机”。

  汽车的到来,成功地消除了马粪的问题。而在人工智能时代,即便给车辆安装高线束激光雷达等传感器感知,配上“足够算力”的计算单元,优化算法,将汽车改装成繁杂的智能体,仍无法避免无人车在长久时间内不出现事故。“这就像是这个时代人类面临的马粪问题。”王飞跃说,“有人驾驶、远程控制、网络车和无人车需要统一起来,成为平行驾驶,根除无人驾驶的‘马粪问题’。如果一定要将这几种因素分开,恐怕就是用马车技术解决马粪问题。”

  在平行驾驶中,视觉感知作为基础环节,处于智能驾驶车辆与外界环境信息交互的关键位置。王飞跃认为,其关键在于使智能驾驶车辆更好地模拟人类驾驶员的感知能力,从而理解自身和周边的驾驶态势。而随着自动驾驶中人为干预度的不断减小,视觉感知获取环境信息的全面性、准确性和高效性要求越来越高,其始终属于智能驾驶的核心部分。

  他同时解释道,当前视觉感知依赖相机系统实现对环境的感知,在实际任务中会产生大量冗余的数据,从而导致计算复杂度和存储负担的增加、计算效率降低。“平行视觉则更加主动,基于描述学习构建软件定义的具有可控性的人工场景、基于预测学习完成人工场景中的计算实验、基于平行执行实现虚实互动,以解决虚拟与现实差异性问题。”

  目前,王飞跃团队采用Agent建模方法,模拟北京中关村区域和常熟智能车测试区域,在图形学工作站上建立人工场景,设计丰富典型的环境条件和目标运动,生成大量带详细标注信息的图像视频数据集。同时,部分研究工作采用生成式对抗网络聚焦于虚实交互过程中存在的领域迁移等问题,并生成了具有真实驾驶场景纹理和细节的合成图像。“现在,视觉感知已经从道路感知逐步向环境认知方向发展。它已成功应用于识别交通信号、道路标志和标线等静态环境信息,以及行人、车辆和其他移动的障碍物。接下来,将会进一步理解道路目标之间的交互关系和逻辑,进行意图分析、预测和决策,有效提升无人驾驶车辆的智能认知能力。”王飞跃说,“随着深度学习技术的进步和推广应用,对车载感知计算平台的性能有了更高要求,将来会在保证算力的情况下降低计算成本。”

  “上述成果让我们有信心布局平行视觉方法在中国智能车未来挑战赛上的应用。平行视觉是平行智能体系的重要一环,结合平行驾驶、平行测试和平行学习等重要理论研究,智能车先在人工世界试开,‘要在人工世界吃多堑,物理世界长多智’。”王飞跃有信心地表示。(袁一雪)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2025年世界互联网大会文化遗产数字化论坛举行

  • 电影《731》拍摄历程特展在哈尔滨举行

独家策划

推荐阅读
中国科学院大连化学物理研究所研究员陈萍、研究员曹湖军、副研究员张炜进团队在氢负离子导体开发及应用方面取得重要进展。
2025-09-18 09:52
工业遗址与科幻主题联动,带来现实与想象交错的奇妙感受;科技手段还原知名IP场景,让游客沉浸到小说里的名场面;利用独特地质地貌,打造“地球上最像火星的地方”……来一场新鲜、有趣的科幻游,成为不少人出游的选择之一。如何做好科幻与文旅深度融合,丰富旅游供给?各地因地制宜进行了探索。
2025-09-18 09:50
记者17日从中国石化新闻办获悉,部署在四川省资阳页岩气田的2口评价井测试产量均超百万立方米,其中资页2-501HF井试获日产气140.7万立方米,刷新我国页岩气测试产量最高纪录。
2025-09-18 09:44
当今中国,科学教育受到前所未有的重视—作为人才培养的根基与路径,科学教育的潜力将变成参与国际竞争、争取国际话语权的实力。
2025-09-18 09:43
日前,由中国科学院合肥物质科学研究院等离子体物理研究所牵头承担的聚变堆主机关键系统综合研究设施(CRAFT)遥操作系统测试平台通过专家组测试与验收。
2025-09-18 09:40
“科创游”是一种将科技与旅游相结合的新型旅游形式,不仅展示科技企业的生产过程和产品,还注重科技教育的普及和科技创新的体验
2025-09-17 10:23
此次大会将讨论通过“人与生物圈计划”及其世界生物圈保护区网络杭州战略行动计划,明确未来十年的发展方向、目标和行动方案
2025-09-17 10:21
人造地球卫星、载人飞船、空间站、空间探测器要“上天”进入预定轨道,运载火箭少不了。在“火箭家族”展台,长征一号至五号运载火箭模型笔直而立。
2025-09-17 10:20
在化学生物学研究中,有一种强大的“分子地图绘制技术”——邻近标记技术。在癌症免疫治疗中,免疫细胞需要足够强和足够多的“信号”才能发起攻击,但癌细胞表面的天然信号往往非常稀疏。
2025-09-17 10:18
当前,秋粮陆续进入成熟期。各地抓住最后的窗口期,落实落细各项增产措施,全力以赴抓好秋粮生产,确保秋粮丰产丰收。
2025-09-17 09:32
人工智能的浪潮正在席卷从科技到教育,乃至全社会的各个角落,中国教育界正在积极推动学习和应用人工智能,以便乘势站在时代前列。今年6月,中国工程院院士、华中科技大学校长尤政提出,人工智能和批判性思维结合形成DNA式的“双螺旋结构”,将有力推动创新。
2025-09-16 09:14
15日,在2025年国家网络安全宣传周主论坛上,《人工智能安全治理框架》2.0版正式发布。落实《全球人工智能治理倡议》,《人工智能安全治理框架》1.0版于2024年9月发布,受到国内外广泛关注。
2025-09-16 09:13
光明日报北京9月15日电 记者陈晨从农业农村部获悉,2025畜禽种业发展论坛14日在北京市平谷区举行。论坛发布了第三次全国畜禽遗传资源普查、濒危畜禽遗传资源保护成效、主要畜种分子身份证构建和遗传评估优秀种公畜等重大成果,举办了畜禽种业振兴成果展,26家单位现场推介新技术、新设备、新成果,72家单位进行专场展示。
2025-09-16 09:13
数智技术以及数智互联技术将推进青年间社会化协同与知识共享,可精准连接青年学习者,并形成跨地域的学习社群与项目协作组。总而言之,数智技术能够为青年群体参与终身学习创造良好条件,能够充分激发青年群体参与终身学习的动力,能够更好地帮助青年群体全面发展。
2025-09-16 09:12
作者:王 珩、程松泉,分别系浙江师范大学教师教育学院教授;浙江师范大学教师教育学院博士生  当前,全球教育正经历一场由人工智能技术驱动的深刻变革。唯有坚守育人初心,在伦理框架内审慎推进技术应用,才能让人工智能真正成为引领教育发展的引擎,而非解构教育本质的飓风。
2025-09-16 09:11
在合成生物学和气候变化应对领域有巨大潜力。
2025-09-16 09:11
走进展区,多款新潮文创让人爱不释手;戴上设备,苏轼笔下的诗词世界任人遨游;指尖轻点,三千年前的青铜器“触手可及”……一系列新产品、新服务、新场景在2025年中国国际服务贸易交易会文旅服务专题亮相,漫步其中,处处感受到科技与创意奔涌、文化和旅游融合的无限活力。
2025-09-15 09:54
在2025年中国国际服务贸易交易会上,一批品类丰富、兼具趣味与文化内涵的文创精品成为展会现场的“人气王”,引爆观展热潮。
2025-09-15 09:54
最大网络基础设施的建成有助于我国突破关键技术的“卡脖子”困境,形成自主可控的核心技术优势,建立起数字经济产业的第二创新生态。 (作者:戎 珂,系清华大学社会科学学院经济学研究所所长、长聘教授;田晓轩,系清华大学社会科学学院经济学研究所博士研究生)
2025-09-15 09:53
今年暑期,工厂游火爆出圈。参观名额秒空、门票收入可观、社交平台相关笔记有10多万条,工厂游俨然成了文旅界新宠。 工厂游等新型旅游业态,实现了工业与文旅的跨界融合,也为文旅经济的发展提供了新增长点。
2025-09-15 09:52
加载更多