点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:智源研究院发布大规模并行训练效率提升器
首页> 科普频道> 科普头条 > 正文

智源研究院发布大规模并行训练效率提升器

来源:《中国科学报》2021-04-29 09:39

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  近日,北京智源人工智能研究院(简称智源研究院)发布大规模并行训练效率提升器TDS。作为超大规模智能模型系统“悟道”的阶段进展,TDS(Tsinghua/Temporary DeepSpeed)插件将进一步优化现今最流行的DeepSpeed 并行计算框架,从而“多快好省”地训练一个大模型。

  据介绍,数据、算法、算力是当前人工智能技术崛起的重要驱动力。利用海量数据训练大规模机器学习模型,有助于人类充分学习数据中蕴含的知识,达到更好的训练效果。

  然而,随着训练规模的扩大,单张GPU卡的显存与计算效率已经无法满足训练的需要,通过分布式训练框架实现多GPU并行训练成为了一种新的刚需。为了提升多GPU并行训练的效率,研发更高效的并行计算框架十分必要。

  为应对大规模计算集群高效训练方法的需求,智源研究院发挥其在硬件设计、模型架构、编程框架研发等方面的优势,组织智源“悟道”团队科研人员研发了 TDS 插件,对当下主流的并行计算框架进行了优化。

  据介绍,TDS 插件重新实现了DeepSpeed的流水线,通过适配器模式封装了DeepSpeed 的其它功能,该插件十分易于使用。如果已经完成了对 DeepSpeed 的安装,只需要将TDS的代码拷贝到工程中,然后加载 DeepSpeed 库即可。(郑金武)

[ 责编:张梦凡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 地质灾害防治·北京在行动

  • 庆祝香港回归祖国28周年活动在维园举行

独家策划

推荐阅读
近日,四川乐山一小伙感觉身体不适独自乘出租车前往医院就诊,途中开启“超强自救”模式:联系妈妈告知情况、打110报警求助、打120告知医院准备急救。如果长期处于焦虑引起的躯体化障碍状态,患者会反复出现头痛、心慌、呼吸急促、胃肠紊乱、肢体疼痛、睡眠问题等。
2025-07-02 10:06
使用人工智能大模型时,不少人或许都遇到过类似问题:它们有时会捏造细节,甚至“一本正经地胡说八道”。当“喂给”大模型的训练数据包含虚假信息时,它就会产生“幻觉”、给出错误答案。
2025-07-02 10:05
中国国际航空公司所属的国产C909客机平稳降落在蒙古国乌兰巴托成吉思汗国际机场,标志着国航首条C909国际航线正式开通。早8时许,这架C909客机从呼和浩特起飞,经过1个多小时飞行抵达乌兰巴托。
2025-07-02 10:03
农业是国民经济的基础,农业领域形成新质生产力是国民经济形成和发展新质生产力的基础和“底盘”。 农业新质生产力是通过提升劳动者素质、优化劳动资料和创新利用劳动对象,实现全要素生产率的显著提高。
2025-07-02 10:01
团队基于卫星遥感数据构建了1988年至2021年青藏高原30米分辨率人工草地数据集,明确了青藏高原主要的人工草地类型及其时空分布特征,并揭示了青藏高原人工草地的迅速扩张及其驱动机制。
2025-07-02 09:59
屠光绍认为,金融机构在应用人工智能时必须在服务投资人与消费者之间寻求平衡,避免AI鸿沟,坚守金融服务大众的初心。鲍建敏倡导构建产学研深度融合、开放共赢的人工智能金融生态体系,搭建跨机构、跨领域的协同创新平台。
2025-07-01 10:13
6月30日,2025温布尔登网球锦标赛在英国伦敦拉开大幕,引发球迷关注。在草地球场,球的速度更快且弹跳不规则,比赛回合较短,发球就成为球员们的重要“武器”。红土球场并不是天然土壤,而是分层分布着碎砖粉、白色碎石灰石、碎石等。
2025-07-01 10:09
7月1日起,医保定点医药机构在销售药品时,必须按要求扫药品追溯码后方可进行医保基金结算;2026年1月1日起,所有医药机构都要实现药品追溯码全量采集上传。步,进入国家医保局微信公众号主页,点击服务、药品追溯信息查询,进入查询页面;或进入国家医保局微信公众号消息对话页,点击医保服务、药品追溯信息查询,进入查询页面。
2025-07-01 10:09
记者从国家航天局获悉,7月1日,该局发布行星探测工程天问二号探测器在轨获取的地月影像图。(国家航天局供图)  月球全色图,由天问二号探测器的窄视场导航敏感器于2025年5月30日15时拍摄,经辐射校正处理后制作而成。
2025-07-01 10:08
龙芯中科近日正式发布基于国产自主指令集龙架构研发的服务器处理器龙芯3C6000系列芯片、工控领域及移动终端处理器龙芯2K3000/3B6000M芯片以及相关整机和解决方案。
2025-07-01 10:06
四大家鱼,即青鱼、草鱼、鲢鱼、鳙鱼,是我国重要的经济鱼类,占淡水鱼类养殖总量的“半壁江山”,尤以长江流域所产鱼品质最优。但人工养殖久了,鱼类品质逐渐下降,需要捕捞野生鱼种来更换,确保鱼类种质“基因库”稳定。
2025-06-30 04:50
FAST如今每天观测时长接近24小时,每年总观测时长超过5300小时,持续不断地为科学家提供宝贵的数据。
2025-06-30 09:52
华南农业大学积极探索应用大数据、人工智能等技术加速育种创新,“华航香银针”就是创新成果之一。
2025-06-30 09:51
在近日落下帷幕的第十五届全国周培源大学生力学竞赛中,一位特殊的“考生”吸引了人们目光。
2025-06-30 09:51
6月29日,在海南文昌卫星超级工厂项目建设现场,各方正全力以赴加快工厂投产进程。
2025-06-30 09:51
作为一所工科见长的大学,近年来,山东科技大学涌现出一批热衷文化艺术的学生:材料学院研究生庄英赞受邀参加《声声入戏——中央广播电视总台首届京剧票友大会》节目;
2025-06-30 04:50
今年“三夏”生产,该农场配备无人驾驶系统的收割机和拖拉机、气吸播种机、精准水肥轮灌系统、自动巡田无人机等智能化装备大显身手。
2025-06-27 10:25
6月24日,国家重大科研仪器研制项目“2.5米大视场高分辨率太阳望远镜”(WeHoST)在四川稻城启动建设配套项目,预计2027年望远镜完成装调并投入试运行。
2025-06-27 10:24
古生物研究表明,包括早期犬齿兽在内的一些远古动物,脑袋为一个没有左右脑半球区分的整体,而现生哺乳动物和典型的进步颌兽类则有左右两个脑半球。
2025-06-27 10:18
6月26日21时29分,经过约6.5小时的出舱活动,神舟二十号乘组航天员陈冬、陈中瑞、王杰密切协同,在空间站机械臂和地面科研人员的配合支持下,圆满完成既定任务。
2025-06-27 10:17
加载更多