点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:科普慕课|Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景
首页> 光明科普> 视频 > 正文

科普慕课|Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景

来源:光明网2025-02-20 17:01
科普慕课|Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景
(基于报告主要内容生成的脑图)

  为了系统解析DeepSeek在技术、应用与伦理交织演进下的革新性探索,带领大家深入了解DeepSeek的“破圈”与“扎根”,浙江大学人工智能科研团队于2月17日起推出DeepSeek系列专题线上公开课。

  第一期活动中,浙江大学信息技术中心主任、人工智能教育教学研究中心副主任陈文智教授带来题为《Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景》的报告。

科普慕课|Chatting or Acting?——DeepSeek的突破边界与“浙大先生”的未来图景

  报告首先浅析了DeepSeek的技术突破,阐释强化学习对模型认知跃迁的推动作用。进而提出“大模型提供认知底座,智能体实现价值闭环”的双螺旋智能演进的观点,探索两者的协同进化对教育范式变革的推动作用。以精彩实例介绍“浙大先生+DeepSeek+CARSI”落地高校场景,向师生展示未来教育“处处用AI,人人会AI”的美好图景。(制作:肖春芳)

  以下为陈文智教授报告的主要内容:

  一、DeepSeek突破边界

  DeepSeek的技术特征与创新

  MOE架构:通过多个专家模型分工合作,降低训练成本,提高效率。

  多头潜在注意力机制:优化注意力机制,减少不必要的计算,降低显存占用。

  其他优化:包括工程优化、数据集优化、计算精度改进等,提高模型性能。

  DeepSeek带来的启示:人工智能迎来发展拐点

  战略拐点:人工智能正处于成长期和产业化之间的战略拐点,即将迎来新的发展机遇。

  算力拐点:DeepSeek通过优化算法和架构,显著降低了训练大模型所需的算力,提高了算力效率。

  数据拐点:大模型的参数量不断增加,但通过蒸馏技术可以将大模型压缩成小模型进行部署,提高了数据利用效率。

  二、大模型与智能体协同发展

  大模型的局限性:尽管大模型具有强大的自然语言处理能力,但在实际应用中仍存在成本高、回答专业问题不够准确、出现幻觉等问题。

  智能体的必要性:智能体是将大模型应用于实际场景的关键,它能够将大模型的知识与特定领域的知识相结合,完成实际任务,实现价值闭环。

  智能体的开发:介绍了智能体的开发过程,包括模型蒸馏、微调、检索增强生成等方法。模型蒸馏就像是给大模型开小灶,针对某一项技能进行专门辅导,使其在某种子集知识上更加精通;模型微调则像是自习室,让模型针对自身短板进行自我补充和完善,以适应特定环境;检索增强生成(RAG)则是在模型与用户交流时,先查找相关资料,再结合已有知识回答问题,不过这种方式虽然能回答问题,但不会提升模型本身的能力,当资料缺失时,模型仍可能无法回答。

  随着大模型与智能体的协同发展,未来智能体开发的时代即将到来。通过多模态的能力,智能体的交互体验将更加丰富和自然,就像人们使用真正的APP和工具应用一样便捷。

  三、浙江大学在人工智能教育与实践中的探索

  “‌浙大先生”‌是浙江大学搭建的一个重要平台,其愿景是实现校园里处处用AI,师生人人会AI,并将这一理念扩展到社会。目前已接入DeepSeek,形成“浙大先生”+DeepSeek+Carsi的教育教学新形态,为师生提供智能化的教学和学习体验。

  “浙大先生”有两个主要入口,一个是门户入口,用户可以与满血版的DeepSeek进行交流,获取问题的答案,同时还能浏览行业应用案例集等内容;另一个入口是开发平台,为用户提供了丰富的智能体和开发工具,包括智能体广场、智能体开发者中心等。在智能体广场,用户可以选择各种智能体进行交互,如 AI 校园智能体,输入问题即可得到回复。

  在教学应用方面,“浙大先生”全面升级了教学平台“学在浙大”,用 AI 赋能教师和学生的教学全过程。

  此外,结合“浙大先生”和 DeepSeek大模型,还可以进行AI创意制作,如短视频故事生成和制作等,为高校教学和科研带来了新的活力和可能性。

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 珍贵档案揭露日本无差别轰炸细节

  • 陆军某合成营实战化对抗演练掠影

独家策划

推荐阅读
你有没有感觉,这些年的春天来得越来越不规律了?相比过去,有的地方春来早,有的地方春迟到。这不是你的错觉,全球变暖正导演着一场波及整个北半球的“春日变奏曲”。
2026-01-14 02:55
布局未来产业,要统筹经济性与战略性,综合考虑绝对优势和比较优势,深耕细分赛道,探索各具特色的发展路径和模式。
2026-01-14 09:03
“十四五”以来,生态环境部卫星遥感监测能力显著提升,目前已在轨运行7颗生态环境卫星,初步构建起多星联动的生态环境卫星遥感监测体系。
2026-01-14 09:03
作为钢铁生产核心工序,高炉占生产总成本的70%左右,其长期稳定运行直接关系企业盈利状况。经过攻关,宝钢股份高炉AI大模型对炉温等关键指标的预测准确率达90%,实现对内部状态的高精度、高时效性感知。
2026-01-14 09:02
1月13日23时25分,我国在海南商业航天发射场使用长征八号甲运载火箭,成功将卫星互联网低轨18组卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。
2026-01-14 09:01
扎实推进农机购置与应用补贴“优机优补”“有进有出”,支持创新机具有序列补,加大补贴力度,推动过时落后机具加快退出。
2026-01-14 09:02
作为全国首个商业航天共性试验和科研生产基地,“北京火箭大街”项目由亦庄控股旗下城市更新公司投资、开发、运营管理
2026-01-13 17:38
力鸿一号遥一飞行器12日在酒泉卫星发射中心圆满完成亚轨道飞行试验任务,返回式载荷舱顺利着陆完成回收。本次飞行试验圆满完成返回式载荷舱的再入大气层返回减速与回收验证,
2026-01-13 03:35
从耳畔低语的智能伴侣,到街头无声行驶的自动驾驶车辆,科技正褪去冰冷外壳,融入人们日常生活。谷歌计划将AI技术嵌入人们日常依赖的应用Gmail内,让其帮助总结冗长的邮件,并撰写得体的回复。
2026-01-13 09:07
南极秦岭站附近,几只黑白分明、步履蹒跚的阿德利企鹅歪着头,打量着不远处向他们热情招手的中国考察队员。今年,中国第42次南极考察队又一次如约而至,继续开展对这些极地“原住民”的监测研究。
2026-01-13 09:06
滑动轴承被称为工业装备的“关节”,其性能直接决定了重型机械、精密机床、高效电机乃至风力发电机、高速列车等高端装备的可靠性、效率与寿命。
2026-01-13 09:06
数据显示,自港珠澳大桥珠海公路口岸开通以来,经港珠澳大桥边检站查验内地旅客数量已超过3938万人次,仅2025年就超过1257万人次,创历史新高。
2026-01-13 09:05
工信学堂致力于推动学生人工智能素养的全面提升,助力拔尖创新型人才培养,为我国未来工信科技人才队伍储备力量。
2026-01-12 15:41
在斯图尔特的农场,赞比亚大豆科技小院首席专家、吉林农业大学教授魏健疆手把手教会当地农户“作物—菌物—肥料”闭环生产。
2026-01-12 08:59
记者1月11日从国家数据局获悉,国家数据局将进一步研究借鉴其他领域登记制度的经验做法,不断吸收社会各界的意见建议,创新建立适应数据特点的登记制度,更好推进数据流通使用,释放数据要素价值。
2026-01-12 08:54
目前团队正牵头建设贵州省人工智能实验室,将吸引更多算力产业链上下游企业集聚贵州,助力数字经济高质量发展。
2026-01-12 08:53
为适配医保业务的新形势新要求,助力中医药产业高质量发展,近日,国家医保局修订中药饮片医保编码规则。这相当于给每一味中药饮片都配上了新的“医保身份证”。
2026-01-12 08:51
以大模型为代表的新一代人工智能技术,深度赋能医疗健康领域,在医学影像判读、疾病风险预警、辅助诊疗决策等领域展现出巨大潜力和应用价值,有力助推临床诊疗模式优化升级,
2026-01-12 03:05
这条光缆,打破了地理困局,让贵州算力真正具备了“走出去”的能力。光缆为算力的灵活调配贯通了“路”,“息壤”平台如同光缆上的“智能交通指挥中心”,将西部算力资源与东部算力需求精准匹配。
2026-01-12 08:53
加载更多