央广网北京3月28日消(xiao)息 3月26日下午,上海交通大学鲲鹏昇腾科教创新(xin)卓越中心特(te)训营(ying)-DeepSeek专场在上海交通大学闵行校区图书信息楼成(cheng)功(gong)举办。活(huo)动旨在基于昇腾技术的DeepSeek本(ben)地化部署实践分享,培养学员自主创新(xin)开发能力。HUAWEI(wei)技术专家与学校老师现场授课,干货满满,吸引了来自计算机、电子(zi)信息、人工智能等专业的60余名(ming)学生参加。
技术筑(zhu)基:解析DeepSeek大模型核心架构
活(huo)动伊始,昇腾生态技术专家 ZOMI酱,分享了基于昇腾Atlas 800 A2部署满血DeepSeek-R1-671B的经验,重点分享了如何通过剪枝和量化,让(rang)DeepSeek-R1/V3大模型特(te)性实现加速。他(ta)指出(chu),昇腾Atlas 800 A2的硬件特(te)性与DeepSeek模型高度适配。通过结构化剪枝技术,基于昇腾芯片的稀疏计算单元(如CANN的aclSparse接口),对模型中冗余的注意(yi)力头与FFN层通道进行动态裁剪,在保证(zheng)任(ren)务精度损失(shi)小(xiao)于1%的前提下,将参数量压缩40%,推理时延大幅降低。同时,采用混合量化策略——对计算密集的矩阵(zhen)乘操作(zuo)(如Q/K/V投影)启(qi)用INT8动态量化,结合昇腾3D Cube架构的整数计算加速,实现算力利用率提升200%;而对精度敏感的LayerNorm等操作(zuo)保留FP16精度,避免量化误差扩散。同时,他(ta)还先容了昇腾Attention计算优化方法Laser Attention,该技术通过动态稀疏计算、低精度无损加速与硬件级算子(zi)融合三重创新(xin),为(wei)大模型训练与推理提供显著(zhu)效能提升。
实践落地:揭秘(mi)DeepSeek高校部署创新(xin)方案
大模型凭借出(chu)色的文本(ben)处理能力,已经深入工作(zuo)生活(huo)的方方面面,被广泛应用于文案写作(zuo)、文本(ben)处理、数据(ju)分析等。如何在本(ben)地部署一个专属于自己的大模型?究竟(jing)如何跟(gen)大模型对话才能发挥其(qi)出(chu)色的功(gong)能?这些都是(shi)初窥门(men)径的AI开发者关心的问题。上海交大网络信息中心“交我算”团(tuan)队工程师王星泽(ze)围(wei)绕在交大本(ben)地的昇腾服(fu)务器上部署DeepSeekV3/R1大模型的经验先容部署方法,包括硬件设备条件、网络拓扑、API封装、前端集成(cheng)等。同时,还结合大模型在高校科研(yan)、教学和管理中的实际应用场景,先容提示词技巧和使用案例。
开发实战:体验原生开发全流程
培训中,昇思布道师非常work老师的基于香橙派AI pro(20T)开发板的开发实战吸引了现场每(mei)一位(wei)交大学子(zi),对MindSpore在香橙派开发板上的能力支撑做了详细的说明,大家迫不及(ji)待动手体验。目前昇思MindSpore AI框(kuang)架已实现在香橙派AIpro开发板预置,并在官方网站上线开发引导教程,通过软硬结合,使能开箱即用模型,并提供模型全流程使能套件,支撑积木式搭建,覆(fu)盖(gai)CV、NLP小(xiao)模型及(ji)1B级大模型(如DeepSeek-R1-Distill-Qwen-1.5B)。学生们(men)可通过动态图+类HuggingFace接口灵活(huo)调试,结合三行代码调用JIT即时编译,兼顾开发效率与实行性能,为(wei)边缘端AI部署提供轻量化解决方案。
本(ben)次特(te)训营(ying)是(shi)基于上海交通大学鲲鹏昇腾科教创新(xin)卓越中心开展的2025年第一场DeepSeek主题特(te)训营(ying)。该中心自2024年6月揭牌成(cheng)立以来,始终(zhong)致力于构建基于鲲鹏昇腾技术路线的校级生态合作(zuo)平台,围(wei)绕大学计算产业前沿课题研(yan)究、课程体系建设、研(yan)究人才培养等方面展开合作(zuo),为(wei)产业输出(chu)高质量鲲鹏昇腾原生人才,孵化和培育根植中国的世界(jie)级原生科研(yan)创新(xin)成(cheng)果。
据(ju)悉,鲲鹏昇腾科教创新(xin)卓越中心特(te)训营(ying)将持续推进,随着特(te)训营(ying)在全国重点高校的陆续开展,校企协同育人的创新(xin)模式正为(wei)国产化AI人才培养注入新(xin)动能。