4月24日,深度求索(DeepSeek)正式发布新一代大模型DeepSeek-V4 系列预览版,我校超级计算中心团队老师,第一时间组织完成模型多个版本在“东风”云扩容项目平台上的私有化部署,并已全面接入我校大模型公共服务平台(https://llm.ustc.edu.cn),面向全校师生开放使用,标志着学校智能算力服务能力再上新台阶。
DeepSeek-V4-Pro具备超大规模参数与卓越推理能力,总参数量达 1.6T,激活参数49B,在复杂推理、长上下文理解、多轮对话等任务中表现突出,可对标国际先进闭源模型水平。
DeepSeek-V4-Flash则聚焦高并发与低延迟场景,具备更快的响应速度和更高的吞吐能力,适用于智能问答、在线交互、教学辅助等对实时性要求较高的应用场景。
两类模型形成“高性能 + 高响应”的协同能力体系,可满足科研、教学与管理多样化需求。
在技术架构上,平台采用“模型网关+推理集群”的分层设计,通过统一网关实现请求分发、负载均衡与故障切换,并结合 GPU / NPU 异构算力资源,对不同模型实行多实例部署、对任务进行动态调度与优化配置,保障高并发场景下的服务性能与可靠性。同时,平台支持API调用与可视化交互(USTCCHAT自动升级为V4)两种使用方式,为师生提供便捷高效的大模型使用体验。
依托我校自主建设的大模型公共服务平台,本次部署充分发挥了平台已有且成熟运营的异构算力融合调度、统一模型网关、多模型协同服务、学校统一身份智慧门户鉴权等方面的技术优势。平台通过统一服务入口,将 DeepSeek-V4系列与已上线的Qwen、GLM等主流模型进行统一纳管,实现模型能力的标准化调用与灵活调度,有效提升算力资源利用效率与服务稳定性。

截止今日,校园网业务自动化运维、智慧入校报备、超算中心知识库、超算中心“小超”“小算”服务机器人、财务智慧报销系统等,以及200多只“小龙虾”活动的云虚拟机,均可以接入对DeepSeek-V4模型的调用测试。
此次 DeepSeek-V4 系列模型的快速引入,是网络信息中心持续推进智能算力基础设施建设的重要举措。未来,中心将持续跟进大模型技术发展,完善模型生态与算力支撑体系,进一步提升平台服务能力,推动人工智能技术在教学、科研与管理场景中的深度应用,为学校“双一流”建设和智慧校园发展提供有力支撑。
