智能计算服务平台围绕不同业务形态构建三大子平台,形成从模型训练 → 模型托管 → 模型推理 → 服务集成的全流程能力体系,为校内业务系统建设与科研任务提供高可用、可扩展、高性能的智能计算支撑环境。

1. 智算虚拟化平台 —— 提供灵活可控的模型训练与开发环境

智算虚拟化平台通过虚拟机与容器运行形态,为轻量常驻型任务及科研开发活动提供弹性算力运行和开发环境核心能力包括:

多实例 GPU/MIG 资源切片、动态配额与共享调度

容器化作业运行、镜像管理与开发环境封装

适用于:
小模型推理服务、业务型 AI 组件、科研模型验证、轻量训练与长期在线任务。

2. 大模型公共服务平台 —— 模型托管与推理服务能力中心

大模型公共服务平台提供集中式模型管理与推理服务能力,实现模型多版本管理、服务统一接入与调用治理,使校内应用能够在无需自建 GPU 环境的情况下快速集成智能能力。核心能力包括:

大模型托管、推理加速与多版本管理

Unified Model Gateway:统一推理网关、访问认证、灰度发布

Embedding、OCR、LLM 推理等通用模型服务

API 调用、服务编排、负载均衡与限流审计

模型在线更新与多模型路由调度

适用于:
智能问答、办事助手、审批辅助、知识库问答、OCR/文本理解等
管理类 AI 服务,以及科研模型的服务化上线与推理运行

3. 训推一体化平台 —— 实现模型从训练到服务落地的贯通能力

训推一体化平台面向高负载训练、模型微调与大规模生成任务,提供集群调度、作业编排与模型上线通路,实现“训练即服务(Train-to-Serve)”的模型全生命周期管理。核心能力包括:

分布式训练、混合精度训练与多机多卡调度

作业队列管理、批处理任务运行与优先级调度

模型微调(LoRA / SFT)、蒸馏压缩与推理优化

适用于:
科研训练任务、模型优化实验、大模型微调、生成式任务与科研成果服务化落地。