青云科技云端QKE 容器引擎助你快速部署AI大模型-网络百科

大模型和 AIGC的发展呈现出了快速推进的态势，不仅在技术层面有所突破，而且在产业应用和市场前景方面也展现出积极的趋势。通过青云科技（qingcloud.com）容器引擎 QKE 快速部署 ChatGLM-6B 大模型，开启属于你自己的 AI 时代。

什么是 QKE

QingCloud 容器引擎 QKE 是基于 Kubernetes 的容器引擎，能够轻松地管理和部署容器化应用。它具备自动化扩容、高可用性、安全性等多项优势，让应用更加稳定、高效。近日，发布 QKE v3.1，支持 Kubernetes v1.25 ，不仅提高了容器集群的性能、可靠性、安全性和可维护性，还为大模型应用场景提供了更好的支持。

5 分钟部署大模型

接下来，我们来看看如何使用 QKE 容器引擎部署 ChatGLM-6B 大模型。

创建 QKE GPU 集群

第一步：创建一个带有 GPU 工作节点池的 QKE 集群

QKE 集群创建成功后，如需以 HTTP 访问带授权的镜像仓库，可在集群信息，镜像参数中配置镜像拉取的 insecure-registries、docker-auths。

第二步：检查 GPU 工作节点上 GPU Device Plugin 的就绪情况。

第三步：将 GPU 工作节点打上标签：accelerator: nvidia-gpu

部署 ChatGLM-6B

第一步：编辑创建 K8s deployment 和 service 的 chatglm-6b.yaml。

其中 nodeSelector.accelerator: nvidia-gpu 让 Pod 调度到的 GPU 工作节点。

第二步：部署 ChatGLM-6B

暴露服务给外部访问