【书生·浦语】大模型实战营——第五次课程作业

本文介绍: 运行上述命令后，会在当前目录新建workspace文件夹，里面存放着转化后的权重文件。以开始以为运行命令参数是 l。

除了安装所需依赖之后，重要的是进行模型转化（转换成TurboMind格式），这里需要注意转化命令的具体用法：

# lmdeploy convert 模型类型/模型名 模型权重文件地址
lmdeploy convert internlm-chat-7b /path/to/internlm-chat-7b

运行上述命令后，会在当前目录新建workspace文件夹，里面存放着转化后的权重文件。以开始以为运行命令参数是 l~~mdelpoy convert 大模型原始路径转化后的模型路径（实际不是）。~~

运行命令：

# Turbomind + Bash Local Chat
lmdeploy chat turbomind ./workspace

# ApiServer+Turbomind   api_server => AsyncEngine => TurboMind
lmdeploy serve api_server ./workspace 
	--server_name 0.0.0.0 
	--server_port 23333 
	--instance_num 64 
	--tp 1


# 新开一个终端
lmdeploy serve api_client http://localhost:23333

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

基础作业——使用LMDeploy 以本地对话、网页Gradio、API服务中的一种方式部署InternLM-Chat-7B模型，生成300字的小故事

环境准备

TurboMind推理 + 命令行本地对话

TurboMind推理 + API服务

TurboMind 推理 + 网页Demo演示

发表回复取消回复