轻松上手：通过阿里云PAI QuickStart微调部署Qwen-72B-Chat模型

本文介绍: 作者：熊兮、求伯、一耘。

作者：熊兮、求伯、一耘

通义千问-72B（Qwen-72B）是阿里云研发的通义千问大模型系列的720亿参数规模模型。Qwen-72B的预训练数据类型多样、覆盖广泛，包括大量网络文本、专业书籍、代码等。Qwen-72B-Chat是在Qwen-72B的基础上，使用对齐机制打造的基于大语言模型的AI助手。

阿里云人工智能平台PAI是面向开发者和企业的机器学习/深度学习平台，提供AI开发全链路服务。快速开始（PAI-QuickStart）是阿里云人工智能平台PAI的产品组件，它集成了国内外 AI 开源社区中优质的预训练模型，支持零代码和 SDK 的方式实现从训练到部署再到推理的全过程，大大简化了模型的开发和部署，为开发者和企业用户带来了更快、更高效、更便捷的 AI 开发和应用体验。

本文将以 Qwen-72B-Chat 为例，介绍如何通过PAI平台的快速开始（PAI-QuickStart）部署和微调千问大模型。

灵骏智算资源的开通购买

开发者可以在 PAI 控制台的“快速开始”入口，找到 Qwen-72B-Chat 的模型，Qwen-72B-Chat 的模型卡片如下图所示：

# 请注意替换为使用服务的Endpoint和Token
export API_ENDPOINT="<ENDPOINT>"
export API_TOKEN="<TOKEN>"

# 查看模型list
curl $API_ENDPOINT/v1/models 
	-H "Content-Type: application/json" 
	-H "Authorization: Bearer $API_TOKEN"

# 调用通用的文本生成API
curl $API_ENDPOINT/v1/completions 
	-H "Content-Type: application/json" 
	-H "Authorization: Bearer $API_TOKEN" 
	-d '{
      "model": "qwen-72b-chat",
      "prompt": "San Francisco is a",
      "max_tokens": 256,
      "temperature": 0,
      "stop": ["<|im_end|>", "<|im_start|>"]
}'

# 调用对话API
curl $API_ENDPOINT/v1/chat/completions 
	-H "Authorization: Bearer $API_TOKEN" 
	-H "Content-Type: application/json" 
	-d '{
      "model": "qwen-72b-chat",
      "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "介绍一下上海的历史"}
      ],
      "stop": ["<|im_end|>", "<|im_start|>"]
      }'

# 安装服务调用SDK
python -m pip install openai

import openai

# 请使用服务详情页获取的访问地址（ENDPOINT）和访问凭证（TOKEN）替换以下代码的配置。
openai.api_key = "<TOKEN>"
openai.base_url = "<ENDPOINT>" + "/v1"


# 调用对话API
completion = openai.chat.completions.create(
    model="qwen-72b-chat",
    temperature=0.0,
    top_p=0.8,
    frequency_penalty=0.0,
    messages=[{"role": "user", "content": "请介绍下你自己。"}],
    stop=["<|im_end|>", "<|im_start|>"],
    # stream=True,
)
# 打印输出内容
print(completion.choices[0].message.content)

[
    {
        "instruction": "写一首以“寓居夜感”为题的诗：",
        "output": "独坐晚凉侵，客窗秋意深。风沙疑化雾，夜气欲成霖。家务劳人倦，浓茶代酒斟。哀鸿鸣四野，一并助长吟。"    
     },
    {
        "instruction": "写一首以“次答友人思乡诗”为题的诗：",
        "output": "阅尽沧桑万事空，何如归卧夕阳中。并州最是伤心地，四十馀年噩梦同。"    
     }
]

# 安装PAI Python SDK
python -m pip install alipai --upgrade

# 交互式得配置访问凭证、PAI工作空间等信息
python -m pai.toolkit.config

from pai.session import  get_default_session
from pai.model import RegisteredModel

session = get_default_session()

# 获取PAI QuickStart 提供的qwen-72b-chat模型
m = RegisteredModel(
    model_name="qwen-72b-chat",
    model_provider="pai",
)

# 部署推理服务
predictor = m.deploy(
    service_name="qwen_72b_chat_{}".format(random_str(6)),
    options={
        # 资源配额ID
        "metadata.quota_id": "<LingJunResourceQuotaId>",
        "metadata.quota_type": "Lingjun",
        "metadata.workspace_id": session.workspace_id,
    }
)

# 查看服务的Endpoint和Token
endpoint = predictor.internet_endpoint
token = predictor.access_token

from pai.model import RegisteredModel

# 获取PAI QuickStart 提供的Qwen-72b-Chat模型
m = RegisteredModel(
    model_name="qwen-72b-chat",
    model_provider="pai",
)

# 获取模型配置的微调算法
est = m.get_estimator()

# 查看算法支持的超参，以及算法输入输出信息
print(est.hyperparameter_definitions)
print(est.input_channel_definitions)


# 配置训练作业使用的灵骏资源配额ID
est.resource_id = "<LingjunResourceQuotaId>"

# 配置训练作业超参
hps = {
    "learning_rate": 1e-5,
    "save_interval": 500,
}
est.set_hyperparameters(**hps)

# 查看模型微调算法的使用的输入信息
print(m.get_estimator_inputs())

# {
#     "model": "oss://pai-quickstart-cn-wulanchabu.oss-cn-wulanchabu-internal.aliyuncs.com/huggingface/models/qwen-72b-chat/megatron/",
#     "train": "oss://pai-quickstart-cn-wulanchabu.oss-cn-wulanchabu-internal.aliyuncs.com/huggingface/datasets/llm_instruct/ch_poetry_train.json",
#     "validation": "oss://pai-quickstart-cn-wulanchabu.oss-cn-wulanchabu-internal.aliyuncs.com/huggingface/datasets/llm_instruct/ch_poetry_test.json",
# }

开发者可以参考以上的训练数据格式准备数据，然后将train和validation输入替换为自己的训练和验证数据集，即可轻松得提交模型微调训练作业。通过 SDK 打印的训练作业链接，用户可以在 PAI 的控制台上查看训练进度详情以及日志信息。

from pai.common.oss_utils import download

# 获取算法的输入数据，包括具体的模型和供测试的公共读数据集.
training_inputs = m.get_estimator_inputs()

# 替换使用开发者自己的训练数据
# training_inputs["train"] = "oss://<BucketName>/path/to/train/data.json"
# training_inputs["validation"] = "oss://<BucketName>/path/to/validation/data.json"

# 提交训练作业，并等待到训练作业结束
est.fit(
    inputs=training_inputs
)

# 查看保存在OSS Bucket上的模型路径
print(est.model_data())


# 用户可以通过ossutils，或是SDK提供的便利方法下载相应的模型到本地
download(est.model_data())

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

b pai qwen

超参数	类型	默认值	是否必须	描述
learning_rate	Float	1e-05	True	用于控制模型权重更新的步长。
min_learning_rate	Float	1e-05	True	最小学习速率是在使用动态调整学习速率策略时设置的下限。
sequence_length	Int	2048	True	序列长度是指模型在一次训练中处理的输入数据的长度。
save_interval	Int	1000	True	保存间隔是指模型在训练过程中每隔多少迭代次数保存一次模型状态。
train_iters	Int	2000	True	训练迭代次数是指模型在整个训练过程中将完成的总迭代次数。
learning_rate_warmup_iters	Int	0	True	学习速率预热迭代次数是指在训练开始的一段时间内，学习速率将逐渐从较低值增加到预设的学习速率的过程中所经过的迭代次数。

引言

运行环境要求

通过PAI控制台使用模型

模型部署和调用

模型微调训练

通过PAI Python SDK使用模型

模型部署和调用

模型微调训练

结论

相关资料

发表回复取消回复

引言

运行环境要求

通过PAI控制台使用模型

模型部署和调用

模型微调训练

通过PAI Python SDK使用模型

模型部署和调用

模型微调训练

结论

相关资料

相关文章

发表回复 取消回复

发表回复取消回复