违禁词 与 logit_bias 参数
- 前文,通过GPT的API实现了一个简单的聊天机器人, 当然也可以做一些内容审核相关的应用
- 这里有一个非常核心,需要重点关注的一个方向,就是对于文本的审核
- 对于我们构建的 Prompt,其实还比较简单,那么可以通过字符串匹配的方式去进行处理
- 对于GPT它返回的结果,我们怎样去进行控制,怎样避免 GPT 生成一些违禁词?
- 对于这一点,Open AI 还提供了其他的参数,帮我们去进行解决,那就是
logit_bias
- 那么我们如何通过
logit_bias
去控制,去剔除违禁词?
代码结构
具体代码实现
package com.xxx.gpt.client.test;
import com.xxx.gpt.client.ChatGPTClient;
import com.xxx.gpt.client.entity.*;
import com.xxx.gpt.client.util.Proxys;
import com.xxx.gpt.client.util.TokensUtil;
import org.junit.Before;
import org.junit.Test;
import java.net.Proxy;
import java.util.Arrays;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
public class ChatReviewTest {
private ChatGPTClient chatGPTClient;
@Before
public void before() {
Proxy proxy = Proxys.socks5("127.0.0.1", 7890);
chatGPTClient = ChatGPTClient.builder()
.apiKey("sk-adfasdfsdfsdf")
.timeout(900)
.proxy(proxy)
.apiHost("https://api.openai.com/")
.build()
.init();
}
@Test
public void chat() {
Message system = Message.ofSystem("你是一个机器学习领域的专家");
Message message = Message.of("介绍机器学习常用算法类型,只需要告诉我名字,不需要额外的介绍");
ChatCompletion chatCompletion = ChatCompletion.builder()
.model(Model.GPT_3_5_TURBO.getName())
.messages(Arrays.asList(system, message))
.maxTokens(3000)
.temperature(0.9)
.build();
ChatCompletionResponse response = chatGPTClient.chatCompletion(chatCompletion);
System.out.println("-------------------chat-------------------");
Message res = response.getChoices().get(0).getMessage();
System.out.println(res.getContent());
}
// @Test
public void chatReview() {
Message system = Message.ofSystem("你是一个机器学习领域的专家");
Message message = Message.of("介绍机器学习常用算法类型,只需要告诉我名字,不需要额外的介绍");
// 不希望返回中,存在 回归, 监督 这两个词
Map<Integer, Integer> logitBiasMap = getBiasMap(Model.GPT_3_5_TURBO.getName(),Arrays.asList("回归","监督"));
ChatCompletion chatCompletion = ChatCompletion.builder()
.model(Model.GPT_3_5_TURBO.getName())
.messages(Arrays.asList(system, message))
.maxTokens(3000)
.n(3) // 返回3条回复
.temperature(0.9)
.frequencyPenalty(2)
.presencePenalty(0)
.logitBias(logitBiasMap)
.build();
ChatCompletionResponse response = chatGPTClient.chatCompletion(chatCompletion);
System.out.println("-------------------chatReview-------------------");
for(ChatChoice choice:response.getChoices()) {
System.out.println(choice.getMessage().getContent());
}
}
private Map<Integer, Integer> getBiasMap(String modelName,List<String> list) {
Map<Integer, Integer> result = new HashMap<>();
for(String word:list) {
List<Integer> tokens = TokensUtil.getTokens(modelName, word);
for(Integer t:tokens) {
result.put(t,-100);
}
}
return result;
}
}
- 这里要去构造了一个 logitBiasMap 这个参数, 它是一个map类型的参数
- 这个 getBiosMap 方法实现非常简单,需要结合之前的 TokensUtil
- 在参数里面进行一下添加
- 也就是我们期望它用多样性的回答对我们来进行回复
- 输出结果可以看到我们的结果已经产生了,不含有
监督
和回归
这两个词,这是对于一些词的过滤的一个实现 - 除了通过
logit_bias
去进行判断控制GPT的输出
moderation 接口
1 )概述
- 对于用户的一些 Prompt GPT其实也提供了相关的接口去进行判断, GPT提供了 moderation 相关的接口
- 当我们去实现一个网站或者实现相关的智能产品相关的一些功能的时候
- 那么具体如何去进行判断?
# -*- coding: utf-8
import os
import openai
openai.api_key = "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"
openai.proxy="http://127.0.0.1:7890"
res = openai.Moderation.create("你不听我的话我就拿刀砍死你") # 这句话具有明显的暴力倾向
output = res["results"][0]
print(output)
- 执行后,输出json显示,我们的输入明显是有暴力倾向,也给予了相关的分值
- 这是对于我们的输入以及GPT输出相关的文本审核的一些方法
- 实际去应用 GPT的时候,那么对于我们的输入, 以及GPT的输出,肯定是需要通过类似的方法去进行控制,去进行判断的
原文地址:https://blog.csdn.net/Tyro_java/article/details/134818268
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.7code.cn/show_46058.html
如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱:suwngjj01@126.com进行投诉反馈,一经查实,立即删除!
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。