对话接口
POST
/v1/chat/completions详细说明参考:API接口文档
请求参数
Header 参数
Body 参数application/json
messages
array [object {2}]
消息列表
消息上下文列表,可以传入历史对话记忆,每一轮包含一条user消息和一条assistant消息,最后一条为用户的问题
role
string
角色
支持填写 system, user, assistant 中的一个,分别表示系统提示词、用户问题、AI回复
content
string
内容
文本内容
app_code
string
应用code
应用或工作流的 code。若不填则表示不绑定具体应用,将请求直接传递给模型
model
string
模型编码
不传则使用应用的默认模型,所有支持模型见 模型列表
temperature
number
温度
默认为应用中配置的温度。温度越高回复越具有创意和不确定性,温度越低则回复更严谨
top_p
integer
模型采样范围
控制模型采样范围,默认值为 1
frequency_penalty
number
频率惩罚项
该参数越大则更倾向于产生不同的内容,范围为 [-2, 2],默认值为 0
presence_penalty
number
存在惩罚项
该参数越大则更倾向于产生不同的内容,范围为 [-2, 2],默认值为 0
stream
boolean
是否流式输出
默认值为 false
示例
{
"app_code": "",
"messages": [
{
"role": "user",
"content": "你好"
}
]
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
choices
array [object {2}]
必需
index
integer
可选
message
object
可选
usage
object
必需
prompt_tokens
integer
请求token数
completion_tokens
integer
响应token数
total_tokens
integer
总token数
总token计算包含 请求 和 响应 中的总token数, 其中请求又包含 应用设定、历史对话、知识库内容、用户问题
示例
{
"choices": [
{
"message": {
"role": "assistant",
"content": "你好啊!有什么我可以帮助你的吗?"
}
}
],
"usage": {
"prompt_tokens": 32,
"completion_tokens": 24,
"total_tokens": 56
}
}
修改于 3 个月前