记忆对话接口
POST
/v1/chat/memory/completions详细说明参考:API接口文档
该接口标准版及以上可用
请求参数
Header 参数
Body 参数application/json
question
string
用户问题
用户本轮输入的问题
session_id
string
会话ID
会话ID,每个session_id都有独立的上下文记忆存储。可传入对用户身份的标识,若该字段不填则系统会自动分配一个唯一标识,在响应中返回
app_code
string
应用code
应用或工作流的 code。若不填则表示不绑定具体应用,将请求直接传递给模型
model
string
模型编码
不传则使用应用的默认模型,所有支持模型见 模型列表
temperature
number
温度
默认为应用中配置的温度。温度越高回复越具有创意和不确定性,温度越低则回复更严谨
top_p
integer
模型采样范围
控制模型采样范围,默认值为 1
frequency_penalty
number
频率惩罚项
该参数越大则更倾向于产生不同的内容,范围为 [-2, 2],默认值为 0
presence_penalty
number
存在惩罚项
该参数越大则更倾向于产生不同的内容,范围为 [-2, 2],默认值为 0
stream
boolean
是否流式输出
默认值为 false
示例
{
"app_code": "",
"question": "你好",
"session_id": "123e4567-e89b-12d3-a456-426614174000"
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
session_id
string
会话ID
如果调用时指定了该字段,将会原样返回,如果未指定则会自动分配一个唯一ID,下次调用该接口时可以携带
choices
array [object {2}]
必需
index
integer
可选
message
object
可选
usage
object
必需
prompt_tokens
integer
请求token数
completion_tokens
integer
响应token数
total_tokens
integer
总token数
总token计算包含 请求 和 响应 中的总token数, 其中请求又包含 应用设定、历史对话、知识库内容、用户问题
示例
{
"session_id": "123e4567-e89b-12d3-a456-426614174000",
"choices": [
{
"message": {
"role": "assistant",
"content": "你好啊!有什么我可以帮助你的吗?"
}
}
],
"usage": {
"prompt_tokens": 32,
"completion_tokens": 24,
"total_tokens": 56
}
}
最后修改时间: 4 个月前