AI 模型配置
配置文字解析和图片识别使用的 AI 模型,支持混合路由(不同场景用不同模型)
文字解析(语音/文字/AI记账)
用于解析用户的自然语言输入为结构化记账记录
模型名称
ai.text.model
—
API Key
ai.text.api_key
—
Base URL(可选,留空用默认值)
ai.text.base_url
(使用默认值)
图片识别(拍照记账)
用于识别小票/截图中的消费信息
模型名称
ai.image.model
—
API Key
ai.image.api_key
—
Base URL(可选,留空用默认值)
ai.image.base_url
(使用默认值)
通用参数
Temperature
ai.temperature
0 = 确定性输出(推荐),0.7 = 较随机
—
Max Tokens
ai.max_tokens
AI 输出最大 token 数,记账解析一般 200-500 足够
—
语音识别 API Key
ai.voice.api_key
阿里云 DashScope(Paraformer-v2),用于语音转文字
—
💡 使用建议
• 文字解析推荐 DeepSeek — 原生 JSON Mode,Prefix Cache 自动生效,延迟低
• 图片识别推荐 通义千问 或 豆包 — 支持多模态视觉模型
• Temperature 设为 0 — 结构化 JSON 输出无需创造性,0 最稳定
• 修改配置后客户端会在下次启动时自动拉取最新设置
• 豆包自定义 endpoint 请填写完整 ID 如 ep-2026xxxx-xxxxx