AI 模型配置

配置文字解析和图片识别使用的 AI 模型,支持混合路由(不同场景用不同模型)

文字解析(语音/文字/AI记账)

用于解析用户的自然语言输入为结构化记账记录

模型名称
ai.text.model
API Key
ai.text.api_key
Base URL(可选,留空用默认值)
ai.text.base_url
(使用默认值)
图片识别(拍照记账)

用于识别小票/截图中的消费信息

模型名称
ai.image.model
API Key
ai.image.api_key
Base URL(可选,留空用默认值)
ai.image.base_url
(使用默认值)
通用参数
Temperature
ai.temperature
0 = 确定性输出(推荐),0.7 = 较随机
Max Tokens
ai.max_tokens
AI 输出最大 token 数,记账解析一般 200-500 足够
语音识别 API Key
ai.voice.api_key
阿里云 DashScope(Paraformer-v2),用于语音转文字

💡 使用建议

文字解析推荐 DeepSeek — 原生 JSON Mode,Prefix Cache 自动生效,延迟低

图片识别推荐 通义千问 或 豆包 — 支持多模态视觉模型

Temperature 设为 0 — 结构化 JSON 输出无需创造性,0 最稳定

• 修改配置后客户端会在下次启动时自动拉取最新设置

• 豆包自定义 endpoint 请填写完整 ID 如 ep-2026xxxx-xxxxx