AI 模型配置

配置文字解析和图片识别使用的 AI 模型，支持混合路由（不同场景用不同模型）

文字解析（语音/文字/AI记账）

用于解析用户的自然语言输入为结构化记账记录

模型提供商

模型名称

ai.text.model

—

API Key

ai.text.api_key

—

Base URL（可选，留空用默认值）

ai.text.base_url

（使用默认值）

图片识别（拍照记账）

用于识别小票/截图中的消费信息

模型提供商

模型名称

ai.image.model

—

API Key

ai.image.api_key

—

Base URL（可选，留空用默认值）

ai.image.base_url

（使用默认值）

通用参数

Temperature

ai.temperature

0 = 确定性输出（推荐），0.7 = 较随机

—

Max Tokens

ai.max_tokens

AI 输出最大 token 数，记账解析一般 200-500 足够

—

语音识别 API Key

ai.voice.api_key

阿里云 DashScope（Paraformer-v2），用于语音转文字

—

💡 使用建议

• 文字解析推荐 DeepSeek — 原生 JSON Mode，Prefix Cache 自动生效，延迟低

• 图片识别推荐通义千问或豆包 — 支持多模态视觉模型

• Temperature 设为 0 — 结构化 JSON 输出无需创造性，0 最稳定

• 修改配置后客户端会在下次启动时自动拉取最新设置

• 豆包自定义 endpoint 请填写完整 ID 如 ep-2026xxxx-xxxxx