From c57cd4723d47657ba5e5194b1e63637cb274bf1b Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Fri, 24 Apr 2026 12:20:24 +0800 Subject: [PATCH 1/5] audit model field values against official docs --- compute/coding-plans/dashscope-coding.json | 54 +- compute/coding-plans/infini-coding.json | 1 + compute/coding-plans/kwai-coding.json | 3 + compute/coding-plans/minimax-coding.json | 107 +++- compute/coding-plans/moonshot-coding.json | 74 ++- compute/coding-plans/moorethread-coding.json | 3 + compute/coding-plans/volcengine-coding.json | 3 + compute/coding-plans/zhipu-coding.json | 115 ++++- compute/providers/anthropic.json | 24 +- compute/providers/baichuan.json | 16 +- compute/providers/baidu.json | 20 +- compute/providers/cohere.json | 16 +- compute/providers/dashscope.json | 187 +++++-- compute/providers/deepseek.json | 20 +- compute/providers/google.json | 11 +- compute/providers/internal-testing.json | 38 +- compute/providers/kling.json | 12 + compute/providers/local-whisper.json | 3 + compute/providers/minimax.json | 104 +++- compute/providers/mistral.json | 33 +- compute/providers/moonshot.json | 119 ++++- compute/providers/ollama.json | 2 + compute/providers/openai.json | 192 +++++-- compute/providers/openrouter.json | 21 +- compute/providers/siliconflow.json | 17 +- compute/providers/stability.json | 3 + compute/providers/tencent.json | 21 +- compute/providers/volcengine.json | 108 ++-- compute/providers/xai.json | 22 +- compute/providers/xunfei.json | 8 +- compute/providers/zhipu-embedding.json | 15 +- compute/providers/zhipu.json | 183 +++++-- manifest.json | 4 +- 字段取值表/anthropic/未确认字段报告.md | 47 ++ 字段取值表/anthropic/详细字段取值表.md | 114 ++++ .../anthropic/逐条处置记录-2026-04-23.md | 17 + 字段取值表/baichuan/未确认字段报告.md | 44 ++ 字段取值表/baichuan/详细字段取值表.md | 89 ++++ 字段取值表/baidu/未确认字段报告.md | 22 + 字段取值表/baidu/详细字段取值表.md | 51 ++ 字段取值表/cohere/未确认字段报告.md | 31 ++ 字段取值表/cohere/详细字段取值表.md | 72 +++ 字段取值表/dashscope-coding/未确认字段报告.md | 20 + 字段取值表/dashscope-coding/详细字段取值表.md | 51 ++ .../dashscope-coding/逐条处置记录-2026-04-23.md | 17 + 字段取值表/dashscope/未确认字段报告.md | 168 ++++++ 字段取值表/dashscope/详细字段取值表.md | 362 +++++++++++++ .../dashscope/逐条处置记录-2026-04-23.md | 38 ++ 字段取值表/deepseek/未确认字段报告.md | 23 + 字段取值表/deepseek/详细字段取值表.md | 51 ++ 字段取值表/google/未确认字段报告.md | 27 + 字段取值表/google/详细字段取值表.md | 72 +++ 字段取值表/google/逐条处置记录-2026-04-23.md | 15 + 字段取值表/infini-coding/未确认字段报告.md | 15 + 字段取值表/infini-coding/详细字段取值表.md | 33 ++ 字段取值表/internal-testing/未确认字段报告.md | 132 +++++ 字段取值表/internal-testing/详细字段取值表.md | 289 +++++++++++ 字段取值表/kling/未确认字段报告.md | 40 ++ 字段取值表/kling/详细字段取值表.md | 87 ++++ 字段取值表/kwai-coding/未确认字段报告.md | 15 + 字段取值表/kwai-coding/详细字段取值表.md | 32 ++ 字段取值表/lingyiwanwu/未确认字段报告.md | 26 + 字段取值表/lingyiwanwu/详细字段取值表.md | 51 ++ 字段取值表/local-whisper/未确认字段报告.md | 13 + 字段取值表/local-whisper/详细字段取值表.md | 31 ++ 字段取值表/minimax-coding/未确认字段报告.md | 13 + 字段取值表/minimax-coding/详细字段取值表.md | 36 ++ 字段取值表/minimax/未确认字段报告.md | 80 +++ 字段取值表/minimax/详细字段取值表.md | 157 ++++++ 字段取值表/minimax/逐条处置记录-2026-04-23.md | 25 + 字段取值表/mistral/未确认字段报告.md | 37 ++ 字段取值表/mistral/详细字段取值表.md | 70 +++ 字段取值表/mistral/逐条处置记录-2026-04-23.md | 17 + 字段取值表/moonshot-coding/未确认字段报告.md | 11 + 字段取值表/moonshot-coding/详细字段取值表.md | 32 ++ 字段取值表/moonshot/未确认字段报告.md | 61 +++ 字段取值表/moonshot/详细字段取值表.md | 134 +++++ .../moonshot/逐条处置记录-2026-04-23.md | 16 + .../moorethread-coding/未确认字段报告.md | 15 + .../moorethread-coding/详细字段取值表.md | 32 ++ 字段取值表/ollama/未确认字段报告.md | 14 + 字段取值表/ollama/详细字段取值表.md | 31 ++ 字段取值表/openai/未确认字段报告.md | 181 +++++++ 字段取值表/openai/详细字段取值表.md | 485 ++++++++++++++++++ 字段取值表/openai/逐条处置记录-2026-04-23.md | 59 +++ 字段取值表/openrouter/未确认字段报告.md | 33 ++ 字段取值表/openrouter/详细字段取值表.md | 74 +++ 字段取值表/perplexity/未确认字段报告.md | 32 ++ 字段取值表/perplexity/详细字段取值表.md | 68 +++ 字段取值表/siliconflow/未确认字段报告.md | 33 ++ 字段取值表/siliconflow/详细字段取值表.md | 72 +++ .../siliconflow/逐条处置记录-2026-04-23.md | 21 + 字段取值表/stability/未确认字段报告.md | 13 + 字段取值表/stability/详细字段取值表.md | 31 ++ 字段取值表/tencent/未确认字段报告.md | 23 + 字段取值表/tencent/详细字段取值表.md | 53 ++ .../volcengine-coding/未确认字段报告.md | 13 + .../volcengine-coding/详细字段取值表.md | 30 ++ 字段取值表/volcengine/未确认字段报告.md | 166 ++++++ 字段取值表/volcengine/详细字段取值表.md | 348 +++++++++++++ .../volcengine/逐条处置记录-2026-04-23.md | 36 ++ 字段取值表/xai/未确认字段报告.md | 24 + 字段取值表/xai/详细字段取值表.md | 52 ++ 字段取值表/xai/逐条处置记录-2026-04-23.md | 20 + 字段取值表/xunfei/未确认字段报告.md | 22 + 字段取值表/xunfei/详细字段取值表.md | 50 ++ 字段取值表/zhipu-coding/未确认字段报告.md | 18 + 字段取值表/zhipu-coding/详细字段取值表.md | 53 ++ 字段取值表/zhipu-embedding/未确认字段报告.md | 13 + 字段取值表/zhipu-embedding/详细字段取值表.md | 30 ++ 字段取值表/zhipu/未确认字段报告.md | 49 ++ 字段取值表/zhipu/详细字段取值表.md | 116 +++++ 字段取值表/zhipu/逐条处置记录-2026-04-23.md | 25 + 字段取值表/目录索引.json | 240 +++++++++ 114 files changed, 6550 insertions(+), 368 deletions(-) create mode 100644 字段取值表/anthropic/未确认字段报告.md create mode 100644 字段取值表/anthropic/详细字段取值表.md create mode 100644 字段取值表/anthropic/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/baichuan/未确认字段报告.md create mode 100644 字段取值表/baichuan/详细字段取值表.md create mode 100644 字段取值表/baidu/未确认字段报告.md create mode 100644 字段取值表/baidu/详细字段取值表.md create mode 100644 字段取值表/cohere/未确认字段报告.md create mode 100644 字段取值表/cohere/详细字段取值表.md create mode 100644 字段取值表/dashscope-coding/未确认字段报告.md create mode 100644 字段取值表/dashscope-coding/详细字段取值表.md create mode 100644 字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/dashscope/未确认字段报告.md create mode 100644 字段取值表/dashscope/详细字段取值表.md create mode 100644 字段取值表/dashscope/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/deepseek/未确认字段报告.md create mode 100644 字段取值表/deepseek/详细字段取值表.md create mode 100644 字段取值表/google/未确认字段报告.md create mode 100644 字段取值表/google/详细字段取值表.md create mode 100644 字段取值表/google/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/infini-coding/未确认字段报告.md create mode 100644 字段取值表/infini-coding/详细字段取值表.md create mode 100644 字段取值表/internal-testing/未确认字段报告.md create mode 100644 字段取值表/internal-testing/详细字段取值表.md create mode 100644 字段取值表/kling/未确认字段报告.md create mode 100644 字段取值表/kling/详细字段取值表.md create mode 100644 字段取值表/kwai-coding/未确认字段报告.md create mode 100644 字段取值表/kwai-coding/详细字段取值表.md create mode 100644 字段取值表/lingyiwanwu/未确认字段报告.md create mode 100644 字段取值表/lingyiwanwu/详细字段取值表.md create mode 100644 字段取值表/local-whisper/未确认字段报告.md create mode 100644 字段取值表/local-whisper/详细字段取值表.md create mode 100644 字段取值表/minimax-coding/未确认字段报告.md create mode 100644 字段取值表/minimax-coding/详细字段取值表.md create mode 100644 字段取值表/minimax/未确认字段报告.md create mode 100644 字段取值表/minimax/详细字段取值表.md create mode 100644 字段取值表/minimax/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/mistral/未确认字段报告.md create mode 100644 字段取值表/mistral/详细字段取值表.md create mode 100644 字段取值表/mistral/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/moonshot-coding/未确认字段报告.md create mode 100644 字段取值表/moonshot-coding/详细字段取值表.md create mode 100644 字段取值表/moonshot/未确认字段报告.md create mode 100644 字段取值表/moonshot/详细字段取值表.md create mode 100644 字段取值表/moonshot/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/moorethread-coding/未确认字段报告.md create mode 100644 字段取值表/moorethread-coding/详细字段取值表.md create mode 100644 字段取值表/ollama/未确认字段报告.md create mode 100644 字段取值表/ollama/详细字段取值表.md create mode 100644 字段取值表/openai/未确认字段报告.md create mode 100644 字段取值表/openai/详细字段取值表.md create mode 100644 字段取值表/openai/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/openrouter/未确认字段报告.md create mode 100644 字段取值表/openrouter/详细字段取值表.md create mode 100644 字段取值表/perplexity/未确认字段报告.md create mode 100644 字段取值表/perplexity/详细字段取值表.md create mode 100644 字段取值表/siliconflow/未确认字段报告.md create mode 100644 字段取值表/siliconflow/详细字段取值表.md create mode 100644 字段取值表/siliconflow/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/stability/未确认字段报告.md create mode 100644 字段取值表/stability/详细字段取值表.md create mode 100644 字段取值表/tencent/未确认字段报告.md create mode 100644 字段取值表/tencent/详细字段取值表.md create mode 100644 字段取值表/volcengine-coding/未确认字段报告.md create mode 100644 字段取值表/volcengine-coding/详细字段取值表.md create mode 100644 字段取值表/volcengine/未确认字段报告.md create mode 100644 字段取值表/volcengine/详细字段取值表.md create mode 100644 字段取值表/volcengine/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/xai/未确认字段报告.md create mode 100644 字段取值表/xai/详细字段取值表.md create mode 100644 字段取值表/xai/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/xunfei/未确认字段报告.md create mode 100644 字段取值表/xunfei/详细字段取值表.md create mode 100644 字段取值表/zhipu-coding/未确认字段报告.md create mode 100644 字段取值表/zhipu-coding/详细字段取值表.md create mode 100644 字段取值表/zhipu-embedding/未确认字段报告.md create mode 100644 字段取值表/zhipu-embedding/详细字段取值表.md create mode 100644 字段取值表/zhipu/未确认字段报告.md create mode 100644 字段取值表/zhipu/详细字段取值表.md create mode 100644 字段取值表/zhipu/逐条处置记录-2026-04-23.md create mode 100644 字段取值表/目录索引.json diff --git a/compute/coding-plans/dashscope-coding.json b/compute/coding-plans/dashscope-coding.json index 14a1b3c..4696bae 100644 --- a/compute/coding-plans/dashscope-coding.json +++ b/compute/coding-plans/dashscope-coding.json @@ -10,7 +10,10 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { "quotas": {}, "usageTracking": { @@ -22,22 +25,45 @@ { "modelName": "qwen3-coder-plus", "displayName": "Qwen3 Coder Plus (Coding)", - "serviceType": ["chat"], - "description": "阿里云百炼 Coding Plan,Qwen3 编程增强版", - "contextWindow": 131072, - "maxOutputTokens": 16384, - "capabilities": ["chat", "reasoning", "code", "tool_use"], - "source": "preset" + "serviceType": [ + "chat" + ], + "description": "阿里云百炼 Coding Plan,Qwen3 编程增强版,100万上下文", + "contextWindow": 1000000, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use" + ], + "source": "preset", + "inputPrice": 1, + "outputPrice": 5, + "defaultTemperature": 0.7 }, { - "modelName": "qwen3-max", + "modelName": "qwen3-max-2026-01-23", "displayName": "Qwen3 Max (Coding)", - "serviceType": ["chat"], - "description": "阿里云百炼 Coding Plan,Qwen3 Max 旗舰模型", - "contextWindow": 131072, - "maxOutputTokens": 16384, - "capabilities": ["chat", "reasoning", "code", "multilingual", "tool_use", "long_context", "vision"], - "source": "preset" + "serviceType": [ + "chat" + ], + "description": "阿里云百炼 Coding Plan,Qwen3 Max 旗舰模型,262K 上下文", + "contextWindow": 262144, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "tool_use", + "long_context", + "vision" + ], + "source": "preset", + "inputPrice": 1.2, + "outputPrice": 6, + "defaultTemperature": 0.7 } ] } diff --git a/compute/coding-plans/infini-coding.json b/compute/coding-plans/infini-coding.json index 24cbe65..9ebdb3c 100644 --- a/compute/coding-plans/infini-coding.json +++ b/compute/coding-plans/infini-coding.json @@ -27,6 +27,7 @@ "contextWindow": 128000, "maxOutputTokens": 8192, "capabilities": ["chat", "reasoning", "code", "multilingual"], + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/kwai-coding.json b/compute/coding-plans/kwai-coding.json index 5ed31d0..5d7393c 100644 --- a/compute/coding-plans/kwai-coding.json +++ b/compute/coding-plans/kwai-coding.json @@ -25,6 +25,9 @@ "serviceType": ["chat"], "description": "快手 KwaiKAT Coding Plan,编程辅助模型", "capabilities": ["chat", "code"], + "contextWindow": 128000, + "maxOutputTokens": 8192, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/minimax-coding.json b/compute/coding-plans/minimax-coding.json index 8e7ec7d..132441e 100644 --- a/compute/coding-plans/minimax-coding.json +++ b/compute/coding-plans/minimax-coding.json @@ -2,7 +2,7 @@ "id": "provider-minimax-coding-001", "provider": "minimax", "brandGroup": "minimax", - "label": "MiniMax Coding Plan", + "label": "MiniMax Token Plan", "baseUrl": "https://api.minimaxi.com/v1", "apiFormat": "openai-completions", "apiKeyRef": "", @@ -10,25 +10,108 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning", + "fast" + ], "codingPlan": { - "quotas": {}, + "quotas": { + "textWindow": "5h", + "standard": { + "starterRequestsPer5h": 1500, + "plusRequestsPer5h": 4500, + "maxRequestsPer5h": 15000 + }, + "highspeed": { + "plusHighspeedRequestsPer5h": 4500, + "maxHighspeedRequestsPer5h": 15000, + "ultraHighspeedRequestsPer5h": 30000 + } + }, "usageTracking": { "method": "rest-api", - "endpoint": "https://api.minimaxi.com/v1/coding/usage", - "consoleUrl": "https://platform.minimaxi.com/" + "endpoint": "https://www.minimax.io/v1/token_plan/remains", + "consoleUrl": "https://www.minimax.io/user-center/token-plan" } }, "models": [ { - "modelName": "MiniMax-M1", - "displayName": "MiniMax-M1 (Coding)", - "serviceType": ["chat"], - "description": "MiniMax Coding Plan,M1 旗舰模型", - "contextWindow": 1000000, + "modelName": "MiniMax-M2.7", + "displayName": "MiniMax-M2.7 (Token Plan)", + "serviceType": [ + "chat" + ], + "description": "MiniMax Token Plan 默认文本模型,M2.7,204,800 上下文,约 60 TPS 输出", + "contextWindow": 204800, "maxOutputTokens": 131072, - "capabilities": ["chat", "reasoning", "code", "long_context"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "long_context" + ], + "source": "preset", + "inputPrice": 0.3, + "outputPrice": 1.2, + "defaultTemperature": 1, + "defaultTopP": 1, + "extra": { + "billing": "token_plan_request_quota", + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } + }, + { + "modelName": "MiniMax-M2.7-highspeed", + "displayName": "MiniMax-M2.7 高速版 (Token Plan)", + "serviceType": [ + "fast" + ], + "description": "MiniMax Token Plan 高速订阅支持模型,M2.7-highspeed,效果与 M2.7 一致但输出更快", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "long_context", + "fast" + ], + "source": "preset", + "inputPrice": 0.6, + "outputPrice": 2.4, + "defaultTemperature": 1, + "defaultTopP": 1, + "extra": { + "billing": "token_plan_highspeed_request_quota", + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } + }, + { + "modelName": "MiniMax-M2.5", + "displayName": "MiniMax-M2.5 (Coding)", + "serviceType": [ + "chat" + ], + "description": "MiniMax Coding Plan,M2.5 模型,204.8K 上下文", + "contextWindow": 204800, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "long_context" + ], + "source": "preset", + "inputPrice": 0.3, + "outputPrice": 1.2, + "defaultTemperature": 1 } ] } diff --git a/compute/coding-plans/moonshot-coding.json b/compute/coding-plans/moonshot-coding.json index 01cf854..09ce9c7 100644 --- a/compute/coding-plans/moonshot-coding.json +++ b/compute/coding-plans/moonshot-coding.json @@ -10,24 +10,76 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { - "quotas": {}, + "quotas": { + "window": "5h", + "approxApiCallsPerWindow": "300-1200", + "maxConcurrency": 30 + }, "usageTracking": { "method": "none", - "consoleUrl": "https://platform.moonshot.cn/" + "consoleUrl": "https://www.kimi.com/code/console" } }, "models": [ { - "modelName": "kimi-k2", - "displayName": "Kimi K2 (Coding)", - "serviceType": ["chat"], - "description": "Kimi Code 套餐,万亿参数 MoE 模型,128K 上下文", - "contextWindow": 128000, - "maxOutputTokens": 8192, - "capabilities": ["chat", "reasoning", "code", "tool_use", "agent", "long_context", "vision"], - "source": "preset" + "modelName": "kimi-for-coding", + "displayName": "Kimi for Coding", + "serviceType": [ + "chat" + ], + "description": "Kimi Code 会员权益模型,官方第三方 Coding Agent 推荐模型 ID,Kimi Code 平台按会员额度计费", + "contextWindow": 262144, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision", + "video_understanding" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "billing": "kimi_membership_quota", + "baseUrlNote": "Kimi Code API Key must use https://api.kimi.com/coding/v1", + "recommendedFor": [ + "Kimi Code CLI", + "Claude Code", + "Roo Code" + ] + } + }, + { + "modelName": "kimi-k2.5", + "displayName": "Kimi K2.5 (Coding)", + "serviceType": [ + "chat" + ], + "description": "Kimi Code 套餐,Kimi K2.5 模型,256K 上下文", + "contextWindow": 256000, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision" + ], + "source": "preset", + "inputPrice": 0.58, + "outputPrice": 3.02, + "defaultTemperature": 1 } ] } diff --git a/compute/coding-plans/moorethread-coding.json b/compute/coding-plans/moorethread-coding.json index 7b18f67..6acd5cf 100644 --- a/compute/coding-plans/moorethread-coding.json +++ b/compute/coding-plans/moorethread-coding.json @@ -25,6 +25,9 @@ "serviceType": ["chat"], "description": "摩尔线程 Coding Plan,国产 GPU 推理", "capabilities": ["chat", "code"], + "contextWindow": 128000, + "maxOutputTokens": 8192, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/volcengine-coding.json b/compute/coding-plans/volcengine-coding.json index b32fa66..42269cb 100644 --- a/compute/coding-plans/volcengine-coding.json +++ b/compute/coding-plans/volcengine-coding.json @@ -31,6 +31,9 @@ "serviceType": ["chat"], "description": "自动路由最优编程模型(Doubao-Seed-Code / GLM-4.7 / DeepSeek-V3.2 / Kimi-K2 等)", "capabilities": ["code", "reasoning", "chat"], + "contextWindow": 256000, + "maxOutputTokens": 32000, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/zhipu-coding.json b/compute/coding-plans/zhipu-coding.json index f008e68..beac3bb 100644 --- a/compute/coding-plans/zhipu-coding.json +++ b/compute/coding-plans/zhipu-coding.json @@ -10,7 +10,10 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { "quotas": {}, "usageTracking": { @@ -19,25 +22,117 @@ } }, "models": [ + { + "modelName": "glm-5.1", + "displayName": "GLM-5.1 (Coding)", + "serviceType": [ + "chat" + ], + "description": "GLM Coding Plan 全量套餐支持的 GLM-5.1,面向复杂推理和大型工程任务,204,800 上下文,131,072 最大输出", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent", + "math", + "multilingual" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "quotaMultiplier": { + "peakHoursUtc8": "14:00-18:00", + "peak": 3, + "offPeak": 2, + "promotionalOffPeak": 1, + "promotionalOffPeakEndsAt": "2026-04-30" + } + } + }, + { + "modelName": "glm-5-turbo", + "displayName": "GLM-5-Turbo (Coding)", + "serviceType": [ + "chat" + ], + "description": "GLM Coding Plan 支持的 GLM-5-Turbo,面向 OpenClaw 等长链路任务优化,204,800 上下文,131,072 最大输出", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "quotaMultiplier": { + "peakHoursUtc8": "14:00-18:00", + "peak": 3, + "offPeak": 2, + "promotionalOffPeak": 1, + "promotionalOffPeakEndsAt": "2026-04-30" + } + } + }, { "modelName": "glm-5", "displayName": "GLM-5 (Coding)", - "serviceType": ["chat"], - "description": "智谱 GLM-5 Coding Plan 版本,745B MoE,编程能力登顶", - "contextWindow": 192000, + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5 Coding Plan 版本,202,752 token 上下文,编程能力登顶", + "contextWindow": 200000, "maxOutputTokens": 128000, - "capabilities": ["chat", "reasoning", "code", "deep_thinking", "long_context", "tool_use", "agent", "math", "multilingual"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent", + "math", + "multilingual" + ], + "source": "preset", + "inputPrice": 0.58, + "outputPrice": 2.6, + "defaultTemperature": 0.95 }, { "modelName": "glm-4.7", "displayName": "GLM-4.7 (Coding)", - "serviceType": ["chat"], - "description": "智谱 GLM-4.7 Coding Plan 版本,200K 上下文", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-4.7 Coding Plan 版本,202,752 token 上下文", "contextWindow": 200000, "maxOutputTokens": 128000, - "capabilities": ["chat", "reasoning", "code", "deep_thinking", "long_context", "tool_use", "multilingual"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "multilingual" + ], + "source": "preset", + "inputPrice": 0.2911, + "outputPrice": 1.1645, + "defaultTemperature": 0.95 } ] } diff --git a/compute/providers/anthropic.json b/compute/providers/anthropic.json index d205155..62873ff 100644 --- a/compute/providers/anthropic.json +++ b/compute/providers/anthropic.json @@ -17,10 +17,12 @@ { "modelName": "claude-opus-4-6", "displayName": "Claude Opus 4.6", - "serviceType": ["chat"], - "description": "Anthropic 最新旗舰 Opus 模型,最强能力", + "serviceType": [ + "chat" + ], + "description": "Anthropic Opus 4.6,1M 上下文,适合复杂代理和编码任务", "contextWindow": 200000, - "maxOutputTokens": 32768, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -36,7 +38,9 @@ { "modelName": "claude-opus-4-5", "displayName": "Claude Opus 4.5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Opus 4.5,顶级推理能力", "contextWindow": 200000, "maxOutputTokens": 32768, @@ -55,7 +59,9 @@ { "modelName": "claude-sonnet-4-5", "displayName": "Claude Sonnet 4.5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Sonnet 4.5,高性能性价比", "contextWindow": 200000, "maxOutputTokens": 64000, @@ -74,7 +80,9 @@ { "modelName": "claude-sonnet-4", "displayName": "Claude Sonnet 4", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Sonnet 4 旗舰模型", "contextWindow": 200000, "maxOutputTokens": 64000, @@ -93,7 +101,9 @@ { "modelName": "claude-sonnet-4-5-computer", "displayName": "Claude Sonnet 4.5 Computer Use", - "serviceType": ["computer_use"], + "serviceType": [ + "computer_use" + ], "description": "Anthropic 最佳 Computer Use 模型", "contextWindow": 200000, "maxOutputTokens": 64000, diff --git a/compute/providers/baichuan.json b/compute/providers/baichuan.json index b725abf..0de20e1 100644 --- a/compute/providers/baichuan.json +++ b/compute/providers/baichuan.json @@ -18,8 +18,8 @@ "displayName": "百川 M3-Plus", "serviceType": ["chat"], "description": "百川智能M3-Plus医疗增强模型,235B参数,幻觉率仅2.6%,API价格较前代下降70%", - "contextWindow": 192000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -40,8 +40,8 @@ "displayName": "百川 M3", "serviceType": ["chat"], "description": "百川智能M3新一代开源医疗增强模型,235B参数", - "contextWindow": 192000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -61,8 +61,8 @@ "displayName": "百川 M2-Plus", "serviceType": ["chat"], "description": "百川智能M2-Plus旗舰模型,最强推理和创作能力", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -81,8 +81,8 @@ "displayName": "百川 M2", "serviceType": ["chat"], "description": "百川智能M2模型,高性能通用模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/baidu.json b/compute/providers/baidu.json index 103bf25..2720fd0 100644 --- a/compute/providers/baidu.json +++ b/compute/providers/baidu.json @@ -9,14 +9,20 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "CNY", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "models": [ { "modelName": "ernie-5.0-thinking-latest", "displayName": "文心 ERNIE 5.0", - "serviceType": ["chat", "reasoning"], + "serviceType": [ + "chat", + "reasoning" + ], "description": "百度最新旗舰模型,支持深度推理、多模态和工具调用,119K输入/64K输出", - "contextWindow": 131072, + "contextWindow": 128000, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -34,10 +40,12 @@ { "modelName": "ernie-4.5-turbo-128k-latest", "displayName": "文心 ERNIE 4.5 Turbo", - "serviceType": ["chat"], - "description": "百度高性价比长上下文模型,128K 窗口,适合日常对话和文档处理", + "serviceType": [ + "chat" + ], + "description": "百度高性价比长上下文模型,128K 窗口,最大输出 12,288 token", "contextWindow": 131072, - "maxOutputTokens": 8192, + "maxOutputTokens": 12288, "capabilities": [ "chat", "code", diff --git a/compute/providers/cohere.json b/compute/providers/cohere.json index 7815cc8..6807513 100644 --- a/compute/providers/cohere.json +++ b/compute/providers/cohere.json @@ -15,9 +15,9 @@ "modelName": "command-a-03-2025", "displayName": "Command A", "serviceType": ["chat"], - "description": "Cohere 旗舰对话模型,262K 上下文,擅长 RAG 和工具调用", - "contextWindow": 262144, - "maxOutputTokens": 8192, + "description": "Cohere 旗舰对话模型,256K 上下文,擅长 RAG 和工具调用", + "contextWindow": 256000, + "maxOutputTokens": 8000, "capabilities": [ "chat", "reasoning", @@ -37,8 +37,8 @@ "modelName": "embed-v4.0", "displayName": "Embed V4", "serviceType": ["embedding"], - "description": "Cohere 最新 Embedding 模型,131K 上下文,多语言支持", - "contextWindow": 131072, + "description": "Cohere 最新 Embedding 模型,128K 上下文,多语言支持", + "contextWindow": 128000, "maxOutputTokens": 0, "capabilities": [ "text_embedding", @@ -46,14 +46,15 @@ ], "inputPrice": 0.12, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "rerank-v3.5", "displayName": "Rerank V3.5", "serviceType": ["rerank"], - "description": "Cohere 语义重排序模型,用于检索结果精排", - "contextWindow": 0, + "description": "Cohere 语义重排序模型,用于检索结果精排,默认单文档截断 4096 token", + "contextWindow": 4096, "maxOutputTokens": 0, "capabilities": [ "rerank", @@ -61,6 +62,7 @@ ], "inputPrice": 2.00, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/dashscope.json b/compute/providers/dashscope.json index 3d89263..58d795f 100644 --- a/compute/providers/dashscope.json +++ b/compute/providers/dashscope.json @@ -26,10 +26,12 @@ { "modelName": "qwen3.5-plus", "displayName": "阿里云 Qwen3.5-Plus", - "serviceType": ["chat"], - "description": "通义千问3.5旗舰模型,支持文本/图像/视频输入,效果媲美Qwen3 Max,性价比更优", - "contextWindow": 262144, - "maxOutputTokens": 16384, + "serviceType": [ + "chat" + ], + "description": "通义千问3.5旗舰模型,支持文本/图像/视频输入,100万上下文,默认开启思考模式", + "contextWindow": 1000000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", @@ -44,14 +46,35 @@ "outputPrice": 4.8, "defaultTemperature": 0.7, "defaultTopP": 0.8, - "extra": {} + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 128000, + "inputPrice": 0.8, + "outputPrice": 4.8 + }, + { + "maxInputTokens": 256000, + "inputPrice": 2, + "outputPrice": 12 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 4, + "outputPrice": 24 + } + ], + "thinkingMaxTokens": 81920 + } }, { "modelName": "qwen-max", "displayName": "阿里云 qwen-max", - "serviceType": ["chat"], - "description": "通义千问Max,千亿参数旗舰模型,最强性能", - "contextWindow": 131072, + "serviceType": [ + "chat" + ], + "description": "通义千问Max,千亿参数旗舰模型,32K 上下文", + "contextWindow": 32768, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -69,10 +92,12 @@ { "modelName": "qwen-plus", "displayName": "阿里云 qwen-plus", - "serviceType": ["chat"], - "description": "通义千问Plus,支持思考模式,128K 上下文", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "serviceType": [ + "chat" + ], + "description": "通义千问Plus,支持思考模式,100万上下文", + "contextWindow": 1000000, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -83,34 +108,64 @@ "outputPrice": 2, "defaultTemperature": 0.6, "defaultTopP": 0.8, - "extra": {} + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 128000, + "inputPrice": 0.8, + "outputPrice": 2, + "thinkingOutputPrice": 8 + }, + { + "maxInputTokens": 256000, + "inputPrice": 2.4, + "outputPrice": 20, + "thinkingOutputPrice": 24 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 4.8, + "outputPrice": 48, + "thinkingOutputPrice": 64 + } + ], + "thinkingMaxTokens": 81920 + } }, { "modelName": "qwen-turbo", "displayName": "阿里云 qwen-turbo", - "serviceType": ["chat"], - "description": "通义千问Turbo,支持100万上下文,高性价比", + "serviceType": [ + "chat" + ], + "description": "通义千问Turbo,非思考模式支持100万上下文,思考模式支持131K上下文", "contextWindow": 1000000, - "maxOutputTokens": 8192, + "maxOutputTokens": 16384, "capabilities": [ "chat", "code", "long_context", "fast" ], - "inputPrice": 0.3, - "outputPrice": 0.6, + "inputPrice": 0.367, + "outputPrice": 1.468, "defaultTemperature": 0.7, "defaultTopP": 0.8, - "extra": {} + "extra": { + "thinkingContextWindow": 131072, + "thinkingOutputPrice": 3.67, + "thinkingMaxTokens": 38912 + } }, { "modelName": "qwen-long", "displayName": "阿里云 qwen-long", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "通义千问Long,支持1000万上下文,适合超长文档处理,降价97%", "contextWindow": 10000000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32768, "capabilities": [ "chat", "ultra_long_context", @@ -125,7 +180,9 @@ { "modelName": "qwen3-max", "displayName": "阿里云 Qwen3-Max", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "通义千问3代旗舰模型,262K 上下文,支持思考模式", "contextWindow": 262144, "maxOutputTokens": 65536, @@ -148,10 +205,12 @@ { "modelName": "qwen3-vl-plus", "displayName": "阿里云 Qwen3-VL-Plus", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "通义千问3代视觉模型Plus版,支持图像理解", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -161,15 +220,18 @@ ], "inputPrice": 1.5, "outputPrice": 6, + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "qwen3-vl-flash", "displayName": "阿里云 Qwen3-VL-Flash", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "通义千问3代视觉模型Flash版,高性价比", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -178,57 +240,78 @@ ], "inputPrice": 0.8, "outputPrice": 3, + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "text-embedding-v3", "displayName": "text-embedding-v3", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "阿里云文本向量化", + "contextWindow": 8192, "capabilities": [ "text_embedding", "semantic_search", "chinese_optimized" ], "inputPrice": 0.7, + "maxOutputTokens": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "text-embedding-v4", "displayName": "阿里云 text-embedding-v4", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "阿里云百炼文本向量模型v4,支持多维度与多语种", + "contextWindow": 8192, "capabilities": [ "text_embedding", "semantic_search", "rag" ], "inputPrice": 0.5, + "maxOutputTokens": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "qwen3-rerank", "displayName": "Qwen3-Rerank", - "serviceType": ["rerank"], + "serviceType": [ + "rerank" + ], "description": "检索重排序,支持 100+ 语种", + "contextWindow": 120000, + "maxOutputTokens": 0, "capabilities": [ "rerank", "semantic_reranking", "multilingual" ], "inputPrice": 1, + "defaultTemperature": 1, "extra": {} }, { "modelName": "cosyvoice-v2", "displayName": "CosyVoice V2", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "通义语音合成,支持中英文", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts", "multilingual", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "voices": [ "longxiaochun", @@ -246,12 +329,17 @@ { "modelName": "paraformer-v2", "displayName": "Paraformer V2", - "serviceType": ["asr"], + "serviceType": [ + "asr" + ], "description": "通义语音识别", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "asr", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "maxAudioLength": 3600, "supportedInputFormats": [ @@ -266,12 +354,17 @@ { "modelName": "wanx-v2", "displayName": "通义万相 V2", - "serviceType": ["image_gen"], + "serviceType": [ + "image_gen" + ], "description": "通义万相文生图", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", @@ -289,12 +382,17 @@ { "modelName": "wanx-video", "displayName": "通义万相视频", - "serviceType": ["video_gen"], + "serviceType": [ + "video_gen" + ], "description": "通义万相文生视频", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -306,13 +404,18 @@ { "modelName": "cosyvoice-clone", "displayName": "CosyVoice 声音复刻", - "serviceType": ["voice_clone"], + "serviceType": [ + "voice_clone" + ], "description": "通义声音复刻,少量样本即可克隆", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], + "defaultTemperature": 1, "extra": { "maxCloneSamples": 5, "minCloneDuration": 3 @@ -321,9 +424,12 @@ { "modelName": "qwen-omni-turbo", "displayName": "Qwen-Omni-Turbo", - "serviceType": ["omni"], + "serviceType": [ + "omni" + ], "description": "通义全能模型,支持音视频文本多模态", "contextWindow": 32768, + "maxOutputTokens": 2048, "capabilities": [ "chat", "vision", @@ -332,19 +438,24 @@ "multimodal", "tool_use" ], + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "qwen3-max-trans", "displayName": "Qwen3-Max(翻译)", - "serviceType": ["translation"], + "serviceType": [ + "translation" + ], "description": "通义千问翻译,中英日韩等多语种互译", "contextWindow": 131072, + "maxOutputTokens": 8192, "capabilities": [ "translation", "multilingual", "chinese_optimized" ], + "defaultTemperature": 0.7, "extra": {} } ] diff --git a/compute/providers/deepseek.json b/compute/providers/deepseek.json index 69cd4f1..958b793 100644 --- a/compute/providers/deepseek.json +++ b/compute/providers/deepseek.json @@ -17,10 +17,12 @@ { "modelName": "deepseek-chat", "displayName": "DeepSeek V3.2", - "serviceType": ["chat"], - "description": "高性价比通用对话模型,64K 上下文", - "contextWindow": 64000, - "maxOutputTokens": 8000, + "serviceType": [ + "chat" + ], + "description": "高性价比通用对话模型,128K 上下文", + "contextWindow": 128000, + "maxOutputTokens": 8192, "capabilities": [ "chat", "code", @@ -36,10 +38,12 @@ { "modelName": "deepseek-reasoner", "displayName": "DeepSeek R1", - "serviceType": ["reasoning"], - "description": "DeepSeek R1 推理模型,64K 上下文,深度推理能力,思维链最长 32K", - "contextWindow": 64000, - "maxOutputTokens": 8192, + "serviceType": [ + "reasoning" + ], + "description": "DeepSeek V3.2 思考模式,128K 上下文,思维链默认 32K,最大输出 64K", + "contextWindow": 128000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/google.json b/compute/providers/google.json index b4a1dba..bc64796 100644 --- a/compute/providers/google.json +++ b/compute/providers/google.json @@ -19,8 +19,8 @@ "modelName": "gemini-2.5-pro", "displayName": "Gemini 2.5 Pro", "serviceType": ["chat"], - "description": "Google 最新旗舰模型,100万上下文,多模态", - "contextWindow": 1000000, + "description": "Google 最新旗舰模型,1,048,576 token 上下文,多模态", + "contextWindow": 1048576, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -40,8 +40,8 @@ "modelName": "gemini-2.5-flash", "displayName": "Gemini 2.5 Flash", "serviceType": ["chat"], - "description": "Google 高性价比模型,100万上下文,速度快", - "contextWindow": 1000000, + "description": "Google 高性价比模型,1,048,576 token 上下文,速度快", + "contextWindow": 1048576, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -63,11 +63,14 @@ "displayName": "Text Embedding 005", "serviceType": ["embedding"], "description": "Google 文本嵌入模型,768维度", + "contextWindow": 2048, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.10, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/internal-testing.json b/compute/providers/internal-testing.json index e4d28e3..6b31f84 100644 --- a/compute/providers/internal-testing.json +++ b/compute/providers/internal-testing.json @@ -23,7 +23,7 @@ "chat" ], "description": "MiniMax M2.7 高速版,低延迟吞吐优化,200K 上下文", - "contextWindow": 200000, + "contextWindow": 204800, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -41,9 +41,9 @@ "serviceType": [ "chat" ], - "description": "智谱 GLM-5.1 新一代旗舰模型,编程与推理能力断档领先,204K 上下文", - "contextWindow": 204800, - "maxOutputTokens": 131072, + "description": "智谱 GLM-5.1 新一代旗舰模型,编程与推理能力断档领先,200K 上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -63,9 +63,9 @@ "serviceType": [ "chat" ], - "description": "智谱 GLM-5 大语言模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "description": "智谱 GLM-5 大语言模型,200K 上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -83,8 +83,8 @@ "chat" ], "description": "智谱 GLM-5-Turbo 大语言模型,更快的推理速度", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -122,7 +122,7 @@ ], "description": "月之暗面 Kimi K2.6 Code Preview,万亿参数 MoE 架构(32B 激活),256K 上下文,代码与智能体能力增强", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -144,8 +144,8 @@ "chat" ], "description": "月之暗面 Kimi-2.5 大语言模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 256000, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -167,7 +167,7 @@ "chat" ], "description": "MiniMax M2.5 大语言模型", - "contextWindow": 128000, + "contextWindow": 204800, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -211,8 +211,8 @@ "chat" ], "description": "阿里通义千问 Qwen3.5 Plus", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 1000000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", @@ -276,8 +276,8 @@ "chat" ], "description": "阿里通义千问 Qwen3 Max (2026-01-23)", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -299,8 +299,8 @@ "chat" ], "description": "字节跳动豆包 Seed 2.0 Code Preview (260215)", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 256000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/kling.json b/compute/providers/kling.json index 0979a7a..ef35efb 100644 --- a/compute/providers/kling.json +++ b/compute/providers/kling.json @@ -18,12 +18,15 @@ "displayName": "可灵 V2.5 Turbo", "serviceType": ["video_gen"], "description": "可灵最新视频生成模型,高性价比", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality", "fast" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -38,11 +41,14 @@ "displayName": "可灵 V2.5 Turbo Pro", "serviceType": ["video_gen"], "description": "可灵高品质视频生成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -57,11 +63,14 @@ "displayName": "可灵 V2", "serviceType": ["video_gen"], "description": "可灵文生视频旗舰模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -75,11 +84,14 @@ "displayName": "可灵 V2 Master", "serviceType": ["video_gen"], "description": "可灵最高品质视频生成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ diff --git a/compute/providers/local-whisper.json b/compute/providers/local-whisper.json index f8c58ad..f0f97c8 100644 --- a/compute/providers/local-whisper.json +++ b/compute/providers/local-whisper.json @@ -18,6 +18,9 @@ "displayName": "Whisper Large V3", "serviceType": ["asr"], "description": "本地部署的 Whisper 大模型", + "contextWindow": 0, + "maxOutputTokens": 0, + "defaultTemperature": 1, "capabilities": [ "asr", "multilingual" diff --git a/compute/providers/minimax.json b/compute/providers/minimax.json index 9e17698..2cbc9e8 100644 --- a/compute/providers/minimax.json +++ b/compute/providers/minimax.json @@ -8,13 +8,20 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "CNY", - "services": ["chat", "fast", "reasoning"], + "priceCurrency": "USD", + "services": [ + "chat", + "fast", + "reasoning" + ], "models": [ { "modelName": "MiniMax-M2.7", "displayName": "MiniMax M2.7", - "serviceType": ["chat", "reasoning"], + "serviceType": [ + "chat", + "reasoning" + ], "description": "MiniMax 新一代旗舰模型,擅长复杂 Agent、软件工程与专业办公任务", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -24,14 +31,22 @@ "code", "tool_use" ], + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.7-highspeed", "displayName": "MiniMax M2.7 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.7 极速版,效果一致,输出更快,适合低延迟场景", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -42,16 +57,25 @@ "tool_use", "fast" ], + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-M2.5", "displayName": "MiniMax M2.5", - "serviceType": ["chat", "reasoning"], - "description": "MiniMax 最新旗舰模型,230B参数(10B激活)MoE架构,百万级上下文,支持深度推理和工具调用", - "contextWindow": 1000000, + "serviceType": [ + "chat", + "reasoning" + ], + "description": "MiniMax M2.5,204.8K 上下文,支持深度推理和工具调用", + "contextWindow": 204800, "maxOutputTokens": 131072, "capabilities": [ "chat", @@ -60,18 +84,24 @@ "tool_use", "long_context" ], - "inputPrice": 2.1, - "outputPrice": 8.4, + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.5-highspeed", "displayName": "MiniMax M2.5 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.5 高速推理版本(100TPS),适合低延迟场景", - "contextWindow": 200000, + "contextWindow": 204800, "maxOutputTokens": 131072, "capabilities": [ "chat", @@ -80,16 +110,22 @@ "tool_use", "fast" ], - "inputPrice": 2.1, - "outputPrice": 16.8, + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-M2.1", "displayName": "MiniMax M2.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "MiniMax 上一代主力模型,200K 上下文,性价比优秀", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -99,16 +135,22 @@ "tool_use", "reasoning" ], - "inputPrice": 2.1, - "outputPrice": 8.4, + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.1-highspeed", "displayName": "MiniMax M2.1 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.1 高速推理版本,适合低延迟场景", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -119,16 +161,22 @@ "tool_use", "fast" ], - "inputPrice": 2.1, - "outputPrice": 16.8, + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-Text-01", "displayName": "MiniMax Text 01", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "MiniMax 百万级长上下文文本模型,擅长长文档处理", "contextWindow": 1000000, "maxOutputTokens": 131072, @@ -138,8 +186,8 @@ "code", "long_context" ], - "inputPrice": 1.4, - "outputPrice": 7.7, + "inputPrice": 0.2, + "outputPrice": 1.1, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} diff --git a/compute/providers/mistral.json b/compute/providers/mistral.json index 44dc440..58b5b34 100644 --- a/compute/providers/mistral.json +++ b/compute/providers/mistral.json @@ -9,12 +9,17 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "USD", - "services": ["chat", "fast"], + "services": [ + "chat", + "fast" + ], "models": [ { "modelName": "mistral-large-latest", "displayName": "Mistral Large 3", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Mistral 旗舰模型,256K 上下文,支持视觉和工具调用", "contextWindow": 256000, "maxOutputTokens": 262144, @@ -26,8 +31,8 @@ "tool_use", "long_context" ], - "inputPrice": 0.50, - "outputPrice": 1.50, + "inputPrice": 0.5, + "outputPrice": 1.5, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -35,9 +40,11 @@ { "modelName": "mistral-small-latest", "displayName": "Mistral Small 3.2", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "Mistral 高效小模型,低延迟,适合快速推理场景", - "contextWindow": 130000, + "contextWindow": 128000, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -47,8 +54,8 @@ "fast", "tool_use" ], - "inputPrice": 0.10, - "outputPrice": 0.30, + "inputPrice": 0.1, + "outputPrice": 0.3, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -56,16 +63,18 @@ { "modelName": "codestral-latest", "displayName": "Codestral", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Mistral 专业代码模型,支持 Fill-in-the-Middle 补全", - "contextWindow": 256000, + "contextWindow": 128000, "maxOutputTokens": 32768, "capabilities": [ "code", "fill_in_the_middle" ], - "inputPrice": 0.30, - "outputPrice": 0.90, + "inputPrice": 0.3, + "outputPrice": 0.9, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} diff --git a/compute/providers/moonshot.json b/compute/providers/moonshot.json index 99be6c9..8a89085 100644 --- a/compute/providers/moonshot.json +++ b/compute/providers/moonshot.json @@ -14,13 +14,64 @@ "reasoning" ], "models": [ + { + "modelName": "kimi-k2.6", + "displayName": "Kimi K2.6", + "serviceType": [ + "chat" + ], + "description": "月之暗面 Kimi K2.6,最新多模态模型,长程代码编写与 Agent 自主执行能力增强,256K 上下文,支持思考/非思考模式", + "contextWindow": 256000, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision", + "video_understanding", + "image_understanding" + ], + "inputPrice": 6.5, + "outputPrice": 27, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "thinking": { + "default": "enabled", + "disabledTemperature": 0.6 + }, + "cacheHitPrice": 1.1, + "supportedImageFormats": [ + "png", + "jpeg", + "webp", + "gif" + ], + "supportedVideoFormats": [ + "mp4", + "mpeg", + "mov", + "avi", + "x-flv", + "mpg", + "webm", + "wmv", + "3gpp" + ] + } + }, { "modelName": "kimi-k2.5", "displayName": "Kimi K2.5", - "serviceType": ["chat"], - "description": "月之暗面Kimi K2.5,2026年1月发布的原生多模态模型,支持视觉编码和智能体集群", + "serviceType": [ + "chat" + ], + "description": "月之暗面Kimi K2.5,原生多模态模型,256K 上下文,支持思考/非思考模式", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -32,15 +83,40 @@ ], "inputPrice": 4, "outputPrice": 21, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, - "extra": {} + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "thinking": { + "default": "enabled", + "disabledTemperature": 0.6 + }, + "cacheHitPrice": 0.7, + "supportedImageFormats": [ + "png", + "jpeg", + "webp", + "gif" + ], + "supportedVideoFormats": [ + "mp4", + "mpeg", + "mov", + "avi", + "x-flv", + "mpg", + "webm", + "wmv", + "3gpp" + ] + } }, { "modelName": "kimi-k2", "displayName": "Kimi K2", - "serviceType": ["chat"], - "description": "月之暗面Kimi K2,万亿参数MoE模型(320B激活),256K上下文,专为智能体设计", + "serviceType": [ + "chat" + ], + "description": "月之暗面Kimi K2,万亿参数MoE模型(32B激活),256K上下文,专为智能体设计", "contextWindow": 256000, "maxOutputTokens": 8192, "capabilities": [ @@ -49,19 +125,22 @@ "code", "tool_use", "agent", - "long_context", - "vision" + "long_context" ], "inputPrice": 4, "outputPrice": 16, "defaultTemperature": 0.7, "defaultTopP": 0.9, - "extra": {} + "extra": { + "cacheHitPrice": 1 + } }, { "modelName": "kimi-k2-thinking", "displayName": "Kimi K2 思考版", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "月之暗面Kimi K2思考版,256K上下文,深度推理能力", "contextWindow": 256000, "maxOutputTokens": 16384, @@ -76,12 +155,16 @@ "outputPrice": 16, "defaultTemperature": 0.7, "defaultTopP": 0.9, - "extra": {} + "extra": { + "cacheHitPrice": 1 + } }, { "modelName": "moonshot-v1-8k", "displayName": "Moonshot V1 8K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,8K上下文", "contextWindow": 8192, "maxOutputTokens": 4096, @@ -98,7 +181,9 @@ { "modelName": "moonshot-v1-32k", "displayName": "Moonshot V1 32K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,32K上下文", "contextWindow": 32768, "maxOutputTokens": 4096, @@ -116,7 +201,9 @@ { "modelName": "moonshot-v1-128k", "displayName": "Moonshot V1 128K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,128K上下文", "contextWindow": 131072, "maxOutputTokens": 4096, diff --git a/compute/providers/ollama.json b/compute/providers/ollama.json index 3262dcf..87064ef 100644 --- a/compute/providers/ollama.json +++ b/compute/providers/ollama.json @@ -19,11 +19,13 @@ "serviceType": ["chat"], "description": "本地运行的 Llama 3.1 70B", "contextWindow": 131072, + "maxOutputTokens": 8192, "capabilities": [ "chat", "code", "reasoning" ], + "defaultTemperature": 0.7, "extra": {} } ] diff --git a/compute/providers/openai.json b/compute/providers/openai.json index 338bb9f..b0de87d 100644 --- a/compute/providers/openai.json +++ b/compute/providers/openai.json @@ -25,7 +25,9 @@ { "modelName": "gpt-5.2", "displayName": "GPT-5.2", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI 最新旗舰模型,400K 上下文,编码和智能体任务优化", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -46,7 +48,9 @@ { "modelName": "gpt-5.2-pro", "displayName": "GPT-5.2 Pro", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5.2 Pro 专业版,最高性能", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -67,7 +71,9 @@ { "modelName": "gpt-5.1", "displayName": "GPT-5.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5.1,400K 上下文,高性能旗舰", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -88,7 +94,9 @@ { "modelName": "gpt-5", "displayName": "GPT-5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5 新一代旗舰模型,统一所有模型能力", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -109,10 +117,12 @@ { "modelName": "gpt-5-pro", "displayName": "GPT-5 Pro", - "serviceType": ["chat"], - "description": "OpenAI GPT-5 Pro 专业版高性能模型", + "serviceType": [ + "chat" + ], + "description": "OpenAI GPT-5 Pro 专业版高性能推理模型", "contextWindow": 400000, - "maxOutputTokens": 128000, + "maxOutputTokens": 272000, "capabilities": [ "chat", "reasoning", @@ -130,10 +140,12 @@ { "modelName": "gpt-5-mini", "displayName": "GPT-5-mini", - "serviceType": ["chat"], - "description": "高性价比模型,适合日常对话", - "contextWindow": 128000, - "maxOutputTokens": 32768, + "serviceType": [ + "chat" + ], + "description": "高性价比模型,适合日常对话,400K 上下文", + "contextWindow": 400000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "fast", @@ -150,17 +162,19 @@ { "modelName": "gpt-5-nano", "displayName": "GPT-5-nano", - "serviceType": ["fast"], - "description": "极速响应模型,适合简单任务", - "contextWindow": 128000, - "maxOutputTokens": 16384, + "serviceType": [ + "fast" + ], + "description": "极速响应模型,适合简单任务,400K 上下文", + "contextWindow": 400000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "code", "fast" ], - "inputPrice": 0.02, - "outputPrice": 0.08, + "inputPrice": 0.05, + "outputPrice": 0.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -168,9 +182,11 @@ { "modelName": "gpt-4.1", "displayName": "GPT-4.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-4.1,支持 1M 上下文,编码和指令遵循能力大幅提升", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -180,8 +196,8 @@ "ultra_long_context", "tool_use" ], - "inputPrice": 2.00, - "outputPrice": 8.00, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -189,9 +205,11 @@ { "modelName": "gpt-4.1-mini", "displayName": "GPT-4.1 mini", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-4.1 mini,1M 上下文,高性价比", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -200,8 +218,8 @@ "ultra_long_context", "tool_use" ], - "inputPrice": 0.40, - "outputPrice": 1.60, + "inputPrice": 0.4, + "outputPrice": 1.6, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -209,9 +227,11 @@ { "modelName": "gpt-4.1-nano", "displayName": "GPT-4.1 nano", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "OpenAI GPT-4.1 nano,1M 上下文,极致性价比", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -219,8 +239,8 @@ "ultra_long_context", "fast" ], - "inputPrice": 0.10, - "outputPrice": 0.40, + "inputPrice": 0.1, + "outputPrice": 0.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -228,7 +248,9 @@ { "modelName": "gpt-4o", "displayName": "GPT-4o", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "多模态模型,支持图像理解", "contextWindow": 128000, "maxOutputTokens": 16384, @@ -238,8 +260,8 @@ "image_understanding", "tool_use" ], - "inputPrice": 2.50, - "outputPrice": 10.00, + "inputPrice": 2.5, + "outputPrice": 10, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -247,7 +269,9 @@ { "modelName": "gpt-4o-mini", "displayName": "GPT-4o mini", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "OpenAI GPT-4o mini,高性价比多模态模型", "contextWindow": 128000, "maxOutputTokens": 16384, @@ -258,7 +282,7 @@ "tool_use" ], "inputPrice": 0.15, - "outputPrice": 0.60, + "outputPrice": 0.6, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -266,35 +290,51 @@ { "modelName": "text-embedding-3-small", "displayName": "text-embedding-3-small", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "轻量文本向量化模型,1536 维", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.02, + "defaultTemperature": 1, "extra": {} }, { "modelName": "text-embedding-3-large", "displayName": "text-embedding-3-large", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "高精度文本向量化模型,3072 维", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.13, + "defaultTemperature": 1, "extra": {} }, { "modelName": "tts-1", "displayName": "TTS-1", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "标准语音合成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts" ], + "inputPrice": 15, + "defaultTemperature": 1, "extra": { "voices": [ "alloy", @@ -315,11 +355,17 @@ { "modelName": "tts-1-hd", "displayName": "TTS-1-HD", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "高清语音合成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts" ], + "inputPrice": 30, + "defaultTemperature": 1, "extra": { "voices": [ "alloy", @@ -340,12 +386,18 @@ { "modelName": "whisper-1", "displayName": "Whisper", - "serviceType": ["asr"], + "serviceType": [ + "asr" + ], "description": "通用语音识别", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "asr", "multilingual" ], + "inputPrice": 0.006, + "defaultTemperature": 1, "extra": { "maxAudioLength": 600, "supportedInputFormats": [ @@ -363,7 +415,9 @@ { "modelName": "o3", "displayName": "o3", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o3 推理模型,200K 上下文,支持工具调用", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -375,8 +429,8 @@ "science", "tool_use" ], - "inputPrice": 2.00, - "outputPrice": 8.00, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -384,7 +438,9 @@ { "modelName": "o3-pro", "displayName": "o3-pro", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o3-pro 高级推理模型,200K 上下文", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -395,8 +451,8 @@ "math", "science" ], - "inputPrice": 20.00, - "outputPrice": 80.00, + "inputPrice": 20, + "outputPrice": 80, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -404,9 +460,11 @@ { "modelName": "o3-mini", "displayName": "o3-mini", - "serviceType": ["responses"], - "description": "OpenAI o3-mini 推理模型,128K 上下文", - "contextWindow": 128000, + "serviceType": [ + "responses" + ], + "description": "OpenAI o3-mini 推理模型,200K 上下文", + "contextWindow": 200000, "maxOutputTokens": 100000, "capabilities": [ "reasoning", @@ -414,8 +472,8 @@ "code", "fast" ], - "inputPrice": 1.10, - "outputPrice": 4.40, + "inputPrice": 1.1, + "outputPrice": 4.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -423,7 +481,9 @@ { "modelName": "o4-mini", "displayName": "o4-mini", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o4-mini 推理模型,200K 上下文,支持工具调用", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -434,8 +494,8 @@ "tool_use", "vision" ], - "inputPrice": 1.10, - "outputPrice": 4.40, + "inputPrice": 1.1, + "outputPrice": 4.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -443,12 +503,17 @@ { "modelName": "dall-e-3", "displayName": "DALL-E 3", - "serviceType": ["image_gen"], + "serviceType": [ + "image_gen" + ], "description": "高质量文生图模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "text_rendering" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", @@ -464,9 +529,12 @@ { "modelName": "gpt-4o-realtime", "displayName": "GPT-4o Realtime", - "serviceType": ["omni"], + "serviceType": [ + "omni" + ], "description": "全能实时模型,支持语音 + 文本 + 视觉", - "contextWindow": 128000, + "contextWindow": 32000, + "maxOutputTokens": 4096, "capabilities": [ "chat", "vision", @@ -474,6 +542,9 @@ "asr", "realtime" ], + "inputPrice": 4, + "outputPrice": 16, + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech", @@ -485,13 +556,20 @@ { "modelName": "gpt-4o-realtime-preview", "displayName": "GPT-4o Realtime Preview", - "serviceType": ["realtime_voice"], + "serviceType": [ + "realtime_voice" + ], "description": "实时语音交互模型", + "contextWindow": 32000, + "maxOutputTokens": 4096, "capabilities": [ "realtime", "speech_to_speech", "low_latency" ], + "inputPrice": 5, + "outputPrice": 20, + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech", diff --git a/compute/providers/openrouter.json b/compute/providers/openrouter.json index 87647ca..2f0a5b1 100644 --- a/compute/providers/openrouter.json +++ b/compute/providers/openrouter.json @@ -16,7 +16,7 @@ "displayName": "OpenRouter Auto", "serviceType": ["chat"], "description": "OpenRouter 自动路由,智能选择最优模型", - "contextWindow": 200000, + "contextWindow": 2000000, "maxOutputTokens": 16384, "capabilities": [ "chat", @@ -29,19 +29,16 @@ "extra": {} }, { - "modelName": "google/gemini-2.5-flash-exp:free", - "displayName": "Gemini 2.5 Flash (免费)", + "modelName": "openai/gpt-oss-120b:free", + "displayName": "GPT-OSS 120B (免费)", "serviceType": ["chat"], - "description": "通过 OpenRouter 免费使用的 Gemini 2.5 Flash,1M 上下文", - "contextWindow": 1048576, - "maxOutputTokens": 65535, + "description": "通过 OpenRouter 免费使用的 OpenAI GPT-OSS 120B", + "contextWindow": 131072, + "maxOutputTokens": 131072, "capabilities": [ "chat", "reasoning", - "vision", - "tool_use", - "fast", - "long_context" + "code" ], "inputPrice": 0.00, "outputPrice": 0.00, @@ -54,8 +51,8 @@ "displayName": "Qwen3 Coder 480B (免费)", "serviceType": ["chat"], "description": "通过 OpenRouter 免费使用的 Qwen3 Coder 480B", - "contextWindow": 262144, - "maxOutputTokens": 32768, + "contextWindow": 262000, + "maxOutputTokens": 262000, "capabilities": [ "code", "reasoning", diff --git a/compute/providers/siliconflow.json b/compute/providers/siliconflow.json index e778373..97a12ee 100644 --- a/compute/providers/siliconflow.json +++ b/compute/providers/siliconflow.json @@ -15,12 +15,13 @@ "modelName": "Qwen/Qwen3-Coder-480B-A35B-Instruct", "displayName": "Qwen3 Coder 480B (硅基)", "serviceType": ["chat"], - "description": "开源最强代码模型,480B MoE 架构,擅长代码生成和 Agent 场景", + "description": "Qwen3-Coder-480B-A35B-Instruct,480B MoE(35B 激活),原生 256K 上下文,可通过外推扩展至 1M,面向 Agentic Coding", "contextWindow": 262144, - "maxOutputTokens": 32768, + "maxOutputTokens": 262144, "capabilities": [ + "chat", "code", - "reasoning", + "long_context", "agent", "tool_use" ], @@ -31,20 +32,19 @@ "extra": {} }, { - "modelName": "Qwen/Qwen3-235B-A22B-Instruct", + "modelName": "Qwen/Qwen3-235B-A22B-Instruct-2507", "displayName": "Qwen3 235B (硅基)", "serviceType": ["chat"], - "description": "Qwen3 旗舰通用模型,235B MoE 架构,多语言能力突出", + "description": "Qwen3-235B-A22B-Instruct-2507,235B MoE(22B 激活)通用指令模型,262K 上下文", "contextWindow": 262144, - "maxOutputTokens": 38912, + "maxOutputTokens": 262144, "capabilities": [ "chat", - "reasoning", "code", "multilingual", "tool_use", "agent", - "vision" + "long_context" ], "inputPrice": 2.5, "outputPrice": 10, @@ -65,6 +65,7 @@ ], "inputPrice": 0, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/stability.json b/compute/providers/stability.json index e12b65d..0e8bc98 100644 --- a/compute/providers/stability.json +++ b/compute/providers/stability.json @@ -18,11 +18,14 @@ "displayName": "Stable Diffusion 3.5 Large", "serviceType": ["image_gen"], "description": "Stability AI 旗舰文生图模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "high_quality", "controllable" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", diff --git a/compute/providers/tencent.json b/compute/providers/tencent.json index 92e097a..c98867c 100644 --- a/compute/providers/tencent.json +++ b/compute/providers/tencent.json @@ -9,14 +9,19 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "CNY", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "models": [ { "modelName": "hunyuan-2.0-thinking-20251109", "displayName": "混元 2.0 Think", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "腾讯混元最新推理模型,128K输入/64K输出,MoE架构406B总参数", - "contextWindow": 131072, + "contextWindow": 128000, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -31,11 +36,13 @@ "extra": {} }, { - "modelName": "hunyuan-turbo-s", + "modelName": "hunyuan-turbos-latest", "displayName": "混元 Turbo S", - "serviceType": ["chat"], - "description": "腾讯混元高速模型,262K 上下文,支持推理和工具调用", - "contextWindow": 262144, + "serviceType": [ + "chat" + ], + "description": "腾讯混元高速模型,32K输入/16K输出,支持推理和工具调用", + "contextWindow": 32768, "maxOutputTokens": 16384, "capabilities": [ "chat", diff --git a/compute/providers/volcengine.json b/compute/providers/volcengine.json index ca8eef2..cea6456 100644 --- a/compute/providers/volcengine.json +++ b/compute/providers/volcengine.json @@ -23,10 +23,12 @@ { "modelName": "doubao-2.0-pro", "displayName": "豆包 2.0 Pro", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包2.0旗舰模型,256K上下文,相比Gemini 3 Pro和GPT 5.2有较大成本优势", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -44,10 +46,12 @@ { "modelName": "doubao-seed-1.8", "displayName": "豆包 Seed-1.8", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.8旗舰模型,256K上下文,支持深度思考和多模态", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -65,10 +69,12 @@ { "modelName": "doubao-seed-1.6", "displayName": "豆包 Seed-1.6", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6旗舰模型,256K上下文", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -86,7 +92,9 @@ { "modelName": "doubao-seed-1.6-thinking", "displayName": "豆包 Seed-1.6 思考版", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6深度思考模型,256K上下文", "contextWindow": 256000, "maxOutputTokens": 32768, @@ -105,10 +113,12 @@ { "modelName": "doubao-seed-1.6-flash", "displayName": "豆包 Seed-1.6 Flash", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6快速版,成本较前代下降63%", "contextWindow": 256000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32000, "capabilities": [ "chat", "code", @@ -124,10 +134,12 @@ { "modelName": "doubao-seed-1.6-lite", "displayName": "豆包 Seed-1.6 Lite", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6轻量版,极致性价比", - "contextWindow": 128000, - "maxOutputTokens": 4096, + "contextWindow": 256000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "code", @@ -142,10 +154,12 @@ { "modelName": "doubao-seed-1.6-vision", "displayName": "豆包 Seed-1.6 视觉版", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "火山引擎豆包1.6视觉模型,256K上下文,支持视频理解", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "vision", @@ -162,7 +176,9 @@ { "modelName": "doubao-seed-code", "displayName": "豆包 Seed-Code", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包编程专用模型,256K上下文", "contextWindow": 256000, "maxOutputTokens": 32768, @@ -180,10 +196,12 @@ { "modelName": "deepseek-v3.2", "displayName": "DeepSeek V3.2 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的DeepSeek V3.2,128K上下文", "contextWindow": 128000, - "maxOutputTokens": 8000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -199,10 +217,12 @@ { "modelName": "deepseek-r1", "displayName": "DeepSeek R1 (火山引擎)", - "serviceType": ["reasoning"], - "description": "火山引擎托管的DeepSeek R1推理模型,64K上下文", - "contextWindow": 64000, - "maxOutputTokens": 32768, + "serviceType": [ + "reasoning" + ], + "description": "火山引擎托管的DeepSeek R1推理模型,128K上下文", + "contextWindow": 128000, + "maxOutputTokens": 65536, "capabilities": [ "reasoning", "math", @@ -219,9 +239,11 @@ { "modelName": "kimi-k2-volcengine", "displayName": "Kimi K2 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的Kimi K2,万亿参数MoE模型,128K上下文", - "contextWindow": 128000, + "contextWindow": 256000, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -240,10 +262,12 @@ { "modelName": "glm-4-7", "displayName": "GLM-4.7 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的智谱GLM-4.7,200K上下文", "contextWindow": 200000, - "maxOutputTokens": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -261,9 +285,12 @@ { "modelName": "doubao-embedding", "displayName": "豆包 Embedding", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "火山引擎豆包标准向量模型,2560维度", "contextWindow": 4096, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", @@ -271,18 +298,24 @@ "chinese_optimized" ], "inputPrice": 0.5, + "defaultTemperature": 1, "extra": {} }, { "modelName": "volc-mega-tts-clone", "displayName": "火山声音复刻", - "serviceType": ["voice_clone"], + "serviceType": [ + "voice_clone" + ], "description": "火山引擎声音复刻,支持极少样本", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], + "defaultTemperature": 1, "extra": { "maxCloneSamples": 3, "minCloneDuration": 5 @@ -291,14 +324,19 @@ { "modelName": "volc-realtime-voice", "displayName": "火山实时语音", - "serviceType": ["realtime_voice"], + "serviceType": [ + "realtime_voice" + ], "description": "火山引擎实时语音交互", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "realtime", "speech_to_speech", "low_latency", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech" @@ -309,13 +347,18 @@ { "modelName": "volc-simultaneous", "displayName": "火山同声传译", - "serviceType": ["simultaneous_interpret"], + "serviceType": [ + "simultaneous_interpret" + ], "description": "火山引擎同声传译,支持中英双向", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "simultaneous_interpretation", "chinese_optimized", "low_latency" ], + "defaultTemperature": 1, "extra": { "streamingSupported": true } @@ -323,13 +366,18 @@ { "modelName": "volc-translation", "displayName": "火山翻译", - "serviceType": ["translation"], + "serviceType": [ + "translation" + ], "description": "火山引擎机器翻译,支持多语种互译", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "translation", "multilingual", "chinese_optimized" ], + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/xai.json b/compute/providers/xai.json index a06693e..6f8e2ed 100644 --- a/compute/providers/xai.json +++ b/compute/providers/xai.json @@ -12,12 +12,12 @@ "services": ["chat", "reasoning"], "models": [ { - "modelName": "grok-4-0709", - "displayName": "Grok 4", + "modelName": "grok-4.20-0309-reasoning", + "displayName": "Grok 4.20 Reasoning", "serviceType": ["chat", "reasoning"], - "description": "xAI 最新旗舰推理模型,262K 上下文,支持工具调用", - "contextWindow": 262144, - "maxOutputTokens": 8192, + "description": "xAI 旗舰推理模型,支持函数调用与结构化输出", + "contextWindow": 2000000, + "maxOutputTokens": 16384, "capabilities": [ "chat", "reasoning", @@ -25,17 +25,17 @@ "vision", "tool_use" ], - "inputPrice": 3.00, - "outputPrice": 15.00, + "inputPrice": 2.00, + "outputPrice": 6.00, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} }, { - "modelName": "grok-4-1-fast", - "displayName": "Grok 4.1 Fast", - "serviceType": ["chat"], - "description": "xAI 超长上下文高速模型,2M token 窗口", + "modelName": "grok-4-1-fast-reasoning", + "displayName": "Grok 4.1 Fast Reasoning", + "serviceType": ["chat", "reasoning"], + "description": "xAI 高速推理模型,2M 上下文窗口", "contextWindow": 2000000, "maxOutputTokens": 16384, "capabilities": [ diff --git a/compute/providers/xunfei.json b/compute/providers/xunfei.json index fc6eff5..6889f5b 100644 --- a/compute/providers/xunfei.json +++ b/compute/providers/xunfei.json @@ -12,12 +12,12 @@ "services": ["chat", "reasoning"], "models": [ { - "modelName": "x1", + "modelName": "spark-x", "displayName": "讯飞星火 X1", "serviceType": ["reasoning"], - "description": "讯飞最新推理模型,基于全国产算力训练,擅长数学和代码推理", - "contextWindow": 32768, - "maxOutputTokens": 16384, + "description": "讯飞深度推理模型(X2),输入64K/输出128K,支持思考模式与函数调用", + "contextWindow": 65536, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/zhipu-embedding.json b/compute/providers/zhipu-embedding.json index 76151c8..6031ad8 100644 --- a/compute/providers/zhipu-embedding.json +++ b/compute/providers/zhipu-embedding.json @@ -18,15 +18,22 @@ "modelName": "embedding-3", "displayName": "智谱 embedding-3", "serviceType": ["embedding"], - "description": "智谱嵌入模型v3,支持自定义维度,单条最大3072 tokens。走 OpenAI 兼容 /embeddings 端点(Anthropic 协议不提供 embeddings)", - "contextWindow": 3072, + "description": "智谱嵌入模型v3,支持自定义维度;模型上下文窗口 8K,单条输入最多 3072 tokens。走 OpenAI 兼容 /embeddings 端点(Anthropic 协议不提供 embeddings)", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", - "rag" + "rag", + "custom_dimensions" ], "inputPrice": 0.5, - "extra": {} + "defaultTemperature": 1, + "extra": { + "maxInputTokensPerItem": 3072, + "maxBatchItems": 64, + "vectorDimensions": "256-2048" + } } ] } diff --git a/compute/providers/zhipu.json b/compute/providers/zhipu.json index f0197a1..c30074f 100644 --- a/compute/providers/zhipu.json +++ b/compute/providers/zhipu.json @@ -8,7 +8,7 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "CNY", + "priceCurrency": "USD", "services": [ "chat", "vision", @@ -18,10 +18,72 @@ "embedding-3" ], "models": [ + { + "modelName": "glm-5.1", + "displayName": "GLM-5.1", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5.1 最新旗舰模型,面向长程 Agentic Coding 与 Autonomous Agent 场景,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "deep_thinking", + "long_context", + "math", + "tool_use", + "agent" + ], + "inputPrice": 1.4, + "outputPrice": 4.4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.26, + "thinking": { + "default": "enabled" + } + } + }, + { + "modelName": "glm-5-turbo", + "displayName": "GLM-5-Turbo", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5-Turbo,面向 OpenClaw 等长链路任务优化,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "inputPrice": 1.2, + "outputPrice": 4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.24, + "thinking": { + "default": "enabled" + } + } + }, { "modelName": "glm-5", "displayName": "GLM-5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "智谱GLM-5,744B参数旗舰基座模型,2026年2月发布,面向Agentic Engineering,编程能力接近Claude Opus", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -36,16 +98,20 @@ "tool_use", "agent" ], - "inputPrice": 4, - "outputPrice": 18, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 1, + "outputPrice": 3.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.2 + } }, { "modelName": "glm-4.7", "displayName": "GLM-4.7", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "智谱GLM-4.7,355B参数MoE架构旗舰模型,200K上下文,编程能力对齐Claude Sonnet", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -58,16 +124,20 @@ "long_context", "tool_use" ], - "inputPrice": 4, - "outputPrice": 16, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11 + } }, { "modelName": "glm-4.7-thinking", "displayName": "GLM-4.7 Thinking", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "智谱GLM-4.7深度思考模式,200K上下文,交错式/保留式/轮级思考", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -78,19 +148,57 @@ "deep_thinking", "long_context" ], - "inputPrice": 8, - "outputPrice": 32, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11, + "aliasOf": "glm-4.7" + } + }, + { + "modelName": "glm-5v-turbo", + "displayName": "GLM-5V-Turbo", + "serviceType": [ + "vision" + ], + "description": "智谱首个多模态 Coding 基座模型,支持视频、图像、文本和文件输入,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "vision", + "video_understanding", + "image_understanding", + "file_understanding", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "inputPrice": 1.2, + "outputPrice": 4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.24, + "thinking": { + "default": "enabled" + } + } }, { "modelName": "glm-4.6v", "displayName": "GLM-4.6V", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "智谱GLM-4.6V多模态版,106B/12B MoE,支持图像视频理解与工具调用,128K上下文", "contextWindow": 128000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -99,28 +207,37 @@ "long_context", "tool_use" ], - "inputPrice": 8, - "outputPrice": 32, - "extra": {} + "inputPrice": 0.3, + "outputPrice": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.05 + } }, { "modelName": "glm-4.6", "displayName": "GLM-4.6", - "serviceType": ["chat"], - "description": "智谱GLM-4.6,增强推理能力,128K上下文", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "serviceType": [ + "chat" + ], + "description": "智谱GLM-4.6,增强推理能力,200K上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", "code", "multilingual", - "deep_thinking", - "vision" + "deep_thinking" ], - "inputPrice": 5, - "outputPrice": 5, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11 + } } ] } diff --git a/manifest.json b/manifest.json index 8a447d7..18dc263 100644 --- a/manifest.json +++ b/manifest.json @@ -1,6 +1,6 @@ { "version": "1.0.0", - "presetDataVersion": 24, - "updatedAt": "2026-04-20", + "presetDataVersion": 29, + "updatedAt": "2026-04-24", "description": "DesireCore 官方配置中心" } diff --git a/字段取值表/anthropic/未确认字段报告.md b/字段取值表/anthropic/未确认字段报告.md new file mode 100644 index 0000000..77d4488 --- /dev/null +++ b/字段取值表/anthropic/未确认字段报告.md @@ -0,0 +1,47 @@ +# 未确认字段报告 - compute/providers/anthropic.json + +- provider: `anthropic` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## claude-opus-4-6 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.6 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-opus-4-5 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.5 +- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4-5 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4-5-computer + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 +- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/anthropic/详细字段取值表.md b/字段取值表/anthropic/详细字段取值表.md new file mode 100644 index 0000000..ca89d3f --- /dev/null +++ b/字段取值表/anthropic/详细字段取值表.md @@ -0,0 +1,114 @@ +# 详细字段取值表 - compute/providers/anthropic.json + +- provider: `anthropic` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.claude.com/docs/en/about-claude/models/overview +- https://platform.claude.com/docs/en/about-claude/pricing +- https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 +- https://www.anthropic.com/news/claude-opus-4-5 +- https://www.anthropic.com/news/claude-sonnet-4-5 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## claude-opus-4-6 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-opus-4.6` +- ZenMux候选: `anthropic/claude-opus-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-opus-4-6"` | `"claude-opus-4.6"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.6 | +| `displayName` | `"Claude Opus 4.6"` | `"Claude Opus 4.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 为 `1M tokens` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 的 Max output 为 `128k tokens` | +| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.6) prompt=5 USD/MTokens | +| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.6) completion=25 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-opus-4-5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-opus-4.5` +- ZenMux候选: `anthropic/claude-opus-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-opus-4-5"` | `"claude-opus-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.5 | +| `displayName` | `"Claude Opus 4.5"` | `"Claude Opus 4.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | ZenMux(anthropic/claude-opus-4.5)口径近似(≤3%) | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens | +| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.5) prompt=5 USD/MTokens | +| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.5) completion=25 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4-5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-sonnet-4.5` +- ZenMux候选: `anthropic/claude-sonnet-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4-5"` | `"claude-sonnet-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 | +| `displayName` | `"Claude Sonnet 4.5"` | `"Claude Sonnet 4.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `200K tokens / 1M tokens (beta)`;本项目 `contextWindow` 取标准口径 `200000` | +| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `64K tokens` 最大输出 | +| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) prompt=3 USD/MTokens | +| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) completion=15 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `anthropic/claude-sonnet-4` +- ZenMux候选: `anthropic/claude-sonnet-4` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4"` | `"claude-sonnet-4"` | 保持 | ZenMux匹配(exact): anthropic/claude-sonnet-4 | +| `displayName` | `"Claude Sonnet 4"` | `"Claude Sonnet 4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 context window 为 `200k tokens` | +| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 Max output 为 `64k tokens` | +| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4) prompt=3 USD/MTokens | +| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4) completion=15 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4-5-computer + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `anthropic/claude-sonnet-4.5`、`anthropic/claude-sonnet-4`、`anthropic/claude-sonnet-4.6`、`anthropic/claude-opus-4.5`、`anthropic/claude-haiku-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4-5-computer"` | `"claude-sonnet-4-5-computer"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Claude Sonnet 4.5 Computer Use"` | `"Claude Sonnet 4.5 Computer Use"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["computer_use"]` | `["computer_use"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | +| `maxOutputTokens` | `64000` | `64000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | +| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","computer_use","tool_use","reasoning"]` | `["chat","vision","computer_use","tool_use","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/anthropic/逐条处置记录-2026-04-23.md b/字段取值表/anthropic/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..14231c8 --- /dev/null +++ b/字段取值表/anthropic/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# anthropic ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Anthropic Models: https://docs.anthropic.com/en/docs/about-claude/models +- Anthropic Pricing: https://www.anthropic.com/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `claude-sonnet-4-5-computer`(ambiguous) +处置:不修改。 +原因:ZenMux 候选覆盖 `sonnet/opus/haiku` 多分支;本地条目为 `computer_use` 专用路由,不能按通用 chat 候选直接覆盖。 + +## 本轮 anthropic 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/baichuan/未确认字段报告.md b/字段取值表/baichuan/未确认字段报告.md new file mode 100644 index 0000000..10ac6b4 --- /dev/null +++ b/字段取值表/baichuan/未确认字段报告.md @@ -0,0 +1,44 @@ +# 未确认字段报告 - compute/providers/baichuan.json + +- provider: `baichuan` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## Baichuan-M3-Plus + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3-Plus` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M3 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M2-Plus + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2-Plus` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baichuan/详细字段取值表.md b/字段取值表/baichuan/详细字段取值表.md new file mode 100644 index 0000000..34471fb --- /dev/null +++ b/字段取值表/baichuan/详细字段取值表.md @@ -0,0 +1,89 @@ +# 详细字段取值表 - compute/providers/baichuan.json + +- provider: `baichuan` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.baichuan-ai.com/prices +- https://platform.baichuan-ai.com/docs/api +- https://platform.baichuan-ai.com/docs/knowledgeBase +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## Baichuan-M3-Plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M3-Plus"` | `"Baichuan-M3-Plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M3-Plus"` | `"百川 M3-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3-Plus`,因此不能直接据此回填 | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `9` | `9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M3"` | `"Baichuan-M3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M3"` | `"百川 M3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3`,因此不能直接据此回填 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","vision","medical"]` | `["chat","reasoning","code","multilingual","vision","medical"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M2-Plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M2-Plus"` | `"Baichuan-M2-Plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M2-Plus"` | `"百川 M2-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2-Plus`,因此不能直接据此回填 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M2"` | `"Baichuan-M2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M2"` | `"百川 M2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2`,因此不能直接据此回填 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/baidu/未确认字段报告.md b/字段取值表/baidu/未确认字段报告.md new file mode 100644 index 0000000..ba90482 --- /dev/null +++ b/字段取值表/baidu/未确认字段报告.md @@ -0,0 +1,22 @@ +# 未确认字段报告 - compute/providers/baidu.json + +- provider: `baidu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## ernie-5.0-thinking-latest + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## ernie-4.5-turbo-128k-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baidu/详细字段取值表.md b/字段取值表/baidu/详细字段取值表.md new file mode 100644 index 0000000..d6c126e --- /dev/null +++ b/字段取值表/baidu/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/baidu.json + +- provider: `baidu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://cloud.baidu.com/doc/qianfan/ +- https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## ernie-5.0-thinking-latest + +- ZenMux匹配级别: `stripped` +- ZenMux命中: `baidu/ernie-5.0-thinking-preview` +- ZenMux候选: `baidu/ernie-5.0-thinking-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-5.0-thinking-latest"` | `"ernie-5.0-thinking-latest"` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 直接列出 `ernie-5.0-thinking-latest` | +| `displayName` | `"文心 ERNIE 5.0"` | `"文心 ERNIE 5.0"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0-thinking-latest` 上下文长度为 `128k` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0-thinking-latest` 最大输出为 `[1,65536]` | +| `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","vision","multimodal","tool_use"]` | `["chat","reasoning","vision","multimodal","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## ernie-4.5-turbo-128k-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-4.5-turbo-128k-latest"` | `"ernie-4.5-turbo-128k-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"文心 ERNIE 4.5 Turbo"` | `"文心 ERNIE 4.5 Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-4.5-turbo-128k` 上下文长度为 `128k`;当前值 `131072` 为按 `128 * 1024` 换算 | +| `maxOutputTokens` | `12288` | `12288` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-4.5-turbo-128k` 最大输出为 `[2,12288]` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","vision","long_context","fast"]` | `["chat","code","vision","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/cohere/未确认字段报告.md b/字段取值表/cohere/未确认字段报告.md new file mode 100644 index 0000000..f348175 --- /dev/null +++ b/字段取值表/cohere/未确认字段报告.md @@ -0,0 +1,31 @@ +# 未确认字段报告 - compute/providers/cohere.json + +- provider: `cohere` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## command-a-03-2025 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## embed-v4.0 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## rerank-v3.5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/cohere/详细字段取值表.md b/字段取值表/cohere/详细字段取值表.md new file mode 100644 index 0000000..2966d2b --- /dev/null +++ b/字段取值表/cohere/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/cohere.json + +- provider: `cohere` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.cohere.com/v1/docs/models/command +- https://docs.cohere.com/v2/docs/models +- https://docs.cohere.com/docs/cohere-embed +- https://docs.cohere.com/v2/docs/rerank +- https://cohere.com/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## command-a-03-2025 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"command-a-03-2025"` | `"command-a-03-2025"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Command A"` | `"Command A"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 context 为 `256,000` tokens | +| `maxOutputTokens` | `8000` | `8000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 max output 为 `8,000` tokens | +| `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## embed-v4.0 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"embed-v4.0"` | `"embed-v4.0"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Embed V4"` | `"Embed V4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Cohere Embed 文档 https://docs.cohere.com/docs/cohere-embed 与模型总览 https://docs.cohere.com/v1/docs/models 均标注 `embed-v4.0` 上下文为 `128k` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/docs/cohere-embed 与 https://docs.cohere.com/v1/docs/models ,`embed-v4.0` 输出为向量表示,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.12` | `0.12` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## rerank-v3.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"rerank-v3.5"` | `"rerank-v3.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Rerank V3.5"` | `"Rerank V3.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["rerank"]` | `["rerank"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `4096` | `4096` | 保持 | Cohere Rerank 文档 https://docs.cohere.com/v2/docs/rerank 标注 `rerank-v3.5` context length 为 `4096` tokens | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/v2/docs/rerank ,`rerank-v3.5` 返回相关性分数而非文本 completion,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["rerank","semantic_reranking"]` | `["rerank","semantic_reranking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope-coding/未确认字段报告.md b/字段取值表/dashscope-coding/未确认字段报告.md new file mode 100644 index 0000000..d16c003 --- /dev/null +++ b/字段取值表/dashscope-coding/未确认字段报告.md @@ -0,0 +1,20 @@ +# 未确认字段报告 - compute/coding-plans/dashscope-coding.json + +- provider: `dashscope` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## qwen3-coder-plus + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-2026-01-23 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope-coding/详细字段取值表.md b/字段取值表/dashscope-coding/详细字段取值表.md new file mode 100644 index 0000000..7571f9d --- /dev/null +++ b/字段取值表/dashscope-coding/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/coding-plans/dashscope-coding.json + +- provider: `dashscope` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://help.aliyun.com/zh/model-studio/getting-started/models +- https://help.aliyun.com/zh/model-studio/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## qwen3-coder-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-coder-plus` +- ZenMux候选: `qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-coder-plus"` | `"qwen3-coder-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3-coder-plus | +| `displayName` | `"Qwen3 Coder Plus (Coding)"` | `"Qwen3 Coder Plus (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云百炼模型列表列明 `qwen3-coder-plus` 上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云百炼模型列表列明 `qwen3-coder-plus` 最大输出为 `65,536` | +| `inputPrice` | `1` | `1` | 保持 | ZenMux(qwen/qwen3-coder-plus) prompt=1 USD/MTokens | +| `outputPrice` | `5` | `5` | 保持 | ZenMux(qwen/qwen3-coder-plus) completion=5 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-2026-01-23 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-2026-01-23"` | `"qwen3-max-2026-01-23"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Max (Coding)"` | `"Qwen3 Max (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云百炼模型列表写明稳定版 `qwen3-max` 当前与 `qwen3-max-2026-01-23` 能力相同,且上下文长度为 `262,144` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 同一官方模型列表写明 `qwen3-max` 最大输出为 `65,536`,并注明其当前与 `qwen3-max-2026-01-23` 能力相同 | +| `inputPrice` | `1.2` | `1.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md b/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..8aedfb6 --- /dev/null +++ b/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# dashscope-coding ambiguous/similar 逐条处置记录(2026-04-23) + +## 范围 + +- 文件:`compute/coding-plans/dashscope-coding.json` +- 目标条目:`qwen3-max-2026-01-23` +- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models` + +## 逐条结论 + +| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 | +|---|---|---|---|---| +| `qwen3-max-2026-01-23` | `qwen/qwen3-max`、`qwen/qwen3-max-preview` | 保持现状(确认) | 否 | 本地 `contextWindow=262144` 与 `qwen/qwen3-max-preview` 精确一致;`inputPrice=1.2`、`outputPrice=6` 与该候选阶梯首档一致。当前值已对齐,无需改动。 | + +## 备注 + +- 此项由“ambiguous”提升为“可解释匹配(通过上下文长度和命名语义)”,但因字段已一致,所以仅记录处置,不产生 JSON 差异。 diff --git a/字段取值表/dashscope/未确认字段报告.md b/字段取值表/dashscope/未确认字段报告.md new file mode 100644 index 0000000..7475592 --- /dev/null +++ b/字段取值表/dashscope/未确认字段报告.md @@ -0,0 +1,168 @@ +# 未确认字段报告 - compute/providers/dashscope.json + +- provider: `dashscope` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## qwen3.5-plus + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-max + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-long + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-vl-plus + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-vl-flash + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-v3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-v4 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-rerank + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## cosyvoice-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## paraformer-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## wanx-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## wanx-video + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## cosyvoice-clone + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-omni-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-trans + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应 +- `maxOutputTokens`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope/详细字段取值表.md b/字段取值表/dashscope/详细字段取值表.md new file mode 100644 index 0000000..05a3c20 --- /dev/null +++ b/字段取值表/dashscope/详细字段取值表.md @@ -0,0 +1,362 @@ +# 详细字段取值表 - compute/providers/dashscope.json + +- provider: `dashscope` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://help.aliyun.com/zh/model-studio/model +- https://help.aliyun.com/zh/model-studio/models +- https://help.aliyun.com/zh/model-studio/rerank +- https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api +- https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni +- https://help.aliyun.com/zh/model-studio/machine-translation +- https://help.aliyun.com/zh/model-studio/user-guide/machine-translation +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## qwen3.5-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3.5-plus` +- ZenMux候选: `qwen/qwen3.5-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-plus"` | `"qwen3.5-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3.5-plus | +| `displayName` | `"阿里云 Qwen3.5-Plus"` | `"阿里云 Qwen3.5-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `4.8` | `4.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-max + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-max"` | `"qwen-max"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-max"` | `"阿里云 qwen-max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-max` 稳定版当前与 `qwen-max-2025-01-25` 能力相同,上下文长度为 `32,768` | +| `maxOutputTokens` | `8192` | `8192` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-max` 稳定版最大输出为 `8,192` | +| `inputPrice` | `2.4` | `2.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `9.6` | `9.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-plus + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-plus"` | `"qwen-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-plus"` | `"阿里云 qwen-plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-plus` 稳定版非思考模式上下文为 `1,000,000`,思考模式为 `995,904`;当前字段按稳定版上限保留 `1,000,000` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-plus` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","thinking_mode"]` | `["chat","reasoning","code","thinking_mode"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.6` | `0.6` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-turbo"` | `"qwen-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-turbo"` | `"阿里云 qwen-turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-turbo` 稳定版非思考模式上下文为 `1,000,000`,思考模式为 `131,072`;当前字段按非思考模式上限保留 `1,000,000` | +| `maxOutputTokens` | `16384` | `16384` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-turbo` 稳定版最大输出为 `16,384` | +| `inputPrice` | `0.367` | `0.367` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1.468` | `1.468` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context","fast"]` | `["chat","code","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-long + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-long"` | `"qwen-long"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-long"` | `"阿里云 qwen-long"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `10000000` | `10000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-long` 稳定版上下文长度为 `10,000,000` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-long` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","ultra_long_context","document_processing"]` | `["chat","ultra_long_context","document_processing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-max` +- ZenMux候选: `qwen/qwen3-max` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max"` | `"qwen3-max"` | 保持 | ZenMux匹配(exact): qwen/qwen3-max | +| `displayName` | `"阿里云 Qwen3-Max"` | `"阿里云 Qwen3-Max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max` 稳定版上下文长度为 `262,144` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max` 非思考模式最大输出为 `65,536`,思考模式为 `32,768`;当前字段按单模型绝对最大输出保留 `65,536` | +| `inputPrice` | `2.5` | `2.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-vl-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-vl-plus` +- ZenMux候选: `qwen/qwen3-vl-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-vl-plus"` | `"qwen3-vl-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3-vl-plus | +| `displayName` | `"阿里云 Qwen3-VL-Plus"` | `"阿里云 Qwen3-VL-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | ZenMux(qwen/qwen3-vl-plus)口径近似(≤3%) | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-plus` 稳定版最大输出为 `32,768` | +| `inputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-vl-flash + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-vl-flash"` | `"qwen3-vl-flash"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 Qwen3-VL-Flash"` | `"阿里云 Qwen3-VL-Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-flash` 稳定版上下文长度为 `262,144` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-flash` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","fast"]` | `["chat","vision","image_understanding","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-v3"` | `"text-embedding-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"text-embedding-v3"` | `"text-embedding-v3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 标注 `text-embedding-v3` 单行最大 Token 数为 `8,192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 说明 `text-embedding-v3` 输出为向量维度,不定义 max output tokens | +| `inputPrice` | `0.7` | `0.7` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","chinese_optimized"]` | `["text_embedding","semantic_search","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-v4 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-v4"` | `"text-embedding-v4"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 text-embedding-v4"` | `"阿里云 text-embedding-v4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 标注 `text-embedding-v4` 单行最大 Token 数为 `8,192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 说明 `text-embedding-v4` 输出为向量维度,不定义 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag"]` | `["text_embedding","semantic_search","rag"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-rerank + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-rerank"` | `"qwen3-rerank"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3-Rerank"` | `"Qwen3-Rerank"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["rerank"]` | `["rerank"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `30000` | `120000` | 建议修改 | 阿里云 Rerank 文档 https://help.aliyun.com/zh/model-studio/rerank 标注 `qwen3-rerank` 单次请求最大 Token 数为 `120,000` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Rerank 文档 https://help.aliyun.com/zh/model-studio/rerank 说明 `qwen3-rerank` 输出为排序分数与文档顺序,不定义 max output tokens | +| `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["rerank","semantic_reranking","multilingual"]` | `["rerank","semantic_reranking","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## cosyvoice-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"cosyvoice-v2"` | `"cosyvoice-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"CosyVoice V2"` | `"CosyVoice V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云语音合成文档 https://help.aliyun.com/model-studio/developer-reference/quick-start-cosyvoice 对 `cosyvoice-v2` 描述为 TTS 模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云语音合成文档 https://help.aliyun.com/model-studio/developer-reference/quick-start-cosyvoice 对 `cosyvoice-v2` 描述为 TTS 模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts","multilingual","chinese_optimized"]` | `["tts","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## paraformer-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"paraformer-v2"` | `"paraformer-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Paraformer V2"` | `"Paraformer V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云 ASR 文档 https://help.aliyun.com/document_detail/2840914.html 对 `paraformer-v2` 描述为语音识别模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 ASR 文档 https://help.aliyun.com/document_detail/2840914.html 对 `paraformer-v2` 描述为语音识别模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","chinese_optimized"]` | `["asr","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## wanx-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"wanx-v2"` | `"wanx-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"通义万相 V2"` | `"通义万相 V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-v2` 归为图像生成模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-v2` 归为图像生成模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","chinese_optimized"]` | `["image_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## wanx-video + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"wanx-video"` | `"wanx-video"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"通义万相视频"` | `"通义万相视频"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-video` 归为视频生成模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-video` 归为视频生成模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized"]` | `["video_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## cosyvoice-clone + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"cosyvoice-clone"` | `"cosyvoice-clone"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"CosyVoice 声音复刻"` | `"CosyVoice 声音复刻"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["voice_clone"]` | `["voice_clone"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将该能力归为语音/声音定制类服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将该能力归为语音/声音定制类服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxCloneSamples":5,"minCloneDuration":3}` | `{"maxCloneSamples":5,"minCloneDuration":3}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-omni-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-omni-turbo"` | `"qwen-omni-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen-Omni-Turbo"` | `"Qwen-Omni-Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["omni"]` | `["omni"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 阿里云 Qwen-Omni 文档 https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni 标注 `qwen-omni-turbo` 上下文长度为 `32,768` | +| `maxOutputTokens` | `2048` | `2048` | 保持 | 阿里云 Qwen-Omni 文档 https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni 标注 `qwen-omni-turbo` 最大输出为 `2,048` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","tts","asr","multimodal","tool_use"]` | `["chat","vision","tts","asr","multimodal","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-trans + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-trans"` | `"qwen3-max-trans"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3-Max(翻译)"` | `"Qwen3-Max(翻译)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["translation"]` | `["translation"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应;当前值暂保留待确认 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应;当前值暂保留待确认 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope/逐条处置记录-2026-04-23.md b/字段取值表/dashscope/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..c858048 --- /dev/null +++ b/字段取值表/dashscope/逐条处置记录-2026-04-23.md @@ -0,0 +1,38 @@ +# dashscope ambiguous/similar 逐条处置记录(2026-04-23) + +## 范围 + +- 文件:`compute/providers/dashscope.json` +- 目标条目:`qwen-max`、`qwen-plus`、`qwen3-vl-flash`、`qwen3-rerank`、`qwen3-max-trans` +- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models` + +## 逐条结论 + +| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 | +|---|---|---|---|---| +| `qwen-max` | `qwen/qwen3-max`、`qwen/qwen3-max-preview` | 不修改 | 否 | 本地为 legacy 命名(`qwen-max`,32K);ZenMux 候选是 Qwen3 Max 系列,规格口径不一致,不能直接覆盖。 | +| `qwen-plus` | `qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus` | 不修改 | 否 | 候选跨模型族(chat/vl/coder),且价格阶梯与本地 `qwen-plus` 不可唯一对齐,拒绝强匹配。 | +| `qwen3-vl-flash` | `qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | ZenMux 未给出 `qwen3-vl-flash` 同名条目;候选包含非视觉模型,无法唯一映射。 | +| `qwen3-rerank` | `qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash` | 不修改 | 否 | 本地是 `rerank` 服务类型,ZenMux 候选均为生成模型,服务类型不一致。 | +| `qwen3-max-trans` | `qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | 本地是翻译专用路由(`translation`),ZenMux 候选为通用生成模型,无法安全映射。 | + +## 备注 + +- 本批次没有可“唯一确认且与本地值不同”的字段,因此 `compute/providers/dashscope.json` 无变更。 + +## none 条目补齐(第2轮) + +依据(官方): +- 阿里云百炼模型概览:`https://help.aliyun.com/zh/model-studio/models` +- 文本向量模型 v3/v4 文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3` +- 文本排序(Rerank)文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api` + +已执行: +1. `text-embedding-v3`:新增 `contextWindow: 8192` +2. `text-embedding-v4`:新增 `contextWindow: 8192` +3. `qwen3-rerank`:新增 `contextWindow: 30000`(按官方“单次请求最大 Token”) + +未改项(说明): +- `text-embedding-v3/v4` 的 `maxOutputTokens` 与 `outputPrice` 保持缺省:Embedding 为输入向量化,不走 completion token 口径。 +- `qwen3-rerank` 的 `maxOutputTokens` 保持缺省:Rerank 返回排序结果,不是文本生成输出。 +- 语音/图像/视频模型(`cosyvoice`/`paraformer`/`wanx`)的 token 上下文与输出上限口径不统一,继续待官方明确 token 语义映射。 diff --git a/字段取值表/deepseek/未确认字段报告.md b/字段取值表/deepseek/未确认字段报告.md new file mode 100644 index 0000000..3e67e70 --- /dev/null +++ b/字段取值表/deepseek/未确认字段报告.md @@ -0,0 +1,23 @@ +# 未确认字段报告 - compute/providers/deepseek.json + +- provider: `deepseek` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## deepseek-chat + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-reasoner + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/deepseek/详细字段取值表.md b/字段取值表/deepseek/详细字段取值表.md new file mode 100644 index 0000000..9a713e0 --- /dev/null +++ b/字段取值表/deepseek/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/deepseek.json + +- provider: `deepseek` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://api-docs.deepseek.com/quick_start/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## deepseek-chat + +- ZenMux匹配级别: `exact` +- ZenMux命中: `deepseek/deepseek-chat` +- ZenMux候选: `deepseek/deepseek-chat` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-chat"` | `"deepseek-chat"` | 保持 | ZenMux匹配(exact): deepseek/deepseek-chat | +| `displayName` | `"DeepSeek V3.2"` | `"DeepSeek V3.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | ZenMux(deepseek/deepseek-chat)口径近似(≤3%) | +| `maxOutputTokens` | `8192` | `8192` | 保持 | DeepSeek 官方模型与价格页 https://api-docs.deepseek.com/quick_start/pricing/ 标注 `deepseek-chat` 最大输出为 8K | +| `inputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","code","reasoning","multilingual"]` | `["chat","code","reasoning","multilingual"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-reasoner + +- ZenMux匹配级别: `exact` +- ZenMux命中: `deepseek/deepseek-reasoner` +- ZenMux候选: `deepseek/deepseek-reasoner` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-reasoner"` | `"deepseek-reasoner"` | 保持 | ZenMux匹配(exact): deepseek/deepseek-reasoner | +| `displayName` | `"DeepSeek R1"` | `"DeepSeek R1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | ZenMux(deepseek/deepseek-reasoner)口径近似(≤3%) | +| `maxOutputTokens` | `65536` | `65536` | 保持 | DeepSeek 官方模型与价格页 https://api-docs.deepseek.com/quick_start/pricing/ 与推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 均标注 `deepseek-reasoner` 最大输出为 64K | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","code","math"]` | `["chat","reasoning","deep_thinking","code","math"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/google/未确认字段报告.md b/字段取值表/google/未确认字段报告.md new file mode 100644 index 0000000..d7434b6 --- /dev/null +++ b/字段取值表/google/未确认字段报告.md @@ -0,0 +1,27 @@ +# 未确认字段报告 - compute/providers/google.json + +- provider: `google` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## gemini-2.5-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gemini-2.5-flash + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-005 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/google/详细字段取值表.md b/字段取值表/google/详细字段取值表.md new file mode 100644 index 0000000..c2e35ad --- /dev/null +++ b/字段取值表/google/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/google.json + +- provider: `google` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://ai.google.dev/gemini-api/docs/models/gemini +- https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings +- https://ai.google.dev/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## gemini-2.5-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `google/gemini-2.5-pro` +- ZenMux候选: `google/gemini-2.5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gemini-2.5-pro"` | `"gemini-2.5-pro"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-pro | +| `displayName` | `"Gemini 2.5 Pro"` | `"Gemini 2.5 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(google/gemini-2.5-pro) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(google/gemini-2.5-pro) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gemini-2.5-flash + +- ZenMux匹配级别: `exact` +- ZenMux命中: `google/gemini-2.5-flash` +- ZenMux候选: `google/gemini-2.5-flash` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gemini-2.5-flash"` | `"gemini-2.5-flash"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-flash | +| `displayName` | `"Gemini 2.5 Flash"` | `"Gemini 2.5 Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | +| `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(google/gemini-2.5-flash) prompt=0.3 USD/MTokens | +| `outputPrice` | `2.5` | `2.5` | 保持 | ZenMux(google/gemini-2.5-flash) completion=2.5 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-005 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-005"` | `"text-embedding-005"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Text Embedding 005"` | `"Text Embedding 005"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2048` | `2048` | 保持 | Google Cloud Vertex AI Embeddings 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 直接列出 `text-embedding-005` 的 `Max sequence length` 为 `2048 tokens` | +| `maxOutputTokens` | `0` | `0` | 保持 | 同一官方 Vertex AI 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 仅定义输出维度与最大序列长度,`text-embedding-005` 输出为向量而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/google/逐条处置记录-2026-04-23.md b/字段取值表/google/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..69658fc --- /dev/null +++ b/字段取值表/google/逐条处置记录-2026-04-23.md @@ -0,0 +1,15 @@ +# google none 条目处置记录(2026-04-23,第2轮) + +依据: +- Google 官方模型文档(Gemini API / Vertex AI)中 `text-embedding-005` 最大输入长度为 `2048` tokens。 +- https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings + +已执行: +1. `text-embedding-005`:新增 `contextWindow: 2048` + +未改项(说明): +- `maxOutputTokens` / `outputPrice` 保持缺省:Embedding 仅输入计费,无生成输出 token 口径。 + +## 本轮 google 落库结果 + +- JSON 变更:1 模型 / 1 字段 diff --git a/字段取值表/infini-coding/未确认字段报告.md b/字段取值表/infini-coding/未确认字段报告.md new file mode 100644 index 0000000..0b2539f --- /dev/null +++ b/字段取值表/infini-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/infini-coding.json + +- provider: `infini` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## deepseek-v3 + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` +- `maxOutputTokens`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/infini-coding/详细字段取值表.md b/字段取值表/infini-coding/详细字段取值表.md new file mode 100644 index 0000000..e3dd778 --- /dev/null +++ b/字段取值表/infini-coding/详细字段取值表.md @@ -0,0 +1,33 @@ +# 详细字段取值表 - compute/coding-plans/infini-coding.json + +- provider: `infini` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html +- https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html +- https://docs.infini-ai.com/public/models/deepseek-v3.html +- https://api-docs.deepseek.com/quick_start/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## deepseek-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-v3"` | `"deepseek-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek V3 (芯穹 Coding)"` | `"DeepSeek V3 (芯穹 Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/internal-testing/未确认字段报告.md b/字段取值表/internal-testing/未确认字段报告.md new file mode 100644 index 0000000..aaad51b --- /dev/null +++ b/字段取值表/internal-testing/未确认字段报告.md @@ -0,0 +1,132 @@ +# 未确认字段报告 - compute/providers/internal-testing.json + +- provider: `internal-testing` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.7-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `8192` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5.1 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2.6-code-preview + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2.5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `8192` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.6-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-35b-a3b + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-27b + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-2026-01-23 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-2-0-code-preview-260215 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/internal-testing/详细字段取值表.md b/字段取值表/internal-testing/详细字段取值表.md new file mode 100644 index 0000000..4793e00 --- /dev/null +++ b/字段取值表/internal-testing/详细字段取值表.md @@ -0,0 +1,289 @@ +# 详细字段取值表 - compute/providers/internal-testing.json + +- provider: `internal-testing` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://help.aliyun.com/zh/model-studio/model +- https://developer.volcengine.com/articles/7615528054736945158 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.7-highspeed + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7-highspeed"` | `"MiniMax-M2.7-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax-M2.7 高速版"` | `"MiniMax-M2.7 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.7-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出;当前值暂保留待确认 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5.1 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5.1"` | `"glm-5.1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5.1"` | `"GLM-5.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5.1 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5.1 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5"` | `"GLM-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5-turbo"` | `"glm-5-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5-Turbo"` | `"GLM-5-Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `200000` | 建议修改 | 智谱官方 GLM-5-Turbo 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `8192` | `128000` | 建议修改 | 智谱官方 GLM-5-Turbo 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7"` | `"GLM-4.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2.6-code-preview + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.6-code-preview"` | `"kimi-k2.6-code-preview"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2.6 Code Preview"` | `"Kimi K2.6 Code Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart 说明 `kimi-k2.6` 提供 `256K` 上下文窗口;本地别名 `kimi-k2.6-code-preview` 可按同规格理解 | +| `maxOutputTokens` | `16384` | `32768` | 建议修改 | Moonshot 官方 Kimi K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart “参数变动说明”列明 `max_tokens` 默认值为 `32k`,即 `32768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi-2.5"` | `"Kimi-2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | Moonshot 官方 Kimi K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 标注模型上下文长度为 `256k` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | Moonshot 官方 Kimi K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart “参数变动说明”列明 `max_tokens` 默认值为 `32k`,即 `32768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"MiniMax-M2.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax-M2.5"` | `"MiniMax-M2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出;当前值暂保留待确认 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.6-plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.6-plus"` | `"qwen3.6-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.6 Plus"` | `"Qwen3.6 Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.6-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.6-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-plus"` | `"qwen3.5-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 Plus"` | `"Qwen3.5 Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `1000000` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `8192` | `65536` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-35b-a3b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-35b-a3b"` | `"qwen3.5-35b-a3b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 35B-A3B"` | `"Qwen3.5 35B-A3B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-35b-a3b` 标注为 `262,144` 上下文 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-35b-a3b` 标注为最大回复长度 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-27b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-27b"` | `"qwen3.5-27b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 27B"` | `"Qwen3.5 27B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-27b` 标注为 `262,144` 上下文 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-27b` 标注为最大回复长度 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-2026-01-23 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-2026-01-23"` | `"qwen3-max-2026-01-23"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Max"` | `"Qwen3 Max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max-2026-01-23` 对应的 `qwen3-max` 上下文长度为 `262,144` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max-2026-01-23` 思考模式最大输出为 `32,768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-2-0-code-preview-260215 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-2-0-code-preview-260215"` | `"doubao-seed-2-0-code-preview-260215"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed 2.0 Code Preview"` | `"豆包 Seed 2.0 Code Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 `doubao-seed-2.0-code` contextWindow 为 `256000`;本地快照别名 `doubao-seed-2-0-code-preview-260215` 可按同规格理解 | +| `maxOutputTokens` | `8192` | `128000` | 建议修改 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 `doubao-seed-2.0-code` maxTokens 为 `128000`;本地快照别名 `doubao-seed-2-0-code-preview-260215` 可按同规格理解 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kling/未确认字段报告.md b/字段取值表/kling/未确认字段报告.md new file mode 100644 index 0000000..6983f76 --- /dev/null +++ b/字段取值表/kling/未确认字段报告.md @@ -0,0 +1,40 @@ +# 未确认字段报告 - compute/providers/kling.json + +- provider: `kling` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kling-v2-5-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2-5-turbo-pro + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2-master + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kling/详细字段取值表.md b/字段取值表/kling/详细字段取值表.md new file mode 100644 index 0000000..b152449 --- /dev/null +++ b/字段取值表/kling/详细字段取值表.md @@ -0,0 +1,87 @@ +# 详细字段取值表 - compute/providers/kling.json + +- provider: `kling` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kling-v2-5-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-5-turbo"` | `"kling-v2-5-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2.5 Turbo"` | `"可灵 V2.5 Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","high_quality","fast"]` | `["video_generation","chinese_optimized","high_quality","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2-5-turbo-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-5-turbo-pro"` | `"kling-v2-5-turbo-pro"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2.5 Turbo Pro"` | `"可灵 V2.5 Turbo Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2"` | `"kling-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2"` | `"可灵 V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","high_quality"]` | `["video_generation","chinese_optimized","high_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2-master + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-master"` | `"kling-v2-master"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2 Master"` | `"可灵 V2 Master"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kwai-coding/未确认字段报告.md b/字段取值表/kwai-coding/未确认字段报告.md new file mode 100644 index 0000000..26edb1e --- /dev/null +++ b/字段取值表/kwai-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/kwai-coding.json + +- provider: `kwai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kwai-coder + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 +- `maxOutputTokens`: 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kwai-coding/详细字段取值表.md b/字段取值表/kwai-coding/详细字段取值表.md new file mode 100644 index 0000000..f2527ef --- /dev/null +++ b/字段取值表/kwai-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/kwai-coding.json + +- provider: `kwai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.streamlake.com/product/kat-coder +- https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 +- https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kwai-coder + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kwai-coder"` | `"kwai-coder"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"KwaiKAT Coder (Coding)"` | `"KwaiKAT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/lingyiwanwu/未确认字段报告.md b/字段取值表/lingyiwanwu/未确认字段报告.md new file mode 100644 index 0000000..5926295 --- /dev/null +++ b/字段取值表/lingyiwanwu/未确认字段报告.md @@ -0,0 +1,26 @@ +# 未确认字段报告 - compute/providers/lingyiwanwu.json + +- provider: `lingyiwanwu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## yi-lightning + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 +- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## yi-vision-v2 + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 +- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/lingyiwanwu/详细字段取值表.md b/字段取值表/lingyiwanwu/详细字段取值表.md new file mode 100644 index 0000000..6d93d67 --- /dev/null +++ b/字段取值表/lingyiwanwu/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/lingyiwanwu.json + +- provider: `lingyiwanwu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.lingyiwanwu.com/billing +- https://platform.lingyiwanwu.com/playground +- https://platform.lingyiwanwu.com/useragreement +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## yi-lightning + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"yi-lightning"` | `"yi-lightning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Yi Lightning"` | `"Yi Lightning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `inputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","fast","smart_routing"]` | `["chat","reasoning","code","fast","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## yi-vision-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"yi-vision-v2"` | `"yi-vision-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Yi Vision V2"` | `"Yi Vision V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `inputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/local-whisper/未确认字段报告.md b/字段取值表/local-whisper/未确认字段报告.md new file mode 100644 index 0000000..73735d9 --- /dev/null +++ b/字段取值表/local-whisper/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/local-whisper.json + +- provider: `local-whisper` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## whisper-large-v3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/local-whisper/详细字段取值表.md b/字段取值表/local-whisper/详细字段取值表.md new file mode 100644 index 0000000..a8682a5 --- /dev/null +++ b/字段取值表/local-whisper/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/local-whisper.json + +- provider: `local-whisper` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://huggingface.co/openai/whisper-large-v3 +- https://github.com/openai/whisper +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## whisper-large-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"whisper-large-v3"` | `"whisper-large-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Whisper Large V3"` | `"Whisper Large V3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://huggingface.co/openai/whisper-large-v3 与 https://github.com/openai/whisper ,`whisper-large-v3` 为语音转文本模型,官方未定义与聊天模型同口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://huggingface.co/openai/whisper-large-v3 与 https://github.com/openai/whisper ,官方未提供 transcription 模型的 max output tokens 规格,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax-coding/未确认字段报告.md b/字段取值表/minimax-coding/未确认字段报告.md new file mode 100644 index 0000000..95f9c86 --- /dev/null +++ b/字段取值表/minimax-coding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/coding-plans/minimax-coding.json + +- provider: `minimax` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.5 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.5 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `32768` +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax-coding/详细字段取值表.md b/字段取值表/minimax-coding/详细字段取值表.md new file mode 100644 index 0000000..c734923 --- /dev/null +++ b/字段取值表/minimax-coding/详细字段取值表.md @@ -0,0 +1,36 @@ +# 详细字段取值表 - compute/coding-plans/minimax-coding.json + +- provider: `minimax` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://platform.minimax.io/docs/guides/pricing-paygo +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.5` +- ZenMux候选: `minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"minimax-m2.5"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.5 | +| `displayName` | `"MiniMax-M2.5 (Coding)"` | `"MiniMax-M2.5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `32768` | +| `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(minimax/minimax-m2.5) prompt=0.3 USD/MTokens | +| `outputPrice` | `1.2` | `1.2` | 保持 | ZenMux(minimax/minimax-m2.5) completion=1.2 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax/未确认字段报告.md b/字段取值表/minimax/未确认字段报告.md new file mode 100644 index 0000000..bb602cd --- /dev/null +++ b/字段取值表/minimax/未确认字段报告.md @@ -0,0 +1,80 @@ +# 未确认字段报告 - compute/providers/minimax.json + +- provider: `minimax` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.7 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.7 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.7-highspeed + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.7-highspeed +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.5 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.1 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.1 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.1-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-Text-01 + +- `modelName`: ZenMux匹配(similar): minimax/minimax-m2 +- `contextWindow`: 已查 https://platform.minimax.io/docs/guides/text-vllm-deployment 与 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 ,官方仅给开源/本地部署口径:vLLM 部署按硬件可支持 `2M` / `5M` context,官方模型卡写明训练上下文 `1M`、推理最高可到 `4M`;MiniMax 托管 API 文档未公布固定 hosted context window,因此无法用官网确认当前 `1000000` +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-post ,官方仅对 `MiniMax-Text-01` 给出废弃 Text Generation 接口的默认 `max_completion_tokens=2048`,未公布 `MiniMax-Text-01` 在托管 API 下的独立模型级最大输出;开源模型卡 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 也未给固定 `max_new_tokens` 上限,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax/详细字段取值表.md b/字段取值表/minimax/详细字段取值表.md new file mode 100644 index 0000000..9695de4 --- /dev/null +++ b/字段取值表/minimax/详细字段取值表.md @@ -0,0 +1,157 @@ +# 详细字段取值表 - compute/providers/minimax.json + +- provider: `minimax` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://platform.minimax.io/docs/guides/models-intro +- https://platform.minimax.io/docs/guides/pricing-paygo +- https://platform.minimax.io/docs/guides/text-vllm-deployment +- https://huggingface.co/MiniMaxAI/MiniMax-Text-01 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.7 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.7` +- ZenMux候选: `minimax/minimax-m2.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7"` | `"minimax-m2.7"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.7 | +| `displayName` | `"MiniMax M2.7"` | `"MiniMax M2.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.7` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.7-highspeed + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.7-highspeed` +- ZenMux候选: `minimax/minimax-m2.7-highspeed` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7-highspeed"` | `"minimax-m2.7-highspeed"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.7-highspeed | +| `displayName` | `"MiniMax M2.7 高速版"` | `"MiniMax M2.7 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.7-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.5` +- ZenMux候选: `minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"minimax-m2.5"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.5 | +| `displayName` | `"MiniMax M2.5"` | `"MiniMax M2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5-highspeed + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `minimax/minimax-m2.5`、`minimax/minimax-m2.7-highspeed`、`minimax/minimax-m2.5-lightning`、`minimax/minimax-m2`、`minimax/minimax-m2.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5-highspeed"` | `"MiniMax-M2.5-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax M2.5 高速版"` | `"MiniMax M2.5 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.1 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.1` +- ZenMux候选: `minimax/minimax-m2.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.1"` | `"minimax-m2.1"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.1 | +| `displayName` | `"MiniMax M2.1"` | `"MiniMax M2.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.1` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","code","tool_use","reasoning"]` | `["chat","code","tool_use","reasoning"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.1-highspeed + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `minimax/minimax-m2.1`、`minimax/minimax-m2.7-highspeed`、`minimax/minimax-m2`、`minimax/minimax-m2.7`、`minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.1-highspeed"` | `"MiniMax-M2.1-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax M2.1 高速版"` | `"MiniMax M2.1 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.1-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-Text-01 + +- ZenMux匹配级别: `similar` +- ZenMux命中: `minimax/minimax-m2` +- ZenMux候选: `minimax/minimax-m2` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-Text-01"` | `"minimax-m2"` | 待确认 | ZenMux匹配(similar): minimax/minimax-m2 | +| `displayName` | `"MiniMax Text 01"` | `"MiniMax Text 01"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 待确认 | 已查 https://platform.minimax.io/docs/guides/text-vllm-deployment 与 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 ,官方仅给开源/本地部署口径:vLLM 部署按硬件可支持 `2M` / `5M` context,官方模型卡写明训练上下文 `1M`、推理最高可到 `4M`;MiniMax 托管 API 文档未公布固定 hosted context window,因此无法用官网确认当前 `1000000` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-post ,官方仅对 `MiniMax-Text-01` 给出废弃 Text Generation 接口的默认 `max_completion_tokens=2048`,未公布 `MiniMax-Text-01` 在托管 API 下的独立模型级最大输出;开源模型卡 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 也未给固定 `max_new_tokens` 上限,因此无法用官网确认当前 `131072` | +| `inputPrice` | `1.4` | `1.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `7.7` | `7.7` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax/逐条处置记录-2026-04-23.md b/字段取值表/minimax/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..2fcb31d --- /dev/null +++ b/字段取值表/minimax/逐条处置记录-2026-04-23.md @@ -0,0 +1,25 @@ +# minimax ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- MiniMax API/模型文档: https://platform.minimaxi.com/document/ChatCompletion?key=66701c8c1d57f38758d581b2 +- MiniMax 定价: https://www.minimaxi.com/platform/price +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `MiniMax-M2.5-highspeed`(ambiguous) +处置:不修改。 +原因:候选混入 `m2.5/m2.5-lightning/m2.7/m2`,无法只凭 ZenMux 唯一确认高速版映射。 + +2. `MiniMax-M2.1-highspeed`(ambiguous) +处置:不修改。 +原因:候选混入 `m2.1/m2.7-highspeed/m2/m2.5`,候选族冲突,缺少唯一锚点。 + +3. `MiniMax-Text-01`(similar) +处置:不修改。 +原因:`similar` 命中 `minimax-m2`,但 `Text-01` 与 `M2` 不是同名同版模型,禁止跨族覆盖。 + +## 本轮 minimax 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/mistral/未确认字段报告.md b/字段取值表/mistral/未确认字段报告.md new file mode 100644 index 0000000..3afcab3 --- /dev/null +++ b/字段取值表/mistral/未确认字段报告.md @@ -0,0 +1,37 @@ +# 未确认字段报告 - compute/providers/mistral.json + +- provider: `mistral` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## mistral-large-latest + +- `modelName`: ZenMux匹配(similar): mistralai/mistral-large-2512 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens +- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## mistral-small-latest + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## codestral-latest + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/mistral/详细字段取值表.md b/字段取值表/mistral/详细字段取值表.md new file mode 100644 index 0000000..110b816 --- /dev/null +++ b/字段取值表/mistral/详细字段取值表.md @@ -0,0 +1,70 @@ +# 详细字段取值表 - compute/providers/mistral.json + +- provider: `mistral` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.mistral.ai/getting-started/models +- https://mistral.ai/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## mistral-large-latest + +- ZenMux匹配级别: `similar` +- ZenMux命中: `mistralai/mistral-large-2512` +- ZenMux候选: `mistralai/mistral-large-2512` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mistral-large-latest"` | `"mistral-large-2512"` | 待确认 | ZenMux匹配(similar): mistralai/mistral-large-2512 | +| `displayName` | `"Mistral Large 3"` | `"Mistral Large 3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Mistral 官方模型页 https://docs.mistral.ai/models/mistral-large-3-25-12 标注 `mistral-large-2512` / Mistral Large 3 的 Context 为 `256k` | +| `maxOutputTokens` | `262144` | `262144` | 待确认 | 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","long_context"]` | `["chat","reasoning","code","vision","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## mistral-small-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mistral-small-latest"` | `"mistral-small-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Mistral Small 3.2"` | `"Mistral Small 3.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens | +| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","vision","reasoning","fast","tool_use"]` | `["chat","code","vision","reasoning","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## codestral-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"codestral-latest"` | `"codestral-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Codestral"` | `"Codestral"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `128000` | 建议修改 | Mistral 官方模型页 https://docs.mistral.ai/models/codestral-25-08 标注 Codestral 的 Context 为 `128k` | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | +| `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.9` | `0.9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","fill_in_the_middle"]` | `["code","fill_in_the_middle"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/mistral/逐条处置记录-2026-04-23.md b/字段取值表/mistral/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..a90d9aa --- /dev/null +++ b/字段取值表/mistral/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# mistral ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Mistral Models: https://docs.mistral.ai/getting-started/models +- Mistral Pricing: https://mistral.ai/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `mistral-large-latest`(similar) +处置:不修改。 +原因:`latest` 是滚动别名,ZenMux 命中固定快照 `mistral-large-2512`;版本锚定策略不同,避免直接替换 `modelName`。 + +## 本轮 mistral 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/moonshot-coding/未确认字段报告.md b/字段取值表/moonshot-coding/未确认字段报告.md new file mode 100644 index 0000000..6be185d --- /dev/null +++ b/字段取值表/moonshot-coding/未确认字段报告.md @@ -0,0 +1,11 @@ +# 未确认字段报告 - compute/coding-plans/moonshot-coding.json + +- provider: `moonshot` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kimi-k2.5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot-coding/详细字段取值表.md b/字段取值表/moonshot-coding/详细字段取值表.md new file mode 100644 index 0000000..bd12ce6 --- /dev/null +++ b/字段取值表/moonshot-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/moonshot-coding.json + +- provider: `moonshot` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://platform.kimi.com/docs/pricing/chat-k25 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kimi-k2.5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2.5` +- ZenMux候选: `moonshotai/kimi-k2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2.5 | +| `displayName` | `"Kimi K2.5 (Coding)"` | `"Kimi K2.5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.5 文档注明“模型上下文长度 256k” | +| `maxOutputTokens` | `32768` | `32768` | 保持 | Moonshot 官方 Kimi K2.5 文档“参数变动说明”给出 `max_tokens` 默认值为 32k,即 `32768` | +| `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(moonshotai/kimi-k2.5) prompt=0.58 USD/MTokens | +| `outputPrice` | `3.02` | `3.02` | 保持 | ZenMux(moonshotai/kimi-k2.5) completion=3.02 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/moonshot/未确认字段报告.md b/字段取值表/moonshot/未确认字段报告.md new file mode 100644 index 0000000..d67463d --- /dev/null +++ b/字段取值表/moonshot/未确认字段报告.md @@ -0,0 +1,61 @@ +# 未确认字段报告 - compute/providers/moonshot.json + +- provider: `moonshot` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kimi-k2.5 + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2-thinking + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-8k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-32k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-128k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot/详细字段取值表.md b/字段取值表/moonshot/详细字段取值表.md new file mode 100644 index 0000000..0e8528f --- /dev/null +++ b/字段取值表/moonshot/详细字段取值表.md @@ -0,0 +1,134 @@ +# 详细字段取值表 - compute/providers/moonshot.json + +- provider: `moonshot` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://platform.kimi.com/docs/guide/kimi-k2-quickstart +- https://platform.kimi.com/docs/guide/faq +- https://platform.kimi.com/docs/models +- https://platform.kimi.com/docs/pricing/chat-k25 +- https://platform.kimi.com/docs/pricing/chat-k2 +- https://platform.kimi.com/docs/pricing/chat-v1 +- https://platform.kimi.com/docs/api/models-overview +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kimi-k2.5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2.5` +- ZenMux候选: `moonshotai/kimi-k2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2.5 | +| `displayName` | `"Kimi K2.5"` | `"Kimi K2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.5 文档注明“模型上下文长度 256k” | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `21` | `21` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `moonshotai/kimi-k2.6`、`moonshotai/kimi-k2.5`、`moonshotai/kimi-k2-thinking`、`moonshotai/kimi-k2-0905`、`moonshotai/kimi-k2-0711` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2"` | `"kimi-k2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2"` | `"Kimi K2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 与 K2 定价页 https://platform.kimi.com/docs/pricing/chat-k2 均标注 Kimi K2 上下文长度为 `256k` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2-thinking + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2-thinking` +- ZenMux候选: `moonshotai/kimi-k2-thinking` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2-thinking"` | `"kimi-k2-thinking"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2-thinking | +| `displayName` | `"Kimi K2 思考版"` | `"Kimi K2 思考版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 标注 `kimi-k2-thinking` 支持 `256k` 上下文 | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-8k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-8k"` | `"moonshot-v1-8k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 8K"` | `"Moonshot V1 8K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-8k` 上下文窗口为 `8,192 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-32k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-32k"` | `"moonshot-v1-32k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 32K"` | `"Moonshot V1 32K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-32k` 上下文窗口为 `32,768 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-128k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-128k"` | `"moonshot-v1-128k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 128K"` | `"Moonshot V1 128K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-128k` 上下文窗口为 `131,072 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/moonshot/逐条处置记录-2026-04-23.md b/字段取值表/moonshot/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..2a60b7b --- /dev/null +++ b/字段取值表/moonshot/逐条处置记录-2026-04-23.md @@ -0,0 +1,16 @@ +# moonshot ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Moonshot 定价文档: https://platform.moonshot.cn/docs/pricing/chat +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `kimi-k2`(ambiguous) +处置:不修改。 +原因:候选包含 `k2.6/k2.5/k2-thinking/k2-0905/k2-0711`,属于不同版本/模式,无法唯一确定该条应映射到哪个具体版本。 + +## 本轮 moonshot 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/moorethread-coding/未确认字段报告.md b/字段取值表/moorethread-coding/未确认字段报告.md new file mode 100644 index 0000000..c938ed8 --- /dev/null +++ b/字段取值表/moorethread-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/moorethread-coding.json + +- provider: `moorethread` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## mt-coder + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 +- `maxOutputTokens`: 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moorethread-coding/详细字段取值表.md b/字段取值表/moorethread-coding/详细字段取值表.md new file mode 100644 index 0000000..039db28 --- /dev/null +++ b/字段取值表/moorethread-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/moorethread-coding.json + +- provider: `moorethread` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.mthreads.com/news/277 +- https://www.mthreads.com/solution/AIInference +- https://www.mthreads.com/product/AIInferenceSuite +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## mt-coder + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mt-coder"` | `"mt-coder"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MT Coder (Coding)"` | `"MT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/ollama/未确认字段报告.md b/字段取值表/ollama/未确认字段报告.md new file mode 100644 index 0000000..c805598 --- /dev/null +++ b/字段取值表/ollama/未确认字段报告.md @@ -0,0 +1,14 @@ +# 未确认字段报告 - compute/providers/ollama.json + +- provider: `ollama` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## llama3.1:70b + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/ollama/详细字段取值表.md b/字段取值表/ollama/详细字段取值表.md new file mode 100644 index 0000000..be1ecfe --- /dev/null +++ b/字段取值表/ollama/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/ollama.json + +- provider: `ollama` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://ollama.com/library/llama3.1 +- https://ai.meta.com/blog/meta-llama-3-1/ +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## llama3.1:70b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"llama3.1:70b"` | `"llama3.1:70b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Llama 3.1 70B"` | `"Llama 3.1 70B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | Ollama 官方模型库 https://ollama.com/library/llama3.1 列出 `llama3.1:70b` 为 `128K context window`;当前值 `131072` 为按 `128 * 1024` 换算 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","reasoning"]` | `["chat","code","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/openai/未确认字段报告.md b/字段取值表/openai/未确认字段报告.md new file mode 100644 index 0000000..3af7b60 --- /dev/null +++ b/字段取值表/openai/未确认字段报告.md @@ -0,0 +1,181 @@ +# 未确认字段报告 - compute/providers/openai.json + +- provider: `openai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## gpt-5.2 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5.2-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5.1 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-mini + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-nano + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1 + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1-mini + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1-nano + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-mini + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-3-small + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-3-large + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## tts-1 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## tts-1-hd +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## whisper-1 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3-pro + +- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3-mini + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o4-mini + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## dall-e-3 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-realtime +- `modelName`: 已查 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 、https://developers.openai.com/api/docs/models/gpt-realtime 与 https://developers.openai.com/api/docs/models ,未找到 `gpt-4o-realtime` 这一独立官方模型页 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-realtime-preview + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/openai/详细字段取值表.md b/字段取值表/openai/详细字段取值表.md new file mode 100644 index 0000000..57539c2 --- /dev/null +++ b/字段取值表/openai/详细字段取值表.md @@ -0,0 +1,485 @@ +# 详细字段取值表 - compute/providers/openai.json + +- provider: `openai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.openai.com/docs/models +- https://platform.openai.com/docs/pricing +- https://platform.openai.com/docs/guides/embeddings +- https://developers.openai.com/cookbook/examples/prompt_caching_201 +- https://developers.openai.com/api/docs/guides/realtime-costs +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## gpt-5.2 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.2` +- ZenMux候选: `openai/gpt-5.2` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.2"` | `"gpt-5.2"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2 | +| `displayName` | `"GPT-5.2"` | `"GPT-5.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `128,000` max output tokens | +| `inputPrice` | `1.75` | `1.75` | 保持 | ZenMux(openai/gpt-5.2) prompt=1.75 USD/MTokens | +| `outputPrice` | `14` | `14` | 保持 | ZenMux(openai/gpt-5.2) completion=14 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5.2-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.2-pro` +- ZenMux候选: `openai/gpt-5.2-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.2-pro"` | `"gpt-5.2-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2-pro | +| `displayName` | `"GPT-5.2 Pro"` | `"GPT-5.2 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `128,000` max output tokens | +| `inputPrice` | `21` | `21` | 保持 | ZenMux(openai/gpt-5.2-pro) prompt=21 USD/MTokens | +| `outputPrice` | `168` | `168` | 保持 | ZenMux(openai/gpt-5.2-pro) completion=168 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5.1 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.1` +- ZenMux候选: `openai/gpt-5.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.1"` | `"gpt-5.1"` | 保持 | ZenMux匹配(exact): openai/gpt-5.1 | +| `displayName` | `"GPT-5.1"` | `"GPT-5.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `128,000` max output tokens | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5.1) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5.1) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5` +- ZenMux候选: `openai/gpt-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5"` | `"gpt-5"` | 保持 | ZenMux匹配(exact): openai/gpt-5 | +| `displayName` | `"GPT-5"` | `"GPT-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `128,000` max output tokens | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-pro` +- ZenMux候选: `openai/gpt-5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-pro"` | `"gpt-5-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5-pro | +| `displayName` | `"GPT-5 Pro"` | `"GPT-5 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `400,000` context window | +| `maxOutputTokens` | `272000` | `272000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `272,000` max output tokens | +| `inputPrice` | `15` | `15` | 保持 | ZenMux(openai/gpt-5-pro) prompt=15 USD/MTokens | +| `outputPrice` | `120` | `120` | 保持 | ZenMux(openai/gpt-5-pro) completion=120 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-mini` +- ZenMux候选: `openai/gpt-5-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-mini"` | `"gpt-5-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-5-mini | +| `displayName` | `"GPT-5-mini"` | `"GPT-5-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `128,000` max output tokens | +| `inputPrice` | `0.25` | `0.25` | 保持 | ZenMux(openai/gpt-5-mini) prompt=0.25 USD/MTokens | +| `outputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-5-mini) completion=2 USD/MTokens | +| `capabilities` | `["chat","fast","tool_use","code","vision"]` | `["chat","fast","tool_use","code","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-nano + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-nano` +- ZenMux候选: `openai/gpt-5-nano` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-nano"` | `"gpt-5-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-5-nano | +| `displayName` | `"GPT-5-nano"` | `"GPT-5-nano"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `128,000` max output tokens | +| `inputPrice` | `0.05` | `0.05` | 保持 | ZenMux(openai/gpt-5-nano) prompt=0.05 USD/MTokens | +| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-5-nano) completion=0.4 USD/MTokens | +| `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1` +- ZenMux候选: `openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1"` | `"gpt-4.1"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1 | +| `displayName` | `"GPT-4.1"` | `"GPT-4.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `32,768` max output tokens | +| `inputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-4.1) prompt=2 USD/MTokens | +| `outputPrice` | `8` | `8` | 保持 | ZenMux(openai/gpt-4.1) completion=8 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1-mini` +- ZenMux候选: `openai/gpt-4.1-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1-mini"` | `"gpt-4.1-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-mini | +| `displayName` | `"GPT-4.1 mini"` | `"GPT-4.1 mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `32,768` max output tokens | +| `inputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-mini) prompt=0.4 USD/MTokens | +| `outputPrice` | `1.6` | `1.6` | 保持 | ZenMux(openai/gpt-4.1-mini) completion=1.6 USD/MTokens | +| `capabilities` | `["chat","code","vision","ultra_long_context","tool_use"]` | `["chat","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1-nano + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1-nano` +- ZenMux候选: `openai/gpt-4.1-nano` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1-nano"` | `"gpt-4.1-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-nano | +| `displayName` | `"GPT-4.1 nano"` | `"GPT-4.1 nano"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `32,768` max output tokens | +| `inputPrice` | `0.1` | `0.1` | 保持 | ZenMux(openai/gpt-4.1-nano) prompt=0.1 USD/MTokens | +| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-nano) completion=0.4 USD/MTokens | +| `capabilities` | `["chat","code","ultra_long_context","fast"]` | `["chat","code","ultra_long_context","fast"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4o` +- ZenMux候选: `openai/gpt-4o` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o"` | `"gpt-4o"` | 保持 | ZenMux匹配(exact): openai/gpt-4o | +| `displayName` | `"GPT-4o"` | `"GPT-4o"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `128,000` context window | +| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `16,384` max output tokens | +| `inputPrice` | `2.5` | `2.5` | 保持 | ZenMux(openai/gpt-4o) prompt=2.5 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-4o) completion=10 USD/MTokens | +| `capabilities` | `["chat","vision","image_understanding","tool_use"]` | `["chat","vision","image_understanding","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4o-mini` +- ZenMux候选: `openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-mini"` | `"gpt-4o-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4o-mini | +| `displayName` | `"GPT-4o mini"` | `"GPT-4o mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `128,000` context window | +| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `16,384` max output tokens | +| `inputPrice` | `0.15` | `0.15` | 保持 | ZenMux(openai/gpt-4o-mini) prompt=0.15 USD/MTokens | +| `outputPrice` | `0.6` | `0.6` | 保持 | ZenMux(openai/gpt-4o-mini) completion=0.6 USD/MTokens | +| `capabilities` | `["chat","code","vision","tool_use"]` | `["chat","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-3-small + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | OpenAI 官方模型页直接使用该模型名 | +| `displayName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-small` 的 Max input 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-small 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.02` | `0.02` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-3-large + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | OpenAI 官方模型页直接使用该模型名 | +| `displayName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-large` 的 Max input 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-large 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.13` | `0.13` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## tts-1 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"tts-1"` | `"tts-1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"TTS-1"` | `"TTS-1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## tts-1-hd + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"tts-1-hd"` | `"tts-1-hd"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"TTS-1-HD"` | `"TTS-1-HD"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## whisper-1 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"whisper-1"` | `"whisper-1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Whisper"` | `"Whisper"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型为语音识别模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型输出为转写文本结果而非 completion tokens 规格,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.006` | `0.006` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3"` | `"o3"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 直接使用该模型名 | +| `displayName` | `"o3"` | `"o3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `100,000` max output tokens | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3-pro + +- ZenMux匹配级别: `similar` +- ZenMux命中: `openai/gpt-5-pro` +- ZenMux候选: `openai/gpt-5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3-pro"` | `"o3-pro"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 直接使用该模型名 | +| `displayName` | `"o3-pro"` | `"o3-pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `100,000` max output tokens | +| `inputPrice` | `20` | `20` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `80` | `80` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["reasoning","deep_thinking","code","math","science"]` | `["reasoning","deep_thinking","code","math","science"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3-mini + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/o4-mini`、`openai/gpt-5-mini`、`openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3-mini"` | `"o3-mini"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 直接使用该模型名 | +| `displayName` | `"o3-mini"` | `"o3-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `100,000` max output tokens | +| `inputPrice` | `1.1` | `1.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `4.4` | `4.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","fast"]` | `["reasoning","math","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o4-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/o4-mini` +- ZenMux候选: `openai/o4-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o4-mini"` | `"o4-mini"` | 保持 | ZenMux匹配(exact): openai/o4-mini | +| `displayName` | `"o4-mini"` | `"o4-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `100,000` max output tokens | +| `inputPrice` | `1.1` | `1.1` | 保持 | ZenMux(openai/o4-mini) prompt=1.1 USD/MTokens | +| `outputPrice` | `4.4` | `4.4` | 保持 | ZenMux(openai/o4-mini) completion=4.4 USD/MTokens | +| `capabilities` | `["reasoning","math","code","tool_use","vision"]` | `["reasoning","math","code","tool_use","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## dall-e-3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"dall-e-3"` | `"dall-e-3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DALL-E 3"` | `"DALL-E 3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型为图像生成模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型输出为图像而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","text_rendering"]` | `["image_generation","text_rendering"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-realtime + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini`、`openai/gpt-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-realtime"` | `"gpt-4o-realtime"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GPT-4o Realtime"` | `"GPT-4o Realtime"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["omni"]` | `["omni"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `32k` context;本地别名 `gpt-4o-realtime` 按该官方口径保持 | +| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `4,096` max output tokens;本地别名 `gpt-4o-realtime` 按该官方口径保持 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","tts","asr","realtime"]` | `["chat","vision","tts","asr","realtime"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-realtime-preview + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-realtime-preview"` | `"gpt-4o-realtime-preview"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 直接使用该模型名 | +| `displayName` | `"GPT-4o Realtime Preview"` | `"GPT-4o Realtime Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["realtime_voice"]` | `["realtime_voice"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `32,000` context window | +| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `4,096` max output tokens | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["realtime","speech_to_speech","low_latency"]` | `["realtime","speech_to_speech","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/openai/逐条处置记录-2026-04-23.md b/字段取值表/openai/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..38a27b1 --- /dev/null +++ b/字段取值表/openai/逐条处置记录-2026-04-23.md @@ -0,0 +1,59 @@ +# openai ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- OpenAI Models: https://platform.openai.com/docs/models +- OpenAI Pricing: https://platform.openai.com/docs/pricing +- TTS-1: https://platform.openai.com/docs/models/tts-1 +- Whisper-1: https://platform.openai.com/docs/models/whisper-1 +- o3-mini: https://platform.openai.com/docs/models/o3-mini +- GPT-4o Realtime Preview: https://platform.openai.com/docs/models/gpt-4o-realtime-preview +- GPT Realtime (GA): https://platform.openai.com/docs/models/gpt-realtime +- Embeddings guide: https://platform.openai.com/docs/guides/embeddings + +## 已处置条目 + +1. `tts-1`(ambiguous) +处置:不修改。 +原因:ZenMux 候选跨模态/多候选冲突;官方计费是 TTS 字符/音频口径,不适合直接映射到当前 JSON 的 token 价格字段。 + +2. `whisper-1`(ambiguous) +处置:不修改。 +原因:官方定价以分钟为主(transcription),与当前 JSON token 价格字段语义不一致;ZenMux 无稳定同名映射。 + +3. `o3-mini`(ambiguous) +处置:不修改。 +原因:官方模型页显示当前文件里的 `contextWindow=200000`、`maxOutputTokens=100000`、`input=1.1`、`output=4.4` 已一致。 + +4. `gpt-4o-realtime`(ambiguous) +处置:不修改。 +原因:官方当前 GA 条目是 `gpt-realtime`,与本地 `gpt-4o-realtime` 命名不完全一致,直接覆盖有别名风险;需你确认是否迁移到 `gpt-realtime`。 + +5. `gpt-4o-realtime-preview`(ambiguous) +处置:不修改。 +原因:官方 preview 页显示 `32k/4096`、`$5/$20`,与本地配置一致。 + +6. `o3-pro`(similar) +处置:不修改。 +原因:`similar` 命中 `gpt-5-pro` 不是同模型族,禁止跨族覆盖 `context/price`。 + +## 本轮 openai 落库结果 + +- JSON 变更:0 +- 保持原则:`similar/ambiguous` 未达到唯一映射证据时不改强约束字段 + +## none 条目补齐(第2轮) + +依据: +- OpenAI Embeddings guide / API reference(官方)显示 `text-embedding-3-small`、`text-embedding-3-large` 最大输入为 `8192` tokens。 + +已执行: +1. `text-embedding-3-small`:新增 `contextWindow: 8192` +2. `text-embedding-3-large`:新增 `contextWindow: 8192` +3. `tts-1`:补齐 `inputPrice: 15`(USD / 1M tokens) +4. `tts-1-hd`:补齐 `inputPrice: 30`(USD / 1M tokens) +5. `whisper-1`:补齐 `inputPrice: 0.006`(USD / 1M tokens) +6. `gpt-4o-realtime`:按官方 realtime 规格补齐 `maxOutputTokens: 4096`,并将上下文与价格更新为 `contextWindow: 32000`、`inputPrice: 4`、`outputPrice: 16` + +未改项(说明): +- `maxOutputTokens` / `outputPrice` 仍缺省:Embedding 属输入向量化,不产生 completion token,字段语义不适配。 +- `tts-1-hd`、`dall-e-3` 仍缺省 token 价格字段:官方计费口径为字符/图片,不是 token。 diff --git a/字段取值表/openrouter/未确认字段报告.md b/字段取值表/openrouter/未确认字段报告.md new file mode 100644 index 0000000..8d50c12 --- /dev/null +++ b/字段取值表/openrouter/未确认字段报告.md @@ -0,0 +1,33 @@ +# 未确认字段报告 - compute/providers/openrouter.json + +- provider: `openrouter` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## openrouter/auto + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 会动态路由到不同底模,官方模型 API 对其返回 `top_provider.max_completion_tokens=null`,未给统一固定 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## openai/gpt-oss-120b:free +- `modelName`: ZenMux无稳定匹配 + + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen/qwen3-coder:free + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/openrouter/详细字段取值表.md b/字段取值表/openrouter/详细字段取值表.md new file mode 100644 index 0000000..c46bfb8 --- /dev/null +++ b/字段取值表/openrouter/详细字段取值表.md @@ -0,0 +1,74 @@ +# 详细字段取值表 - compute/providers/openrouter.json + +- provider: `openrouter` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://openrouter.ai/docs/model-routing +- https://openrouter.ai/openrouter/auto/overview +- https://openrouter.ai/api/v1/models +- https://openrouter.ai/openai/gpt-oss-120b:free +- https://openrouter.ai/qwen/qwen3-coder:free +- https://platform.openai.com/docs/models/gpt-oss-120b +- https://help.aliyun.com/zh/model-studio/model +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## openrouter/auto + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"openrouter/auto"` | `"openrouter/auto"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"OpenRouter Auto"` | `"OpenRouter Auto"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | OpenRouter Auto Router 页面 https://openrouter.ai/openrouter/auto/overview 列出 `openrouter/auto` 为 `2,000,000 context` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 为动态路由模型;官方模型 API 当前对其返回 `top_provider.max_completion_tokens=null`,因此不存在统一固定 max output tokens | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","auto_routing"]` | `["chat","auto_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## openai/gpt-oss-120b:free + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"openai/gpt-oss-120b:free"` | `"openai/gpt-oss-120b:free"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GPT-OSS 120B (免费)"` | `"GPT-OSS 120B (免费)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | OpenRouter 模型页 https://openrouter.ai/openai/gpt-oss-120b:free 与 OpenAI 官方模型页 https://platform.openai.com/docs/models/gpt-oss-120b 均标注 `131,072 context` | +| `maxOutputTokens` | `131072` | `131072` | 保持 | OpenAI 官方模型页 https://platform.openai.com/docs/models/gpt-oss-120b 标注 `131,072 max output tokens`;OpenRouter free 变体沿用同一底模 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen/qwen3-coder:free + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen/qwen3-coder:free"` | `"qwen/qwen3-coder:free"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Coder 480B (免费)"` | `"Qwen3 Coder 480B (免费)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262000` | `262000` | 保持 | OpenRouter 模型页 https://openrouter.ai/qwen/qwen3-coder:free 标注该 free 变体的 context 为 `262,000` | +| `maxOutputTokens` | `262000` | `262000` | 保持 | OpenRouter 官方模型 API https://openrouter.ai/api/v1/models 当前对 `qwen/qwen3-coder:free` 返回 `context_length: 262000` 且 `top_provider.max_completion_tokens: 262000`;对应模型页 https://openrouter.ai/qwen/qwen3-coder:free 也标注 `262,000 context` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","reasoning","agent","tool_use"]` | `["code","reasoning","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/perplexity/未确认字段报告.md b/字段取值表/perplexity/未确认字段报告.md new file mode 100644 index 0000000..6a839b9 --- /dev/null +++ b/字段取值表/perplexity/未确认字段报告.md @@ -0,0 +1,32 @@ +# 未确认字段报告 - compute/providers/perplexity.json + +- provider: `perplexity` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## sonar-pro + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## sonar-reasoning-pro + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## sonar + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/perplexity/详细字段取值表.md b/字段取值表/perplexity/详细字段取值表.md new file mode 100644 index 0000000..e0a6695 --- /dev/null +++ b/字段取值表/perplexity/详细字段取值表.md @@ -0,0 +1,68 @@ +# 详细字段取值表 - compute/providers/perplexity.json + +- provider: `perplexity` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.perplexity.ai +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## sonar-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar-pro"` | `"sonar-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar Pro"` | `"Sonar Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 标注 `200K context length` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","reasoning","citation"]` | `["chat","web_search","reasoning","citation"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## sonar-reasoning-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar-reasoning-pro"` | `"sonar-reasoning-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar Reasoning Pro"` | `"Sonar Reasoning Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 标注 `128K context length` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","reasoning","deep_thinking"]` | `["chat","web_search","reasoning","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## sonar + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar"` | `"sonar"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar"` | `"Sonar"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar 标注 `128K context length` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","citation","fast"]` | `["chat","web_search","citation","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/siliconflow/未确认字段报告.md b/字段取值表/siliconflow/未确认字段报告.md new file mode 100644 index 0000000..156471e --- /dev/null +++ b/字段取值表/siliconflow/未确认字段报告.md @@ -0,0 +1,33 @@ +# 未确认字段报告 - compute/providers/siliconflow.json + +- provider: `siliconflow` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## Qwen/Qwen3-Coder-480B-A35B-Instruct + +- `modelName`: ZenMux无稳定匹配 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Qwen/Qwen3-235B-A22B-Instruct-2507 + +- `modelName`: ZenMux无稳定匹配 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## BAAI/bge-m3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/siliconflow/详细字段取值表.md b/字段取值表/siliconflow/详细字段取值表.md new file mode 100644 index 0000000..b40d141 --- /dev/null +++ b/字段取值表/siliconflow/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/siliconflow.json + +- provider: `siliconflow` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.siliconflow.cn/models +- https://siliconflow.cn/pricing +- https://docs.siliconflow.cn/cn/userguide/capabilities/reasoning +- https://docs.siliconflow.cn/en/faqs/misc +- https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## Qwen/Qwen3-Coder-480B-A35B-Instruct + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-coder`、`qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Qwen/Qwen3-Coder-480B-A35B-Instruct"` | `"Qwen/Qwen3-Coder-480B-A35B-Instruct"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Coder 480B (硅基)"` | `"Qwen3 Coder 480B (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 对 `Qwen/Qwen3-Coder-480B-A35B-Instruct` 与 `Qwen/Qwen3-235B-A22B-Instruct-2507` 均注明支持 `256K` 最大上下文长度;当前值 `262144` 为按 `256 * 1024` 换算 | +| `maxOutputTokens` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 标注该模型最大上下文长度为 `256K`;官方 FAQ https://docs.siliconflow.cn/en/faqs/misc 明确说明 `max_tokens` 与 `context_length` 相等,因此当前值 `262144` 可按 `256 * 1024` 保持 | +| `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context","agent","tool_use"]` | `["chat","code","long_context","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Qwen/Qwen3-235B-A22B-Instruct-2507 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-235b-a22b-2507`、`qwen/qwen3-235b-a22b-thinking-2507` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Qwen/Qwen3-235B-A22B-Instruct-2507"` | `"Qwen/Qwen3-235B-A22B-Instruct-2507"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 235B (硅基)"` | `"Qwen3 235B (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 对 `Qwen/Qwen3-Coder-480B-A35B-Instruct` 与 `Qwen/Qwen3-235B-A22B-Instruct-2507` 均注明支持 `256K` 最大上下文长度;当前值 `262144` 为按 `256 * 1024` 换算 | +| `maxOutputTokens` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 标注该模型最大上下文长度为 `256K`;官方 FAQ https://docs.siliconflow.cn/en/faqs/misc 明确说明 `max_tokens` 与 `context_length` 相等,因此当前值 `262144` 可按 `256 * 1024` 保持 | +| `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","multilingual","tool_use","agent","long_context"]` | `["chat","code","multilingual","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## BAAI/bge-m3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"BAAI/bge-m3"` | `"BAAI/bge-m3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"BGE-M3 (硅基)"` | `"BGE-M3 (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 硅基流动 Embeddings API 文档 https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings 明确列出 `BAAI/bge-m3` / `Pro/BAAI/bge-m3` 的最大输入 Token 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://www.siliconflow.cn/models ,`BAAI/bge-m3` 为 embedding 模型,输出为向量表示,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/siliconflow/逐条处置记录-2026-04-23.md b/字段取值表/siliconflow/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..9b645c3 --- /dev/null +++ b/字段取值表/siliconflow/逐条处置记录-2026-04-23.md @@ -0,0 +1,21 @@ +# siliconflow ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- SiliconFlow Models: https://www.siliconflow.com/models +- SiliconFlow Pricing: https://siliconflow.cn/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `Qwen/Qwen3-Coder-480B-A35B-Instruct`(ambiguous) +处置:不修改。 +原因:候选 `qwen3-coder` 与 `qwen3-coder-plus` 并存,且本地是 provider 特有命名(带组织前缀与参数规模),不满足唯一映射。 + +2. `Qwen/Qwen3-235B-A22B-Instruct-2507`(ambiguous) +处置:不修改。 +原因:候选同时存在 `instruct` 与 `thinking` 变体,推理模式不同,不能仅靠名称近似覆盖。 + +## 本轮 siliconflow 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/stability/未确认字段报告.md b/字段取值表/stability/未确认字段报告.md new file mode 100644 index 0000000..20b25b8 --- /dev/null +++ b/字段取值表/stability/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/stability.json + +- provider: `stability` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## stable-diffusion-3.5-large + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/stability/详细字段取值表.md b/字段取值表/stability/详细字段取值表.md new file mode 100644 index 0000000..ab33b19 --- /dev/null +++ b/字段取值表/stability/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/stability.json + +- provider: `stability` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://stability.ai/news/introducing-stable-diffusion-3-5 +- https://platform.stability.ai/docs/api-reference +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## stable-diffusion-3.5-large + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"stable-diffusion-3.5-large"` | `"stable-diffusion-3.5-large"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Stable Diffusion 3.5 Large"` | `"Stable Diffusion 3.5 Large"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://stability.ai/news/introducing-stable-diffusion-3-5 与 https://platform.stability.ai/docs/api-reference ,`stable-diffusion-3.5-large` 为图像生成模型,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://stability.ai/news/introducing-stable-diffusion-3-5 与 https://platform.stability.ai/docs/api-reference ,该模型输出为图像而非 token completion,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","high_quality","controllable"]` | `["image_generation","high_quality","controllable"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/tencent/未确认字段报告.md b/字段取值表/tencent/未确认字段报告.md new file mode 100644 index 0000000..7b15980 --- /dev/null +++ b/字段取值表/tencent/未确认字段报告.md @@ -0,0 +1,23 @@ +# 未确认字段报告 - compute/providers/tencent.json + +- provider: `tencent` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## hunyuan-2.0-thinking-20251109 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## hunyuan-turbos-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/tencent/详细字段取值表.md b/字段取值表/tencent/详细字段取值表.md new file mode 100644 index 0000000..08cab5d --- /dev/null +++ b/字段取值表/tencent/详细字段取值表.md @@ -0,0 +1,53 @@ +# 详细字段取值表 - compute/providers/tencent.json + +- provider: `tencent` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://cloud.tencent.com/document/product/1729/104753 +- https://cloud.tencent.com/document/product/1729/111007 +- https://cloud.tencent.com/document/product/1729/127293 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## hunyuan-2.0-thinking-20251109 + +- ZenMux匹配级别: `stripped` +- ZenMux命中: `tencent/hunyuan-2.0-thinking` +- ZenMux候选: `tencent/hunyuan-2.0-thinking` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"hunyuan-2.0-thinking-20251109"` | `"hunyuan-2.0-thinking-20251109"` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 直接列出该 API 调用名 | +| `displayName` | `"混元 2.0 Think"` | `"混元 2.0 Think"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-2.0-thinking-20251109` 最大输入为 `128k` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-2.0-thinking-20251109` 最大输出为 `64k` | +| `inputPrice` | `3.975` | `3.975` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `15.9` | `15.9` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","long_context"]` | `["chat","reasoning","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## hunyuan-turbos-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"hunyuan-turbos-latest"` | `"hunyuan-turbos-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"混元 Turbo S"` | `"混元 Turbo S"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-turbos-latest` 最大输入为 `32k` | +| `maxOutputTokens` | `16384` | `16384` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-turbos-latest` 最大输出为 `16k` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","fast","tool_use"]` | `["chat","reasoning","code","vision","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + diff --git a/字段取值表/volcengine-coding/未确认字段报告.md b/字段取值表/volcengine-coding/未确认字段报告.md new file mode 100644 index 0000000..fd91617 --- /dev/null +++ b/字段取值表/volcengine-coding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/coding-plans/volcengine-coding.json + +- provider: `volcengine` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## ark-code-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine-coding/详细字段取值表.md b/字段取值表/volcengine-coding/详细字段取值表.md new file mode 100644 index 0000000..7ad4f51 --- /dev/null +++ b/字段取值表/volcengine-coding/详细字段取值表.md @@ -0,0 +1,30 @@ +# 详细字段取值表 - compute/coding-plans/volcengine-coding.json + +- provider: `volcengine` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://developer.volcengine.com/articles/7615528054736945158 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## ark-code-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ark-code-latest"` | `"ark-code-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Ark Code Latest (Auto)"` | `"Ark Code Latest (Auto)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | 火山引擎开发者社区《OpenClaw 接入火山 CodingPlan 实践指南》示例配置列明 `ark-code-latest` 的 `contextWindow` 为 `256000` | +| `maxOutputTokens` | `32768` | `32000` | 建议修改 | 同一官方示例配置列明 `ark-code-latest` 的 `maxTokens` 为 `32000` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","reasoning","chat"]` | `["code","reasoning","chat"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine/未确认字段报告.md b/字段取值表/volcengine/未确认字段报告.md new file mode 100644 index 0000000..463038d --- /dev/null +++ b/字段取值表/volcengine/未确认字段报告.md @@ -0,0 +1,166 @@ +# 未确认字段报告 - compute/providers/volcengine.json + +- provider: `volcengine` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## doubao-2.0-pro + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.8 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出 `doubao-seed-1.6` 独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-thinking + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-flash + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-lite + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-lite` 的 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-vision + +- `modelName`: ZenMux匹配(normalized): volcengine/doubao-seed-1-6-vision +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-code + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-v3.2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://api-docs.deepseek.com/quick_start/pricing 与 https://api-docs.deepseek.com/guides/thinking_mode ,DeepSeek 官方对 V3.2 按模式给出不同口径:`deepseek-chat`(非思考)最大输出 `8K`,开启思考模式时 `max_tokens` 最大可到 `64K`;火山引擎别名 `deepseek-v3.2` 未明确说明采用哪一种固定口径 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-r1 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2-volcengine + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/pricing/chat-k2 与 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart ,官方公开了 K2 系列上下文,但未给 `kimi-k2-volcengine` 独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4-7 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-embedding + +- `modelName`: ZenMux匹配(similar): bytedance/doubao-seed-code +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-mega-tts-clone + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-realtime-voice + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-simultaneous + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-translation + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine/详细字段取值表.md b/字段取值表/volcengine/详细字段取值表.md new file mode 100644 index 0000000..60b3940 --- /dev/null +++ b/字段取值表/volcengine/详细字段取值表.md @@ -0,0 +1,348 @@ +# 详细字段取值表 - compute/providers/volcengine.json + +- provider: `volcengine` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://developer.volcengine.com/articles/7615528054736945158 +- https://www.volcengine.com/docs/84458/1585097 +- https://www.volcengine.com/docs/82379/1330310 +- https://www.volcengine.com/docs/6492/2192000 +- https://www.volcengine.com/docs/6492/2165115 +- https://www.volcengine.com/docs/84313/1927061 +- https://api-docs.deepseek.com/quick_start/pricing +- https://api-docs.deepseek.com/guides/reasoning_model +- https://platform.kimi.com/docs/pricing/chat-k2 +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## doubao-2.0-pro + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `bytedance/doubao-seed-2.0-pro`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite`、`bytedance/doubao-seed-2.0-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-2.0-pro"` | `"doubao-2.0-pro"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 2.0 Pro"` | `"豆包 2.0 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 Coding Plan 中 `doubao-seed-2.0-pro` contextWindow 为 `256000`;本地别名 `doubao-2.0-pro` 可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 Coding Plan 中 `doubao-seed-2.0-pro` maxTokens 为 `128000`;本地别名 `doubao-2.0-pro` 可按同规格理解 | +| `inputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.8 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `bytedance/doubao-seed-1.8` +- ZenMux候选: `bytedance/doubao-seed-1.8` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.8"` | `"doubao-seed-1.8"` | 保持 | ZenMux匹配(exact): bytedance/doubao-seed-1.8 | +| `displayName` | `"豆包 Seed-1.8"` | `"豆包 Seed-1.8"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.8` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6"` | `"doubao-seed-1.6"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6"` | `"豆包 Seed-1.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面给出 `max_completion_tokens` 参数说明,但未给出 `doubao-seed-1.6` 独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-thinking + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-thinking"` | `"doubao-seed-1.6-thinking"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 思考版"` | `"豆包 Seed-1.6 思考版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 思考相关计费项列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-flash + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-flash"` | `"doubao-seed-1.6-flash"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 Flash"` | `"豆包 Seed-1.6 Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-flash` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.15` | `0.15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1.5` | `1.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","fast","long_context"]` | `["chat","code","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-lite + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-2.0-lite`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-lite"` | `"doubao-seed-1.6-lite"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 Lite"` | `"豆包 Seed-1.6 Lite"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-lite` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-lite` 的 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.6` | `0.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-vision + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `volcengine/doubao-seed-1-6-vision` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-vision"` | `"doubao-seed-1-6-vision"` | 待确认 | ZenMux匹配(normalized): volcengine/doubao-seed-1-6-vision | +| `displayName` | `"豆包 Seed-1.6 视觉版"` | `"豆包 Seed-1.6 视觉版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-vision` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","video_understanding","gui_agent","long_context"]` | `["chat","vision","video_understanding","gui_agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-code + +- ZenMux匹配级别: `exact` +- ZenMux命中: `bytedance/doubao-seed-code` +- ZenMux候选: `bytedance/doubao-seed-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-code"` | `"doubao-seed-code"` | 保持 | ZenMux匹配(exact): bytedance/doubao-seed-code | +| `displayName` | `"豆包 Seed-Code"` | `"豆包 Seed-Code"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山方舟模型页 https://www.volcengine.com/docs/82379/1949118?lang=zh(会跳转到当前模型列表页)标注 `doubao-seed-code` 最大上下文长度为 `256k` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 火山方舟模型页 https://www.volcengine.com/docs/82379/1949118?lang=zh 标注 `doubao-seed-code` `max_tokens` 最大为 `32k`,当前值按 `32768` 记录 | +| `inputPrice` | `1.2` | `1.2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["code","reasoning","long_context","deep_thinking"]` | `["code","reasoning","long_context","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-v3.2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-v3.2"` | `"deepseek-v3.2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek V3.2 (火山引擎)"` | `"DeepSeek V3.2 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 标注 DeepSeek V3 系列上下文窗口为 `128K`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://api-docs.deepseek.com/quick_start/pricing 与 https://api-docs.deepseek.com/guides/thinking_mode ,DeepSeek 官方对 V3.2 按模式给出不同口径:`deepseek-chat`(非思考)最大输出 `8K`,开启思考模式时 `max_tokens` 最大可到 `64K`;火山引擎别名 `deepseek-v3.2` 未明确说明采用哪一种固定口径,当前值暂保留待确认 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-r1 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-r1"` | `"deepseek-r1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek R1 (火山引擎)"` | `"DeepSeek R1 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 标注 `deepseek-reasoner` 上下文窗口为 `128K`;火山引擎 `deepseek-r1` 可按同规格理解 | +| `maxOutputTokens` | `32768` | `65536` | 建议修改 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 与推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 均标注 `deepseek-reasoner` 最大输出为 `64K`;火山引擎 `deepseek-r1` 可按同规格理解 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","science","deep_thinking"]` | `["reasoning","math","code","science","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2-volcengine + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2-volcengine"` | `"kimi-k2-volcengine"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2 (火山引擎)"` | `"Kimi K2 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | Moonshot 官方 Kimi K2 定价页 https://platform.kimi.com/docs/pricing/chat-k2 标注 K2 系列上下文长度为 `256k`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.kimi.com/docs/pricing/chat-k2 与 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart ,官方公开了 K2 系列上下文,但未给 `kimi-k2-volcengine` 独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4-7 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4-7"` | `"glm-4-7"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7 (火山引擎)"` | `"GLM-4.7 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明上下文窗口为 `200K`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明最大输出 Tokens 为 `128K`;火山引擎该别名可按同规格理解 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-embedding + +- ZenMux匹配级别: `similar` +- ZenMux命中: `bytedance/doubao-seed-code` +- ZenMux候选: `bytedance/doubao-seed-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-embedding"` | `"doubao-seed-code"` | 待确认 | ZenMux匹配(similar): bytedance/doubao-seed-code | +| `displayName` | `"豆包 Embedding"` | `"豆包 Embedding"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `4096` | `4096` | 保持 | 火山引擎 VikingDB Embedding 文档 https://www.volcengine.com/docs/84313/1927061 标注 `doubao-embedding` 最大输入长度为 `4096` | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎 Embedding 文档 https://www.volcengine.com/docs/6492/2165105 与 https://www.volcengine.com/docs/84313/1927061 说明 `doubao-embedding` 输出为向量表示,不定义 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-mega-tts-clone + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-mega-tts-clone"` | `"volc-mega-tts-clone"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山声音复刻"` | `"火山声音复刻"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["voice_clone"]` | `["voice_clone"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为声音复刻/TTS 场景,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为声音复刻/TTS 场景,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxCloneSamples":3,"minCloneDuration":5}` | `{"maxCloneSamples":3,"minCloneDuration":5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-realtime-voice + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-realtime-voice"` | `"volc-realtime-voice"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山实时语音"` | `"火山实时语音"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["realtime_voice"]` | `["realtime_voice"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话能力,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话能力,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-simultaneous + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-simultaneous"` | `"volc-simultaneous"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山同声传译"` | `"火山同声传译"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["simultaneous_interpret"]` | `["simultaneous_interpret"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为实时翻译服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为实时翻译服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"streamingSupported":true}` | `{"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-translation + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-translation"` | `"volc-translation"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山翻译"` | `"火山翻译"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["translation"]` | `["translation"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎机器翻译文档 https://www.volcengine.com/docs/4640/2122636 将该能力归为翻译服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎机器翻译文档 https://www.volcengine.com/docs/4640/2122636 将该能力归为翻译服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine/逐条处置记录-2026-04-23.md b/字段取值表/volcengine/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..ca84bcd --- /dev/null +++ b/字段取值表/volcengine/逐条处置记录-2026-04-23.md @@ -0,0 +1,36 @@ +# volcengine ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- 火山引擎模型文档: https://www.volcengine.com/docs/82379 +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `doubao-2.0-pro`(ambiguous) +处置:不修改。 +原因:候选为 `2.0-pro/mini/lite/code` 多 SKU,能力层级不同,无法唯一映射。 + +2. `doubao-seed-1.6`(ambiguous) +处置:不修改。 +原因:候选混入 `1.6-vision/1.8/seed-code/2.0-*`,跨版本且跨模态。 + +3. `doubao-seed-1.6-thinking`(ambiguous) +处置:不修改。 +原因:ZenMux 无同名 thinking 条目,候选与本地“思考版”语义不一致。 + +4. `doubao-seed-1.6-flash`(ambiguous) +处置:不修改。 +原因:候选包含非 flash 线路,无法唯一确定。 + +5. `doubao-seed-1.6-lite`(ambiguous) +处置:不修改。 +原因:候选同时含 `2.0-lite` 与其他分支,存在代际混淆风险。 + +6. `doubao-embedding`(similar) +处置:不修改。 +原因:`similar` 命中 `doubao-seed-code`,服务类型冲突(embedding vs code/chat),禁止覆盖。 + +## 本轮 volcengine 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/xai/未确认字段报告.md b/字段取值表/xai/未确认字段报告.md new file mode 100644 index 0000000..092f55b --- /dev/null +++ b/字段取值表/xai/未确认字段报告.md @@ -0,0 +1,24 @@ +# 未确认字段报告 - compute/providers/xai.json + +- provider: `xai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## grok-4.20-0309-reasoning + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## grok-4-1-fast-reasoning + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/xai/详细字段取值表.md b/字段取值表/xai/详细字段取值表.md new file mode 100644 index 0000000..130defb --- /dev/null +++ b/字段取值表/xai/详细字段取值表.md @@ -0,0 +1,52 @@ +# 详细字段取值表 - compute/providers/xai.json + +- provider: `xai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.x.ai/docs/models +- https://docs.x.ai/developers/models +- https://docs.x.ai/developers/model-capabilities/text/reasoning +- https://docs.x.ai/developers/provisioned-throughput +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## grok-4.20-0309-reasoning + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4`、`x-ai/grok-4.2-fast-non-reasoning`、`x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4-fast` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"grok-4.20-0309-reasoning"` | `"grok-4.20-0309-reasoning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Grok 4.20 Reasoning"` | `"Grok 4.20 Reasoning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方 Models and Pricing 页面 https://docs.x.ai/developers/models 标注 Grok 4.20 的 context window 为 `2,000,000` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## grok-4-1-fast-reasoning + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4.1-fast`、`x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4-fast`、`x-ai/grok-4.2-fast-non-reasoning` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"grok-4-1-fast-reasoning"` | `"grok-4-1-fast-reasoning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Grok 4.1 Fast Reasoning"` | `"Grok 4.1 Fast Reasoning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方旧版 Models and Pricing 页面 https://docs.x.ai/docs/models?cluster=us-east-1%2F 列出 `grok-4-fast-reasoning` 的 Context 为 `2,000,000`;官方 reasoning 文档同时表明当前命名使用 `grok-4-1-fast` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 | +| `inputPrice` | `0.2` | `0.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/xai/逐条处置记录-2026-04-23.md b/字段取值表/xai/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..02c2c1a --- /dev/null +++ b/字段取值表/xai/逐条处置记录-2026-04-23.md @@ -0,0 +1,20 @@ +# xai ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- xAI Models: https://docs.x.ai/docs/models +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `grok-4.20-0309-reasoning`(ambiguous) +处置:不修改。 +原因:ZenMux 候选混入 `non-reasoning` 及不同小版本;本地条目明确是 reasoning 线路,不能跨模式覆盖。 + +2. `grok-4-1-fast-reasoning`(ambiguous) +处置:不修改。 +原因:候选同时存在 `fast` 与 `fast-non-reasoning`,且版本跨度到 `4/4.1/4.2`,缺少唯一映射证据。 + +## 本轮 xai 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/xunfei/未确认字段报告.md b/字段取值表/xunfei/未确认字段报告.md new file mode 100644 index 0000000..15cf768 --- /dev/null +++ b/字段取值表/xunfei/未确认字段报告.md @@ -0,0 +1,22 @@ +# 未确认字段报告 - compute/providers/xunfei.json + +- provider: `xunfei` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## spark-x + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## 4.0Ultra + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/xunfei/详细字段取值表.md b/字段取值表/xunfei/详细字段取值表.md new file mode 100644 index 0000000..65f24f5 --- /dev/null +++ b/字段取值表/xunfei/详细字段取值表.md @@ -0,0 +1,50 @@ +# 详细字段取值表 - compute/providers/xunfei.json + +- provider: `xunfei` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.xfyun.cn/doc/spark/X1http.html +- https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## spark-x + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"spark-x"` | `"spark-x"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"讯飞星火 X1"` | `"讯飞星火 X1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `65536` | `65536` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 标注当前 `spark-x`(X2)输入为 `64K`;当前值 `65536` 为按 `64 * 1024` 换算 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 标注当前 `spark-x`(X2)输出为 `128K`;本地值按十进制 `128000` 维护 | +| `inputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","math","code"]` | `["chat","reasoning","deep_thinking","math","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## 4.0Ultra + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"4.0Ultra"` | `"4.0Ultra"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"讯飞星火 4.0 Ultra"` | `"讯飞星火 4.0 Ultra"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 讯飞星火 HTTP 调用文档 https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html 标注 `4.0 Ultra` 最大输入长度为 `32K`;当前值 `32768` 为按 `32 * 1024` 换算 | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 同一官方文档标注 `4.0 Ultra` 最大输出长度为 `32K`;当前值 `32768` 为按 `32 * 1024` 换算 | +| `inputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu-coding/未确认字段报告.md b/字段取值表/zhipu-coding/未确认字段报告.md new file mode 100644 index 0000000..4f9bb2f --- /dev/null +++ b/字段取值表/zhipu-coding/未确认字段报告.md @@ -0,0 +1,18 @@ +# 未确认字段报告 - compute/coding-plans/zhipu-coding.json + +- provider: `zhipu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## glm-5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-coding/详细字段取值表.md b/字段取值表/zhipu-coding/详细字段取值表.md new file mode 100644 index 0000000..1442eac --- /dev/null +++ b/字段取值表/zhipu-coding/详细字段取值表.md @@ -0,0 +1,53 @@ +# 详细字段取值表 - compute/coding-plans/zhipu-coding.json + +- provider: `zhipu` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://www.bigmodel.cn/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## glm-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-5` +- ZenMux候选: `z-ai/glm-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 保持 | ZenMux匹配(exact): z-ai/glm-5 | +| `displayName` | `"GLM-5 (Coding)"` | `"GLM-5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(z-ai/glm-5) prompt=0.58 USD/MTokens | +| `outputPrice` | `2.6` | `2.6` | 保持 | ZenMux(z-ai/glm-5) completion=2.6 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.7` +- ZenMux候选: `z-ai/glm-4.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.7 | +| `displayName` | `"GLM-4.7 (Coding)"` | `"GLM-4.7 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0.2911` | `0.2911` | 保持 | ZenMux(z-ai/glm-4.7) prompt=0.2911 USD/MTokens | +| `outputPrice` | `1.1645` | `1.1645` | 保持 | ZenMux(z-ai/glm-4.7) completion=1.1645 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu-embedding/未确认字段报告.md b/字段取值表/zhipu-embedding/未确认字段报告.md new file mode 100644 index 0000000..89107e0 --- /dev/null +++ b/字段取值表/zhipu-embedding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/zhipu-embedding.json + +- provider: `zhipu-embedding` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## embedding-3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-embedding/详细字段取值表.md b/字段取值表/zhipu-embedding/详细字段取值表.md new file mode 100644 index 0000000..3204f69 --- /dev/null +++ b/字段取值表/zhipu-embedding/详细字段取值表.md @@ -0,0 +1,30 @@ +# 详细字段取值表 - compute/providers/zhipu-embedding.json + +- provider: `zhipu-embedding` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/embedding/embedding-3 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## embedding-3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"embedding-3"` | `"embedding-3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"智谱 embedding-3"` | `"智谱 embedding-3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 智谱官方 Embedding-3 模型页列明上下文窗口为 `8K` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.bigmodel.cn/cn/guide/models/embedding/embedding-3 ,官方定义输出模态为向量,未提供 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu/未确认字段报告.md b/字段取值表/zhipu/未确认字段报告.md new file mode 100644 index 0000000..28f7f5e --- /dev/null +++ b/字段取值表/zhipu/未确认字段报告.md @@ -0,0 +1,49 @@ +# 未确认字段报告 - compute/providers/zhipu.json + +- provider: `zhipu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## glm-5 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7-thinking + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.6v + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.6 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu/详细字段取值表.md b/字段取值表/zhipu/详细字段取值表.md new file mode 100644 index 0000000..8f2a355 --- /dev/null +++ b/字段取值表/zhipu/详细字段取值表.md @@ -0,0 +1,116 @@ +# 详细字段取值表 - compute/providers/zhipu.json + +- provider: `zhipu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.6 +- https://docs.bigmodel.cn/cn/guide/start/model-overview +- https://docs.bigmodel.cn/cn/guide/start/concept-param +- https://docs.bigmodel.cn/cn/guide/capabilities/thinking-mode +- https://www.bigmodel.cn/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## glm-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-5` +- ZenMux候选: `z-ai/glm-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 保持 | ZenMux匹配(exact): z-ai/glm-5 | +| `displayName` | `"GLM-5"` | `"GLM-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `18` | `18` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.7` +- ZenMux候选: `z-ai/glm-4.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.7 | +| `displayName` | `"GLM-4.7"` | `"GLM-4.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7-thinking + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `z-ai/glm-4.7`、`z-ai/glm-4.7-flashx`、`z-ai/glm-4.7-flash-free`、`z-ai/glm-4.6v`、`z-ai/glm-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7-thinking"` | `"glm-4.7-thinking"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7 Thinking"` | `"GLM-4.7 Thinking"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K`,且思考模式文档说明 `GLM-4.7` 默认开启 Thinking,本地别名 `glm-4.7-thinking` 可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K`,思考模式文档说明 `GLM-4.7` 默认开启 Thinking | +| `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.6v + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.6v` +- ZenMux候选: `z-ai/glm-4.6v` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.6v"` | `"glm-4.6v"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.6v | +| `displayName` | `"GLM-4.6V"` | `"GLM-4.6V"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `128000` | 建议修改 | 智谱官方 `GLM-4.6V` 模型页与模型概览页均列明上下文窗口为 `128K` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 智谱官方模型概览页与核心参数页均列明 `glm-4.6v` 最大输出为 `32K` / `32768` | +| `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.6 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.6` +- ZenMux候选: `z-ai/glm-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.6"` | `"glm-4.6"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.6 | +| `displayName` | `"GLM-4.6"` | `"GLM-4.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.6 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.6 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking"]` | `["chat","reasoning","code","multilingual","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu/逐条处置记录-2026-04-23.md b/字段取值表/zhipu/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..fb587a7 --- /dev/null +++ b/字段取值表/zhipu/逐条处置记录-2026-04-23.md @@ -0,0 +1,25 @@ +# zhipu ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- 智谱开放平台文档: https://bigmodel.cn/dev/howuse/model +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `glm-4.7-thinking`(ambiguous) +处置:不修改。 +原因:ZenMux 候选含 `glm-4.7/4.7-flashx/4.7-flash-free/4.6v/4.6` 多分支;本地为 thinking 专线路由,无法唯一映射到某个候选。 + +## 本轮 zhipu 落库结果 + +- JSON 变更:0 + +## 默认采样参数补齐(非 ambiguous) + +依据: +- 智谱官方模型参数说明(GLM-4.6 默认 `temperature=1.0`、`top_p=0.95`) +- https://docs.bigmodel.cn/cn/guide/models/migrate-to-v4#glm-4.6 + +已执行: +1. `glm-4.6`:补齐 `defaultTemperature: 1`、`defaultTopP: 0.95` diff --git a/字段取值表/目录索引.json b/字段取值表/目录索引.json new file mode 100644 index 0000000..5384106 --- /dev/null +++ b/字段取值表/目录索引.json @@ -0,0 +1,240 @@ +[ + { + "file": "compute/coding-plans/dashscope-coding.json", + "folder": "字段取值表/dashscope-coding", + "detailed": "字段取值表/dashscope-coding/详细字段取值表.md", + "unresolved": "字段取值表/dashscope-coding/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/coding-plans/infini-coding.json", + "folder": "字段取值表/infini-coding", + "detailed": "字段取值表/infini-coding/详细字段取值表.md", + "unresolved": "字段取值表/infini-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/kwai-coding.json", + "folder": "字段取值表/kwai-coding", + "detailed": "字段取值表/kwai-coding/详细字段取值表.md", + "unresolved": "字段取值表/kwai-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/minimax-coding.json", + "folder": "字段取值表/minimax-coding", + "detailed": "字段取值表/minimax-coding/详细字段取值表.md", + "unresolved": "字段取值表/minimax-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/moonshot-coding.json", + "folder": "字段取值表/moonshot-coding", + "detailed": "字段取值表/moonshot-coding/详细字段取值表.md", + "unresolved": "字段取值表/moonshot-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/moorethread-coding.json", + "folder": "字段取值表/moorethread-coding", + "detailed": "字段取值表/moorethread-coding/详细字段取值表.md", + "unresolved": "字段取值表/moorethread-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/volcengine-coding.json", + "folder": "字段取值表/volcengine-coding", + "detailed": "字段取值表/volcengine-coding/详细字段取值表.md", + "unresolved": "字段取值表/volcengine-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/zhipu-coding.json", + "folder": "字段取值表/zhipu-coding", + "detailed": "字段取值表/zhipu-coding/详细字段取值表.md", + "unresolved": "字段取值表/zhipu-coding/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/anthropic.json", + "folder": "字段取值表/anthropic", + "detailed": "字段取值表/anthropic/详细字段取值表.md", + "unresolved": "字段取值表/anthropic/未确认字段报告.md", + "modelCount": 5 + }, + { + "file": "compute/providers/baichuan.json", + "folder": "字段取值表/baichuan", + "detailed": "字段取值表/baichuan/详细字段取值表.md", + "unresolved": "字段取值表/baichuan/未确认字段报告.md", + "modelCount": 4 + }, + { + "file": "compute/providers/baidu.json", + "folder": "字段取值表/baidu", + "detailed": "字段取值表/baidu/详细字段取值表.md", + "unresolved": "字段取值表/baidu/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/cohere.json", + "folder": "字段取值表/cohere", + "detailed": "字段取值表/cohere/详细字段取值表.md", + "unresolved": "字段取值表/cohere/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/dashscope.json", + "folder": "字段取值表/dashscope", + "detailed": "字段取值表/dashscope/详细字段取值表.md", + "unresolved": "字段取值表/dashscope/未确认字段报告.md", + "modelCount": 18 + }, + { + "file": "compute/providers/deepseek.json", + "folder": "字段取值表/deepseek", + "detailed": "字段取值表/deepseek/详细字段取值表.md", + "unresolved": "字段取值表/deepseek/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/google.json", + "folder": "字段取值表/google", + "detailed": "字段取值表/google/详细字段取值表.md", + "unresolved": "字段取值表/google/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/internal-testing.json", + "folder": "字段取值表/internal-testing", + "detailed": "字段取值表/internal-testing/详细字段取值表.md", + "unresolved": "字段取值表/internal-testing/未确认字段报告.md", + "modelCount": 14 + }, + { + "file": "compute/providers/kling.json", + "folder": "字段取值表/kling", + "detailed": "字段取值表/kling/详细字段取值表.md", + "unresolved": "字段取值表/kling/未确认字段报告.md", + "modelCount": 4 + }, + { + "file": "compute/providers/lingyiwanwu.json", + "folder": "字段取值表/lingyiwanwu", + "detailed": "字段取值表/lingyiwanwu/详细字段取值表.md", + "unresolved": "字段取值表/lingyiwanwu/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/local-whisper.json", + "folder": "字段取值表/local-whisper", + "detailed": "字段取值表/local-whisper/详细字段取值表.md", + "unresolved": "字段取值表/local-whisper/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/minimax.json", + "folder": "字段取值表/minimax", + "detailed": "字段取值表/minimax/详细字段取值表.md", + "unresolved": "字段取值表/minimax/未确认字段报告.md", + "modelCount": 7 + }, + { + "file": "compute/providers/mistral.json", + "folder": "字段取值表/mistral", + "detailed": "字段取值表/mistral/详细字段取值表.md", + "unresolved": "字段取值表/mistral/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/moonshot.json", + "folder": "字段取值表/moonshot", + "detailed": "字段取值表/moonshot/详细字段取值表.md", + "unresolved": "字段取值表/moonshot/未确认字段报告.md", + "modelCount": 6 + }, + { + "file": "compute/providers/ollama.json", + "folder": "字段取值表/ollama", + "detailed": "字段取值表/ollama/详细字段取值表.md", + "unresolved": "字段取值表/ollama/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/openai.json", + "folder": "字段取值表/openai", + "detailed": "字段取值表/openai/详细字段取值表.md", + "unresolved": "字段取值表/openai/未确认字段报告.md", + "modelCount": 24 + }, + { + "file": "compute/providers/openrouter.json", + "folder": "字段取值表/openrouter", + "detailed": "字段取值表/openrouter/详细字段取值表.md", + "unresolved": "字段取值表/openrouter/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/perplexity.json", + "folder": "字段取值表/perplexity", + "detailed": "字段取值表/perplexity/详细字段取值表.md", + "unresolved": "字段取值表/perplexity/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/siliconflow.json", + "folder": "字段取值表/siliconflow", + "detailed": "字段取值表/siliconflow/详细字段取值表.md", + "unresolved": "字段取值表/siliconflow/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/stability.json", + "folder": "字段取值表/stability", + "detailed": "字段取值表/stability/详细字段取值表.md", + "unresolved": "字段取值表/stability/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/tencent.json", + "folder": "字段取值表/tencent", + "detailed": "字段取值表/tencent/详细字段取值表.md", + "unresolved": "字段取值表/tencent/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/volcengine.json", + "folder": "字段取值表/volcengine", + "detailed": "字段取值表/volcengine/详细字段取值表.md", + "unresolved": "字段取值表/volcengine/未确认字段报告.md", + "modelCount": 17 + }, + { + "file": "compute/providers/xai.json", + "folder": "字段取值表/xai", + "detailed": "字段取值表/xai/详细字段取值表.md", + "unresolved": "字段取值表/xai/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/xunfei.json", + "folder": "字段取值表/xunfei", + "detailed": "字段取值表/xunfei/详细字段取值表.md", + "unresolved": "字段取值表/xunfei/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/zhipu-embedding.json", + "folder": "字段取值表/zhipu-embedding", + "detailed": "字段取值表/zhipu-embedding/详细字段取值表.md", + "unresolved": "字段取值表/zhipu-embedding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/zhipu.json", + "folder": "字段取值表/zhipu", + "detailed": "字段取值表/zhipu/详细字段取值表.md", + "unresolved": "字段取值表/zhipu/未确认字段报告.md", + "modelCount": 5 + } +] From 7159e1cf593c4e7c17774cdea013b7fb21629ef3 Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Fri, 24 Apr 2026 15:12:13 +0800 Subject: [PATCH 2/5] fix(coding-plans): revert incorrect model name suffix and align MiniMax Token Plan labels - Revert qwen3-max-2026-01-23 back to qwen3-max in dashscope-coding - Update minimax-coding labels/descriptions to "Token Plan" to match actual config params (endpoints, quotas, billing), since MiniMax upgraded Coding Plan to Token Plan in March 2026 Co-Authored-By: Claude Opus 4.6 --- compute/coding-plans/dashscope-coding.json | 2 +- compute/coding-plans/minimax-coding.json | 2 +- 2 files changed, 2 insertions(+), 2 deletions(-) diff --git a/compute/coding-plans/dashscope-coding.json b/compute/coding-plans/dashscope-coding.json index 4696bae..9eccf46 100644 --- a/compute/coding-plans/dashscope-coding.json +++ b/compute/coding-plans/dashscope-coding.json @@ -43,7 +43,7 @@ "defaultTemperature": 0.7 }, { - "modelName": "qwen3-max-2026-01-23", + "modelName": "qwen3-max", "displayName": "Qwen3 Max (Coding)", "serviceType": [ "chat" diff --git a/compute/coding-plans/minimax-coding.json b/compute/coding-plans/minimax-coding.json index 132441e..0353b12 100644 --- a/compute/coding-plans/minimax-coding.json +++ b/compute/coding-plans/minimax-coding.json @@ -99,7 +99,7 @@ "serviceType": [ "chat" ], - "description": "MiniMax Coding Plan,M2.5 模型,204.8K 上下文", + "description": "MiniMax Token Plan,M2.5 模型,204.8K 上下文", "contextWindow": 204800, "maxOutputTokens": 32768, "capabilities": [ From cc2fb7b9a567803f658e5ca5c7f6c834d79fdaf0 Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Fri, 24 Apr 2026 19:53:57 +0800 Subject: [PATCH 3/5] fix: remove irrelevant text-model fields from non-text providers Remove contextWindow: 0 and maxOutputTokens: 0 from non-text models (tts, asr, image_gen, video_gen, voice_clone, translation, etc.) and maxOutputTokens: 0 from embedding/rerank models across kling, local-whisper, stability, openai, dashscope, google, volcengine, and zhipu-embedding configs. Co-Authored-By: Claude Opus 4.6 --- compute/providers/dashscope.json | 145 +++++++++++++++++++------ compute/providers/google.json | 94 +++++++++++++++- compute/providers/kling.json | 12 -- compute/providers/local-whisper.json | 3 - compute/providers/openai.json | 34 +++--- compute/providers/stability.json | 3 - compute/providers/volcengine.json | 72 ++++++------ compute/providers/zhipu-embedding.json | 4 +- 8 files changed, 256 insertions(+), 111 deletions(-) diff --git a/compute/providers/dashscope.json b/compute/providers/dashscope.json index 58d795f..0a3facb 100644 --- a/compute/providers/dashscope.json +++ b/compute/providers/dashscope.json @@ -23,6 +23,88 @@ "translation" ], "models": [ + { + "modelName": "qwen3.6-plus", + "displayName": "阿里云 Qwen3.6-Plus", + "serviceType": [ + "chat", + "vision" + ], + "description": "通义千问3.6 Plus,支持文本/图像/视频输入,100万上下文,支持内置工具和 Function Calling", + "contextWindow": 1000000, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "long_context", + "tool_use", + "agent", + "vision" + ], + "inputPrice": 2, + "outputPrice": 12, + "defaultTemperature": 0.6, + "defaultTopP": 0.95, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 256000, + "inputPrice": 2, + "outputPrice": 12, + "thinkingOutputPrice": 12 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 8, + "outputPrice": 48, + "thinkingOutputPrice": 48 + } + ], + "thinkingMaxTokens": 81920 + } + }, + { + "modelName": "qwen3.6-flash", + "displayName": "阿里云 Qwen3.6-Flash", + "serviceType": [ + "chat", + "vision" + ], + "description": "通义千问3.6 Flash,高性价比多模态模型,100万上下文,支持内置工具和 Function Calling", + "contextWindow": 1000000, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "long_context", + "tool_use", + "vision", + "fast" + ], + "inputPrice": 1.2, + "outputPrice": 7.2, + "defaultTemperature": 0.6, + "defaultTopP": 0.95, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 256000, + "inputPrice": 1.2, + "outputPrice": 7.2 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 4.8, + "outputPrice": 28.8 + } + ], + "thinkingMaxTokens": 131072 + } + }, { "modelName": "qwen3.5-plus", "displayName": "阿里云 Qwen3.5-Plus", @@ -44,8 +126,8 @@ ], "inputPrice": 0.8, "outputPrice": 4.8, - "defaultTemperature": 0.7, - "defaultTopP": 0.8, + "defaultTemperature": 0.6, + "defaultTopP": 0.95, "extra": { "pricingTiers": [ { @@ -106,8 +188,8 @@ ], "inputPrice": 0.8, "outputPrice": 2, - "defaultTemperature": 0.6, - "defaultTopP": 0.8, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "pricingTiers": [ { @@ -149,8 +231,8 @@ ], "inputPrice": 0.367, "outputPrice": 1.468, - "defaultTemperature": 0.7, - "defaultTopP": 0.8, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "thinkingContextWindow": 131072, "thinkingOutputPrice": 3.67, @@ -173,7 +255,7 @@ ], "inputPrice": 0.5, "outputPrice": 2, - "defaultTemperature": 0.7, + "defaultTemperature": 1, "defaultTopP": 0.8, "extra": {} }, @@ -198,8 +280,8 @@ ], "inputPrice": 2.5, "outputPrice": 10, - "defaultTemperature": 0.7, - "defaultTopP": 0.8, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -221,6 +303,7 @@ "inputPrice": 1.5, "outputPrice": 6, "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -241,6 +324,7 @@ "inputPrice": 0.8, "outputPrice": 3, "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -257,8 +341,8 @@ "chinese_optimized" ], "inputPrice": 0.7, - "maxOutputTokens": 0, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -275,8 +359,8 @@ "rag" ], "inputPrice": 0.5, - "maxOutputTokens": 0, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -287,14 +371,14 @@ ], "description": "检索重排序,支持 100+ 语种", "contextWindow": 120000, - "maxOutputTokens": 0, "capabilities": [ "rerank", "semantic_reranking", "multilingual" ], "inputPrice": 1, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -304,14 +388,13 @@ "tts" ], "description": "通义语音合成,支持中英文", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "tts", "multilingual", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "voices": [ "longxiaochun", @@ -333,13 +416,12 @@ "asr" ], "description": "通义语音识别", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "asr", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxAudioLength": 3600, "supportedInputFormats": [ @@ -358,13 +440,12 @@ "image_gen" ], "description": "通义万相文生图", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "image_generation", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "supportedImageSizes": [ "1024x1024", @@ -386,13 +467,12 @@ "video_gen" ], "description": "通义万相文生视频", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -408,14 +488,13 @@ "voice_clone" ], "description": "通义声音复刻,少量样本即可克隆", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxCloneSamples": 5, "minCloneDuration": 3 @@ -438,7 +517,8 @@ "multimodal", "tool_use" ], - "defaultTemperature": 0.7, + "defaultTemperature": null, + "defaultTopP": 0.01, "extra": {} }, { @@ -455,7 +535,8 @@ "multilingual", "chinese_optimized" ], - "defaultTemperature": 0.7, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/google.json b/compute/providers/google.json index bc64796..fd3cfd4 100644 --- a/compute/providers/google.json +++ b/compute/providers/google.json @@ -15,6 +15,92 @@ "embedding" ], "models": [ + { + "modelName": "gemini-3.1-pro-preview", + "displayName": "Gemini 3.1 Pro Preview", + "serviceType": ["chat"], + "description": "Google Gemini 3.1 Pro Preview,面向复杂推理、编码和智能体工作流", + "contextWindow": 1048576, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "vision", + "ultra_long_context", + "tool_use" + ], + "inputPrice": 2.00, + "outputPrice": 12.00, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "pricingNotes": "Standard paid tier text/image/video price for prompts <= 200K tokens; prompts > 200K are $4 input and $18 output per 1M tokens.", + "cachePricing": { + "inputCacheRead": 0.20, + "inputCacheReadOver200k": 0.40, + "storagePerMillionTokensPerHour": 4.50 + } + } + }, + { + "modelName": "gemini-3-flash-preview", + "displayName": "Gemini 3 Flash Preview", + "serviceType": ["chat"], + "description": "Google Gemini 3 Flash Preview,高速多模态推理模型", + "contextWindow": 1048576, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "vision", + "ultra_long_context", + "tool_use", + "fast" + ], + "inputPrice": 0.50, + "outputPrice": 3.00, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "pricingNotes": "Standard paid tier text/image/video price; audio input is $1.00 per 1M tokens.", + "cachePricing": { + "inputCacheRead": 0.05, + "audioInputCacheRead": 0.10, + "storagePerMillionTokensPerHour": 1.00 + } + } + }, + { + "modelName": "gemini-3.1-flash-lite-preview", + "displayName": "Gemini 3.1 Flash-Lite Preview", + "serviceType": ["fast"], + "description": "Google Gemini 3.1 Flash-Lite Preview,低成本高吞吐多模态模型", + "contextWindow": 1048576, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "vision", + "ultra_long_context", + "tool_use", + "fast" + ], + "inputPrice": 0.25, + "outputPrice": 1.50, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "pricingNotes": "Standard paid tier text/image/video price; audio input is $0.50 per 1M tokens.", + "cachePricing": { + "inputCacheRead": 0.025, + "audioInputCacheRead": 0.05, + "storagePerMillionTokensPerHour": 1.00 + } + } + }, { "modelName": "gemini-2.5-pro", "displayName": "Gemini 2.5 Pro", @@ -32,7 +118,7 @@ ], "inputPrice": 1.25, "outputPrice": 10, - "defaultTemperature": 1, + "defaultTemperature": null, "defaultTopP": 0.95, "extra": {} }, @@ -54,7 +140,7 @@ ], "inputPrice": 0.30, "outputPrice": 2.50, - "defaultTemperature": 1, + "defaultTemperature": null, "defaultTopP": 0.95, "extra": {} }, @@ -64,13 +150,13 @@ "serviceType": ["embedding"], "description": "Google 文本嵌入模型,768维度", "contextWindow": 2048, - "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.10, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/kling.json b/compute/providers/kling.json index ef35efb..0979a7a 100644 --- a/compute/providers/kling.json +++ b/compute/providers/kling.json @@ -18,15 +18,12 @@ "displayName": "可灵 V2.5 Turbo", "serviceType": ["video_gen"], "description": "可灵最新视频生成模型,高性价比", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality", "fast" ], - "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -41,14 +38,11 @@ "displayName": "可灵 V2.5 Turbo Pro", "serviceType": ["video_gen"], "description": "可灵高品质视频生成", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], - "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -63,14 +57,11 @@ "displayName": "可灵 V2", "serviceType": ["video_gen"], "description": "可灵文生视频旗舰模型", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality" ], - "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -84,14 +75,11 @@ "displayName": "可灵 V2 Master", "serviceType": ["video_gen"], "description": "可灵最高品质视频生成", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], - "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ diff --git a/compute/providers/local-whisper.json b/compute/providers/local-whisper.json index f0f97c8..f8c58ad 100644 --- a/compute/providers/local-whisper.json +++ b/compute/providers/local-whisper.json @@ -18,9 +18,6 @@ "displayName": "Whisper Large V3", "serviceType": ["asr"], "description": "本地部署的 Whisper 大模型", - "contextWindow": 0, - "maxOutputTokens": 0, - "defaultTemperature": 1, "capabilities": [ "asr", "multilingual" diff --git a/compute/providers/openai.json b/compute/providers/openai.json index b0de87d..ac56c30 100644 --- a/compute/providers/openai.json +++ b/compute/providers/openai.json @@ -295,13 +295,13 @@ ], "description": "轻量文本向量化模型,1536 维", "contextWindow": 8192, - "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.02, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -312,13 +312,13 @@ ], "description": "高精度文本向量化模型,3072 维", "contextWindow": 8192, - "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.13, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -328,13 +328,12 @@ "tts" ], "description": "标准语音合成", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "tts" ], "inputPrice": 15, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "voices": [ "alloy", @@ -359,13 +358,12 @@ "tts" ], "description": "高清语音合成", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "tts" ], "inputPrice": 30, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "voices": [ "alloy", @@ -390,14 +388,13 @@ "asr" ], "description": "通用语音识别", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "asr", "multilingual" ], "inputPrice": 0.006, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxAudioLength": 600, "supportedInputFormats": [ @@ -507,13 +504,12 @@ "image_gen" ], "description": "高质量文生图模型", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "image_generation", "text_rendering" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "supportedImageSizes": [ "1024x1024", @@ -544,7 +540,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 1, + "defaultTemperature": 0.7, + "defaultTopP": null, "extra": { "supportedModes": [ "speech-to-speech", @@ -569,7 +566,8 @@ ], "inputPrice": 5, "outputPrice": 20, - "defaultTemperature": 1, + "defaultTemperature": 0.7, + "defaultTopP": null, "extra": { "supportedModes": [ "speech-to-speech", diff --git a/compute/providers/stability.json b/compute/providers/stability.json index 0e8bc98..e12b65d 100644 --- a/compute/providers/stability.json +++ b/compute/providers/stability.json @@ -18,14 +18,11 @@ "displayName": "Stable Diffusion 3.5 Large", "serviceType": ["image_gen"], "description": "Stability AI 旗舰文生图模型", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "image_generation", "high_quality", "controllable" ], - "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", diff --git a/compute/providers/volcengine.json b/compute/providers/volcengine.json index cea6456..b4f0714 100644 --- a/compute/providers/volcengine.json +++ b/compute/providers/volcengine.json @@ -39,8 +39,8 @@ ], "inputPrice": 3.2, "outputPrice": 16, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -51,7 +51,7 @@ ], "description": "火山引擎豆包1.8旗舰模型,256K上下文,支持深度思考和多模态", "contextWindow": 256000, - "maxOutputTokens": 32000, + "maxOutputTokens": 16000, "capabilities": [ "chat", "reasoning", @@ -62,8 +62,8 @@ ], "inputPrice": 0.8, "outputPrice": 2, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -85,8 +85,8 @@ ], "inputPrice": 0.8, "outputPrice": 8, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -97,7 +97,7 @@ ], "description": "火山引擎豆包1.6深度思考模型,256K上下文", "contextWindow": 256000, - "maxOutputTokens": 32768, + "maxOutputTokens": 16000, "capabilities": [ "reasoning", "math", @@ -107,7 +107,8 @@ ], "inputPrice": 0.8, "outputPrice": 8, - "defaultTemperature": 0.3, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -118,7 +119,7 @@ ], "description": "火山引擎豆包1.6快速版,成本较前代下降63%", "contextWindow": 256000, - "maxOutputTokens": 32000, + "maxOutputTokens": 16000, "capabilities": [ "chat", "code", @@ -127,8 +128,8 @@ ], "inputPrice": 0.15, "outputPrice": 1.5, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -147,8 +148,8 @@ ], "inputPrice": 0.3, "outputPrice": 0.6, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -169,8 +170,8 @@ ], "inputPrice": 0.8, "outputPrice": 8, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -190,7 +191,8 @@ ], "inputPrice": 1.2, "outputPrice": 8, - "defaultTemperature": 0.3, + "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} }, { @@ -232,8 +234,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -255,8 +257,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 0.6, + "defaultTopP": 1, "extra": {} }, { @@ -278,8 +280,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -290,7 +292,6 @@ ], "description": "火山引擎豆包标准向量模型,2560维度", "contextWindow": 4096, - "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", @@ -298,7 +299,8 @@ "chinese_optimized" ], "inputPrice": 0.5, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -308,14 +310,13 @@ "voice_clone" ], "description": "火山引擎声音复刻,支持极少样本", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxCloneSamples": 3, "minCloneDuration": 5 @@ -328,15 +329,14 @@ "realtime_voice" ], "description": "火山引擎实时语音交互", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "realtime", "speech_to_speech", "low_latency", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "supportedModes": [ "speech-to-speech" @@ -351,14 +351,13 @@ "simultaneous_interpret" ], "description": "火山引擎同声传译,支持中英双向", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "simultaneous_interpretation", "chinese_optimized", "low_latency" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "streamingSupported": true } @@ -370,14 +369,13 @@ "translation" ], "description": "火山引擎机器翻译,支持多语种互译", - "contextWindow": 0, - "maxOutputTokens": 0, "capabilities": [ "translation", "multilingual", "chinese_optimized" ], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/zhipu-embedding.json b/compute/providers/zhipu-embedding.json index 6031ad8..0d78149 100644 --- a/compute/providers/zhipu-embedding.json +++ b/compute/providers/zhipu-embedding.json @@ -20,7 +20,6 @@ "serviceType": ["embedding"], "description": "智谱嵌入模型v3,支持自定义维度;模型上下文窗口 8K,单条输入最多 3072 tokens。走 OpenAI 兼容 /embeddings 端点(Anthropic 协议不提供 embeddings)", "contextWindow": 8192, - "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", @@ -28,7 +27,8 @@ "custom_dimensions" ], "inputPrice": 0.5, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "maxInputTokensPerItem": 3072, "maxBatchItems": 64, From 5b9c8ac61fa56e832c7ab8a4624b3f7eee449481 Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Fri, 24 Apr 2026 20:06:24 +0800 Subject: [PATCH 4/5] fix: restore CNY pricing for MiniMax and Zhipu (Chinese providers) MiniMax and Zhipu are Chinese providers whose priceCurrency was incorrectly changed from CNY to USD, with prices converted to USD values. Restored correct CNY pricing verified against official docs. Co-Authored-By: Claude Opus 4.6 --- compute/providers/minimax.json | 70 +++++++++++++++++----------------- compute/providers/zhipu.json | 50 ++++++++++++------------ 2 files changed, 60 insertions(+), 60 deletions(-) diff --git a/compute/providers/minimax.json b/compute/providers/minimax.json index 2cbc9e8..28c5bef 100644 --- a/compute/providers/minimax.json +++ b/compute/providers/minimax.json @@ -8,7 +8,7 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "USD", + "priceCurrency": "CNY", "services": [ "chat", "fast", @@ -31,13 +31,13 @@ "code", "tool_use" ], - "inputPrice": 0.3, - "outputPrice": 1.2, + "inputPrice": 2.1, + "outputPrice": 8.4, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.06, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.42, + "cacheWritePrice": 2.625, "outputSpeedTps": 60 } }, @@ -57,13 +57,13 @@ "tool_use", "fast" ], - "inputPrice": 0.6, - "outputPrice": 2.4, + "inputPrice": 4.2, + "outputPrice": 16.8, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.06, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.42, + "cacheWritePrice": 2.625, "outputSpeedTps": 100 } }, @@ -84,13 +84,13 @@ "tool_use", "long_context" ], - "inputPrice": 0.3, - "outputPrice": 1.2, + "inputPrice": 2.1, + "outputPrice": 8.4, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.03, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.21, + "cacheWritePrice": 2.625, "outputSpeedTps": 60 } }, @@ -110,13 +110,13 @@ "tool_use", "fast" ], - "inputPrice": 0.6, - "outputPrice": 2.4, + "inputPrice": 4.2, + "outputPrice": 16.8, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.03, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.21, + "cacheWritePrice": 2.625, "outputSpeedTps": 100 } }, @@ -135,13 +135,13 @@ "tool_use", "reasoning" ], - "inputPrice": 0.3, - "outputPrice": 1.2, + "inputPrice": 2.1, + "outputPrice": 8.4, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.03, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.21, + "cacheWritePrice": 2.625, "outputSpeedTps": 60 } }, @@ -161,13 +161,13 @@ "tool_use", "fast" ], - "inputPrice": 0.6, - "outputPrice": 2.4, + "inputPrice": 4.2, + "outputPrice": 16.8, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { - "cacheReadPrice": 0.03, - "cacheWritePrice": 0.375, + "cacheReadPrice": 0.21, + "cacheWritePrice": 2.625, "outputSpeedTps": 100 } }, @@ -186,10 +186,10 @@ "code", "long_context" ], - "inputPrice": 0.2, - "outputPrice": 1.1, - "defaultTemperature": 1, - "defaultTopP": 1, + "inputPrice": 1.4, + "outputPrice": 7.7, + "defaultTemperature": 0.1, + "defaultTopP": 0.95, "extra": {} } ] diff --git a/compute/providers/zhipu.json b/compute/providers/zhipu.json index c30074f..fdfeaa8 100644 --- a/compute/providers/zhipu.json +++ b/compute/providers/zhipu.json @@ -8,7 +8,7 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "USD", + "priceCurrency": "CNY", "services": [ "chat", "vision", @@ -38,12 +38,12 @@ "tool_use", "agent" ], - "inputPrice": 1.4, - "outputPrice": 4.4, + "inputPrice": 6, + "outputPrice": 24, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.26, + "cacheHitPrice": 1.2, "thinking": { "default": "enabled" } @@ -67,12 +67,12 @@ "tool_use", "agent" ], - "inputPrice": 1.2, - "outputPrice": 4, + "inputPrice": 5, + "outputPrice": 22, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.24, + "cacheHitPrice": 1, "thinking": { "default": "enabled" } @@ -98,12 +98,12 @@ "tool_use", "agent" ], - "inputPrice": 1, - "outputPrice": 3.2, + "inputPrice": 4, + "outputPrice": 18, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.2 + "cacheHitPrice": 0.8 } }, { @@ -124,12 +124,12 @@ "long_context", "tool_use" ], - "inputPrice": 0.6, - "outputPrice": 2.2, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.11 + "cacheHitPrice": 0.5 } }, { @@ -148,12 +148,12 @@ "deep_thinking", "long_context" ], - "inputPrice": 0.6, - "outputPrice": 2.2, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.11, + "cacheHitPrice": 0.5, "aliasOf": "glm-4.7" } }, @@ -179,12 +179,12 @@ "tool_use", "agent" ], - "inputPrice": 1.2, - "outputPrice": 4, + "inputPrice": 5, + "outputPrice": 22, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.24, + "cacheHitPrice": 1, "thinking": { "default": "enabled" } @@ -207,12 +207,12 @@ "long_context", "tool_use" ], - "inputPrice": 0.3, - "outputPrice": 0.9, + "inputPrice": 1, + "outputPrice": 4, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.05 + "cacheHitPrice": 0.2 } }, { @@ -231,12 +231,12 @@ "multilingual", "deep_thinking" ], - "inputPrice": 0.6, - "outputPrice": 2.2, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 0.95, "extra": { - "cacheHitPrice": 0.11 + "cacheHitPrice": 0.5 } } ] From b0e0cead047d796c31b9137a6ff95c48f75cece1 Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Fri, 24 Apr 2026 20:12:57 +0800 Subject: [PATCH 5/5] chore: update field audit tables and provider configs Batch update from official docs audit - price corrections, context window fixes, field report updates across all providers. Co-Authored-By: Claude Opus 4.6 --- compute/coding-plans/dashscope-coding.json | 6 +- compute/coding-plans/infini-coding.json | 3 +- compute/coding-plans/kwai-coding.json | 1 + compute/coding-plans/minimax-coding.json | 7 +- compute/coding-plans/moonshot-coding.json | 7 +- compute/coding-plans/moorethread-coding.json | 3 +- compute/coding-plans/volcengine-coding.json | 3 +- compute/coding-plans/zhipu-coding.json | 6 +- compute/providers/anthropic.json | 133 +++-- compute/providers/baichuan.json | 16 +- compute/providers/baidu.json | 114 ++++- compute/providers/cohere.json | 46 +- compute/providers/deepseek.json | 14 +- compute/providers/internal-testing.json | 22 +- compute/providers/lingyiwanwu.json | 8 +- compute/providers/mistral.json | 6 +- compute/providers/moonshot.json | 20 +- compute/providers/ollama.json | 3 +- compute/providers/perplexity.json | 39 +- compute/providers/siliconflow.json | 11 +- compute/providers/tencent.json | 59 ++- compute/providers/xai.json | 8 +- compute/providers/xunfei.json | 12 +- 字段取值表/anthropic/未确认字段报告.md | 46 +- 字段取值表/anthropic/详细字段取值表.md | 108 +--- 字段取值表/baichuan/未确认字段报告.md | 16 +- 字段取值表/baichuan/详细字段取值表.md | 25 +- 字段取值表/baidu/未确认字段报告.md | 4 - 字段取值表/baidu/详细字段取值表.md | 47 +- 字段取值表/cohere/未确认字段报告.md | 30 +- 字段取值表/cohere/详细字段取值表.md | 63 +-- 字段取值表/dashscope-coding/未确认字段报告.md | 4 - 字段取值表/dashscope-coding/详细字段取值表.md | 8 +- 字段取值表/dashscope/未确认字段报告.md | 42 +- 字段取值表/dashscope/详细字段取值表.md | 79 +-- 字段取值表/deepseek/未确认字段报告.md | 5 - 字段取值表/deepseek/详细字段取值表.md | 11 +- 字段取值表/google/未确认字段报告.md | 22 +- 字段取值表/google/详细字段取值表.md | 83 ++- 字段取值表/infini-coding/未确认字段报告.md | 6 +- 字段取值表/infini-coding/详细字段取值表.md | 8 +- 字段取值表/internal-testing/未确认字段报告.md | 28 - 字段取值表/internal-testing/详细字段取值表.md | 56 +- 字段取值表/kling/未确认字段报告.md | 8 - 字段取值表/kling/详细字段取值表.md | 16 +- 字段取值表/kwai-coding/未确认字段报告.md | 6 +- 字段取值表/kwai-coding/详细字段取值表.md | 9 +- 字段取值表/lingyiwanwu/未确认字段报告.md | 12 +- 字段取值表/lingyiwanwu/详细字段取值表.md | 17 +- 字段取值表/local-whisper/未确认字段报告.md | 2 - 字段取值表/local-whisper/详细字段取值表.md | 4 +- 字段取值表/minimax-coding/未确认字段报告.md | 2 - 字段取值表/minimax-coding/详细字段取值表.md | 22 +- 字段取值表/minimax/未确认字段报告.md | 14 - 字段取值表/minimax/详细字段取值表.md | 28 +- 字段取值表/mistral/未确认字段报告.md | 30 +- 字段取值表/mistral/详细字段取值表.md | 58 +-- 字段取值表/moonshot-coding/未确认字段报告.md | 2 - 字段取值表/moonshot-coding/详细字段取值表.md | 14 +- 字段取值表/moonshot/未确认字段报告.md | 24 +- 字段取值表/moonshot/详细字段取值表.md | 38 +- .../moorethread-coding/未确认字段报告.md | 6 +- .../moorethread-coding/详细字段取值表.md | 8 +- 字段取值表/ollama/未确认字段报告.md | 4 +- 字段取值表/ollama/详细字段取值表.md | 8 +- 字段取值表/openai/未确认字段报告.md | 180 +------ 字段取值表/openai/详细字段取值表.md | 484 +----------------- 字段取值表/openrouter/未确认字段报告.md | 11 +- 字段取值表/openrouter/详细字段取值表.md | 15 +- 字段取值表/perplexity/未确认字段报告.md | 28 +- 字段取值表/perplexity/详细字段取值表.md | 56 +- 字段取值表/siliconflow/未确认字段报告.md | 8 - 字段取值表/siliconflow/详细字段取值表.md | 13 +- 字段取值表/stability/未确认字段报告.md | 2 - 字段取值表/stability/详细字段取值表.md | 4 +- 字段取值表/tencent/未确认字段报告.md | 5 - 字段取值表/tencent/详细字段取值表.md | 26 +- .../volcengine-coding/未确认字段报告.md | 2 - .../volcengine-coding/详细字段取值表.md | 5 +- 字段取值表/volcengine/未确认字段报告.md | 41 +- 字段取值表/volcengine/详细字段取值表.md | 80 +-- 字段取值表/xai/未确认字段报告.md | 21 +- 字段取值表/xai/详细字段取值表.md | 43 +- 字段取值表/xunfei/未确认字段报告.md | 4 - 字段取值表/xunfei/详细字段取值表.md | 8 +- 字段取值表/zhipu-coding/未确认字段报告.md | 4 - 字段取值表/zhipu-coding/详细字段取值表.md | 27 +- 字段取值表/zhipu-embedding/未确认字段报告.md | 2 - 字段取值表/zhipu-embedding/详细字段取值表.md | 4 +- 字段取值表/zhipu/未确认字段报告.md | 10 - 字段取值表/zhipu/详细字段取值表.md | 21 +- 字段取值表/采样参数复核报告.md | 89 ++++ 92 files changed, 1000 insertions(+), 1763 deletions(-) create mode 100644 字段取值表/采样参数复核报告.md diff --git a/compute/coding-plans/dashscope-coding.json b/compute/coding-plans/dashscope-coding.json index 9eccf46..6da63ce 100644 --- a/compute/coding-plans/dashscope-coding.json +++ b/compute/coding-plans/dashscope-coding.json @@ -40,7 +40,8 @@ "source": "preset", "inputPrice": 1, "outputPrice": 5, - "defaultTemperature": 0.7 + "defaultTemperature": 0.7, + "defaultTopP": 0.8 }, { "modelName": "qwen3-max", @@ -63,7 +64,8 @@ "source": "preset", "inputPrice": 1.2, "outputPrice": 6, - "defaultTemperature": 0.7 + "defaultTemperature": 0.7, + "defaultTopP": 0.8 } ] } diff --git a/compute/coding-plans/infini-coding.json b/compute/coding-plans/infini-coding.json index 9ebdb3c..fb55d3c 100644 --- a/compute/coding-plans/infini-coding.json +++ b/compute/coding-plans/infini-coding.json @@ -27,7 +27,8 @@ "contextWindow": 128000, "maxOutputTokens": 8192, "capabilities": ["chat", "reasoning", "code", "multilingual"], - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "source": "preset" } ] diff --git a/compute/coding-plans/kwai-coding.json b/compute/coding-plans/kwai-coding.json index 5d7393c..ed28bd6 100644 --- a/compute/coding-plans/kwai-coding.json +++ b/compute/coding-plans/kwai-coding.json @@ -28,6 +28,7 @@ "contextWindow": 128000, "maxOutputTokens": 8192, "defaultTemperature": 1, + "defaultTopP": 1, "source": "preset" } ] diff --git a/compute/coding-plans/minimax-coding.json b/compute/coding-plans/minimax-coding.json index 0353b12..531f263 100644 --- a/compute/coding-plans/minimax-coding.json +++ b/compute/coding-plans/minimax-coding.json @@ -56,7 +56,7 @@ "inputPrice": 0.3, "outputPrice": 1.2, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { "billing": "token_plan_request_quota", "cacheReadPrice": 0.06, @@ -85,7 +85,7 @@ "inputPrice": 0.6, "outputPrice": 2.4, "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTopP": 0.95, "extra": { "billing": "token_plan_highspeed_request_quota", "cacheReadPrice": 0.06, @@ -111,7 +111,8 @@ "source": "preset", "inputPrice": 0.3, "outputPrice": 1.2, - "defaultTemperature": 1 + "defaultTemperature": 1, + "defaultTopP": 0.95 } ] } diff --git a/compute/coding-plans/moonshot-coding.json b/compute/coding-plans/moonshot-coding.json index 09ce9c7..60057c7 100644 --- a/compute/coding-plans/moonshot-coding.json +++ b/compute/coding-plans/moonshot-coding.json @@ -46,8 +46,8 @@ "video_understanding" ], "source": "preset", - "defaultTemperature": 1, - "defaultTopP": 0.95, + "defaultTemperature": null, + "defaultTopP": null, "extra": { "billing": "kimi_membership_quota", "baseUrlNote": "Kimi Code API Key must use https://api.kimi.com/coding/v1", @@ -79,7 +79,8 @@ "source": "preset", "inputPrice": 0.58, "outputPrice": 3.02, - "defaultTemperature": 1 + "defaultTemperature": 1, + "defaultTopP": 0.95 } ] } diff --git a/compute/coding-plans/moorethread-coding.json b/compute/coding-plans/moorethread-coding.json index 6acd5cf..4441aed 100644 --- a/compute/coding-plans/moorethread-coding.json +++ b/compute/coding-plans/moorethread-coding.json @@ -27,7 +27,8 @@ "capabilities": ["chat", "code"], "contextWindow": 128000, "maxOutputTokens": 8192, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "source": "preset" } ] diff --git a/compute/coding-plans/volcengine-coding.json b/compute/coding-plans/volcengine-coding.json index 42269cb..eaa76d6 100644 --- a/compute/coding-plans/volcengine-coding.json +++ b/compute/coding-plans/volcengine-coding.json @@ -33,7 +33,8 @@ "capabilities": ["code", "reasoning", "chat"], "contextWindow": 256000, "maxOutputTokens": 32000, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "source": "preset" } ] diff --git a/compute/coding-plans/zhipu-coding.json b/compute/coding-plans/zhipu-coding.json index beac3bb..3b776b9 100644 --- a/compute/coding-plans/zhipu-coding.json +++ b/compute/coding-plans/zhipu-coding.json @@ -109,7 +109,8 @@ "source": "preset", "inputPrice": 0.58, "outputPrice": 2.6, - "defaultTemperature": 0.95 + "defaultTemperature": 1, + "defaultTopP": 0.95 }, { "modelName": "glm-4.7", @@ -132,7 +133,8 @@ "source": "preset", "inputPrice": 0.2911, "outputPrice": 1.1645, - "defaultTemperature": 0.95 + "defaultTemperature": 1, + "defaultTopP": 0.95 } ] } diff --git a/compute/providers/anthropic.json b/compute/providers/anthropic.json index 62873ff..bb8671e 100644 --- a/compute/providers/anthropic.json +++ b/compute/providers/anthropic.json @@ -15,13 +15,13 @@ ], "models": [ { - "modelName": "claude-opus-4-6", - "displayName": "Claude Opus 4.6", + "modelName": "claude-opus-4-7", + "displayName": "Claude Opus 4.7", "serviceType": [ "chat" ], - "description": "Anthropic Opus 4.6,1M 上下文,适合复杂代理和编码任务", - "contextWindow": 200000, + "description": "Anthropic 当前最强通用模型,适合复杂推理和智能体编码任务", + "contextWindow": 1000000, "maxOutputTokens": 128000, "capabilities": [ "chat", @@ -33,91 +33,76 @@ "inputPrice": 5, "outputPrice": 25, "defaultTemperature": 1, - "extra": {} + "defaultTopP": null, + "extra": { + "cachePricing": { + "write5m": 6.25, + "write1h": 10, + "read": 0.5 + }, + "pricingNotes": "Prices are per 1M tokens. Opus 4.7 includes the full 1M context window at standard pricing." + } }, { - "modelName": "claude-opus-4-5", - "displayName": "Claude Opus 4.5", + "modelName": "claude-sonnet-4-6", + "displayName": "Claude Sonnet 4.6", "serviceType": [ - "chat" - ], - "description": "Anthropic Opus 4.5,顶级推理能力", - "contextWindow": 200000, - "maxOutputTokens": 32768, - "capabilities": [ "chat", - "reasoning", - "code", - "vision", - "tool_use" - ], - "inputPrice": 5, - "outputPrice": 25, - "defaultTemperature": 1, - "extra": {} - }, - { - "modelName": "claude-sonnet-4-5", - "displayName": "Claude Sonnet 4.5", - "serviceType": [ - "chat" - ], - "description": "Anthropic Sonnet 4.5,高性能性价比", - "contextWindow": 200000, - "maxOutputTokens": 64000, - "capabilities": [ - "chat", - "reasoning", - "code", - "vision", - "tool_use" - ], - "inputPrice": 3, - "outputPrice": 15, - "defaultTemperature": 1, - "extra": {} - }, - { - "modelName": "claude-sonnet-4", - "displayName": "Claude Sonnet 4", - "serviceType": [ - "chat" - ], - "description": "Anthropic Sonnet 4 旗舰模型", - "contextWindow": 200000, - "maxOutputTokens": 64000, - "capabilities": [ - "chat", - "reasoning", - "code", - "vision", - "tool_use" - ], - "inputPrice": 3, - "outputPrice": 15, - "defaultTemperature": 1, - "extra": {} - }, - { - "modelName": "claude-sonnet-4-5-computer", - "displayName": "Claude Sonnet 4.5 Computer Use", - "serviceType": [ "computer_use" ], - "description": "Anthropic 最佳 Computer Use 模型", - "contextWindow": 200000, + "description": "Anthropic 高智能高速度模型,适合编码、工具使用和智能体任务", + "contextWindow": 1000000, "maxOutputTokens": 64000, "capabilities": [ "chat", + "reasoning", + "code", "vision", - "computer_use", "tool_use", - "reasoning" + "computer_use" ], "inputPrice": 3, "outputPrice": 15, "defaultTemperature": 1, - "extra": {} + "defaultTopP": null, + "extra": { + "cachePricing": { + "write5m": 3.75, + "write1h": 6, + "read": 0.3 + }, + "pricingNotes": "Prices are per 1M tokens. Sonnet 4.6 includes the full 1M context window at standard pricing." + } + }, + { + "modelName": "claude-haiku-4-5", + "displayName": "Claude Haiku 4.5", + "serviceType": [ + "chat" + ], + "description": "Anthropic 最快模型,具备接近前沿模型的智能水平", + "contextWindow": 200000, + "maxOutputTokens": 64000, + "capabilities": [ + "chat", + "reasoning", + "code", + "vision", + "tool_use" + ], + "inputPrice": 1, + "outputPrice": 5, + "defaultTemperature": 1, + "defaultTopP": null, + "extra": { + "modelId": "claude-haiku-4-5-20251001", + "cachePricing": { + "write5m": 1.25, + "write1h": 2, + "read": 0.1 + }, + "pricingNotes": "Prices are per 1M tokens." + } } ] } diff --git a/compute/providers/baichuan.json b/compute/providers/baichuan.json index 0de20e1..4ec0bd7 100644 --- a/compute/providers/baichuan.json +++ b/compute/providers/baichuan.json @@ -31,8 +31,8 @@ ], "inputPrice": 5, "outputPrice": 9, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -52,8 +52,8 @@ ], "inputPrice": 10, "outputPrice": 30, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -72,8 +72,8 @@ ], "inputPrice": 10, "outputPrice": 30, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -91,8 +91,8 @@ ], "inputPrice": 2, "outputPrice": 20, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/baidu.json b/compute/providers/baidu.json index 2720fd0..fa60c58 100644 --- a/compute/providers/baidu.json +++ b/compute/providers/baidu.json @@ -31,14 +31,62 @@ "multimodal", "tool_use" ], - "inputPrice": 8, - "outputPrice": 32, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "inputPrice": 6, + "outputPrice": 24, + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 32768, + "inputPrice": 6, + "outputPrice": 24 + }, + { + "maxInputTokens": 131072, + "inputPrice": 10, + "outputPrice": 40 + } + ], + "thinkingMaxTokens": 60000 + } }, { - "modelName": "ernie-4.5-turbo-128k-latest", + "modelName": "ernie-5.0", + "displayName": "文心 ERNIE 5.0 非思考", + "serviceType": [ + "chat" + ], + "description": "百度 ERNIE 5.0 旗舰模型,128K 上下文,119K 最大输入,最大输出 65,536 token", + "contextWindow": 131072, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "vision", + "multimodal", + "tool_use" + ], + "inputPrice": 6, + "outputPrice": 24, + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 32768, + "inputPrice": 6, + "outputPrice": 24 + }, + { + "maxInputTokens": 131072, + "inputPrice": 10, + "outputPrice": 40 + } + ] + } + }, + { + "modelName": "ernie-4.5-turbo-128k", "displayName": "文心 ERNIE 4.5 Turbo", "serviceType": [ "chat" @@ -55,9 +103,59 @@ ], "inputPrice": 0.8, "outputPrice": 3.2, - "defaultTemperature": 1, + "defaultTemperature": 0.8, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheHitPrice": 0.2 + } + }, + { + "modelName": "ernie-4.5-turbo-20260402", + "displayName": "文心 ERNIE 4.5 Turbo 20260402", + "serviceType": [ + "chat" + ], + "description": "百度 ERNIE 4.5 Turbo 20260402 快照,128K 上下文,最大输出 12,288 token", + "contextWindow": 131072, + "maxOutputTokens": 12288, + "capabilities": [ + "chat", + "code", + "vision", + "long_context", + "fast" + ], + "inputPrice": 0.8, + "outputPrice": 3.2, + "defaultTemperature": 0.8, + "defaultTopP": 1, + "extra": { + "cacheHitPrice": 0.2 + } + }, + { + "modelName": "ernie-x1.1", + "displayName": "文心 ERNIE X1.1", + "serviceType": [ + "reasoning" + ], + "description": "百度 ERNIE X1.1 深度思考模型,64K 上下文,最大输出 65,536 token", + "contextWindow": 65536, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "deep_thinking", + "math", + "code" + ], + "inputPrice": 1, + "outputPrice": 4, + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "thinkingMaxTokens": 65536 + } } ] } diff --git a/compute/providers/cohere.json b/compute/providers/cohere.json index 6807513..f567af5 100644 --- a/compute/providers/cohere.json +++ b/compute/providers/cohere.json @@ -29,9 +29,33 @@ ], "inputPrice": 2.50, "outputPrice": 10.00, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": 0.3, + "defaultTopP": 0.75, + "extra": { + "pricingNotes": "Prices are per 1M tokens." + } + }, + { + "modelName": "command-r7b-12-2024", + "displayName": "Command R7B", + "serviceType": ["fast"], + "description": "Cohere 小型高速对话模型,适合高吞吐、低延迟场景", + "contextWindow": 128000, + "maxOutputTokens": 4000, + "capabilities": [ + "chat", + "reasoning", + "tool_use", + "rag", + "fast" + ], + "inputPrice": 0.0375, + "outputPrice": 0.15, + "defaultTemperature": 0.3, + "defaultTopP": 0.75, + "extra": { + "pricingNotes": "Prices are per 1M tokens." + } }, { "modelName": "embed-v4.0", @@ -46,8 +70,13 @@ ], "inputPrice": 0.12, "outputPrice": 0, - "defaultTemperature": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "dimensions": [256, 512, 1024, 1536], + "defaultDimension": 1536, + "pricingNotes": "Embedding models are priced by embedded tokens; price is per 1M tokens." + } }, { "modelName": "rerank-v3.5", @@ -62,8 +91,11 @@ ], "inputPrice": 2.00, "outputPrice": 0, - "defaultTemperature": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "pricingNotes": "Cohere Rerank is priced by search units, not input/output tokens; one search unit is one query with up to 100 documents. The token price fields are retained for schema compatibility." + } } ] } diff --git a/compute/providers/deepseek.json b/compute/providers/deepseek.json index 958b793..df96426 100644 --- a/compute/providers/deepseek.json +++ b/compute/providers/deepseek.json @@ -30,10 +30,12 @@ "multilingual" ], "inputPrice": 2, - "outputPrice": 8, + "outputPrice": 3, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheHitPrice": 0.2 + } }, { "modelName": "deepseek-reasoner", @@ -53,9 +55,11 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "cacheHitPrice": 0.2 + } } ] } diff --git a/compute/providers/internal-testing.json b/compute/providers/internal-testing.json index 6b31f84..002fed2 100644 --- a/compute/providers/internal-testing.json +++ b/compute/providers/internal-testing.json @@ -33,6 +33,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -54,7 +55,8 @@ ], "inputPrice": 0, "outputPrice": 0, - "defaultTemperature": 0.95, + "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -74,6 +76,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -93,6 +96,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -112,6 +116,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -134,7 +139,8 @@ ], "inputPrice": 0, "outputPrice": 0, - "defaultTemperature": 0.7, + "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -158,6 +164,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -179,6 +186,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.95, "extra": {} }, { @@ -202,6 +210,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -224,7 +233,8 @@ ], "inputPrice": 0, "outputPrice": 0, - "defaultTemperature": 1, + "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -246,6 +256,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -267,6 +278,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -289,7 +301,8 @@ ], "inputPrice": 0, "outputPrice": 0, - "defaultTemperature": 1, + "defaultTemperature": 0.7, + "defaultTopP": 0.8, "extra": {} }, { @@ -309,6 +322,7 @@ "inputPrice": 0, "outputPrice": 0, "defaultTemperature": 1, + "defaultTopP": 0.7, "extra": {} } ] diff --git a/compute/providers/lingyiwanwu.json b/compute/providers/lingyiwanwu.json index 7589d1f..bc09aaf 100644 --- a/compute/providers/lingyiwanwu.json +++ b/compute/providers/lingyiwanwu.json @@ -30,8 +30,8 @@ ], "inputPrice": 0.99, "outputPrice": 0.99, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -51,8 +51,8 @@ ], "inputPrice": 6, "outputPrice": 6, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/mistral.json b/compute/providers/mistral.json index 58b5b34..6b207b5 100644 --- a/compute/providers/mistral.json +++ b/compute/providers/mistral.json @@ -33,7 +33,7 @@ ], "inputPrice": 0.5, "outputPrice": 1.5, - "defaultTemperature": 1, + "defaultTemperature": null, "defaultTopP": 1, "extra": {} }, @@ -56,7 +56,7 @@ ], "inputPrice": 0.1, "outputPrice": 0.3, - "defaultTemperature": 1, + "defaultTemperature": null, "defaultTopP": 1, "extra": {} }, @@ -75,7 +75,7 @@ ], "inputPrice": 0.3, "outputPrice": 0.9, - "defaultTemperature": 1, + "defaultTemperature": null, "defaultTopP": 1, "extra": {} } diff --git a/compute/providers/moonshot.json b/compute/providers/moonshot.json index 8a89085..1fc23f6 100644 --- a/compute/providers/moonshot.json +++ b/compute/providers/moonshot.json @@ -129,8 +129,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 0.6, + "defaultTopP": 1, "extra": { "cacheHitPrice": 1 } @@ -153,8 +153,8 @@ ], "inputPrice": 4, "outputPrice": 16, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 1, + "defaultTopP": 1, "extra": { "cacheHitPrice": 1 } @@ -174,8 +174,8 @@ ], "inputPrice": 2, "outputPrice": 2, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 0, + "defaultTopP": 1, "extra": {} }, { @@ -194,8 +194,8 @@ ], "inputPrice": 5, "outputPrice": 5, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 0, + "defaultTopP": 1, "extra": {} }, { @@ -214,8 +214,8 @@ ], "inputPrice": 10, "outputPrice": 10, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, + "defaultTemperature": 0, + "defaultTopP": 1, "extra": {} } ] diff --git a/compute/providers/ollama.json b/compute/providers/ollama.json index 87064ef..153c2b0 100644 --- a/compute/providers/ollama.json +++ b/compute/providers/ollama.json @@ -25,7 +25,8 @@ "code", "reasoning" ], - "defaultTemperature": 0.7, + "defaultTemperature": 0.8, + "defaultTopP": 0.9, "extra": {} } ] diff --git a/compute/providers/perplexity.json b/compute/providers/perplexity.json index bc7a12f..4bc495b 100644 --- a/compute/providers/perplexity.json +++ b/compute/providers/perplexity.json @@ -26,9 +26,16 @@ ], "inputPrice": 3.00, "outputPrice": 15.00, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "requestPricingPer1k": { + "low": 6, + "medium": 10, + "high": 14 + }, + "pricingNotes": "Total Sonar API cost includes token costs plus a request fee based on search context size." + } }, { "modelName": "sonar-reasoning-pro", @@ -45,9 +52,16 @@ ], "inputPrice": 2.00, "outputPrice": 8.00, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "requestPricingPer1k": { + "low": 6, + "medium": 10, + "high": 14 + }, + "pricingNotes": "Total Sonar API cost includes token costs plus a request fee based on search context size." + } }, { "modelName": "sonar", @@ -64,9 +78,16 @@ ], "inputPrice": 1.00, "outputPrice": 1.00, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "requestPricingPer1k": { + "low": 5, + "medium": 8, + "high": 12 + }, + "pricingNotes": "Total Sonar API cost includes token costs plus a request fee based on search context size." + } } ] } diff --git a/compute/providers/siliconflow.json b/compute/providers/siliconflow.json index 97a12ee..7c398fb 100644 --- a/compute/providers/siliconflow.json +++ b/compute/providers/siliconflow.json @@ -27,8 +27,8 @@ ], "inputPrice": 8, "outputPrice": 16, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": 0.7, "extra": {} }, { @@ -48,8 +48,8 @@ ], "inputPrice": 2.5, "outputPrice": 10, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": 0.7, "extra": {} }, { @@ -65,7 +65,8 @@ ], "inputPrice": 0, "outputPrice": 0, - "defaultTemperature": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/tencent.json b/compute/providers/tencent.json index c98867c..6585efd 100644 --- a/compute/providers/tencent.json +++ b/compute/providers/tencent.json @@ -21,7 +21,7 @@ "reasoning" ], "description": "腾讯混元最新推理模型,128K输入/64K输出,MoE架构406B总参数", - "contextWindow": 128000, + "contextWindow": 196608, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -31,9 +31,56 @@ ], "inputPrice": 3.975, "outputPrice": 15.9, - "defaultTemperature": 1, - "defaultTopP": 1, - "extra": {} + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 32768, + "inputPrice": 3.975, + "outputPrice": 15.9 + }, + { + "maxInputTokens": 131072, + "inputPrice": 5.3, + "outputPrice": 21.2 + } + ] + } + }, + { + "modelName": "hunyuan-2.0-instruct-20251111", + "displayName": "混元 2.0 Instruct", + "serviceType": [ + "chat" + ], + "description": "腾讯混元 2.0 指令模型,最大输入128K/最大输出16K,支持联网搜索和 Function Calling", + "contextWindow": 147456, + "maxOutputTokens": 16384, + "capabilities": [ + "chat", + "code", + "long_context", + "tool_use" + ], + "inputPrice": 3.18, + "outputPrice": 7.95, + "defaultTemperature": null, + "defaultTopP": null, + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 32768, + "inputPrice": 3.18, + "outputPrice": 7.95 + }, + { + "maxInputTokens": 131072, + "inputPrice": 4.505, + "outputPrice": 11.13 + } + ] + } }, { "modelName": "hunyuan-turbos-latest", @@ -54,8 +101,8 @@ ], "inputPrice": 0.8, "outputPrice": 2, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/xai.json b/compute/providers/xai.json index 6f8e2ed..71f13a6 100644 --- a/compute/providers/xai.json +++ b/compute/providers/xai.json @@ -27,8 +27,8 @@ ], "inputPrice": 2.00, "outputPrice": 6.00, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} }, { @@ -49,8 +49,8 @@ ], "inputPrice": 0.20, "outputPrice": 0.50, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": null, + "defaultTopP": null, "extra": {} } ] diff --git a/compute/providers/xunfei.json b/compute/providers/xunfei.json index 6889f5b..c236129 100644 --- a/compute/providers/xunfei.json +++ b/compute/providers/xunfei.json @@ -25,12 +25,10 @@ "math", "code" ], - "inputPrice": 11, - "outputPrice": 11, - "defaultTemperature": 1, - "defaultTopP": 1, + "defaultTemperature": 1.2, + "defaultTopP": 0.95, "extra": { - "pricingNote": "讯飞按token包计费,不区分输入输出" + "pricingNote": "官方公开文档说明模型价格以控制台及实际购买页为准,未公开固定 token 单价" } }, { @@ -46,12 +44,10 @@ "code", "tool_use" ], - "inputPrice": 60, - "outputPrice": 60, "defaultTemperature": 1, "defaultTopP": 1, "extra": { - "pricingNote": "讯飞按token包计费,不区分输入输出" + "pricingNote": "官方公开文档说明模型价格以控制台及实际购买页为准,未公开固定 token 单价" } } ] diff --git a/字段取值表/anthropic/未确认字段报告.md b/字段取值表/anthropic/未确认字段报告.md index 77d4488..b068d8e 100644 --- a/字段取值表/anthropic/未确认字段报告.md +++ b/字段取值表/anthropic/未确认字段报告.md @@ -1,47 +1,17 @@ # 未确认字段报告 - compute/providers/anthropic.json - provider: `anthropic` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` -## claude-opus-4-6 +## claude-opus-4-7 -- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.6 -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTopP`: 已查 https://docs.anthropic.com/en/api/messages 。官方页面给出了 `top_p` 参数说明和范围,但没有给“省略参数时默认值”,因此只能保留为 `null`。 -## claude-opus-4-5 +## claude-sonnet-4-6 -- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.5 -- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTopP`: 已查 https://docs.anthropic.com/en/api/messages 。官方页面给出了 `top_p` 参数说明和范围,但没有给“省略参数时默认值”,因此只能保留为 `null`。 -## claude-sonnet-4-5 +## claude-haiku-4-5 -- `modelName`: ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## claude-sonnet-4 - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## claude-sonnet-4-5-computer - -- `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 -- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTopP`: 已查 https://docs.anthropic.com/en/api/messages 。官方页面给出了 `top_p` 参数说明和范围,但没有给“省略参数时默认值”,因此只能保留为 `null`。 diff --git a/字段取值表/anthropic/详细字段取值表.md b/字段取值表/anthropic/详细字段取值表.md index ca89d3f..b5e451e 100644 --- a/字段取值表/anthropic/详细字段取值表.md +++ b/字段取值表/anthropic/详细字段取值表.md @@ -1,114 +1,30 @@ # 详细字段取值表 - compute/providers/anthropic.json - provider: `anthropic` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://platform.claude.com/docs/en/about-claude/models/overview -- https://platform.claude.com/docs/en/about-claude/pricing -- https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 -- https://www.anthropic.com/news/claude-opus-4-5 -- https://www.anthropic.com/news/claude-sonnet-4-5 -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models +- https://docs.anthropic.com/en/api/messages -## claude-opus-4-6 - -- ZenMux匹配级别: `normalized` -- ZenMux命中: `anthropic/claude-opus-4.6` -- ZenMux候选: `anthropic/claude-opus-4.6` +## claude-opus-4-7 | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"claude-opus-4-6"` | `"claude-opus-4.6"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.6 | -| `displayName` | `"Claude Opus 4.6"` | `"Claude Opus 4.6"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1000000` | `1000000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 为 `1M tokens` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 的 Max output 为 `128k tokens` | -| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.6) prompt=5 USD/MTokens | -| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.6) completion=25 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `1` | `1` | 保持 | Anthropic Messages API 文档明确写明 `temperature` `Defaults to 1.0`。 | +| `defaultTopP` | `null` | `null` | 保持 | Anthropic Messages API 文档描述了 `top_p` 的含义和范围,但未给省略时默认值;JSON 不应伪装成官方默认值。 | -## claude-opus-4-5 - -- ZenMux匹配级别: `normalized` -- ZenMux命中: `anthropic/claude-opus-4.5` -- ZenMux候选: `anthropic/claude-opus-4.5` +## claude-sonnet-4-6 | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"claude-opus-4-5"` | `"claude-opus-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.5 | -| `displayName` | `"Claude Opus 4.5"` | `"Claude Opus 4.5"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | ZenMux(anthropic/claude-opus-4.5)口径近似(≤3%) | -| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens | -| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.5) prompt=5 USD/MTokens | -| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.5) completion=25 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `1` | `1` | 保持 | Anthropic Messages API 文档明确写明 `temperature` `Defaults to 1.0`。 | +| `defaultTopP` | `null` | `null` | 保持 | Anthropic Messages API 文档描述了 `top_p` 的含义和范围,但未给省略时默认值;JSON 不应伪装成官方默认值。 | -## claude-sonnet-4-5 - -- ZenMux匹配级别: `normalized` -- ZenMux命中: `anthropic/claude-sonnet-4.5` -- ZenMux候选: `anthropic/claude-sonnet-4.5` +## claude-haiku-4-5 | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"claude-sonnet-4-5"` | `"claude-sonnet-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 | -| `displayName` | `"Claude Sonnet 4.5"` | `"Claude Sonnet 4.5"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `200K tokens / 1M tokens (beta)`;本项目 `contextWindow` 取标准口径 `200000` | -| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `64K tokens` 最大输出 | -| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) prompt=3 USD/MTokens | -| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) completion=15 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## claude-sonnet-4 - -- ZenMux匹配级别: `exact` -- ZenMux命中: `anthropic/claude-sonnet-4` -- ZenMux候选: `anthropic/claude-sonnet-4` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"claude-sonnet-4"` | `"claude-sonnet-4"` | 保持 | ZenMux匹配(exact): anthropic/claude-sonnet-4 | -| `displayName` | `"Claude Sonnet 4"` | `"Claude Sonnet 4"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 context window 为 `200k tokens` | -| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 Max output 为 `64k tokens` | -| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4) prompt=3 USD/MTokens | -| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4) completion=15 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## claude-sonnet-4-5-computer - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `anthropic/claude-sonnet-4.5`、`anthropic/claude-sonnet-4`、`anthropic/claude-sonnet-4.6`、`anthropic/claude-opus-4.5`、`anthropic/claude-haiku-4.5` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"claude-sonnet-4-5-computer"` | `"claude-sonnet-4-5-computer"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Claude Sonnet 4.5 Computer Use"` | `"Claude Sonnet 4.5 Computer Use"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["computer_use"]` | `["computer_use"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | -| `maxOutputTokens` | `64000` | `64000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | -| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","vision","computer_use","tool_use","reasoning"]` | `["chat","vision","computer_use","tool_use","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `1` | `1` | 保持 | Anthropic Messages API 文档明确写明 `temperature` `Defaults to 1.0`。 | +| `defaultTopP` | `null` | `null` | 保持 | Anthropic Messages API 文档描述了 `top_p` 的含义和范围,但未给省略时默认值;JSON 不应伪装成官方默认值。 | diff --git a/字段取值表/baichuan/未确认字段报告.md b/字段取值表/baichuan/未确认字段报告.md index 10ac6b4..722e863 100644 --- a/字段取值表/baichuan/未确认字段报告.md +++ b/字段取值表/baichuan/未确认字段报告.md @@ -6,39 +6,31 @@ ## Baichuan-M3-Plus - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3-Plus` +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3-Plus` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## Baichuan-M3 - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3` +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## Baichuan-M2-Plus - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2-Plus` +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2-Plus` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## Baichuan-M2 - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2` +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baichuan/详细字段取值表.md b/字段取值表/baichuan/详细字段取值表.md index 34471fb..bed0255 100644 --- a/字段取值表/baichuan/详细字段取值表.md +++ b/字段取值表/baichuan/详细字段取值表.md @@ -8,6 +8,7 @@ - https://platform.baichuan-ai.com/prices - https://platform.baichuan-ai.com/docs/api +- https://platform.baichuan-ai.com/api/gitlab/file - https://platform.baichuan-ai.com/docs/knowledgeBase - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -23,12 +24,12 @@ | `displayName` | `"百川 M3-Plus"` | `"百川 M3-Plus"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3-Plus`,因此不能直接据此回填 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3-Plus`,因此不能直接据此回填 | | `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `9` | `9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `temperature` 默认值 `0.3`;未覆盖 `Baichuan-M3-Plus`,按“官网未定义该型号默认值”记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `top_p` 默认值 `0.85`;未覆盖 `Baichuan-M3-Plus`,按“官网未定义该型号默认值”记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## Baichuan-M3 @@ -42,12 +43,12 @@ | `displayName` | `"百川 M3"` | `"百川 M3"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3`,因此不能直接据此回填 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3`,因此不能直接据此回填 | | `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","vision","medical"]` | `["chat","reasoning","code","multilingual","vision","medical"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `temperature` 默认值 `0.3`;未覆盖 `Baichuan-M3`,按“官网未定义该型号默认值”记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `top_p` 默认值 `0.85`;未覆盖 `Baichuan-M3`,按“官网未定义该型号默认值”记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## Baichuan-M2-Plus @@ -61,12 +62,12 @@ | `displayName` | `"百川 M2-Plus"` | `"百川 M2-Plus"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2-Plus`,因此不能直接据此回填 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2-Plus`,因此不能直接据此回填 | | `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `temperature` 默认值 `0.3`;未覆盖 `Baichuan-M2-Plus`,按“官网未定义该型号默认值”记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `top_p` 默认值 `0.85`;未覆盖 `Baichuan-M2-Plus`,按“官网未定义该型号默认值”记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## Baichuan-M2 @@ -80,10 +81,10 @@ | `displayName` | `"百川 M2"` | `"百川 M2"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2`,因此不能直接据此回填 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api 及其官方正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 返回的 `mainDocument.md`;当前通用对话 API 文档确有 `max_tokens` 参数,取值范围为 `[1,2048]`、默认 `2048`,但正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2`,因此不能直接据此回填 | | `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `temperature` 默认值 `0.3`;未覆盖 `Baichuan-M2`,按“官网未定义该型号默认值”记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 百川官方通用对话 API 文档 https://platform.baichuan-ai.com/docs/api 及其正文源 `https://platform.baichuan-ai.com/api/gitlab/file` 仅为 `Baichuan4/3/2-Turbo` 系列声明 `top_p` 默认值 `0.85`;未覆盖 `Baichuan-M2`,按“官网未定义该型号默认值”记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/baidu/未确认字段报告.md b/字段取值表/baidu/未确认字段报告.md index ba90482..7a0ce7b 100644 --- a/字段取值表/baidu/未确认字段报告.md +++ b/字段取值表/baidu/未确认字段报告.md @@ -8,8 +8,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## ernie-4.5-turbo-128k-latest @@ -17,6 +15,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baidu/详细字段取值表.md b/字段取值表/baidu/详细字段取值表.md index d6c126e..cc9c357 100644 --- a/字段取值表/baidu/详细字段取值表.md +++ b/字段取值表/baidu/详细字段取值表.md @@ -8,6 +8,7 @@ - https://cloud.baidu.com/doc/qianfan/ - https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j +- https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -27,8 +28,8 @@ | `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","vision","multimodal","tool_use"]` | `["chat","reasoning","vision","multimodal","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-5.0` 系列属于“ERNIE 深度思考模型”,`temperature` 不支持、传入后忽略不报错,因此本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-5.0` 系列 `top_p` 不支持、传入后忽略不报错,因此本地字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## ernie-4.5-turbo-128k-latest @@ -46,6 +47,44 @@ | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","vision","long_context","fast"]` | `["chat","code","vision","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.8` | `0.8` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-4.5-turbo` 系列 `temperature` 默认值为 `0.8` | +| `defaultTopP` | `1` | `1` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-4.5-turbo` 系列 `top_p` 默认值为 `1.0` | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## ernie-5.0 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-5.0"` | `"ernie-5.0"` | 保持 | 百度千帆默认模型与深度思考文档均直接使用该模型名 | +| `displayName` | `"文心 ERNIE 5.0 非思考"` | `"文心 ERNIE 5.0 非思考"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0` 上下文长度为 `128k`;当前值 `131072` 为按 `128 * 1024` 换算 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0` 最大输出为 `[1,65536]` | +| `inputPrice` | `6` | `6` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `24` | `24` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","vision","multimodal","tool_use"]` | `["chat","vision","multimodal","tool_use"]` | 待确认 | 能力字段为项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-5.0` 系列属于“ERNIE 深度思考模型”,`temperature` 不支持、传入后忽略不报错 | +| `defaultTopP` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-5.0` 系列 `top_p` 不支持、传入后忽略不报错 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## ernie-x1.1 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-x1.1"` | `"ernie-x1.1"` | 保持 | 百度千帆模型列表直接使用该模型名 | +| `displayName` | `"文心 ERNIE X1.1"` | `"文心 ERNIE X1.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `65536` | `65536` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-x1.1` 上下文长度为 `64k`;当前值 `65536` 为按 `64 * 1024` 换算 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-x1.1` 最大输出为 `[1,65536]` | +| `inputPrice` | `1` | `1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","math","code"]` | `["chat","reasoning","deep_thinking","math","code"]` | 待确认 | 能力字段为项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-x1.1` 系列属于“ERNIE 深度思考模型”,`temperature` 不支持、传入后忽略不报错 | +| `defaultTopP` | `null` | `null` | 保持 | 百度千帆官方“模型默认参数说明” https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf 明确 `ernie-x1.1` 系列 `top_p` 不支持、传入后忽略不报错 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/cohere/未确认字段报告.md b/字段取值表/cohere/未确认字段报告.md index f348175..f1e61eb 100644 --- a/字段取值表/cohere/未确认字段报告.md +++ b/字段取值表/cohere/未确认字段报告.md @@ -1,31 +1,7 @@ # 未确认字段报告 - compute/providers/cohere.json - provider: `cohere` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` -## command-a-03-2025 - -- `modelName`: ZenMux无稳定匹配 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## embed-v4.0 - -- `modelName`: ZenMux无稳定匹配 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## rerank-v3.5 - -- `modelName`: ZenMux无稳定匹配 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +本轮范围内无剩余未确认项。 diff --git a/字段取值表/cohere/详细字段取值表.md b/字段取值表/cohere/详细字段取值表.md index 2966d2b..0ac45f8 100644 --- a/字段取值表/cohere/详细字段取值表.md +++ b/字段取值表/cohere/详细字段取值表.md @@ -1,72 +1,39 @@ # 详细字段取值表 - compute/providers/cohere.json - provider: `cohere` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://docs.cohere.com/v1/docs/models/command -- https://docs.cohere.com/v2/docs/models +- https://docs.cohere.com/reference/chat - https://docs.cohere.com/docs/cohere-embed - https://docs.cohere.com/v2/docs/rerank -- https://cohere.com/pricing -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models ## command-a-03-2025 -- ZenMux匹配级别: `none` -- ZenMux候选: (none) +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `0.3` | `0.3` | 保持 | Cohere Chat API 参考文档明确写明 `temperature` `Defaults to 0.3`。 | +| `defaultTopP` | `0.75` | `0.75` | 保持 | Cohere Chat API 参考文档使用参数名 `p`,并明确写明 `Defaults to 0.75`;本项目字段 `defaultTopP` 对应此 nucleus sampling 参数。 | + +## command-r7b-12-2024 | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"command-a-03-2025"` | `"command-a-03-2025"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Command A"` | `"Command A"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `256000` | `256000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 context 为 `256,000` tokens | -| `maxOutputTokens` | `8000` | `8000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 max output 为 `8,000` tokens | -| `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `0.3` | `0.3` | 保持 | Cohere Chat API 参考文档明确写明 `temperature` `Defaults to 0.3`。 | +| `defaultTopP` | `0.75` | `0.75` | 保持 | Cohere Chat API 参考文档使用参数名 `p`,并明确写明 `Defaults to 0.75`;本项目字段 `defaultTopP` 对应此 nucleus sampling 参数。 | ## embed-v4.0 -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"embed-v4.0"` | `"embed-v4.0"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Embed V4"` | `"Embed V4"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 保持 | Cohere Embed 文档 https://docs.cohere.com/docs/cohere-embed 与模型总览 https://docs.cohere.com/v1/docs/models 均标注 `embed-v4.0` 上下文为 `128k` | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/docs/cohere-embed 与 https://docs.cohere.com/v1/docs/models ,`embed-v4.0` 输出为向量表示,官方未定义 max output tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `0.12` | `0.12` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Cohere Embed 文档未定义聊天采样参数默认值;embedding 模型不按聊天采样参数工作。 | +| `defaultTopP` | `null` | `null` | 保持 | Cohere Embed 文档未定义聊天采样参数默认值;embedding 模型不按聊天采样参数工作。 | ## rerank-v3.5 -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"rerank-v3.5"` | `"rerank-v3.5"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Rerank V3.5"` | `"Rerank V3.5"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["rerank"]` | `["rerank"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `4096` | `4096` | 保持 | Cohere Rerank 文档 https://docs.cohere.com/v2/docs/rerank 标注 `rerank-v3.5` context length 为 `4096` tokens | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/v2/docs/rerank ,`rerank-v3.5` 返回相关性分数而非文本 completion,官方未定义 max output tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["rerank","semantic_reranking"]` | `["rerank","semantic_reranking"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Cohere Rerank 文档未定义聊天采样参数默认值;rerank 模型不按聊天采样参数工作。 | +| `defaultTopP` | `null` | `null` | 保持 | Cohere Rerank 文档未定义聊天采样参数默认值;rerank 模型不按聊天采样参数工作。 | diff --git a/字段取值表/dashscope-coding/未确认字段报告.md b/字段取值表/dashscope-coding/未确认字段报告.md index d16c003..4f71795 100644 --- a/字段取值表/dashscope-coding/未确认字段报告.md +++ b/字段取值表/dashscope-coding/未确认字段报告.md @@ -6,8 +6,6 @@ ## qwen3-coder-plus - `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-max-2026-01-23 @@ -15,6 +13,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope-coding/详细字段取值表.md b/字段取值表/dashscope-coding/详细字段取值表.md index 7571f9d..327d49b 100644 --- a/字段取值表/dashscope-coding/详细字段取值表.md +++ b/字段取值表/dashscope-coding/详细字段取值表.md @@ -27,8 +27,8 @@ | `inputPrice` | `1` | `1` | 保持 | ZenMux(qwen/qwen3-coder-plus) prompt=1 USD/MTokens | | `outputPrice` | `5` | `5` | 保持 | ZenMux(qwen/qwen3-coder-plus) completion=5 USD/MTokens | | `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 已复核阿里云官方 OpenAI Chat / DashScope API 文档,`Qwen3-Coder` 系列默认 `temperature=0.7` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 已复核阿里云官方 OpenAI Chat / DashScope API 文档,`Qwen3-Coder` 系列默认 `top_p=0.8` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-max-2026-01-23 @@ -46,6 +46,6 @@ | `inputPrice` | `1.2` | `1.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 已复核阿里云官方 OpenAI Chat / DashScope API 文档,`qwen-max` 系列默认 `temperature=0.7` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 已复核阿里云官方 OpenAI Chat / DashScope API 文档,`qwen-max` 系列默认 `top_p=0.8` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope/未确认字段报告.md b/字段取值表/dashscope/未确认字段报告.md index 7475592..893b391 100644 --- a/字段取值表/dashscope/未确认字段报告.md +++ b/字段取值表/dashscope/未确认字段报告.md @@ -8,8 +8,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen-max @@ -17,8 +15,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen-plus @@ -26,8 +22,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen-turbo @@ -35,8 +29,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen-long @@ -44,8 +36,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-max @@ -53,8 +43,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-vl-plus @@ -62,8 +50,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-vl-flash @@ -71,8 +57,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## text-embedding-v3 @@ -80,8 +64,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## text-embedding-v4 @@ -89,8 +71,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-rerank @@ -98,8 +78,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## cosyvoice-v2 @@ -107,8 +85,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## paraformer-v2 @@ -116,8 +92,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## wanx-v2 @@ -125,8 +99,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## wanx-video @@ -134,8 +106,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## cosyvoice-clone @@ -143,8 +113,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen-omni-turbo @@ -152,17 +120,15 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-max-trans - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应 -- `maxOutputTokens`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应 +- `contextWindow`: 已复核 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方当前机器翻译产品线公开的是 `qwen-mt-plus` / `qwen-mt-flash` / `qwen-mt-turbo` / `qwen-mt-lite`;用户指南还明确 `qwen-mt-plus`、`qwen-mt-turbo` 属于 `Qwen3-MT`,但没有任何页面使用 `qwen3-max-trans` 这个模型名,也没有给出本地别名到官方型号的一一映射,因此无法确认本地 `qwen3-max-trans` 的固定上下文窗口 +- `maxOutputTokens`: 已复核 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方机器翻译页确实公开了 `qwen-mt-plus` / `qwen-mt-flash` / `qwen-mt-turbo` / `qwen-mt-lite` 的最大输出规格,但没有任何页面使用 `qwen3-max-trans` 这个模型名,也没有给出别名映射,因此不能把任一 `Qwen-MT` 规格直接回填到本地 `qwen3-max-trans` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 +- `defaultTemperature`: 已复核 https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/machine-translation ,官方只对 `qwen-mt` 系列给出 `temperature=0.65` 的默认值,但没有提供本地别名 `qwen3-max-trans` 到 `qwen-mt-*` 的官方映射,因此不能把该数字确认为本地模型的官方默认值 +- `defaultTopP`: 已复核 https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/machine-translation ,官方只对 `qwen-mt` 系列给出 `top_p=0.8` 的默认值,但没有提供本地别名 `qwen3-max-trans` 到 `qwen-mt-*` 的官方映射,因此不能把该数字确认为本地模型的官方默认值 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope/详细字段取值表.md b/字段取值表/dashscope/详细字段取值表.md index 05a3c20..f9d2121 100644 --- a/字段取值表/dashscope/详细字段取值表.md +++ b/字段取值表/dashscope/详细字段取值表.md @@ -8,6 +8,9 @@ - https://help.aliyun.com/zh/model-studio/model - https://help.aliyun.com/zh/model-studio/models +- https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions +- https://help.aliyun.com/zh/model-studio/deep-thinking +- https://help.aliyun.com/zh/model-studio/vision - https://help.aliyun.com/zh/model-studio/rerank - https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api - https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni @@ -32,8 +35,8 @@ | `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `4.8` | `4.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.6` | `0.6` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 给出 Qwen3.5 思考模式默认 `temperature=0.6`;视觉理解文档 https://help.aliyun.com/zh/model-studio/vision 明确 `qwen3.5` 系列 `enable_thinking` 默认为 `true` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 给出 Qwen3.5 思考模式默认 `top_p=0.95`;视觉理解文档确认 `qwen3.5` 系列默认开启思考 | | `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen-max @@ -51,8 +54,8 @@ | `inputPrice` | `2.4` | `2.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `9.6` | `9.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 将 `qwen-max` 系列默认 `temperature` 标注为 `0.7` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 将 `qwen-max` 系列默认 `top_p` 标注为 `0.8` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen-plus @@ -70,8 +73,8 @@ | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","thinking_mode"]` | `["chat","reasoning","code","thinking_mode"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.6` | `0.6` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 只区分 `qwen-plus` 系列思考/非思考两套参数;深度思考文档 https://help.aliyun.com/zh/model-studio/deep-thinking 说明该模型支持 `enable_thinking` 切换,但官网没有给“省略 `enable_thinking` 时”的单一默认值,因此本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 官网仅给出模式相关参数口径,未给 `qwen-plus` 稳定版在省略 `enable_thinking` 时的单一 `top_p` 默认值,因此本地字段应为 `null` | | `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen-turbo @@ -89,8 +92,8 @@ | `inputPrice` | `0.367` | `0.367` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `1.468` | `1.468` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","long_context","fast"]` | `["chat","code","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 只给出 `qwen-turbo` 非思考模式默认值;官网未说明稳定版省略 `enable_thinking` 时是否默认进入思考模式,因此本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 官网未公开 `qwen-turbo` 在省略 `enable_thinking` 时的单一模型级 `top_p` 默认值,因此本地字段应为 `null` | | `extra` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen-long @@ -108,8 +111,8 @@ | `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","ultra_long_context","document_processing"]` | `["chat","ultra_long_context","document_processing"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 将 `qwen-long` 系列默认 `temperature` 标注为 `1.0` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 将 `qwen-long` 系列默认 `top_p` 标注为 `0.8` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-max @@ -128,8 +131,8 @@ | `inputPrice` | `2.5` | `2.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `10` | `10` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 对 `Qwen3` 仅区分思考/非思考两套默认参数;官网没有给 `qwen3-max` 稳定版省略思考开关时的单一默认值,因此本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 官网未公开 `qwen3-max` 稳定版在省略思考开关时的单一模型级 `top_p` 默认值,因此本地字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-vl-plus @@ -148,8 +151,8 @@ | `inputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `6` | `6` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 给出 `Qwen3-VL` 非思考模式默认 `temperature=0.7`;视觉理解文档 https://help.aliyun.com/zh/model-studio/vision 明确 `qwen3-vl-plus` 默认 `enable_thinking=false` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 阿里云 OpenAI Chat API 文档给出 `Qwen3-VL` 非思考模式默认 `top_p=0.8`;视觉理解文档确认 `qwen3-vl-plus` 默认关闭思考 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-vl-flash @@ -167,8 +170,8 @@ | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","vision","image_understanding","fast"]` | `["chat","vision","image_understanding","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 给出 `Qwen3-VL` 非思考模式默认 `temperature=0.7`;视觉理解文档 https://help.aliyun.com/zh/model-studio/vision 明确 `qwen3-vl-flash` 默认 `enable_thinking=false` | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 阿里云 OpenAI Chat API 文档给出 `Qwen3-VL` 非思考模式默认 `top_p=0.8`;视觉理解文档确认 `qwen3-vl-flash` 默认关闭思考 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## text-embedding-v3 @@ -186,8 +189,8 @@ | `inputPrice` | `0.7` | `0.7` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["text_embedding","semantic_search","chinese_optimized"]` | `["text_embedding","semantic_search","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 仅定义输入文本、向量维度等参数,不支持采样参数;`defaultTemperature` 应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云 Embedding 同步接口文档未定义 `top_p`;Embedding 模型不支持采样参数,因此字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## text-embedding-v4 @@ -205,8 +208,8 @@ | `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["text_embedding","semantic_search","rag"]` | `["text_embedding","semantic_search","rag"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 仅定义输入文本、向量维度等参数,不支持采样参数;`defaultTemperature` 应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云 Embedding 同步接口文档未定义 `top_p`;Embedding 模型不支持采样参数,因此字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-rerank @@ -224,8 +227,8 @@ | `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["rerank","semantic_reranking","multilingual"]` | `["rerank","semantic_reranking","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 Rerank 文档 https://help.aliyun.com/zh/model-studio/rerank 仅定义检索文本、文档列表等重排序参数,不支持采样参数;字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云 Rerank 文档未定义 `top_p`;重排序模型不支持采样参数,因此字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## cosyvoice-v2 @@ -243,8 +246,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["tts","multilingual","chinese_optimized"]` | `["tts","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云语音合成文档 https://help.aliyun.com/model-studio/developer-reference/quick-start-cosyvoice 仅定义语音、音色、格式等参数,不支持采样参数;字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云语音合成文档未定义 `top_p`;TTS 模型不支持采样参数,因此字段应为 `null` | | `extra` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## paraformer-v2 @@ -262,8 +265,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["asr","chinese_optimized"]` | `["asr","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 ASR 文档 https://help.aliyun.com/document_detail/2840914.html 仅定义音频识别参数,不支持采样参数;字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云 ASR 文档未定义 `top_p`;ASR 模型不支持采样参数,因此字段应为 `null` | | `extra` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## wanx-v2 @@ -281,8 +284,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["image_generation","chinese_optimized"]` | `["image_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-v2` 归为图像生成模型,官方接口未定义 `temperature` 默认值;本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云图像生成相关文档未定义 `top_p`;图像生成模型不支持该采样字段时应记为 `null` | | `extra` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## wanx-video @@ -300,8 +303,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["video_generation","chinese_optimized"]` | `["video_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-video` 归为视频生成模型,官方接口未定义 `temperature` 默认值;本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 阿里云视频生成相关文档未定义 `top_p`;视频生成模型不支持该采样字段时应记为 `null` | | `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## cosyvoice-clone @@ -319,8 +322,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将该能力归为声音定制类服务,官方接口未定义采样参数;字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 声音复刻能力未定义 `top_p`;该字段不适用,应为 `null` | | `extra` | `{"maxCloneSamples":5,"minCloneDuration":3}` | `{"maxCloneSamples":5,"minCloneDuration":3}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen-omni-turbo @@ -338,8 +341,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","vision","tts","asr","multimodal","tool_use"]` | `["chat","vision","tts","asr","multimodal","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 给出了 `qwen-omni-turbo` 系列 `top_p` 默认值,但未给非实时 Qwen-Omni 的 `temperature` 默认值;因此本地 `defaultTemperature` 应为 `null` | +| `defaultTopP` | `0.01` | `0.01` | 保持 | 阿里云 OpenAI Chat API 文档 https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions 明确 `qwen-omni-turbo` 系列默认 `top_p=0.01` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-max-trans @@ -352,11 +355,11 @@ | `modelName` | `"qwen3-max-trans"` | `"qwen3-max-trans"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"Qwen3-Max(翻译)"` | `"Qwen3-Max(翻译)"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["translation"]` | `["translation"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `131072` | `131072` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应;当前值暂保留待确认 | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应;当前值暂保留待确认 | +| `contextWindow` | `131072` | `131072` | 待确认 | 已复核 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方当前机器翻译产品线公开的是 `qwen-mt-plus` / `qwen-mt-flash` / `qwen-mt-turbo` / `qwen-mt-lite`;用户指南还明确 `qwen-mt-plus`、`qwen-mt-turbo` 属于 `Qwen3-MT`,但没有任何页面使用 `qwen3-max-trans` 这个模型名,也没有给出本地别名到官方型号的一一映射,因此无法确认本地 `qwen3-max-trans` 的固定上下文窗口 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方机器翻译页确实公开了 `qwen-mt-plus` / `qwen-mt-flash` / `qwen-mt-turbo` / `qwen-mt-lite` 的最大输出规格,但没有任何页面使用 `qwen3-max-trans` 这个模型名,也没有给出别名映射,因此不能把任一 `Qwen-MT` 规格直接回填到本地 `qwen3-max-trans` | | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 阿里云机器翻译文档 https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 为 `qwen-mt` 系列给出 `temperature=0.65`、`top_p=0.8` 的参考默认值,但官方没有给出本地别名 `qwen3-max-trans` 到 `qwen-mt-*` 的一一映射,因此本地字段不能伪装成官方默认值,应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 机器翻译文档中的 `0.8` 仅能作为 `qwen-mt` 系列参考值;在没有官方别名映射前,`qwen3-max-trans` 的 `defaultTopP` 不能确认为官方默认值,应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/deepseek/未确认字段报告.md b/字段取值表/deepseek/未确认字段报告.md index 3e67e70..12f4283 100644 --- a/字段取值表/deepseek/未确认字段报告.md +++ b/字段取值表/deepseek/未确认字段报告.md @@ -8,8 +8,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## deepseek-reasoner @@ -17,7 +15,4 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 - diff --git a/字段取值表/deepseek/详细字段取值表.md b/字段取值表/deepseek/详细字段取值表.md index 9a713e0..327713e 100644 --- a/字段取值表/deepseek/详细字段取值表.md +++ b/字段取值表/deepseek/详细字段取值表.md @@ -7,6 +7,9 @@ ## 来源 - https://api-docs.deepseek.com/quick_start/pricing +- https://api-docs.deepseek.com/api/create-chat-completion +- https://api-docs.deepseek.com/guides/reasoning_model +- https://api-docs.deepseek.com/quick_start/parameter_settings - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -26,8 +29,8 @@ | `inputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","code","reasoning","multilingual"]` | `["chat","code","reasoning","multilingual"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | DeepSeek 官方 Chat Completions API https://api-docs.deepseek.com/api/create-chat-completion 将 `temperature` schema 默认值标注为 `1`;参数设置页 https://api-docs.deepseek.com/quick_start/parameter_settings 也写明默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | DeepSeek 官方 Chat Completions API https://api-docs.deepseek.com/api/create-chat-completion 将 `top_p` schema 默认值标注为 `1` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## deepseek-reasoner @@ -46,6 +49,6 @@ | `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","deep_thinking","code","math"]` | `["chat","reasoning","deep_thinking","code","math"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | DeepSeek 官方推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 明确 `deepseek-reasoner` 不支持参数 `temperature`,因此本地字段应为 `null` 而不是伪装成默认值 | +| `defaultTopP` | `null` | `null` | 保持 | DeepSeek 官方推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 明确 `deepseek-reasoner` 不支持参数 `top_p`,因此本地字段应为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/google/未确认字段报告.md b/字段取值表/google/未确认字段报告.md index d7434b6..abf0c4d 100644 --- a/字段取值表/google/未确认字段报告.md +++ b/字段取值表/google/未确认字段报告.md @@ -1,27 +1,13 @@ # 未确认字段报告 - compute/providers/google.json - provider: `google` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` ## gemini-2.5-pro -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://ai.google.dev/api/models 、https://ai.google.dev/gemini-api/docs/text-generation 。官方明确说明模型元数据里存在 backend 默认值,但公共文档没有直接给出 Gemini 2.5 的默认温度数字;本地原值 `1` 只能视为参考值,不能作为官方默认值写入 JSON。 ## gemini-2.5-flash -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## text-embedding-005 - -- `modelName`: ZenMux无稳定匹配 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://ai.google.dev/api/models 、https://ai.google.dev/gemini-api/docs/text-generation 。官方明确说明模型元数据里存在 backend 默认值,但公共文档没有直接给出 Gemini 2.5 的默认温度数字;本地原值 `1` 只能视为参考值,不能作为官方默认值写入 JSON。 diff --git a/字段取值表/google/详细字段取值表.md b/字段取值表/google/详细字段取值表.md index c2e35ad..d7c8693 100644 --- a/字段取值表/google/详细字段取值表.md +++ b/字段取值表/google/详细字段取值表.md @@ -1,72 +1,55 @@ # 详细字段取值表 - compute/providers/google.json - provider: `google` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://ai.google.dev/gemini-api/docs/models/gemini +- https://ai.google.dev/api/models +- https://ai.google.dev/gemini-api/docs/text-generation +- https://ai.google.dev/gemini-api/docs/gemini-3 +- https://ai.google.dev/gemini-api/docs/prompting-strategies - https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings -- https://ai.google.dev/pricing -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models + +## gemini-3.1-pro-preview + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | Gemini 3 文档明确写明 `temperature` 的默认值为 `1.0`。 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Prompting strategies 文档明确写明 `topP` 的默认值为 `0.95`;Models API 文档说明该值是 backend 默认值。 | + +## gemini-3-flash-preview + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | Gemini 3 文档明确写明 `temperature` 的默认值为 `1.0`。 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Prompting strategies 文档明确写明 `topP` 的默认值为 `0.95`;Models API 文档说明该值是 backend 默认值。 | + +## gemini-3.1-flash-lite-preview + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | Gemini 3 文档明确写明 `temperature` 的默认值为 `1.0`。 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Prompting strategies 文档明确写明 `topP` 的默认值为 `0.95`;Models API 文档说明该值是 backend 默认值。 | ## gemini-2.5-pro -- ZenMux匹配级别: `exact` -- ZenMux命中: `google/gemini-2.5-pro` -- ZenMux候选: `google/gemini-2.5-pro` - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"gemini-2.5-pro"` | `"gemini-2.5-pro"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-pro | -| `displayName` | `"Gemini 2.5 Pro"` | `"Gemini 2.5 Pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | -| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | -| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(google/gemini-2.5-pro) prompt=1.25 USD/MTokens | -| `outputPrice` | `10` | `10` | 保持 | ZenMux(google/gemini-2.5-pro) completion=10 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Google 公共文档未直接给出 Gemini 2.5 的 API 默认 `temperature` 数字;`models.get` 文档只说明模型元数据会返回 backend 默认值,因此 JSON 不保留为伪官方默认值。参考值可记为 `1.0`,但只作参考。 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Prompting strategies 文档明确写明 `topP` 的默认值为 `0.95`。 | ## gemini-2.5-flash -- ZenMux匹配级别: `exact` -- ZenMux命中: `google/gemini-2.5-flash` -- ZenMux候选: `google/gemini-2.5-flash` - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"gemini-2.5-flash"` | `"gemini-2.5-flash"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-flash | -| `displayName` | `"Gemini 2.5 Flash"` | `"Gemini 2.5 Flash"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | -| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | -| `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(google/gemini-2.5-flash) prompt=0.3 USD/MTokens | -| `outputPrice` | `2.5` | `2.5` | 保持 | ZenMux(google/gemini-2.5-flash) completion=2.5 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Google 公共文档未直接给出 Gemini 2.5 的 API 默认 `temperature` 数字;`models.get` 文档只说明模型元数据会返回 backend 默认值,因此 JSON 不保留为伪官方默认值。参考值可记为 `1.0`,但只作参考。 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Prompting strategies 文档明确写明 `topP` 的默认值为 `0.95`。 | ## text-embedding-005 -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"text-embedding-005"` | `"text-embedding-005"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Text Embedding 005"` | `"Text Embedding 005"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `2048` | `2048` | 保持 | Google Cloud Vertex AI Embeddings 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 直接列出 `text-embedding-005` 的 `Max sequence length` 为 `2048 tokens` | -| `maxOutputTokens` | `0` | `0` | 保持 | 同一官方 Vertex AI 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 仅定义输出维度与最大序列长度,`text-embedding-005` 输出为向量而非 completion tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Vertex AI embeddings 文档仅定义嵌入输入长度、维度等规格,不定义采样默认值;embedding 模型不按聊天采样参数使用。 | +| `defaultTopP` | `null` | `null` | 保持 | Vertex AI embeddings 文档仅定义嵌入输入长度、维度等规格,不定义采样默认值;embedding 模型不按聊天采样参数使用。 | diff --git a/字段取值表/infini-coding/未确认字段报告.md b/字段取值表/infini-coding/未确认字段报告.md index 0b2539f..1eaee2d 100644 --- a/字段取值表/infini-coding/未确认字段报告.md +++ b/字段取值表/infini-coding/未确认字段报告.md @@ -6,10 +6,8 @@ ## deepseek-v3 - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` -- `maxOutputTokens`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 +- `contextWindow`: 已复核 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 支持模型页仅列 `deepseek-v3.2` / `deepseek-v3.2-thinking`,并注明模型列表接口本身不返回 metadata;已复核 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中 OpenClaw 示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但页面同时声明该 JSON 示例“可能与实际值不一致”;官方没有把本地别名 `deepseek-v3` 与 `deepseek-v3.2` 做一一映射,因此不能据此确认本地 `deepseek-v3` +- `maxOutputTokens`: 已复核 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方当前只对 `deepseek-v3.2` 的 OpenClaw 示例展示 `maxTokens: 128000`,且示例页明确声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 未出现在官方当前 Coding Plan 模型列表中,无法确认其固定最大输出值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/infini-coding/详细字段取值表.md b/字段取值表/infini-coding/详细字段取值表.md index e3dd778..53a9133 100644 --- a/字段取值表/infini-coding/详细字段取值表.md +++ b/字段取值表/infini-coding/详细字段取值表.md @@ -23,11 +23,11 @@ | `modelName` | `"deepseek-v3"` | `"deepseek-v3"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"DeepSeek V3 (芯穹 Coding)"` | `"DeepSeek V3 (芯穹 Coding)"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已复核 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 支持模型页仅列 `deepseek-v3.2` / `deepseek-v3.2-thinking`,并注明模型列表接口本身不返回 metadata;已复核 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中 OpenClaw 示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但页面同时声明该 JSON 示例“可能与实际值不一致”;官方没有把本地别名 `deepseek-v3` 与 `deepseek-v3.2` 做一一映射,因此不能据此确认本地 `deepseek-v3` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方当前只对 `deepseek-v3.2` 的 OpenClaw 示例展示 `maxTokens: 128000`,且示例页明确声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 未出现在官方当前 Coding Plan 模型列表中,无法确认其固定最大输出值 | | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方当前公开的是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未把本地别名 `deepseek-v3` 与某个官方型号做 1:1 映射;按规则不应冒充官方默认值,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;官方当前没有为本地别名 `deepseek-v3` 公布可直接回填的默认 `top_p`,当前保持 `null` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/internal-testing/未确认字段报告.md b/字段取值表/internal-testing/未确认字段报告.md index aaad51b..4be1a48 100644 --- a/字段取值表/internal-testing/未确认字段报告.md +++ b/字段取值表/internal-testing/未确认字段报告.md @@ -9,8 +9,6 @@ - `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `8192` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-5.1 @@ -18,8 +16,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-5 @@ -27,8 +23,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-5-turbo @@ -36,8 +30,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.7 @@ -45,8 +37,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kimi-k2.6-code-preview @@ -54,8 +44,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kimi-k2.5 @@ -63,8 +51,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.5 @@ -73,8 +59,6 @@ - `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `8192` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3.6-plus @@ -82,8 +66,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3.5-plus @@ -91,8 +73,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3.5-35b-a3b @@ -100,8 +80,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3.5-27b @@ -109,8 +87,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen3-max-2026-01-23 @@ -118,8 +94,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-2-0-code-preview-260215 @@ -127,6 +101,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/internal-testing/详细字段取值表.md b/字段取值表/internal-testing/详细字段取值表.md index 4793e00..18e8c05 100644 --- a/字段取值表/internal-testing/详细字段取值表.md +++ b/字段取值表/internal-testing/详细字段取值表.md @@ -37,8 +37,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1`;本地 `MiniMax-M2.7-highspeed` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95`;本地 `MiniMax-M2.7-highspeed` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-5.1 @@ -56,8 +56,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `temperature` 默认值为 `1`;本地 `glm-5.1` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `top_p` 默认值为 `0.95`;本地 `glm-5.1` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-5 @@ -75,8 +75,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `temperature` 默认值为 `1`;本地 `glm-5` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `top_p` 默认值为 `0.95`;本地 `glm-5` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-5-turbo @@ -94,8 +94,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `temperature` 默认值为 `1`;本地 `glm-5-turbo` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `top_p` 默认值为 `0.95`;本地 `glm-5-turbo` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.7 @@ -113,8 +113,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `temperature` 默认值为 `1`;本地 `glm-4.7` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `top_p` 默认值为 `0.95`;本地 `glm-4.7` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kimi-k2.6-code-preview @@ -132,8 +132,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | Moonshot K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart 明确 K2.6/K2.5 系列默认开启思考,`temperature` 使用确定值 `1.0`;本地 `kimi-k2.6-code-preview` 按同系列理解 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Moonshot K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart 明确 K2.6/K2.5 系列 `top_p` 使用确定值 `0.95`;本地 `kimi-k2.6-code-preview` 按同系列理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kimi-k2.5 @@ -151,8 +151,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | Moonshot K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 明确 K2.5 系列默认开启思考,`temperature` 使用确定值 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Moonshot K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 明确 K2.5 系列 `top_p` 使用确定值 `0.95` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.5 @@ -170,8 +170,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1`;本地 `MiniMax-M2.5` 与官方模型名一致 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95`;本地 `MiniMax-M2.5` 与官方模型名一致 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3.6-plus @@ -189,8 +189,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-plus` / `Qwen3(非思考模式)` 默认 `temperature=0.7`;本地 `qwen3.6-plus` 按 `qwen-plus` 系列处理 | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-plus` / `Qwen3(非思考模式)` 默认 `top_p=0.8`;本地 `qwen3.6-plus` 按 `qwen-plus` 系列处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3.5-plus @@ -208,8 +208,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-plus` / `Qwen3(非思考模式)` 默认 `temperature=0.7`;本地 `qwen3.5-plus` 按 `qwen-plus` 系列处理 | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-plus` / `Qwen3(非思考模式)` 默认 `top_p=0.8`;本地 `qwen3.5-plus` 按 `qwen-plus` 系列处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3.5-35b-a3b @@ -227,8 +227,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen开源系列` 默认 `temperature=0.7`;本地 `qwen3.5-35b-a3b` 按 qwen 开源系列处理 | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen开源系列` 默认 `top_p=0.8`;本地 `qwen3.5-35b-a3b` 按 qwen 开源系列处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3.5-27b @@ -246,8 +246,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen开源系列` 默认 `temperature=0.7`;本地 `qwen3.5-27b` 按 qwen 开源系列处理 | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen开源系列` 默认 `top_p=0.8`;本地 `qwen3.5-27b` 按 qwen 开源系列处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen3-max-2026-01-23 @@ -265,8 +265,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-max` 系列默认 `temperature=0.7`;本地 `qwen3-max-2026-01-23` 可按官方 dated `qwen3-max` 同系列理解 | +| `defaultTopP` | `0.8` | `0.8` | 保持 | 通义千问 API 参考 https://help.aliyun.com/zh/model-studio/use-qwen-by-calling-api 明确 `qwen-max` 系列默认 `top_p=0.8`;本地 `qwen3-max-2026-01-23` 可按官方 dated `qwen3-max` 同系列理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-2-0-code-preview-260215 @@ -284,6 +284,6 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1`;本地 `doubao-seed-2-0-code-preview-260215` 按官方 `doubao-seed-2.0-code` 快照别名同规格理解 | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7`;本地 `doubao-seed-2-0-code-preview-260215` 按官方 `doubao-seed-2.0-code` 快照别名同规格理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kling/未确认字段报告.md b/字段取值表/kling/未确认字段报告.md index 6983f76..c23c2fc 100644 --- a/字段取值表/kling/未确认字段报告.md +++ b/字段取值表/kling/未确认字段报告.md @@ -8,8 +8,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kling-v2-5-turbo-pro @@ -17,8 +15,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kling-v2 @@ -26,8 +22,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kling-v2-master @@ -35,6 +29,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kling/详细字段取值表.md b/字段取值表/kling/详细字段取值表.md index b152449..d7e4e26 100644 --- a/字段取值表/kling/详细字段取值表.md +++ b/字段取值表/kling/详细字段取值表.md @@ -25,8 +25,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["video_generation","chinese_optimized","high_quality","fast"]` | `["video_generation","chinese_optimized","high_quality","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核可灵官方模型使用指南;视频生成模型按时长/分辨率生成任务,不提供文本采样 `temperature`,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;视频生成模型不提供文本采样 `top_p`,当前保持 `null` | | `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kling-v2-5-turbo-pro @@ -44,8 +44,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核可灵官方模型使用指南;视频生成模型按时长/分辨率生成任务,不提供文本采样 `temperature`,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;视频生成模型不提供文本采样 `top_p`,当前保持 `null` | | `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kling-v2 @@ -63,8 +63,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["video_generation","chinese_optimized","high_quality"]` | `["video_generation","chinese_optimized","high_quality"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核可灵官方模型使用指南;视频生成模型按时长/分辨率生成任务,不提供文本采样 `temperature`,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;视频生成模型不提供文本采样 `top_p`,当前保持 `null` | | `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kling-v2-master @@ -82,6 +82,6 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核可灵官方模型使用指南;视频生成模型按时长/分辨率生成任务,不提供文本采样 `temperature`,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;视频生成模型不提供文本采样 `top_p`,当前保持 `null` | | `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kwai-coding/未确认字段报告.md b/字段取值表/kwai-coding/未确认字段报告.md index 26edb1e..4b97ff1 100644 --- a/字段取值表/kwai-coding/未确认字段报告.md +++ b/字段取值表/kwai-coding/未确认字段报告.md @@ -6,10 +6,8 @@ ## kwai-coder - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 -- `maxOutputTokens`: 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 +- `contextWindow`: 已复核产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名是 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已复核发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但当前公开文档没有上下文窗口字段,也没有说明 `kwai-coder` 与该官方型号的一一映射 +- `maxOutputTokens`: 已复核官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid `customModels` 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但该值出现在客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的固定最大输出说明,不能直接据此回填 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kwai-coding/详细字段取值表.md b/字段取值表/kwai-coding/详细字段取值表.md index f2527ef..16063e2 100644 --- a/字段取值表/kwai-coding/详细字段取值表.md +++ b/字段取值表/kwai-coding/详细字段取值表.md @@ -9,6 +9,7 @@ - https://www.streamlake.com/product/kat-coder - https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 - https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco +- https://www.streamlake.com/document/WANQING/me6z3u08sjus2mzplbj - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -22,11 +23,11 @@ | `modelName` | `"kwai-coder"` | `"kwai-coder"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"KwaiKAT Coder (Coding)"` | `"KwaiKAT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 待确认 | 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已复核产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名是 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已复核发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但当前公开文档没有上下文窗口字段,也没有说明 `kwai-coder` 与该官方型号的一一映射 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid `customModels` 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但该值出现在客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的固定最大输出说明,不能直接据此回填 | | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 已复核 StreamLake 官方“文本生成”接口文档,在线推理点对话 API 的 `temperature` 默认值为 `1` | +| `defaultTopP` | `1` | `1` | 保持 | 已复核 StreamLake 官方“文本生成”接口文档,在线推理点对话 API 的 `top_p` 默认值为 `1` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/lingyiwanwu/未确认字段报告.md b/字段取值表/lingyiwanwu/未确认字段报告.md index 5926295..7fa2daf 100644 --- a/字段取值表/lingyiwanwu/未确认字段报告.md +++ b/字段取值表/lingyiwanwu/未确认字段报告.md @@ -6,21 +6,17 @@ ## yi-lightning - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 -- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `contextWindow`: 已复核 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开可访问页面只展示平台导航、计费入口、Playground 与文档入口,未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片或参数表;已复核 https://platform.lingyiwanwu.com/useragreement ,官方明确开放平台是“多模型聚合平台”,会按任务进行智能路由,因此不能从聚合平台入口反推这两个公开别名的固定上下文规格 +- `maxOutputTokens`: 已复核 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面没有 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且用户协议明确平台存在智能路由,不足以从聚合平台公开入口反推固定 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## yi-vision-v2 - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 -- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `contextWindow`: 已复核 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开可访问页面只展示平台导航、计费入口、Playground 与文档入口,未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片或参数表;已复核 https://platform.lingyiwanwu.com/useragreement ,官方明确开放平台是“多模型聚合平台”,会按任务进行智能路由,因此不能从聚合平台入口反推这两个公开别名的固定上下文规格 +- `maxOutputTokens`: 已复核 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面没有 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且用户协议明确平台存在智能路由,不足以从聚合平台公开入口反推固定 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/lingyiwanwu/详细字段取值表.md b/字段取值表/lingyiwanwu/详细字段取值表.md index 6d93d67..061d300 100644 --- a/字段取值表/lingyiwanwu/详细字段取值表.md +++ b/字段取值表/lingyiwanwu/详细字段取值表.md @@ -8,6 +8,7 @@ - https://platform.lingyiwanwu.com/billing - https://platform.lingyiwanwu.com/playground +- https://platform.lingyiwanwu.com/docs/api-reference - https://platform.lingyiwanwu.com/useragreement - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -22,13 +23,13 @@ | `modelName` | `"yi-lightning"` | `"yi-lightning"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"Yi Lightning"` | `"Yi Lightning"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `contextWindow` | `16000` | `16000` | 待确认 | 已复核 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开可访问页面只展示平台导航、计费入口、Playground 与文档入口,未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片或参数表;已复核 https://platform.lingyiwanwu.com/useragreement ,官方明确开放平台是“多模型聚合平台”,会按任务进行智能路由,因此不能从聚合平台入口反推这两个公开别名的固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已复核 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面没有 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且用户协议明确平台存在智能路由,不足以从聚合平台公开入口反推固定 `maxOutputTokens` | | `inputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","fast","smart_routing"]` | `["chat","reasoning","code","fast","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核官方 `playground`、`docs/api-reference` 与用户协议;公开页面未给 `yi-lightning` 的默认采样值,且平台官方明确为智能路由聚合平台,不应把本地参考值冒充官方默认,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;公开页面未给 `yi-lightning` 的默认 `top_p`,当前保持 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## yi-vision-v2 @@ -41,11 +42,11 @@ | `modelName` | `"yi-vision-v2"` | `"yi-vision-v2"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"Yi Vision V2"` | `"Yi Vision V2"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `contextWindow` | `16000` | `16000` | 待确认 | 已复核 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开可访问页面只展示平台导航、计费入口、Playground 与文档入口,未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片或参数表;已复核 https://platform.lingyiwanwu.com/useragreement ,官方明确开放平台是“多模型聚合平台”,会按任务进行智能路由,因此不能从聚合平台入口反推这两个公开别名的固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已复核 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面没有 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且用户协议明确平台存在智能路由,不足以从聚合平台公开入口反推固定 `maxOutputTokens` | | `inputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核官方 `playground`、`docs/api-reference` 与用户协议;公开页面未给 `yi-vision-v2` 的默认采样值,且平台官方明确为智能路由聚合平台,不应把本地参考值冒充官方默认,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;公开页面未给 `yi-vision-v2` 的默认 `top_p`,当前保持 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/local-whisper/未确认字段报告.md b/字段取值表/local-whisper/未确认字段报告.md index 73735d9..06ccbf5 100644 --- a/字段取值表/local-whisper/未确认字段报告.md +++ b/字段取值表/local-whisper/未确认字段报告.md @@ -8,6 +8,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/local-whisper/详细字段取值表.md b/字段取值表/local-whisper/详细字段取值表.md index a8682a5..e5b0ad4 100644 --- a/字段取值表/local-whisper/详细字段取值表.md +++ b/字段取值表/local-whisper/详细字段取值表.md @@ -26,6 +26,6 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核 Whisper 官方仓库与 `whisper-large-v3` 模型卡;Whisper 是 ASR/翻译模型,官方公开的是转录解码策略而非本地 OpenAI 兼容服务的固定模型级默认采样值,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 已复核 Whisper 官方仓库与模型卡,未提供 ASR 模型的 `top_p` 采样默认值,当前保持 `null` | | `extra` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax-coding/未确认字段报告.md b/字段取值表/minimax-coding/未确认字段报告.md index 95f9c86..0c5827c 100644 --- a/字段取值表/minimax-coding/未确认字段报告.md +++ b/字段取值表/minimax-coding/未确认字段报告.md @@ -8,6 +8,4 @@ - `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.5 - `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `32768` - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax-coding/详细字段取值表.md b/字段取值表/minimax-coding/详细字段取值表.md index c734923..b30108a 100644 --- a/字段取值表/minimax-coding/详细字段取值表.md +++ b/字段取值表/minimax-coding/详细字段取值表.md @@ -31,6 +31,24 @@ | `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(minimax/minimax-m2.5) prompt=0.3 USD/MTokens | | `outputPrice` | `1.2` | `1.2` | 保持 | ZenMux(minimax/minimax-m2.5) completion=1.2 USD/MTokens | | `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `temperature=1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `top_p=0.95` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.7 + +- 本次补充 `defaultTemperature` / `defaultTopP` 复核结论 + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `temperature=1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `top_p=0.95` | + +## MiniMax-M2.7-highspeed + +- 本次补充 `defaultTemperature` / `defaultTopP` 复核结论 + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `temperature=1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核 MiniMax 官方 OpenAI / Anthropic 兼容接口文档,文本模型默认 `top_p=0.95` | diff --git a/字段取值表/minimax/未确认字段报告.md b/字段取值表/minimax/未确认字段报告.md index bb602cd..f46f15d 100644 --- a/字段取值表/minimax/未确认字段报告.md +++ b/字段取值表/minimax/未确认字段报告.md @@ -10,8 +10,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.7-highspeed @@ -21,8 +19,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.5 @@ -32,8 +28,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.5-highspeed @@ -42,8 +36,6 @@ - `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.1 @@ -53,8 +45,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-M2.1-highspeed @@ -63,8 +53,6 @@ - `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## MiniMax-Text-01 @@ -75,6 +63,4 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax/详细字段取值表.md b/字段取值表/minimax/详细字段取值表.md index 9695de4..ff8d1bd 100644 --- a/字段取值表/minimax/详细字段取值表.md +++ b/字段取值表/minimax/详细字段取值表.md @@ -34,8 +34,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.7-highspeed @@ -54,8 +54,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.5 @@ -74,8 +74,8 @@ | `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.5-highspeed @@ -93,8 +93,8 @@ | `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.1 @@ -113,8 +113,8 @@ | `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","code","tool_use","reasoning"]` | `["chat","code","tool_use","reasoning"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-M2.1-highspeed @@ -132,8 +132,8 @@ | `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax OpenAI 兼容文本对话文档 https://platform.minimaxi.com/docs/api-reference/text-chat-openai 明确 `top_p` 默认值为 `0.95` | | `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## MiniMax-Text-01 @@ -152,6 +152,6 @@ | `inputPrice` | `1.4` | `1.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `7.7` | `7.7` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.1` | `0.1` | 保持 | MiniMax 文本合成文档 https://platform.minimaxi.com/docs/api-reference/text-post 明确 `MiniMax-Text-01` 的 `temperature` 默认值为 `0.1` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | MiniMax 文本合成文档 https://platform.minimaxi.com/docs/api-reference/text-post 明确各模型 `top_p` 默认值为 `0.95`,其中覆盖 `MiniMax-Text-01` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/mistral/未确认字段报告.md b/字段取值表/mistral/未确认字段报告.md index 3afcab3..6286e0d 100644 --- a/字段取值表/mistral/未确认字段报告.md +++ b/字段取值表/mistral/未确认字段报告.md @@ -1,37 +1,17 @@ # 未确认字段报告 - compute/providers/mistral.json - provider: `mistral` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` ## mistral-large-latest -- `modelName`: ZenMux匹配(similar): mistralai/mistral-large-2512 -- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens -- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 -- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.mistral.ai/api 。官方只说明默认值随模型而变,需调用 `/models` 获取;公开文档未直接给出该模型默认数字,因此只能保留 `null`。 ## mistral-small-latest -- `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 -- `maxOutputTokens`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.mistral.ai/api 。官方只说明默认值随模型而变,需调用 `/models` 获取;公开文档未直接给出该模型默认数字,因此只能保留 `null`。 ## codestral-latest -- `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - +- `defaultTemperature`: 已查 https://docs.mistral.ai/api 。官方只说明默认值随模型而变,需调用 `/models` 获取;公开文档未直接给出该模型默认数字,因此只能保留 `null`。 diff --git a/字段取值表/mistral/详细字段取值表.md b/字段取值表/mistral/详细字段取值表.md index 110b816..29183b3 100644 --- a/字段取值表/mistral/详细字段取值表.md +++ b/字段取值表/mistral/详细字段取值表.md @@ -1,70 +1,30 @@ # 详细字段取值表 - compute/providers/mistral.json - provider: `mistral` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://docs.mistral.ai/getting-started/models -- https://mistral.ai/pricing -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models +- https://docs.mistral.ai/api ## mistral-large-latest -- ZenMux匹配级别: `similar` -- ZenMux命中: `mistralai/mistral-large-2512` -- ZenMux候选: `mistralai/mistral-large-2512` - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"mistral-large-latest"` | `"mistral-large-2512"` | 待确认 | ZenMux匹配(similar): mistralai/mistral-large-2512 | -| `displayName` | `"Mistral Large 3"` | `"Mistral Large 3"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `256000` | `256000` | 保持 | Mistral 官方模型页 https://docs.mistral.ai/models/mistral-large-3-25-12 标注 `mistral-large-2512` / Mistral Large 3 的 Context 为 `256k` | -| `maxOutputTokens` | `262144` | `262144` | 待确认 | 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | -| `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | -| `outputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | -| `capabilities` | `["chat","reasoning","code","vision","tool_use","long_context"]` | `["chat","reasoning","code","vision","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Mistral API 文档明确写明 `temperature` 的默认值取决于具体模型,并要求调用 `/models` 获取;公开文档未给该模型的默认数字。 | +| `defaultTopP` | `1` | `1` | 保持 | Mistral API 文档在 Chat Completion / FIM 参数定义中明确写明 `top_p` `Default Value: 1`。 | ## mistral-small-latest -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"mistral-small-latest"` | `"mistral-small-latest"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Mistral Small 3.2"` | `"Mistral Small 3.2"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens | -| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","code","vision","reasoning","fast","tool_use"]` | `["chat","code","vision","reasoning","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Mistral API 文档明确写明 `temperature` 的默认值取决于具体模型,并要求调用 `/models` 获取;公开文档未给该模型的默认数字。 | +| `defaultTopP` | `1` | `1` | 保持 | Mistral API 文档在 Chat Completion / FIM 参数定义中明确写明 `top_p` `Default Value: 1`。 | ## codestral-latest -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"codestral-latest"` | `"codestral-latest"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Codestral"` | `"Codestral"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `256000` | `128000` | 建议修改 | Mistral 官方模型页 https://docs.mistral.ai/models/codestral-25-08 标注 Codestral 的 Context 为 `128k` | -| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | -| `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `0.9` | `0.9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["code","fill_in_the_middle"]` | `["code","fill_in_the_middle"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Mistral API 文档明确写明 `temperature` 的默认值取决于具体模型,并要求调用 `/models` 获取;公开文档未给该模型的默认数字。 | +| `defaultTopP` | `1` | `1` | 保持 | Mistral API 文档在 Chat Completion / FIM 参数定义中明确写明 `top_p` `Default Value: 1`。 | diff --git a/字段取值表/moonshot-coding/未确认字段报告.md b/字段取值表/moonshot-coding/未确认字段报告.md index 6be185d..02b375d 100644 --- a/字段取值表/moonshot-coding/未确认字段报告.md +++ b/字段取值表/moonshot-coding/未确认字段报告.md @@ -6,6 +6,4 @@ ## kimi-k2.5 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot-coding/详细字段取值表.md b/字段取值表/moonshot-coding/详细字段取值表.md index bd12ce6..1f27a02 100644 --- a/字段取值表/moonshot-coding/详细字段取值表.md +++ b/字段取值表/moonshot-coding/详细字段取值表.md @@ -7,6 +7,7 @@ ## 来源 - https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://platform.kimi.com/docs/api/models-overview - https://platform.kimi.com/docs/pricing/chat-k25 - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -27,6 +28,15 @@ | `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(moonshotai/kimi-k2.5) prompt=0.58 USD/MTokens | | `outputPrice` | `3.02` | `3.02` | 保持 | ZenMux(moonshotai/kimi-k2.5) completion=3.02 USD/MTokens | | `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 已复核 Moonshot 官方 Kimi K2.5 文档,K2.5 当前将 `temperature` 固定为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核 Moonshot 官方 Kimi K2.5 文档,K2.5 当前将 `top_p` 固定为 `0.95` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-for-coding + +- 本次补充 `defaultTemperature` / `defaultTopP` 复核结论 + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `null` | `null` | 保持 | 已复核 Moonshot 官方模型总览与 Kimi K2.5 文档,公开模型页列出的是 `kimi-k2.5`,未公开 `kimi-for-coding` 的独立模型卡片或默认采样参数;该本地别名无法和官网型号做 1:1 映射,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;公开资料未给 `kimi-for-coding` 的固定默认 `top_p`,当前保持 `null` | diff --git a/字段取值表/moonshot/未确认字段报告.md b/字段取值表/moonshot/未确认字段报告.md index d67463d..11145c8 100644 --- a/字段取值表/moonshot/未确认字段报告.md +++ b/字段取值表/moonshot/未确认字段报告.md @@ -5,57 +5,45 @@ ## kimi-k2.5 -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` +- `maxOutputTokens`: 已复核 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kimi-k2 - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` +- `maxOutputTokens`: 已复核 https://platform.kimi.com/ 、https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官网首页当前把 `K2 0905` 展示为 `kimi-k2`,但正式模型列表/FAQ 使用的公开模型 ID 仍是 `kimi-k2-0905-preview`、`kimi-k2-0711`、`kimi-k2-turbo-preview` 等;FAQ 中“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖这些精确 ID,未直接覆盖本地别名 `kimi-k2`,因此无法安全回填固定 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kimi-k2-thinking -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` +- `maxOutputTokens`: 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但公开文档没有给出固定最大输出常数;FAQ 的“最大输出长度”段落也未单独覆盖 `kimi-k2-thinking` - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## moonshot-v1-8k -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 +- `maxOutputTokens`: 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,因此不是固定常数 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## moonshot-v1-32k -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 +- `maxOutputTokens`: 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,因此不是固定常数 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## moonshot-v1-128k -- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 +- `maxOutputTokens`: 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,因此不是固定常数 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot/详细字段取值表.md b/字段取值表/moonshot/详细字段取值表.md index 0e8528f..3894bbd 100644 --- a/字段取值表/moonshot/详细字段取值表.md +++ b/字段取值表/moonshot/详细字段取值表.md @@ -6,10 +6,12 @@ ## 来源 +- https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart - https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart - https://platform.kimi.com/docs/guide/kimi-k2-quickstart - https://platform.kimi.com/docs/guide/faq - https://platform.kimi.com/docs/models +- https://platform.kimi.com/ - https://platform.kimi.com/docs/pricing/chat-k25 - https://platform.kimi.com/docs/pricing/chat-k2 - https://platform.kimi.com/docs/pricing/chat-v1 @@ -29,12 +31,12 @@ | `displayName` | `"Kimi K2.5"` | `"Kimi K2.5"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.5 文档注明“模型上下文长度 256k” | -| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已复核 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` | | `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `21` | `21` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2.5` 的 `temperature` 为固定值 `1.0`;K2.5 快速开始 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 进一步说明关闭思考时会改用固定值 `0.6`,但模型默认 `thinking={"type":"enabled"}` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2.5` 的 `top_p` 为固定值 `0.95`,且 K2.5 快速开始说明不可改 | | `extra` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kimi-k2 @@ -48,12 +50,12 @@ | `displayName` | `"Kimi K2"` | `"Kimi K2"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 与 K2 定价页 https://platform.kimi.com/docs/pricing/chat-k2 均标注 Kimi K2 上下文长度为 `256k` | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核 https://platform.kimi.com/ 、https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官网首页当前把 `K2 0905` 展示为 `kimi-k2`,但正式模型列表/FAQ 使用的公开模型 ID 仍是 `kimi-k2-0905-preview`、`kimi-k2-0711`、`kimi-k2-turbo-preview` 等;FAQ 中“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖这些精确 ID,未直接覆盖本地别名 `kimi-k2`,因此无法安全回填固定 `maxOutputTokens` | | `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.6` | `0.6` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2` 系列 `temperature` 默认值为 `0.6` | +| `defaultTopP` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2` 系列 `top_p` 默认值为 `1.0` | | `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kimi-k2-thinking @@ -68,12 +70,12 @@ | `displayName` | `"Kimi K2 思考版"` | `"Kimi K2 思考版"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 标注 `kimi-k2-thinking` 支持 `256k` 上下文 | -| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但公开文档没有给出固定最大输出常数;FAQ 的“最大输出长度”段落也未单独覆盖 `kimi-k2-thinking` | | `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2-thinking` 系列 `temperature` 默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2-thinking` 系列 `top_p` 默认值为 `1.0` | | `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## moonshot-v1-8k @@ -87,12 +89,12 @@ | `displayName` | `"Moonshot V1 8K"` | `"Moonshot V1 8K"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `8192` | `8192` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-8k` 上下文窗口为 `8,192 tokens` | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,因此不是固定常数 | | `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0` | `0` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `temperature` 默认值为 `0.0` | +| `defaultTopP` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## moonshot-v1-32k @@ -106,12 +108,12 @@ | `displayName` | `"Moonshot V1 32K"` | `"Moonshot V1 32K"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `32768` | `32768` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-32k` 上下文窗口为 `32,768 tokens` | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,因此不是固定常数 | | `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0` | `0` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `temperature` 默认值为 `0.0` | +| `defaultTopP` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## moonshot-v1-128k @@ -125,10 +127,10 @@ | `displayName` | `"Moonshot V1 128K"` | `"Moonshot V1 128K"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `131072` | `131072` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-128k` 上下文窗口为 `131,072 tokens` | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已复核 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/guide/faq 与 https://platform.kimi.com/docs/pricing/chat-v1 ,官方模型页明确 V1 系列区别仅在“最大上下文长度(包括输入和输出)”,FAQ 进一步写明 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,因此不是固定常数 | | `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0` | `0` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `temperature` 默认值为 `0.0` | +| `defaultTopP` | `1` | `1` | 保持 | Moonshot 官方参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `moonshot-v1` 系列 `top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/moorethread-coding/未确认字段报告.md b/字段取值表/moorethread-coding/未确认字段报告.md index c938ed8..aa4cdf3 100644 --- a/字段取值表/moorethread-coding/未确认字段报告.md +++ b/字段取值表/moorethread-coding/未确认字段报告.md @@ -6,10 +6,8 @@ ## mt-coder - `modelName`: ZenMux无稳定匹配 -- `contextWindow`: 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 -- `maxOutputTokens`: 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 +- `contextWindow`: 已复核新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,官网当前只公开 AI Coding / AI 推理方案与产品能力介绍,没有 `mt-coder` 独立模型页,也没有任何上下文长度字段,因此无法确认固定 `contextWindow` +- `maxOutputTokens`: 已复核 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网当前没有 `mt-coder` 独立模型卡片、参数表或固定输出长度说明,无法确认固定 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moorethread-coding/详细字段取值表.md b/字段取值表/moorethread-coding/详细字段取值表.md index 039db28..4fed000 100644 --- a/字段取值表/moorethread-coding/详细字段取值表.md +++ b/字段取值表/moorethread-coding/详细字段取值表.md @@ -22,11 +22,11 @@ | `modelName` | `"mt-coder"` | `"mt-coder"` | 待确认 | ZenMux无稳定匹配 | | `displayName` | `"MT Coder (Coding)"` | `"MT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 待确认 | 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已复核新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,官网当前只公开 AI Coding / AI 推理方案与产品能力介绍,没有 `mt-coder` 独立模型页,也没有任何上下文长度字段,因此无法确认固定 `contextWindow` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网当前没有 `mt-coder` 独立模型卡片、参数表或固定输出长度说明,无法确认固定 `maxOutputTokens` | | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的推理参数文档或默认采样值,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;官网未公开 `mt-coder` 的默认 `top_p`,当前保持 `null` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/ollama/未确认字段报告.md b/字段取值表/ollama/未确认字段报告.md index c805598..b744e7d 100644 --- a/字段取值表/ollama/未确认字段报告.md +++ b/字段取值表/ollama/未确认字段报告.md @@ -6,9 +6,7 @@ ## llama3.1:70b - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 +- `maxOutputTokens`: 已复核 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`;进一步复核 https://docs.ollama.com/modelfile 与 https://docs.ollama.com/api ,Ollama 将输出长度控制公开为运行时参数 `num_predict`,默认 `-1`(无限生成),并未给 `llama3.1:70b` 这个 Ollama 变体定义固定模型级 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/ollama/详细字段取值表.md b/字段取值表/ollama/详细字段取值表.md index be1ecfe..8810878 100644 --- a/字段取值表/ollama/详细字段取值表.md +++ b/字段取值表/ollama/详细字段取值表.md @@ -8,6 +8,8 @@ - https://ollama.com/library/llama3.1 - https://ai.meta.com/blog/meta-llama-3-1/ +- https://docs.ollama.com/modelfile +- https://docs.ollama.com/api - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -22,10 +24,10 @@ | `displayName` | `"Llama 3.1 70B"` | `"Llama 3.1 70B"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `131072` | `131072` | 保持 | Ollama 官方模型库 https://ollama.com/library/llama3.1 列出 `llama3.1:70b` 为 `128K context window`;当前值 `131072` 为按 `128 * 1024` 换算 | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已复核 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`;进一步复核 https://docs.ollama.com/modelfile 与 https://docs.ollama.com/api ,Ollama 将输出长度控制公开为运行时参数 `num_predict`,默认 `-1`(无限生成),并未给 `llama3.1:70b` 这个 Ollama 变体定义固定模型级 `maxOutputTokens` | | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","reasoning"]` | `["chat","code","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.8` | `0.8` | 保持 | 已复核 Ollama 官方 Modelfile 文档,`temperature` 默认值为 `0.8` | +| `defaultTopP` | `0.9` | `0.9` | 保持 | 已复核 Ollama 官方 Modelfile 文档,`top_p` 默认值为 `0.9` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/openai/未确认字段报告.md b/字段取值表/openai/未确认字段报告.md index 3af7b60..328e063 100644 --- a/字段取值表/openai/未确认字段报告.md +++ b/字段取值表/openai/未确认字段报告.md @@ -1,181 +1,7 @@ # 未确认字段报告 - compute/providers/openai.json - provider: `openai` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` -## gpt-5.2 - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5.2-pro - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5.1 - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5 - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5-pro - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5-mini - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-5-nano - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4.1 - -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4.1-mini - -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4.1-nano - -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4o - -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4o-mini - -- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## text-embedding-3-small - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## text-embedding-3-large - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## tts-1 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## tts-1-hd -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## whisper-1 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## o3 - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## o3-pro - -- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 -- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## o3-mini - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## o4-mini - -- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## dall-e-3 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4o-realtime -- `modelName`: 已查 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 、https://developers.openai.com/api/docs/models/gpt-realtime 与 https://developers.openai.com/api/docs/models ,未找到 `gpt-4o-realtime` 这一独立官方模型页 - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - -## gpt-4o-realtime-preview - -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +本轮范围内无剩余未确认项。 diff --git a/字段取值表/openai/详细字段取值表.md b/字段取值表/openai/详细字段取值表.md index 57539c2..2dba172 100644 --- a/字段取值表/openai/详细字段取值表.md +++ b/字段取值表/openai/详细字段取值表.md @@ -1,485 +1,41 @@ # 详细字段取值表 - compute/providers/openai.json - provider: `openai` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://platform.openai.com/docs/models -- https://platform.openai.com/docs/pricing -- https://platform.openai.com/docs/guides/embeddings -- https://developers.openai.com/cookbook/examples/prompt_caching_201 -- https://developers.openai.com/api/docs/guides/realtime-costs -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models +- https://api.openai.com/v1/responses +- https://api.openai.com/v1/realtime/sessions +- https://api.openai.com/v1/embeddings +- https://api.openai.com/v1/audio/speech +- https://api.openai.com/v1/audio/transcriptions +- https://api.openai.com/v1/images/generations -## gpt-5.2 +## 文本 / 视觉 / 推理模型 -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5.2` -- ZenMux候选: `openai/gpt-5.2` +- 模型: `gpt-5.2`, `gpt-5.2-pro`, `gpt-5.1`, `gpt-5`, `gpt-5-pro`, `gpt-5-mini`, `gpt-5-nano`, `gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`, `gpt-4o`, `gpt-4o-mini`, `o3`, `o3-pro`, `o3-mini`, `o4-mini` | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"gpt-5.2"` | `"gpt-5.2"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2 | -| `displayName` | `"GPT-5.2"` | `"GPT-5.2"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `128,000` max output tokens | -| `inputPrice` | `1.75` | `1.75` | 保持 | ZenMux(openai/gpt-5.2) prompt=1.75 USD/MTokens | -| `outputPrice` | `14` | `14` | 保持 | ZenMux(openai/gpt-5.2) completion=14 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `1` | `1` | 保持 | OpenAI `/v1/responses` 官方示例在请求省略 `temperature` 时,响应对象返回 `temperature: 1.0`。 | +| `defaultTopP` | `1` | `1` | 保持 | OpenAI `/v1/responses` 官方示例在请求省略 `top_p` 时,响应对象返回 `top_p: 1.0`。 | -## gpt-5.2-pro +## Realtime 模型 -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5.2-pro` -- ZenMux候选: `openai/gpt-5.2-pro` +- 模型: `gpt-4o-realtime`, `gpt-4o-realtime-preview` | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"gpt-5.2-pro"` | `"gpt-5.2-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2-pro | -| `displayName` | `"GPT-5.2 Pro"` | `"GPT-5.2 Pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `128,000` max output tokens | -| `inputPrice` | `21` | `21` | 保持 | ZenMux(openai/gpt-5.2-pro) prompt=21 USD/MTokens | -| `outputPrice` | `168` | `168` | 保持 | ZenMux(openai/gpt-5.2-pro) completion=168 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `0.7` | `0.7` | 保持 | OpenAI `/v1/realtime/sessions` 官方示例在请求未显式设置 `temperature` 时,返回的 session 对象包含 `temperature: 0.7`。 | +| `defaultTopP` | `null` | `null` | 保持 | OpenAI `/v1/realtime/sessions` 官方示例和返回对象未公开 `top_p` 默认值;JSON 不应伪装成官方默认值。 | -## gpt-5.1 +## Embedding / TTS / ASR / Image 模型 -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5.1` -- ZenMux候选: `openai/gpt-5.1` +- 模型: `text-embedding-3-small`, `text-embedding-3-large`, `tts-1`, `tts-1-hd`, `whisper-1`, `dall-e-3` | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"gpt-5.1"` | `"gpt-5.1"` | 保持 | ZenMux匹配(exact): openai/gpt-5.1 | -| `displayName` | `"GPT-5.1"` | `"GPT-5.1"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `128,000` max output tokens | -| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5.1) prompt=1.25 USD/MTokens | -| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5.1) completion=10 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-5 - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5` -- ZenMux候选: `openai/gpt-5` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-5"` | `"gpt-5"` | 保持 | ZenMux匹配(exact): openai/gpt-5 | -| `displayName` | `"GPT-5"` | `"GPT-5"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `128,000` max output tokens | -| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5) prompt=1.25 USD/MTokens | -| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5) completion=10 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-5-pro - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5-pro` -- ZenMux候选: `openai/gpt-5-pro` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-5-pro"` | `"gpt-5-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5-pro | -| `displayName` | `"GPT-5 Pro"` | `"GPT-5 Pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `400,000` context window | -| `maxOutputTokens` | `272000` | `272000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `272,000` max output tokens | -| `inputPrice` | `15` | `15` | 保持 | ZenMux(openai/gpt-5-pro) prompt=15 USD/MTokens | -| `outputPrice` | `120` | `120` | 保持 | ZenMux(openai/gpt-5-pro) completion=120 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-5-mini - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5-mini` -- ZenMux候选: `openai/gpt-5-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-5-mini"` | `"gpt-5-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-5-mini | -| `displayName` | `"GPT-5-mini"` | `"GPT-5-mini"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `128,000` max output tokens | -| `inputPrice` | `0.25` | `0.25` | 保持 | ZenMux(openai/gpt-5-mini) prompt=0.25 USD/MTokens | -| `outputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-5-mini) completion=2 USD/MTokens | -| `capabilities` | `["chat","fast","tool_use","code","vision"]` | `["chat","fast","tool_use","code","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-5-nano - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-5-nano` -- ZenMux候选: `openai/gpt-5-nano` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-5-nano"` | `"gpt-5-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-5-nano | -| `displayName` | `"GPT-5-nano"` | `"GPT-5-nano"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `400,000` context window | -| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `128,000` max output tokens | -| `inputPrice` | `0.05` | `0.05` | 保持 | ZenMux(openai/gpt-5-nano) prompt=0.05 USD/MTokens | -| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-5-nano) completion=0.4 USD/MTokens | -| `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4.1 - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-4.1` -- ZenMux候选: `openai/gpt-4.1` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4.1"` | `"gpt-4.1"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1 | -| `displayName` | `"GPT-4.1"` | `"GPT-4.1"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `1,047,576` context window | -| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `32,768` max output tokens | -| `inputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-4.1) prompt=2 USD/MTokens | -| `outputPrice` | `8` | `8` | 保持 | ZenMux(openai/gpt-4.1) completion=8 USD/MTokens | -| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4.1-mini - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-4.1-mini` -- ZenMux候选: `openai/gpt-4.1-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4.1-mini"` | `"gpt-4.1-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-mini | -| `displayName` | `"GPT-4.1 mini"` | `"GPT-4.1 mini"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `1,047,576` context window | -| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `32,768` max output tokens | -| `inputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-mini) prompt=0.4 USD/MTokens | -| `outputPrice` | `1.6` | `1.6` | 保持 | ZenMux(openai/gpt-4.1-mini) completion=1.6 USD/MTokens | -| `capabilities` | `["chat","code","vision","ultra_long_context","tool_use"]` | `["chat","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4.1-nano - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-4.1-nano` -- ZenMux候选: `openai/gpt-4.1-nano` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4.1-nano"` | `"gpt-4.1-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-nano | -| `displayName` | `"GPT-4.1 nano"` | `"GPT-4.1 nano"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `1,047,576` context window | -| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `32,768` max output tokens | -| `inputPrice` | `0.1` | `0.1` | 保持 | ZenMux(openai/gpt-4.1-nano) prompt=0.1 USD/MTokens | -| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-nano) completion=0.4 USD/MTokens | -| `capabilities` | `["chat","code","ultra_long_context","fast"]` | `["chat","code","ultra_long_context","fast"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4o - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-4o` -- ZenMux候选: `openai/gpt-4o` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4o"` | `"gpt-4o"` | 保持 | ZenMux匹配(exact): openai/gpt-4o | -| `displayName` | `"GPT-4o"` | `"GPT-4o"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `128,000` context window | -| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `16,384` max output tokens | -| `inputPrice` | `2.5` | `2.5` | 保持 | ZenMux(openai/gpt-4o) prompt=2.5 USD/MTokens | -| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-4o) completion=10 USD/MTokens | -| `capabilities` | `["chat","vision","image_understanding","tool_use"]` | `["chat","vision","image_understanding","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4o-mini - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/gpt-4o-mini` -- ZenMux候选: `openai/gpt-4o-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4o-mini"` | `"gpt-4o-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4o-mini | -| `displayName` | `"GPT-4o mini"` | `"GPT-4o mini"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `128,000` context window | -| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `16,384` max output tokens | -| `inputPrice` | `0.15` | `0.15` | 保持 | ZenMux(openai/gpt-4o-mini) prompt=0.15 USD/MTokens | -| `outputPrice` | `0.6` | `0.6` | 保持 | ZenMux(openai/gpt-4o-mini) completion=0.6 USD/MTokens | -| `capabilities` | `["chat","code","vision","tool_use"]` | `["chat","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## text-embedding-3-small - -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | OpenAI 官方模型页直接使用该模型名 | -| `displayName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-small` 的 Max input 为 `8192` | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-small 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `0.02` | `0.02` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## text-embedding-3-large - -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | OpenAI 官方模型页直接使用该模型名 | -| `displayName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-large` 的 Max input 为 `8192` | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-large 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `0.13` | `0.13` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## tts-1 - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"tts-1"` | `"tts-1"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"TTS-1"` | `"TTS-1"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## tts-1-hd - -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"tts-1-hd"` | `"tts-1-hd"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"TTS-1-HD"` | `"TTS-1-HD"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## whisper-1 - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"whisper-1"` | `"whisper-1"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Whisper"` | `"Whisper"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型为语音识别模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型输出为转写文本结果而非 completion tokens 规格,当前以 `0` 记录为不适用 | -| `inputPrice` | `0.006` | `0.006` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## o3 - -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"o3"` | `"o3"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 直接使用该模型名 | -| `displayName` | `"o3"` | `"o3"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `200,000` context window | -| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `100,000` max output tokens | -| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## o3-pro - -- ZenMux匹配级别: `similar` -- ZenMux命中: `openai/gpt-5-pro` -- ZenMux候选: `openai/gpt-5-pro` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"o3-pro"` | `"o3-pro"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 直接使用该模型名 | -| `displayName` | `"o3-pro"` | `"o3-pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `200,000` context window | -| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `100,000` max output tokens | -| `inputPrice` | `20` | `20` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | -| `outputPrice` | `80` | `80` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | -| `capabilities` | `["reasoning","deep_thinking","code","math","science"]` | `["reasoning","deep_thinking","code","math","science"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## o3-mini - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `openai/o4-mini`、`openai/gpt-5-mini`、`openai/gpt-4o-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"o3-mini"` | `"o3-mini"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 直接使用该模型名 | -| `displayName` | `"o3-mini"` | `"o3-mini"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `200,000` context window | -| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `100,000` max output tokens | -| `inputPrice` | `1.1` | `1.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `4.4` | `4.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["reasoning","math","code","fast"]` | `["reasoning","math","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## o4-mini - -- ZenMux匹配级别: `exact` -- ZenMux命中: `openai/o4-mini` -- ZenMux候选: `openai/o4-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"o4-mini"` | `"o4-mini"` | 保持 | ZenMux匹配(exact): openai/o4-mini | -| `displayName` | `"o4-mini"` | `"o4-mini"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `200,000` context window | -| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `100,000` max output tokens | -| `inputPrice` | `1.1` | `1.1` | 保持 | ZenMux(openai/o4-mini) prompt=1.1 USD/MTokens | -| `outputPrice` | `4.4` | `4.4` | 保持 | ZenMux(openai/o4-mini) completion=4.4 USD/MTokens | -| `capabilities` | `["reasoning","math","code","tool_use","vision"]` | `["reasoning","math","code","tool_use","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## dall-e-3 - -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"dall-e-3"` | `"dall-e-3"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"DALL-E 3"` | `"DALL-E 3"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型为图像生成模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | -| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型输出为图像而非 completion tokens,当前以 `0` 记录为不适用 | -| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["image_generation","text_rendering"]` | `["image_generation","text_rendering"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4o-realtime - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini`、`openai/gpt-5` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4o-realtime"` | `"gpt-4o-realtime"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"GPT-4o Realtime"` | `"GPT-4o Realtime"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["omni"]` | `["omni"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `32k` context;本地别名 `gpt-4o-realtime` 按该官方口径保持 | -| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `4,096` max output tokens;本地别名 `gpt-4o-realtime` 按该官方口径保持 | -| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","vision","tts","asr","realtime"]` | `["chat","vision","tts","asr","realtime"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | - -## gpt-4o-realtime-preview - -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini` - -| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | -|---|---|---|---|---| -| `modelName` | `"gpt-4o-realtime-preview"` | `"gpt-4o-realtime-preview"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 直接使用该模型名 | -| `displayName` | `"GPT-4o Realtime Preview"` | `"GPT-4o Realtime Preview"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["realtime_voice"]` | `["realtime_voice"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `32,000` context window | -| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `4,096` max output tokens | -| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["realtime","speech_to_speech","low_latency"]` | `["realtime","speech_to_speech","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | OpenAI `embeddings`、`audio/speech`、`images/generations` 等官方接口未给这些模型定义通用聊天采样默认值;按项目规则记为不适用。`whisper-1` 所属 `audio/transcriptions` 虽有任务参数,但不应作为 provider 级模型默认采样值。 | +| `defaultTopP` | `null` | `null` | 保持 | OpenAI `embeddings`、`audio/speech`、`audio/transcriptions`、`images/generations` 官方接口未给这些模型定义通用聊天采样默认值;按项目规则记为不适用。 | diff --git a/字段取值表/openrouter/未确认字段报告.md b/字段取值表/openrouter/未确认字段报告.md index 8d50c12..95c82b1 100644 --- a/字段取值表/openrouter/未确认字段报告.md +++ b/字段取值表/openrouter/未确认字段报告.md @@ -6,21 +6,16 @@ ## openrouter/auto - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 会动态路由到不同底模,官方模型 API 对其返回 `top_provider.max_completion_tokens=null`,未给统一固定 max output tokens +- `maxOutputTokens`: 已复核 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 官方定义就是动态路由到底层模型集合;其官方模型 API 当前对该条目返回 `top_provider.max_completion_tokens=null`,因此不存在统一固定 `maxOutputTokens` - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## openai/gpt-oss-120b:free + - `modelName`: ZenMux无稳定匹配 - - - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## qwen/qwen3-coder:free @@ -28,6 +23,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/openrouter/详细字段取值表.md b/字段取值表/openrouter/详细字段取值表.md index c46bfb8..f88f58e 100644 --- a/字段取值表/openrouter/详细字段取值表.md +++ b/字段取值表/openrouter/详细字段取值表.md @@ -11,6 +11,7 @@ - https://openrouter.ai/api/v1/models - https://openrouter.ai/openai/gpt-oss-120b:free - https://openrouter.ai/qwen/qwen3-coder:free +- https://openrouter.ai/docs/api/reference/parameters - https://platform.openai.com/docs/models/gpt-oss-120b - https://help.aliyun.com/zh/model-studio/model - https://zenmux.ai/models @@ -27,12 +28,12 @@ | `displayName` | `"OpenRouter Auto"` | `"OpenRouter Auto"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `2000000` | `2000000` | 保持 | OpenRouter Auto Router 页面 https://openrouter.ai/openrouter/auto/overview 列出 `openrouter/auto` 为 `2,000,000 context` | -| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 为动态路由模型;官方模型 API 当前对其返回 `top_provider.max_completion_tokens=null`,因此不存在统一固定 max output tokens | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已复核 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 官方定义就是动态路由到底层模型集合;其官方模型 API 当前对该条目返回 `top_provider.max_completion_tokens=null`,因此不存在统一固定 `maxOutputTokens` | | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","auto_routing"]` | `["chat","auto_routing"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## openai/gpt-oss-120b:free @@ -50,8 +51,8 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## qwen/qwen3-coder:free @@ -69,6 +70,6 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["code","reasoning","agent","tool_use"]` | `["code","reasoning","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | OpenRouter 参数文档 https://openrouter.ai/docs/api/reference/parameters 明确写明当请求未传入该字段时,`top_p` 默认值为 `1.0` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/perplexity/未确认字段报告.md b/字段取值表/perplexity/未确认字段报告.md index 6a839b9..7173f54 100644 --- a/字段取值表/perplexity/未确认字段报告.md +++ b/字段取值表/perplexity/未确认字段报告.md @@ -1,32 +1,20 @@ # 未确认字段报告 - compute/providers/perplexity.json - provider: `perplexity` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` ## sonar-pro -- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 +- `defaultTopP`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 ## sonar-reasoning-pro -- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 +- `defaultTopP`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 ## sonar -- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 - +- `defaultTemperature`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 +- `defaultTopP`: 已查 https://docs.perplexity.ai/api-reference/sonar-post 。官方有参数定义和范围,但没有默认值。 diff --git a/字段取值表/perplexity/详细字段取值表.md b/字段取值表/perplexity/详细字段取值表.md index e0a6695..f481f50 100644 --- a/字段取值表/perplexity/详细字段取值表.md +++ b/字段取值表/perplexity/详细字段取值表.md @@ -1,68 +1,30 @@ # 详细字段取值表 - compute/providers/perplexity.json - provider: `perplexity` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://docs.perplexity.ai -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models +- https://docs.perplexity.ai/api-reference/sonar-post ## sonar-pro -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"sonar-pro"` | `"sonar-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | -| `displayName` | `"Sonar Pro"` | `"Sonar Pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `200000` | `200000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 标注 `200K context length` | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | -| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","web_search","reasoning","citation"]` | `["chat","web_search","reasoning","citation"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `temperature` 参数和取值范围,但未给“省略时默认值”。 | +| `defaultTopP` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `top_p` 参数和取值范围,但未给“省略时默认值”。 | ## sonar-reasoning-pro -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"sonar-reasoning-pro"` | `"sonar-reasoning-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | -| `displayName` | `"Sonar Reasoning Pro"` | `"Sonar Reasoning Pro"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 标注 `128K context length` | -| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | -| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","web_search","reasoning","deep_thinking"]` | `["chat","web_search","reasoning","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `temperature` 参数和取值范围,但未给“省略时默认值”。 | +| `defaultTopP` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `top_p` 参数和取值范围,但未给“省略时默认值”。 | ## sonar -- ZenMux匹配级别: `none` -- ZenMux候选: (none) - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"sonar"` | `"sonar"` | 保持 | Perplexity 官方模型页直接使用该模型名 | -| `displayName` | `"Sonar"` | `"Sonar"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar 标注 `128K context length` | -| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | -| `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","web_search","citation","fast"]` | `["chat","web_search","citation","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `temperature` 参数和取值范围,但未给“省略时默认值”。 | +| `defaultTopP` | `null` | `null` | 保持 | Perplexity Sonar API 文档给出了 `top_p` 参数和取值范围,但未给“省略时默认值”。 | diff --git a/字段取值表/siliconflow/未确认字段报告.md b/字段取值表/siliconflow/未确认字段报告.md index 156471e..0f5f033 100644 --- a/字段取值表/siliconflow/未确认字段报告.md +++ b/字段取值表/siliconflow/未确认字段报告.md @@ -6,21 +6,15 @@ ## Qwen/Qwen3-Coder-480B-A35B-Instruct - `modelName`: ZenMux无稳定匹配 - - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## Qwen/Qwen3-235B-A22B-Instruct-2507 - `modelName`: ZenMux无稳定匹配 - - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## BAAI/bge-m3 @@ -28,6 +22,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/siliconflow/详细字段取值表.md b/字段取值表/siliconflow/详细字段取值表.md index b40d141..406852f 100644 --- a/字段取值表/siliconflow/详细字段取值表.md +++ b/字段取值表/siliconflow/详细字段取值表.md @@ -10,6 +10,7 @@ - https://siliconflow.cn/pricing - https://docs.siliconflow.cn/cn/userguide/capabilities/reasoning - https://docs.siliconflow.cn/en/faqs/misc +- https://docs.siliconflow.cn/en/api-reference/chat-completions/chat-completions - https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -29,8 +30,8 @@ | `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","long_context","agent","tool_use"]` | `["chat","code","long_context","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 硅基流动对话接口文档 https://docs.siliconflow.cn/en/api-reference/chat-completions/chat-completions 仅给出 `temperature` 示例值,没有 `default:` 字段;按“官网未定义默认值则记为 null”处理 | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 硅基流动对话接口文档 https://docs.siliconflow.cn/en/api-reference/chat-completions/chat-completions 明确 `top_p` 的 `default: 0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## Qwen/Qwen3-235B-A22B-Instruct-2507 @@ -48,8 +49,8 @@ | `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","multilingual","tool_use","agent","long_context"]` | `["chat","code","multilingual","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 硅基流动对话接口文档 https://docs.siliconflow.cn/en/api-reference/chat-completions/chat-completions 仅给出 `temperature` 示例值,没有 `default:` 字段;按“官网未定义默认值则记为 null”处理 | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 硅基流动对话接口文档 https://docs.siliconflow.cn/en/api-reference/chat-completions/chat-completions 明确 `top_p` 的 `default: 0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## BAAI/bge-m3 @@ -67,6 +68,6 @@ | `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | `BAAI/bge-m3` 为 embedding 模型,官方接口 https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings 不支持采样参数,按不适用记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | `BAAI/bge-m3` 为 embedding 模型,官方接口 https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings 不支持采样参数,按不适用记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/stability/未确认字段报告.md b/字段取值表/stability/未确认字段报告.md index 20b25b8..264bda7 100644 --- a/字段取值表/stability/未确认字段报告.md +++ b/字段取值表/stability/未确认字段报告.md @@ -8,6 +8,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/stability/详细字段取值表.md b/字段取值表/stability/详细字段取值表.md index ab33b19..1c87a4a 100644 --- a/字段取值表/stability/详细字段取值表.md +++ b/字段取值表/stability/详细字段取值表.md @@ -26,6 +26,6 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["image_generation","high_quality","controllable"]` | `["image_generation","high_quality","controllable"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核 Stability 官方模型发布页与 API Reference,`stable-diffusion-3.5-large` 为图像生成模型,官方 API 不以文本采样 `temperature` 控制输出,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;图像生成模型不提供文本采样 `top_p`,当前保持 `null` | | `extra` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/tencent/未确认字段报告.md b/字段取值表/tencent/未确认字段报告.md index 7b15980..dd12913 100644 --- a/字段取值表/tencent/未确认字段报告.md +++ b/字段取值表/tencent/未确认字段报告.md @@ -8,8 +8,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## hunyuan-turbos-latest @@ -17,7 +15,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 - diff --git a/字段取值表/tencent/详细字段取值表.md b/字段取值表/tencent/详细字段取值表.md index 08cab5d..76faca6 100644 --- a/字段取值表/tencent/详细字段取值表.md +++ b/字段取值表/tencent/详细字段取值表.md @@ -28,8 +28,8 @@ | `inputPrice` | `3.975` | `3.975` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `15.9` | `15.9` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","deep_thinking","long_context"]` | `["chat","reasoning","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 明确 `temperature` 默认值为“无”,且“不传值时使用各模型推荐值,不推荐用户修改”;官方没有公开统一模型级默认数值,因此本地字段应为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 虽在参数表写 `top_p` 默认值 `0`,但同一行说明“不传值时使用各模型推荐值”,并未公开统一模型级默认数值,因此本地字段应为 `null` 而不是 `0` 或 `1` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## hunyuan-turbos-latest @@ -47,7 +47,25 @@ | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","vision","fast","tool_use"]` | `["chat","reasoning","code","vision","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 明确 `temperature` 默认值为“无”,且“不传值时使用各模型推荐值”,未公开 `hunyuan-turbos-latest` 的统一默认数值 | +| `defaultTopP` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 的 `top_p` 参数表虽写默认值 `0`,但同一行明确实际省略时使用各模型推荐值,未公开模型级默认数值 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +## hunyuan-2.0-instruct-20251111 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"hunyuan-2.0-instruct-20251111"` | `"hunyuan-2.0-instruct-20251111"` | 保持 | 腾讯云 Anthropic 兼容接口文档 https://cloud.tencent.com/document/product/1729/127293 直接列出该模型名 | +| `displayName` | `"混元 2.0 Instruct"` | `"混元 2.0 Instruct"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `147456` | `147456` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注该模型最大输入 `128k`、最大输出 `16k`;当前值按两者和维护为 `147456` | +| `maxOutputTokens` | `16384` | `16384` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注该模型最大输出 `16k` | +| `inputPrice` | `3.18` | `3.18` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `7.95` | `7.95` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context","tool_use"]` | `["chat","code","long_context","tool_use"]` | 待确认 | 能力字段为项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 明确 `temperature` 默认值为“无”,不传值时使用各模型推荐值,但未公开该模型推荐数值 | +| `defaultTopP` | `null` | `null` | 保持 | 腾讯混元 OpenAI 兼容接口文档 https://cloud.tencent.com/document/product/1729/111007 参数表虽写 `top_p` 默认值 `0`,但同一行说明省略时使用各模型推荐值,未公开模型级默认数值 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine-coding/未确认字段报告.md b/字段取值表/volcengine-coding/未确认字段报告.md index fd91617..6747677 100644 --- a/字段取值表/volcengine-coding/未确认字段报告.md +++ b/字段取值表/volcengine-coding/未确认字段报告.md @@ -8,6 +8,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine-coding/详细字段取值表.md b/字段取值表/volcengine-coding/详细字段取值表.md index 7ad4f51..cade2b7 100644 --- a/字段取值表/volcengine-coding/详细字段取值表.md +++ b/字段取值表/volcengine-coding/详细字段取值表.md @@ -7,6 +7,7 @@ ## 来源 - https://developer.volcengine.com/articles/7615528054736945158 +- https://www.volcengine.com/docs/82379/1494384?redirect=1&lang=zh - https://zenmux.ai/models - https://zenmux.ai/api/v1/models @@ -25,6 +26,6 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["code","reasoning","chat"]` | `["code","reasoning","chat"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核官方 Coding Plan 接入文章与火山方舟官方对话 API 页面;`ark-code-latest` 是自动路由别名,公开资料未给出该别名的固定默认 `temperature`,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;公开资料未给出 `ark-code-latest` 的固定默认 `top_p`,当前保持 `null` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine/未确认字段报告.md b/字段取值表/volcengine/未确认字段报告.md index 463038d..99a0d1f 100644 --- a/字段取值表/volcengine/未确认字段报告.md +++ b/字段取值表/volcengine/未确认字段报告.md @@ -8,48 +8,35 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.8 -- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2192000 与 https://www.volcengine.com/docs/82379/2123228 。当前官方 API 页明确给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但公开可抓取页面仍未给 `Doubao-Seed-1.8` 的独立 `max_tokens` 上限;因此还不能确认本项目 `maxOutputTokens` 应落到回答上限还是总生成上限 - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.6 - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出 `doubao-seed-1.6` 独立 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.6-thinking - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.6-flash - `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.6-lite @@ -58,18 +45,14 @@ - `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-lite` 的 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-1.6-vision - `modelName`: ZenMux匹配(normalized): volcengine/doubao-seed-1-6-vision -- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310、https://www.volcengine.com/docs/84458/1585097 与 https://developer.volcengine.com/articles/7560657862188990514 。官方可确认 `Doubao-Seed-1.6-vision` 型号存在、支持 `256k` 输入窗口并具备 VisualCoT 能力,但当前公开可抓取页面未给该独立型号的 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-seed-code @@ -77,8 +60,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## deepseek-v3.2 @@ -87,8 +68,6 @@ - `maxOutputTokens`: 已查 https://api-docs.deepseek.com/quick_start/pricing 与 https://api-docs.deepseek.com/guides/thinking_mode ,DeepSeek 官方对 V3.2 按模式给出不同口径:`deepseek-chat`(非思考)最大输出 `8K`,开启思考模式时 `max_tokens` 最大可到 `64K`;火山引擎别名 `deepseek-v3.2` 未明确说明采用哪一种固定口径 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## deepseek-r1 @@ -96,8 +75,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## kimi-k2-volcengine @@ -106,8 +83,6 @@ - `maxOutputTokens`: 已查 https://platform.kimi.com/docs/pricing/chat-k2 与 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart ,官方公开了 K2 系列上下文,但未给 `kimi-k2-volcengine` 独立 max output 数值 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4-7 @@ -115,8 +90,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## doubao-embedding @@ -125,8 +98,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## volc-mega-tts-clone @@ -134,8 +105,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## volc-realtime-voice @@ -143,8 +112,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## volc-simultaneous @@ -152,8 +119,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## volc-translation @@ -161,6 +126,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine/详细字段取值表.md b/字段取值表/volcengine/详细字段取值表.md index 60b3940..0ed719a 100644 --- a/字段取值表/volcengine/详细字段取值表.md +++ b/字段取值表/volcengine/详细字段取值表.md @@ -7,8 +7,10 @@ ## 来源 - https://developer.volcengine.com/articles/7615528054736945158 +- https://developer.volcengine.com/articles/7517188344586403876 - https://www.volcengine.com/docs/84458/1585097 - https://www.volcengine.com/docs/82379/1330310 +- https://www.volcengine.com/docs/82379/2123228 - https://www.volcengine.com/docs/6492/2192000 - https://www.volcengine.com/docs/6492/2165115 - https://www.volcengine.com/docs/84313/1927061 @@ -35,8 +37,8 @@ | `inputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.8 @@ -51,12 +53,12 @@ | `displayName` | `"豆包 Seed-1.8"` | `"豆包 Seed-1.8"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.8` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2192000 与 https://www.volcengine.com/docs/82379/2123228 。当前官方 API 页明确给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但公开可抓取页面仍未给 `Doubao-Seed-1.8` 的独立 `max_tokens` 上限;因此还不能确认本项目 `maxOutputTokens` 应落到回答上限还是总生成上限 | | `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.6 @@ -70,12 +72,12 @@ | `displayName` | `"豆包 Seed-1.6"` | `"豆包 Seed-1.6"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面给出 `max_completion_tokens` 参数说明,但未给出 `doubao-seed-1.6` 独立 max output 数值;当前值暂保留待确认 | +| `maxOutputTokens` | `16000` | `16000` | 保持 | 火山引擎官方开发者社区文章 https://developer.volcengine.com/articles/7517188344586403876 的 `不同技术参数的对比` 表列出 `Doubao-Seed-1.6` 的 `最大输出 = 16k,默认4k`;已据此将 provider JSON 回填为 `16000` | | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.6-thinking @@ -89,12 +91,12 @@ | `displayName` | `"豆包 Seed-1.6 思考版"` | `"豆包 Seed-1.6 思考版"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 思考相关计费项列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | -| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `maxOutputTokens` | `16000` | `16000` | 保持 | 火山引擎官方开发者社区文章 https://developer.volcengine.com/articles/7517188344586403876 的 `不同技术参数的对比` 表列出 `Doubao-Seed-1.6-thinking` 的 `最大输出 = 16k,默认4k`;已据此将 provider JSON 回填为 `16000` | | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1`;本地思考版未见单独默认值说明,按同接口默认值处理 | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7`;本地思考版未见单独默认值说明,按同接口默认值处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.6-flash @@ -108,12 +110,12 @@ | `displayName` | `"豆包 Seed-1.6 Flash"` | `"豆包 Seed-1.6 Flash"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-flash` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `maxOutputTokens` | `16000` | `16000` | 保持 | 火山引擎官方开发者社区文章 https://developer.volcengine.com/articles/7517188344586403876 的 `不同技术参数的对比` 表列出 `Doubao-Seed-1.6-flash` 的 `最大输出 = 16k,默认4k`;已据此将 provider JSON 回填为 `16000` | | `inputPrice` | `0.15` | `0.15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `1.5` | `1.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","fast","long_context"]` | `["chat","code","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.6-lite @@ -131,8 +133,8 @@ | `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `0.6` | `0.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-1.6-vision @@ -147,12 +149,12 @@ | `displayName` | `"豆包 Seed-1.6 视觉版"` | `"豆包 Seed-1.6 视觉版"` | 保持 | 展示字段,需按产品命名策略 | | `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | | `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-vision` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | -| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值;当前值暂保留待确认 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310、https://www.volcengine.com/docs/84458/1585097 与 https://developer.volcengine.com/articles/7560657862188990514 。官方可确认 `Doubao-Seed-1.6-vision` 型号存在、支持 `256k` 输入窗口并具备 VisualCoT 能力,但当前公开可抓取页面未给该独立型号的 max output 数值 | | `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","vision","video_understanding","gui_agent","long_context"]` | `["chat","vision","video_understanding","gui_agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎视觉内容理解文档 https://www.volcengine.com/docs/6492/2165096 明确 `temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎视觉内容理解文档 https://www.volcengine.com/docs/6492/2165096 明确 `top_p` 默认值为 `0.7` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-seed-code @@ -171,8 +173,8 @@ | `inputPrice` | `1.2` | `1.2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["code","reasoning","long_context","deep_thinking"]` | `["code","reasoning","long_context","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `temperature` 默认值为 `1`;本地 `doubao-seed-code` 按同接口默认值处理 | +| `defaultTopP` | `0.7` | `0.7` | 保持 | 火山引擎 AI 数据湖文本生成文档 https://www.volcengine.com/docs/6492/2165102?lang=zh 明确豆包/DeepSeek 文本生成接口 `top_p` 默认值为 `0.7`;本地 `doubao-seed-code` 按同接口默认值处理 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## deepseek-v3.2 @@ -190,8 +192,8 @@ | `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | DeepSeek Chat Completions 文档 https://api-docs.deepseek.com/api/create-chat-completion 明确 `temperature` 默认值为 `1`;火山引擎 `deepseek-v3.2` 按同底模理解 | +| `defaultTopP` | `1` | `1` | 保持 | DeepSeek Chat Completions 文档 https://api-docs.deepseek.com/api/create-chat-completion 明确 `top_p` 默认值为 `1`;火山引擎 `deepseek-v3.2` 按同底模理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## deepseek-r1 @@ -209,8 +211,8 @@ | `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["reasoning","math","code","science","deep_thinking"]` | `["reasoning","math","code","science","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | DeepSeek 推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 明确 `deepseek-reasoner` 不支持 `temperature`,即使传入也不会生效,因此按 `null` 记录 | +| `defaultTopP` | `null` | `null` | 保持 | DeepSeek 推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 明确 `deepseek-reasoner` 不支持 `top_p`,即使传入也不会生效,因此按 `null` 记录 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## kimi-k2-volcengine @@ -228,8 +230,8 @@ | `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `0.6` | `0.6` | 保持 | Kimi 模型参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2` 系列 `temperature=0.6`;火山引擎 `kimi-k2-volcengine` 按同底模理解 | +| `defaultTopP` | `1` | `1` | 保持 | Kimi 模型参数参考 https://platform.kimi.com/docs/api/models-overview 明确 `kimi-k2` 系列 `top_p=1.0`;火山引擎 `kimi-k2-volcengine` 按同底模理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4-7 @@ -247,8 +249,8 @@ | `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `temperature` 默认值为 `1`;火山引擎 `glm-4-7` 按官方 `glm-4.7` 同底模理解 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱对话补全文档 https://docs.bigmodel.cn/api-reference 明确 `top_p` 默认值为 `0.95`;火山引擎 `glm-4-7` 按官方 `glm-4.7` 同底模理解 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## doubao-embedding @@ -267,8 +269,8 @@ | `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | `doubao-embedding` 为向量模型,火山引擎 Embedding 文档 https://www.volcengine.com/docs/6492/2165105 与 https://www.volcengine.com/docs/84313/1927061 均未定义采样参数,按不适用记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | `doubao-embedding` 为向量模型,火山引擎 Embedding 文档 https://www.volcengine.com/docs/6492/2165105 与 https://www.volcengine.com/docs/84313/1927061 均未定义采样参数,按不适用记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## volc-mega-tts-clone @@ -286,8 +288,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为 TTS/声音复刻服务,不存在文本采样默认值,按 `null` 记录 | +| `defaultTopP` | `null` | `null` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为 TTS/声音复刻服务,不存在文本采样默认值,按 `null` 记录 | | `extra` | `{"maxCloneSamples":3,"minCloneDuration":5}` | `{"maxCloneSamples":3,"minCloneDuration":5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## volc-realtime-voice @@ -305,8 +307,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话服务,不存在文本采样默认值,按 `null` 记录 | +| `defaultTopP` | `null` | `null` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话服务,不存在文本采样默认值,按 `null` 记录 | | `extra` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## volc-simultaneous @@ -324,8 +326,8 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为同传服务,不存在文本采样默认值,按 `null` 记录 | +| `defaultTopP` | `null` | `null` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为同传服务,不存在文本采样默认值,按 `null` 记录 | | `extra` | `{"streamingSupported":true}` | `{"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## volc-translation @@ -343,6 +345,6 @@ | `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 火山翻译属于机器翻译服务,公开文档未定义文本采样默认值,按不适用记为 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 火山翻译属于机器翻译服务,公开文档未定义文本采样默认值,按不适用记为 `null` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/xai/未确认字段报告.md b/字段取值表/xai/未确认字段报告.md index 092f55b..d917f28 100644 --- a/字段取值表/xai/未确认字段报告.md +++ b/字段取值表/xai/未确认字段报告.md @@ -1,24 +1,15 @@ # 未确认字段报告 - compute/providers/xai.json - provider: `xai` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮范围: `defaultTemperature` / `defaultTopP` ## grok-4.20-0309-reasoning -- `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.x.ai/developers/rest-api-reference/inference/chat 。官方公开文档未给默认值。 +- `defaultTopP`: 已查 https://docs.x.ai/developers/rest-api-reference/inference/chat 。官方公开文档未给默认值。 ## grok-4-1-fast-reasoning -- `modelName`: ZenMux无稳定匹配 -- `maxOutputTokens`: 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 -- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 -- `extra`: 扩展字段为本地schema,需业务侧定义 +- `defaultTemperature`: 已查 https://docs.x.ai/developers/rest-api-reference/inference/chat 。官方公开文档未给默认值。 +- `defaultTopP`: 已查 https://docs.x.ai/developers/rest-api-reference/inference/chat 。官方公开文档未给默认值。 diff --git a/字段取值表/xai/详细字段取值表.md b/字段取值表/xai/详细字段取值表.md index 130defb..f3eb257 100644 --- a/字段取值表/xai/详细字段取值表.md +++ b/字段取值表/xai/详细字段取值表.md @@ -1,52 +1,23 @@ # 详细字段取值表 - compute/providers/xai.json - provider: `xai` -- priceCurrency: `USD` -- generatedAt: `2026-04-23T15:11:31.654Z` +- generatedAt: `2026-04-24T00:00:00+08:00` +- 本轮复核字段: `defaultTemperature` / `defaultTopP` ## 来源 -- https://docs.x.ai/docs/models -- https://docs.x.ai/developers/models -- https://docs.x.ai/developers/model-capabilities/text/reasoning -- https://docs.x.ai/developers/provisioned-throughput -- https://zenmux.ai/models -- https://zenmux.ai/api/v1/models +- https://docs.x.ai/developers/rest-api-reference/inference/chat ## grok-4.20-0309-reasoning -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4`、`x-ai/grok-4.2-fast-non-reasoning`、`x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4-fast` - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"grok-4.20-0309-reasoning"` | `"grok-4.20-0309-reasoning"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Grok 4.20 Reasoning"` | `"Grok 4.20 Reasoning"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方 Models and Pricing 页面 https://docs.x.ai/developers/models 标注 Grok 4.20 的 context window 为 `2,000,000` | -| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 | -| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | xAI Chat 文档公开页面未给 `temperature` 的默认值。 | +| `defaultTopP` | `null` | `null` | 保持 | xAI Chat 文档公开页面未给 `top_p` 的默认值。 | ## grok-4-1-fast-reasoning -- ZenMux匹配级别: `ambiguous` -- ZenMux候选: `x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4.1-fast`、`x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4-fast`、`x-ai/grok-4.2-fast-non-reasoning` - | 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | |---|---|---|---|---| -| `modelName` | `"grok-4-1-fast-reasoning"` | `"grok-4-1-fast-reasoning"` | 待确认 | ZenMux无稳定匹配 | -| `displayName` | `"Grok 4.1 Fast Reasoning"` | `"Grok 4.1 Fast Reasoning"` | 保持 | 展示字段,需按产品命名策略 | -| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | -| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方旧版 Models and Pricing 页面 https://docs.x.ai/docs/models?cluster=us-east-1%2F 列出 `grok-4-fast-reasoning` 的 Context 为 `2,000,000`;官方 reasoning 文档同时表明当前命名使用 `grok-4-1-fast` | -| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 | -| `inputPrice` | `0.2` | `0.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `outputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | -| `capabilities` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | +| `defaultTemperature` | `null` | `null` | 保持 | xAI Chat 文档公开页面未给 `temperature` 的默认值。 | +| `defaultTopP` | `null` | `null` | 保持 | xAI Chat 文档公开页面未给 `top_p` 的默认值。 | diff --git a/字段取值表/xunfei/未确认字段报告.md b/字段取值表/xunfei/未确认字段报告.md index 15cf768..4033e34 100644 --- a/字段取值表/xunfei/未确认字段报告.md +++ b/字段取值表/xunfei/未确认字段报告.md @@ -8,8 +8,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## 4.0Ultra @@ -17,6 +15,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/xunfei/详细字段取值表.md b/字段取值表/xunfei/详细字段取值表.md index 65f24f5..af2cefc 100644 --- a/字段取值表/xunfei/详细字段取值表.md +++ b/字段取值表/xunfei/详细字段取值表.md @@ -26,8 +26,8 @@ | `inputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","deep_thinking","math","code"]` | `["chat","reasoning","deep_thinking","math","code"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1.2` | `1.2` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 参数表明确 `temperature` 默认值为 `1.2` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 参数表明确 `top_p` 默认值为 `0.95` | | `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## 4.0Ultra @@ -45,6 +45,6 @@ | `inputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 讯飞星火 HTTP 调用文档 https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html 参数表明确 `temperature` 默认值为 `1.0` | +| `defaultTopP` | `1` | `1` | 保持 | 讯飞星火 HTTP 调用文档 https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html 参数表明确 `top_p` 默认值为 `1` | | `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu-coding/未确认字段报告.md b/字段取值表/zhipu-coding/未确认字段报告.md index 4f9bb2f..1451235 100644 --- a/字段取值表/zhipu-coding/未确认字段报告.md +++ b/字段取值表/zhipu-coding/未确认字段报告.md @@ -6,13 +6,9 @@ ## glm-5 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.7 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-coding/详细字段取值表.md b/字段取值表/zhipu-coding/详细字段取值表.md index 1442eac..5361cda 100644 --- a/字段取值表/zhipu-coding/详细字段取值表.md +++ b/字段取值表/zhipu-coding/详细字段取值表.md @@ -7,6 +7,7 @@ ## 来源 - https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 - https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 - https://www.bigmodel.cn/pricing - https://zenmux.ai/models @@ -28,8 +29,8 @@ | `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(z-ai/glm-5) prompt=0.58 USD/MTokens | | `outputPrice` | `2.6` | `2.6` | 保持 | ZenMux(z-ai/glm-5) completion=2.6 USD/MTokens | | `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 已复核智谱官方 GLM-5 模型页,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核智谱官方 GLM-5 模型页,`top_p` 默认值为 `0.95` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.7 @@ -48,6 +49,24 @@ | `inputPrice` | `0.2911` | `0.2911` | 保持 | ZenMux(z-ai/glm-4.7) prompt=0.2911 USD/MTokens | | `outputPrice` | `1.1645` | `1.1645` | 保持 | ZenMux(z-ai/glm-4.7) completion=1.1645 USD/MTokens | | `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 已复核智谱官方 GLM-4.7 模型页,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核智谱官方 GLM-4.7 模型页,`top_p` 默认值为 `0.95` | | `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5.1 + +- 本次补充 `defaultTemperature` / `defaultTopP` 复核结论 + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | 已复核智谱官方 GLM-5.1 模型页,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核智谱官方 GLM-5.1 模型页,`top_p` 默认值为 `0.95` | + +## glm-5-turbo + +- 本次补充 `defaultTemperature` / `defaultTopP` 复核结论 + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `defaultTemperature` | `1` | `1` | 保持 | 已复核智谱官方 GLM-5-Turbo 模型页,`temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 已复核智谱官方 GLM-5-Turbo 模型页,`top_p` 默认值为 `0.95` | diff --git a/字段取值表/zhipu-embedding/未确认字段报告.md b/字段取值表/zhipu-embedding/未确认字段报告.md index 89107e0..fd7ee3a 100644 --- a/字段取值表/zhipu-embedding/未确认字段报告.md +++ b/字段取值表/zhipu-embedding/未确认字段报告.md @@ -8,6 +8,4 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-embedding/详细字段取值表.md b/字段取值表/zhipu-embedding/详细字段取值表.md index 3204f69..0d35e79 100644 --- a/字段取值表/zhipu-embedding/详细字段取值表.md +++ b/字段取值表/zhipu-embedding/详细字段取值表.md @@ -25,6 +25,6 @@ | `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `null` | `null` | 保持 | 已复核智谱官方 Embedding-3 模型页;该模型输出模态为向量,不支持聊天采样参数,当前保持 `null` | +| `defaultTopP` | `null` | `null` | 保持 | 同上;Embedding 模型不支持 `top_p`,当前保持 `null` | | `extra` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu/未确认字段报告.md b/字段取值表/zhipu/未确认字段报告.md index 28f7f5e..a50aef4 100644 --- a/字段取值表/zhipu/未确认字段报告.md +++ b/字段取值表/zhipu/未确认字段报告.md @@ -8,8 +8,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.7 @@ -17,8 +15,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.7-thinking @@ -26,8 +22,6 @@ - `modelName`: ZenMux无稳定匹配 - `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 - `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.6v @@ -35,8 +29,6 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 ## glm-4.6 @@ -44,6 +36,4 @@ - `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 - `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 -- `defaultTemperature`: 官方通常不提供默认采样参数 -- `defaultTopP`: 官方通常不提供默认采样参数 - `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu/详细字段取值表.md b/字段取值表/zhipu/详细字段取值表.md index 8f2a355..10c7529 100644 --- a/字段取值表/zhipu/详细字段取值表.md +++ b/字段取值表/zhipu/详细字段取值表.md @@ -6,6 +6,7 @@ ## 来源 +- https://docs.bigmodel.cn/api-reference - https://docs.bigmodel.cn/cn/guide/models/text/glm-5 - https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 - https://docs.bigmodel.cn/cn/guide/models/text/glm-4.6 @@ -32,8 +33,8 @@ | `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `18` | `18` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 将 `temperature` schema 默认值标为 `1`,并明确 `GLM-5` 系列默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 将 `top_p` schema 默认值标为 `0.95`,并明确 `GLM-5` 系列默认值为 `0.95` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.7 @@ -52,8 +53,8 @@ | `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.7` 系列 `temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.7` 系列 `top_p` 默认值为 `0.95` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.7-thinking @@ -71,8 +72,8 @@ | `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `outputPrice` | `32` | `32` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | | `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.7` 系列 `temperature` 默认值为 `1.0`;本地 `glm-4.7-thinking` 为同系列思考别名 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.7` 系列 `top_p` 默认值为 `0.95`;本地 `glm-4.7-thinking` 为同系列思考别名 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.6v @@ -91,8 +92,8 @@ | `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 将 `temperature` 默认值标为 `1`;`glm-4.6v` 通过同一 chat completions 接口调用,视觉模型同样适用该默认值 | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 将 `top_p` 默认值标为 `0.95`;`glm-4.6v` 通过同一 chat completions 接口调用,视觉模型同样适用该默认值 | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | ## glm-4.6 @@ -111,6 +112,6 @@ | `inputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `outputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | | `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking"]` | `["chat","reasoning","code","multilingual","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | -| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | -| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTemperature` | `1` | `1` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.6` 系列 `temperature` 默认值为 `1.0` | +| `defaultTopP` | `0.95` | `0.95` | 保持 | 智谱官方对话补全 API https://docs.bigmodel.cn/api-reference 明确 `GLM-4.6` 系列 `top_p` 默认值为 `0.95` | | `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/采样参数复核报告.md b/字段取值表/采样参数复核报告.md new file mode 100644 index 0000000..545daa9 --- /dev/null +++ b/字段取值表/采样参数复核报告.md @@ -0,0 +1,89 @@ +# 采样参数复核报告 + +- 复核范围: `defaultTemperature` / `defaultTopP` +- 复核时间: `2026-04-24` +- 复核对象: `compute/providers/*` 与 `compute/coding-plans/*` + +## 判定规则 + +1. 官网明确写出 `Defaults to ...`,或官方接口示例在省略参数时返回固定值: +填写该数字,视为官方默认值。 +2. 官网只给参数范围、推荐起点、示例值,或者说明“默认值随模型而变”但公共页面不公开具体数字: +JSON 不保留伪官方默认值,改为 `null`;如有意义,可在字段表里记“参考值”。 +3. 模型类型不使用聊天采样参数,例如 `embedding`、`rerank`、`tts`、`image_generation`、大部分 `asr` / `video_generation`: +统一记为 `null`。 +4. 聚合平台、自动路由别名、或本地别名无法和官网型号 1:1 映射: +不硬填,记为 `null`,并在对应 `未确认字段报告.md` 写明查过的网址和原因。 + +## 已确认为官方默认值 + +- `OpenAI`: + 文本/视觉/Responses 模型保留 `temperature=1`、`top_p=1`。 + 依据: `https://platform.openai.com/docs/api-reference/chat/create-chat-completion`, `https://platform.openai.com/docs/api-reference/responses/retrieve` +- `Anthropic`: + `temperature=1`。 + 依据: `https://docs.anthropic.com/en/api/messages` +- `Google Gemini 3`: + `temperature=1`、`topP=0.95`。 + 依据: `https://ai.google.dev/gemini-api/docs/gemini-3`, `https://ai.google.dev/gemini-api/docs/prompting-strategies`, `https://ai.google.dev/api/models` +- `Cohere Chat`: + `temperature=0.3`、`topP=0.75`。 + 依据: `https://docs.cohere.com/reference/chat` +- `Mistral`: + `top_p=1`;`temperature` 公共文档未给固定数字。 + 依据: `https://docs.mistral.ai/api` +- `MiniMax` / `MiniMax Coding`: + 主模型家族统一确认 `temperature=1`、`top_p=0.95`;`MiniMax-Text-01` 为 `0.1 / 0.95`。 + 依据: `https://platform.minimaxi.com/docs/api-reference/text-chat-openai`, `https://platform.minimaxi.com/docs/api-reference/text-post` +- `DashScope / Qwen`: + 多数官方模型已按接口默认值确认,例如 `qwen3.5-plus` / `qwen3.6-*` 为 `0.6 / 0.95`,`qwen-max` 为 `0.7 / 0.8`。 + 依据: `https://help.aliyun.com/zh/model-studio/qwen-api-via-openai-chat-completions`, `https://help.aliyun.com/zh/model-studio/qwen-api-via-dashscope` +- `DeepSeek`: + `deepseek-chat = 1 / 1`。 + 依据: `https://api-docs.deepseek.com/api/create-chat-completion` +- `Moonshot / Kimi`: + `kimi-k2.5 = 1 / 0.95`,`kimi-k2 = 0.6 / 1`,`kimi-k2-thinking = 1 / 1`,`moonshot-v1-* = 0 / 1`。 + 依据: `https://platform.kimi.com/docs/api/models-overview`, `https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart`, `https://platform.kimi.com/docs/guide/kimi-k2-quickstart` +- `Zhipu / Zhipu Coding`: + `glm-5*`、`glm-4.7*`、`glm-4.6*` 默认 `temperature=1`、`top_p=0.95`。 + 依据: `https://docs.bigmodel.cn/api-reference` +- `Baidu`: + `ernie-4.5-turbo-* = 0.8 / 1`。 + 依据: `https://cloud.baidu.com/doc/qianfan/s/6mh4stoyf` +- `Xunfei`: + `spark-x = 1.2 / 0.95`,`4.0Ultra = 1 / 1`。 + 依据: `https://www.xfyun.cn/doc/spark/X1http.html`, `https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html` +- `OpenRouter`: + 平台级默认 `temperature=1`、`top_p=1`。 + 依据: `https://openrouter.ai/docs/api/reference/parameters` +- `Ollama`: + `llama3.1:70b = 0.8 / 0.9`。 + 依据: `https://docs.ollama.com/modelfile` +- `Kwai Coding`: + `kwai-coder = 1 / 1`。 + 依据: `https://www.streamlake.com/document/WANQING/me6z3u08sjus2mzplbj` + +## 已改为 null 的类型 + +- 官网没有公开默认值: + `Perplexity`, `xAI`, `Tencent Hunyuan`, `Lingyiwanwu`, `Baichuan` 本地 `M2/M3` 系列。 +- 官网明确参数不适用: + `DeepSeek Reasoner`, `BGE / Embed / Rerank`, `Kling` 视频模型, `Stability` 图像模型, `Zhipu embedding`, 多数 `TTS / ASR / image / video` 模型。 +- 官网只给“随模型而变”但公共页没有具体数值: + `Mistral temperature`, `Google Gemini 2.5 temperature`。 +- 本地别名无法和官网型号一一映射: + `infini-coding/deepseek-v3`, `moonshot-coding/kimi-for-coding`, `volcengine-coding/ark-code-latest`, `dashscope/qwen3-max-trans`。 + +## 参考值但不写入 JSON 的边界项 + +- `Google Gemini 2.5 temperature`: + 官方 `models.get` 文档承认存在 backend 默认值,但公共文档未直接公开数字;本地旧值 `1.0` 只能视为参考,JSON 保持 `null`。 +- `DashScope qwen3-max-trans`: + 机器翻译文档里有 `qwen-mt` 的采样默认值,但本地别名没有官方 1:1 映射,JSON 保持 `null`。 + +## 结果说明 + +- 这轮复核后,仓库里 `defaultTemperature` / `defaultTopP` 的取值不再沿用“习惯值”或“看起来像默认值”的数字。 +- 能从官网坐实的,已经改成官方默认值。 +- 官网不公开默认值或字段不适用的,已经明确改成 `null`。 +- 仍出现在各 provider `未确认字段报告.md` 里的条目,不是没查,而是官网当前只给参数定义、范围、或要求调用 API 元数据接口才能取到具体默认值。