diff --git a/compute/coding-plans/dashscope-coding.json b/compute/coding-plans/dashscope-coding.json index 14a1b3c..4696bae 100644 --- a/compute/coding-plans/dashscope-coding.json +++ b/compute/coding-plans/dashscope-coding.json @@ -10,7 +10,10 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { "quotas": {}, "usageTracking": { @@ -22,22 +25,45 @@ { "modelName": "qwen3-coder-plus", "displayName": "Qwen3 Coder Plus (Coding)", - "serviceType": ["chat"], - "description": "阿里云百炼 Coding Plan,Qwen3 编程增强版", - "contextWindow": 131072, - "maxOutputTokens": 16384, - "capabilities": ["chat", "reasoning", "code", "tool_use"], - "source": "preset" + "serviceType": [ + "chat" + ], + "description": "阿里云百炼 Coding Plan,Qwen3 编程增强版,100万上下文", + "contextWindow": 1000000, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use" + ], + "source": "preset", + "inputPrice": 1, + "outputPrice": 5, + "defaultTemperature": 0.7 }, { - "modelName": "qwen3-max", + "modelName": "qwen3-max-2026-01-23", "displayName": "Qwen3 Max (Coding)", - "serviceType": ["chat"], - "description": "阿里云百炼 Coding Plan,Qwen3 Max 旗舰模型", - "contextWindow": 131072, - "maxOutputTokens": 16384, - "capabilities": ["chat", "reasoning", "code", "multilingual", "tool_use", "long_context", "vision"], - "source": "preset" + "serviceType": [ + "chat" + ], + "description": "阿里云百炼 Coding Plan,Qwen3 Max 旗舰模型,262K 上下文", + "contextWindow": 262144, + "maxOutputTokens": 65536, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "tool_use", + "long_context", + "vision" + ], + "source": "preset", + "inputPrice": 1.2, + "outputPrice": 6, + "defaultTemperature": 0.7 } ] } diff --git a/compute/coding-plans/infini-coding.json b/compute/coding-plans/infini-coding.json index 24cbe65..9ebdb3c 100644 --- a/compute/coding-plans/infini-coding.json +++ b/compute/coding-plans/infini-coding.json @@ -27,6 +27,7 @@ "contextWindow": 128000, "maxOutputTokens": 8192, "capabilities": ["chat", "reasoning", "code", "multilingual"], + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/kwai-coding.json b/compute/coding-plans/kwai-coding.json index 5ed31d0..5d7393c 100644 --- a/compute/coding-plans/kwai-coding.json +++ b/compute/coding-plans/kwai-coding.json @@ -25,6 +25,9 @@ "serviceType": ["chat"], "description": "快手 KwaiKAT Coding Plan,编程辅助模型", "capabilities": ["chat", "code"], + "contextWindow": 128000, + "maxOutputTokens": 8192, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/minimax-coding.json b/compute/coding-plans/minimax-coding.json index 8e7ec7d..132441e 100644 --- a/compute/coding-plans/minimax-coding.json +++ b/compute/coding-plans/minimax-coding.json @@ -2,7 +2,7 @@ "id": "provider-minimax-coding-001", "provider": "minimax", "brandGroup": "minimax", - "label": "MiniMax Coding Plan", + "label": "MiniMax Token Plan", "baseUrl": "https://api.minimaxi.com/v1", "apiFormat": "openai-completions", "apiKeyRef": "", @@ -10,25 +10,108 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning", + "fast" + ], "codingPlan": { - "quotas": {}, + "quotas": { + "textWindow": "5h", + "standard": { + "starterRequestsPer5h": 1500, + "plusRequestsPer5h": 4500, + "maxRequestsPer5h": 15000 + }, + "highspeed": { + "plusHighspeedRequestsPer5h": 4500, + "maxHighspeedRequestsPer5h": 15000, + "ultraHighspeedRequestsPer5h": 30000 + } + }, "usageTracking": { "method": "rest-api", - "endpoint": "https://api.minimaxi.com/v1/coding/usage", - "consoleUrl": "https://platform.minimaxi.com/" + "endpoint": "https://www.minimax.io/v1/token_plan/remains", + "consoleUrl": "https://www.minimax.io/user-center/token-plan" } }, "models": [ { - "modelName": "MiniMax-M1", - "displayName": "MiniMax-M1 (Coding)", - "serviceType": ["chat"], - "description": "MiniMax Coding Plan,M1 旗舰模型", - "contextWindow": 1000000, + "modelName": "MiniMax-M2.7", + "displayName": "MiniMax-M2.7 (Token Plan)", + "serviceType": [ + "chat" + ], + "description": "MiniMax Token Plan 默认文本模型,M2.7,204,800 上下文,约 60 TPS 输出", + "contextWindow": 204800, "maxOutputTokens": 131072, - "capabilities": ["chat", "reasoning", "code", "long_context"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "long_context" + ], + "source": "preset", + "inputPrice": 0.3, + "outputPrice": 1.2, + "defaultTemperature": 1, + "defaultTopP": 1, + "extra": { + "billing": "token_plan_request_quota", + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } + }, + { + "modelName": "MiniMax-M2.7-highspeed", + "displayName": "MiniMax-M2.7 高速版 (Token Plan)", + "serviceType": [ + "fast" + ], + "description": "MiniMax Token Plan 高速订阅支持模型,M2.7-highspeed,效果与 M2.7 一致但输出更快", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "long_context", + "fast" + ], + "source": "preset", + "inputPrice": 0.6, + "outputPrice": 2.4, + "defaultTemperature": 1, + "defaultTopP": 1, + "extra": { + "billing": "token_plan_highspeed_request_quota", + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } + }, + { + "modelName": "MiniMax-M2.5", + "displayName": "MiniMax-M2.5 (Coding)", + "serviceType": [ + "chat" + ], + "description": "MiniMax Coding Plan,M2.5 模型,204.8K 上下文", + "contextWindow": 204800, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "long_context" + ], + "source": "preset", + "inputPrice": 0.3, + "outputPrice": 1.2, + "defaultTemperature": 1 } ] } diff --git a/compute/coding-plans/moonshot-coding.json b/compute/coding-plans/moonshot-coding.json index 01cf854..09ce9c7 100644 --- a/compute/coding-plans/moonshot-coding.json +++ b/compute/coding-plans/moonshot-coding.json @@ -10,24 +10,76 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { - "quotas": {}, + "quotas": { + "window": "5h", + "approxApiCallsPerWindow": "300-1200", + "maxConcurrency": 30 + }, "usageTracking": { "method": "none", - "consoleUrl": "https://platform.moonshot.cn/" + "consoleUrl": "https://www.kimi.com/code/console" } }, "models": [ { - "modelName": "kimi-k2", - "displayName": "Kimi K2 (Coding)", - "serviceType": ["chat"], - "description": "Kimi Code 套餐,万亿参数 MoE 模型,128K 上下文", - "contextWindow": 128000, - "maxOutputTokens": 8192, - "capabilities": ["chat", "reasoning", "code", "tool_use", "agent", "long_context", "vision"], - "source": "preset" + "modelName": "kimi-for-coding", + "displayName": "Kimi for Coding", + "serviceType": [ + "chat" + ], + "description": "Kimi Code 会员权益模型,官方第三方 Coding Agent 推荐模型 ID,Kimi Code 平台按会员额度计费", + "contextWindow": 262144, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision", + "video_understanding" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "billing": "kimi_membership_quota", + "baseUrlNote": "Kimi Code API Key must use https://api.kimi.com/coding/v1", + "recommendedFor": [ + "Kimi Code CLI", + "Claude Code", + "Roo Code" + ] + } + }, + { + "modelName": "kimi-k2.5", + "displayName": "Kimi K2.5 (Coding)", + "serviceType": [ + "chat" + ], + "description": "Kimi Code 套餐,Kimi K2.5 模型,256K 上下文", + "contextWindow": 256000, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision" + ], + "source": "preset", + "inputPrice": 0.58, + "outputPrice": 3.02, + "defaultTemperature": 1 } ] } diff --git a/compute/coding-plans/moorethread-coding.json b/compute/coding-plans/moorethread-coding.json index 7b18f67..6acd5cf 100644 --- a/compute/coding-plans/moorethread-coding.json +++ b/compute/coding-plans/moorethread-coding.json @@ -25,6 +25,9 @@ "serviceType": ["chat"], "description": "摩尔线程 Coding Plan,国产 GPU 推理", "capabilities": ["chat", "code"], + "contextWindow": 128000, + "maxOutputTokens": 8192, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/volcengine-coding.json b/compute/coding-plans/volcengine-coding.json index b32fa66..42269cb 100644 --- a/compute/coding-plans/volcengine-coding.json +++ b/compute/coding-plans/volcengine-coding.json @@ -31,6 +31,9 @@ "serviceType": ["chat"], "description": "自动路由最优编程模型(Doubao-Seed-Code / GLM-4.7 / DeepSeek-V3.2 / Kimi-K2 等)", "capabilities": ["code", "reasoning", "chat"], + "contextWindow": 256000, + "maxOutputTokens": 32000, + "defaultTemperature": 1, "source": "preset" } ] diff --git a/compute/coding-plans/zhipu-coding.json b/compute/coding-plans/zhipu-coding.json index f008e68..beac3bb 100644 --- a/compute/coding-plans/zhipu-coding.json +++ b/compute/coding-plans/zhipu-coding.json @@ -10,7 +10,10 @@ "enabled": false, "status": "unconfigured", "accessMode": "coding-plan", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "codingPlan": { "quotas": {}, "usageTracking": { @@ -19,25 +22,117 @@ } }, "models": [ + { + "modelName": "glm-5.1", + "displayName": "GLM-5.1 (Coding)", + "serviceType": [ + "chat" + ], + "description": "GLM Coding Plan 全量套餐支持的 GLM-5.1,面向复杂推理和大型工程任务,204,800 上下文,131,072 最大输出", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent", + "math", + "multilingual" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "quotaMultiplier": { + "peakHoursUtc8": "14:00-18:00", + "peak": 3, + "offPeak": 2, + "promotionalOffPeak": 1, + "promotionalOffPeakEndsAt": "2026-04-30" + } + } + }, + { + "modelName": "glm-5-turbo", + "displayName": "GLM-5-Turbo (Coding)", + "serviceType": [ + "chat" + ], + "description": "GLM Coding Plan 支持的 GLM-5-Turbo,面向 OpenClaw 等长链路任务优化,204,800 上下文,131,072 最大输出", + "contextWindow": 204800, + "maxOutputTokens": 131072, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "source": "preset", + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "quotaMultiplier": { + "peakHoursUtc8": "14:00-18:00", + "peak": 3, + "offPeak": 2, + "promotionalOffPeak": 1, + "promotionalOffPeakEndsAt": "2026-04-30" + } + } + }, { "modelName": "glm-5", "displayName": "GLM-5 (Coding)", - "serviceType": ["chat"], - "description": "智谱 GLM-5 Coding Plan 版本,745B MoE,编程能力登顶", - "contextWindow": 192000, + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5 Coding Plan 版本,202,752 token 上下文,编程能力登顶", + "contextWindow": 200000, "maxOutputTokens": 128000, - "capabilities": ["chat", "reasoning", "code", "deep_thinking", "long_context", "tool_use", "agent", "math", "multilingual"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent", + "math", + "multilingual" + ], + "source": "preset", + "inputPrice": 0.58, + "outputPrice": 2.6, + "defaultTemperature": 0.95 }, { "modelName": "glm-4.7", "displayName": "GLM-4.7 (Coding)", - "serviceType": ["chat"], - "description": "智谱 GLM-4.7 Coding Plan 版本,200K 上下文", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-4.7 Coding Plan 版本,202,752 token 上下文", "contextWindow": 200000, "maxOutputTokens": 128000, - "capabilities": ["chat", "reasoning", "code", "deep_thinking", "long_context", "tool_use", "multilingual"], - "source": "preset" + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "multilingual" + ], + "source": "preset", + "inputPrice": 0.2911, + "outputPrice": 1.1645, + "defaultTemperature": 0.95 } ] } diff --git a/compute/providers/anthropic.json b/compute/providers/anthropic.json index d205155..62873ff 100644 --- a/compute/providers/anthropic.json +++ b/compute/providers/anthropic.json @@ -17,10 +17,12 @@ { "modelName": "claude-opus-4-6", "displayName": "Claude Opus 4.6", - "serviceType": ["chat"], - "description": "Anthropic 最新旗舰 Opus 模型,最强能力", + "serviceType": [ + "chat" + ], + "description": "Anthropic Opus 4.6,1M 上下文,适合复杂代理和编码任务", "contextWindow": 200000, - "maxOutputTokens": 32768, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -36,7 +38,9 @@ { "modelName": "claude-opus-4-5", "displayName": "Claude Opus 4.5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Opus 4.5,顶级推理能力", "contextWindow": 200000, "maxOutputTokens": 32768, @@ -55,7 +59,9 @@ { "modelName": "claude-sonnet-4-5", "displayName": "Claude Sonnet 4.5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Sonnet 4.5,高性能性价比", "contextWindow": 200000, "maxOutputTokens": 64000, @@ -74,7 +80,9 @@ { "modelName": "claude-sonnet-4", "displayName": "Claude Sonnet 4", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Anthropic Sonnet 4 旗舰模型", "contextWindow": 200000, "maxOutputTokens": 64000, @@ -93,7 +101,9 @@ { "modelName": "claude-sonnet-4-5-computer", "displayName": "Claude Sonnet 4.5 Computer Use", - "serviceType": ["computer_use"], + "serviceType": [ + "computer_use" + ], "description": "Anthropic 最佳 Computer Use 模型", "contextWindow": 200000, "maxOutputTokens": 64000, diff --git a/compute/providers/baichuan.json b/compute/providers/baichuan.json index b725abf..0de20e1 100644 --- a/compute/providers/baichuan.json +++ b/compute/providers/baichuan.json @@ -18,8 +18,8 @@ "displayName": "百川 M3-Plus", "serviceType": ["chat"], "description": "百川智能M3-Plus医疗增强模型,235B参数,幻觉率仅2.6%,API价格较前代下降70%", - "contextWindow": 192000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -40,8 +40,8 @@ "displayName": "百川 M3", "serviceType": ["chat"], "description": "百川智能M3新一代开源医疗增强模型,235B参数", - "contextWindow": 192000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -61,8 +61,8 @@ "displayName": "百川 M2-Plus", "serviceType": ["chat"], "description": "百川智能M2-Plus旗舰模型,最强推理和创作能力", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -81,8 +81,8 @@ "displayName": "百川 M2", "serviceType": ["chat"], "description": "百川智能M2模型,高性能通用模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 32000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/baidu.json b/compute/providers/baidu.json index 103bf25..2720fd0 100644 --- a/compute/providers/baidu.json +++ b/compute/providers/baidu.json @@ -9,14 +9,20 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "CNY", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "models": [ { "modelName": "ernie-5.0-thinking-latest", "displayName": "文心 ERNIE 5.0", - "serviceType": ["chat", "reasoning"], + "serviceType": [ + "chat", + "reasoning" + ], "description": "百度最新旗舰模型,支持深度推理、多模态和工具调用,119K输入/64K输出", - "contextWindow": 131072, + "contextWindow": 128000, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -34,10 +40,12 @@ { "modelName": "ernie-4.5-turbo-128k-latest", "displayName": "文心 ERNIE 4.5 Turbo", - "serviceType": ["chat"], - "description": "百度高性价比长上下文模型,128K 窗口,适合日常对话和文档处理", + "serviceType": [ + "chat" + ], + "description": "百度高性价比长上下文模型,128K 窗口,最大输出 12,288 token", "contextWindow": 131072, - "maxOutputTokens": 8192, + "maxOutputTokens": 12288, "capabilities": [ "chat", "code", diff --git a/compute/providers/cohere.json b/compute/providers/cohere.json index 7815cc8..6807513 100644 --- a/compute/providers/cohere.json +++ b/compute/providers/cohere.json @@ -15,9 +15,9 @@ "modelName": "command-a-03-2025", "displayName": "Command A", "serviceType": ["chat"], - "description": "Cohere 旗舰对话模型,262K 上下文,擅长 RAG 和工具调用", - "contextWindow": 262144, - "maxOutputTokens": 8192, + "description": "Cohere 旗舰对话模型,256K 上下文,擅长 RAG 和工具调用", + "contextWindow": 256000, + "maxOutputTokens": 8000, "capabilities": [ "chat", "reasoning", @@ -37,8 +37,8 @@ "modelName": "embed-v4.0", "displayName": "Embed V4", "serviceType": ["embedding"], - "description": "Cohere 最新 Embedding 模型,131K 上下文,多语言支持", - "contextWindow": 131072, + "description": "Cohere 最新 Embedding 模型,128K 上下文,多语言支持", + "contextWindow": 128000, "maxOutputTokens": 0, "capabilities": [ "text_embedding", @@ -46,14 +46,15 @@ ], "inputPrice": 0.12, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "rerank-v3.5", "displayName": "Rerank V3.5", "serviceType": ["rerank"], - "description": "Cohere 语义重排序模型,用于检索结果精排", - "contextWindow": 0, + "description": "Cohere 语义重排序模型,用于检索结果精排,默认单文档截断 4096 token", + "contextWindow": 4096, "maxOutputTokens": 0, "capabilities": [ "rerank", @@ -61,6 +62,7 @@ ], "inputPrice": 2.00, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/dashscope.json b/compute/providers/dashscope.json index 3d89263..58d795f 100644 --- a/compute/providers/dashscope.json +++ b/compute/providers/dashscope.json @@ -26,10 +26,12 @@ { "modelName": "qwen3.5-plus", "displayName": "阿里云 Qwen3.5-Plus", - "serviceType": ["chat"], - "description": "通义千问3.5旗舰模型,支持文本/图像/视频输入,效果媲美Qwen3 Max,性价比更优", - "contextWindow": 262144, - "maxOutputTokens": 16384, + "serviceType": [ + "chat" + ], + "description": "通义千问3.5旗舰模型,支持文本/图像/视频输入,100万上下文,默认开启思考模式", + "contextWindow": 1000000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", @@ -44,14 +46,35 @@ "outputPrice": 4.8, "defaultTemperature": 0.7, "defaultTopP": 0.8, - "extra": {} + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 128000, + "inputPrice": 0.8, + "outputPrice": 4.8 + }, + { + "maxInputTokens": 256000, + "inputPrice": 2, + "outputPrice": 12 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 4, + "outputPrice": 24 + } + ], + "thinkingMaxTokens": 81920 + } }, { "modelName": "qwen-max", "displayName": "阿里云 qwen-max", - "serviceType": ["chat"], - "description": "通义千问Max,千亿参数旗舰模型,最强性能", - "contextWindow": 131072, + "serviceType": [ + "chat" + ], + "description": "通义千问Max,千亿参数旗舰模型,32K 上下文", + "contextWindow": 32768, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -69,10 +92,12 @@ { "modelName": "qwen-plus", "displayName": "阿里云 qwen-plus", - "serviceType": ["chat"], - "description": "通义千问Plus,支持思考模式,128K 上下文", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "serviceType": [ + "chat" + ], + "description": "通义千问Plus,支持思考模式,100万上下文", + "contextWindow": 1000000, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -83,34 +108,64 @@ "outputPrice": 2, "defaultTemperature": 0.6, "defaultTopP": 0.8, - "extra": {} + "extra": { + "pricingTiers": [ + { + "maxInputTokens": 128000, + "inputPrice": 0.8, + "outputPrice": 2, + "thinkingOutputPrice": 8 + }, + { + "maxInputTokens": 256000, + "inputPrice": 2.4, + "outputPrice": 20, + "thinkingOutputPrice": 24 + }, + { + "maxInputTokens": 1000000, + "inputPrice": 4.8, + "outputPrice": 48, + "thinkingOutputPrice": 64 + } + ], + "thinkingMaxTokens": 81920 + } }, { "modelName": "qwen-turbo", "displayName": "阿里云 qwen-turbo", - "serviceType": ["chat"], - "description": "通义千问Turbo,支持100万上下文,高性价比", + "serviceType": [ + "chat" + ], + "description": "通义千问Turbo,非思考模式支持100万上下文,思考模式支持131K上下文", "contextWindow": 1000000, - "maxOutputTokens": 8192, + "maxOutputTokens": 16384, "capabilities": [ "chat", "code", "long_context", "fast" ], - "inputPrice": 0.3, - "outputPrice": 0.6, + "inputPrice": 0.367, + "outputPrice": 1.468, "defaultTemperature": 0.7, "defaultTopP": 0.8, - "extra": {} + "extra": { + "thinkingContextWindow": 131072, + "thinkingOutputPrice": 3.67, + "thinkingMaxTokens": 38912 + } }, { "modelName": "qwen-long", "displayName": "阿里云 qwen-long", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "通义千问Long,支持1000万上下文,适合超长文档处理,降价97%", "contextWindow": 10000000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32768, "capabilities": [ "chat", "ultra_long_context", @@ -125,7 +180,9 @@ { "modelName": "qwen3-max", "displayName": "阿里云 Qwen3-Max", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "通义千问3代旗舰模型,262K 上下文,支持思考模式", "contextWindow": 262144, "maxOutputTokens": 65536, @@ -148,10 +205,12 @@ { "modelName": "qwen3-vl-plus", "displayName": "阿里云 Qwen3-VL-Plus", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "通义千问3代视觉模型Plus版,支持图像理解", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -161,15 +220,18 @@ ], "inputPrice": 1.5, "outputPrice": 6, + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "qwen3-vl-flash", "displayName": "阿里云 Qwen3-VL-Flash", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "通义千问3代视觉模型Flash版,高性价比", - "contextWindow": 131072, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -178,57 +240,78 @@ ], "inputPrice": 0.8, "outputPrice": 3, + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "text-embedding-v3", "displayName": "text-embedding-v3", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "阿里云文本向量化", + "contextWindow": 8192, "capabilities": [ "text_embedding", "semantic_search", "chinese_optimized" ], "inputPrice": 0.7, + "maxOutputTokens": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "text-embedding-v4", "displayName": "阿里云 text-embedding-v4", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "阿里云百炼文本向量模型v4,支持多维度与多语种", + "contextWindow": 8192, "capabilities": [ "text_embedding", "semantic_search", "rag" ], "inputPrice": 0.5, + "maxOutputTokens": 0, + "defaultTemperature": 1, "extra": {} }, { "modelName": "qwen3-rerank", "displayName": "Qwen3-Rerank", - "serviceType": ["rerank"], + "serviceType": [ + "rerank" + ], "description": "检索重排序,支持 100+ 语种", + "contextWindow": 120000, + "maxOutputTokens": 0, "capabilities": [ "rerank", "semantic_reranking", "multilingual" ], "inputPrice": 1, + "defaultTemperature": 1, "extra": {} }, { "modelName": "cosyvoice-v2", "displayName": "CosyVoice V2", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "通义语音合成,支持中英文", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts", "multilingual", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "voices": [ "longxiaochun", @@ -246,12 +329,17 @@ { "modelName": "paraformer-v2", "displayName": "Paraformer V2", - "serviceType": ["asr"], + "serviceType": [ + "asr" + ], "description": "通义语音识别", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "asr", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "maxAudioLength": 3600, "supportedInputFormats": [ @@ -266,12 +354,17 @@ { "modelName": "wanx-v2", "displayName": "通义万相 V2", - "serviceType": ["image_gen"], + "serviceType": [ + "image_gen" + ], "description": "通义万相文生图", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", @@ -289,12 +382,17 @@ { "modelName": "wanx-video", "displayName": "通义万相视频", - "serviceType": ["video_gen"], + "serviceType": [ + "video_gen" + ], "description": "通义万相文生视频", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -306,13 +404,18 @@ { "modelName": "cosyvoice-clone", "displayName": "CosyVoice 声音复刻", - "serviceType": ["voice_clone"], + "serviceType": [ + "voice_clone" + ], "description": "通义声音复刻,少量样本即可克隆", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], + "defaultTemperature": 1, "extra": { "maxCloneSamples": 5, "minCloneDuration": 3 @@ -321,9 +424,12 @@ { "modelName": "qwen-omni-turbo", "displayName": "Qwen-Omni-Turbo", - "serviceType": ["omni"], + "serviceType": [ + "omni" + ], "description": "通义全能模型,支持音视频文本多模态", "contextWindow": 32768, + "maxOutputTokens": 2048, "capabilities": [ "chat", "vision", @@ -332,19 +438,24 @@ "multimodal", "tool_use" ], + "defaultTemperature": 0.7, "extra": {} }, { "modelName": "qwen3-max-trans", "displayName": "Qwen3-Max(翻译)", - "serviceType": ["translation"], + "serviceType": [ + "translation" + ], "description": "通义千问翻译,中英日韩等多语种互译", "contextWindow": 131072, + "maxOutputTokens": 8192, "capabilities": [ "translation", "multilingual", "chinese_optimized" ], + "defaultTemperature": 0.7, "extra": {} } ] diff --git a/compute/providers/deepseek.json b/compute/providers/deepseek.json index 69cd4f1..958b793 100644 --- a/compute/providers/deepseek.json +++ b/compute/providers/deepseek.json @@ -17,10 +17,12 @@ { "modelName": "deepseek-chat", "displayName": "DeepSeek V3.2", - "serviceType": ["chat"], - "description": "高性价比通用对话模型,64K 上下文", - "contextWindow": 64000, - "maxOutputTokens": 8000, + "serviceType": [ + "chat" + ], + "description": "高性价比通用对话模型,128K 上下文", + "contextWindow": 128000, + "maxOutputTokens": 8192, "capabilities": [ "chat", "code", @@ -36,10 +38,12 @@ { "modelName": "deepseek-reasoner", "displayName": "DeepSeek R1", - "serviceType": ["reasoning"], - "description": "DeepSeek R1 推理模型,64K 上下文,深度推理能力,思维链最长 32K", - "contextWindow": 64000, - "maxOutputTokens": 8192, + "serviceType": [ + "reasoning" + ], + "description": "DeepSeek V3.2 思考模式,128K 上下文,思维链默认 32K,最大输出 64K", + "contextWindow": 128000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/google.json b/compute/providers/google.json index b4a1dba..bc64796 100644 --- a/compute/providers/google.json +++ b/compute/providers/google.json @@ -19,8 +19,8 @@ "modelName": "gemini-2.5-pro", "displayName": "Gemini 2.5 Pro", "serviceType": ["chat"], - "description": "Google 最新旗舰模型,100万上下文,多模态", - "contextWindow": 1000000, + "description": "Google 最新旗舰模型,1,048,576 token 上下文,多模态", + "contextWindow": 1048576, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -40,8 +40,8 @@ "modelName": "gemini-2.5-flash", "displayName": "Gemini 2.5 Flash", "serviceType": ["chat"], - "description": "Google 高性价比模型,100万上下文,速度快", - "contextWindow": 1000000, + "description": "Google 高性价比模型,1,048,576 token 上下文,速度快", + "contextWindow": 1048576, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -63,11 +63,14 @@ "displayName": "Text Embedding 005", "serviceType": ["embedding"], "description": "Google 文本嵌入模型,768维度", + "contextWindow": 2048, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.10, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/internal-testing.json b/compute/providers/internal-testing.json index e4d28e3..6b31f84 100644 --- a/compute/providers/internal-testing.json +++ b/compute/providers/internal-testing.json @@ -23,7 +23,7 @@ "chat" ], "description": "MiniMax M2.7 高速版,低延迟吞吐优化,200K 上下文", - "contextWindow": 200000, + "contextWindow": 204800, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -41,9 +41,9 @@ "serviceType": [ "chat" ], - "description": "智谱 GLM-5.1 新一代旗舰模型,编程与推理能力断档领先,204K 上下文", - "contextWindow": 204800, - "maxOutputTokens": 131072, + "description": "智谱 GLM-5.1 新一代旗舰模型,编程与推理能力断档领先,200K 上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -63,9 +63,9 @@ "serviceType": [ "chat" ], - "description": "智谱 GLM-5 大语言模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "description": "智谱 GLM-5 大语言模型,200K 上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -83,8 +83,8 @@ "chat" ], "description": "智谱 GLM-5-Turbo 大语言模型,更快的推理速度", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -122,7 +122,7 @@ ], "description": "月之暗面 Kimi K2.6 Code Preview,万亿参数 MoE 架构(32B 激活),256K 上下文,代码与智能体能力增强", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -144,8 +144,8 @@ "chat" ], "description": "月之暗面 Kimi-2.5 大语言模型", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 256000, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -167,7 +167,7 @@ "chat" ], "description": "MiniMax M2.5 大语言模型", - "contextWindow": 128000, + "contextWindow": 204800, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -211,8 +211,8 @@ "chat" ], "description": "阿里通义千问 Qwen3.5 Plus", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 1000000, + "maxOutputTokens": 65536, "capabilities": [ "chat", "reasoning", @@ -276,8 +276,8 @@ "chat" ], "description": "阿里通义千问 Qwen3 Max (2026-01-23)", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 262144, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -299,8 +299,8 @@ "chat" ], "description": "字节跳动豆包 Seed 2.0 Code Preview (260215)", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "contextWindow": 256000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/kling.json b/compute/providers/kling.json index 0979a7a..ef35efb 100644 --- a/compute/providers/kling.json +++ b/compute/providers/kling.json @@ -18,12 +18,15 @@ "displayName": "可灵 V2.5 Turbo", "serviceType": ["video_gen"], "description": "可灵最新视频生成模型,高性价比", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality", "fast" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -38,11 +41,14 @@ "displayName": "可灵 V2.5 Turbo Pro", "serviceType": ["video_gen"], "description": "可灵高品质视频生成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -57,11 +63,14 @@ "displayName": "可灵 V2", "serviceType": ["video_gen"], "description": "可灵文生视频旗舰模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "high_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ @@ -75,11 +84,14 @@ "displayName": "可灵 V2 Master", "serviceType": ["video_gen"], "description": "可灵最高品质视频生成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "video_generation", "chinese_optimized", "ultra_quality" ], + "defaultTemperature": 1, "extra": { "maxVideoDuration": 10, "supportedResolutions": [ diff --git a/compute/providers/local-whisper.json b/compute/providers/local-whisper.json index f8c58ad..f0f97c8 100644 --- a/compute/providers/local-whisper.json +++ b/compute/providers/local-whisper.json @@ -18,6 +18,9 @@ "displayName": "Whisper Large V3", "serviceType": ["asr"], "description": "本地部署的 Whisper 大模型", + "contextWindow": 0, + "maxOutputTokens": 0, + "defaultTemperature": 1, "capabilities": [ "asr", "multilingual" diff --git a/compute/providers/minimax.json b/compute/providers/minimax.json index 9e17698..2cbc9e8 100644 --- a/compute/providers/minimax.json +++ b/compute/providers/minimax.json @@ -8,13 +8,20 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "CNY", - "services": ["chat", "fast", "reasoning"], + "priceCurrency": "USD", + "services": [ + "chat", + "fast", + "reasoning" + ], "models": [ { "modelName": "MiniMax-M2.7", "displayName": "MiniMax M2.7", - "serviceType": ["chat", "reasoning"], + "serviceType": [ + "chat", + "reasoning" + ], "description": "MiniMax 新一代旗舰模型,擅长复杂 Agent、软件工程与专业办公任务", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -24,14 +31,22 @@ "code", "tool_use" ], + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.7-highspeed", "displayName": "MiniMax M2.7 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.7 极速版,效果一致,输出更快,适合低延迟场景", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -42,16 +57,25 @@ "tool_use", "fast" ], + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.06, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-M2.5", "displayName": "MiniMax M2.5", - "serviceType": ["chat", "reasoning"], - "description": "MiniMax 最新旗舰模型,230B参数(10B激活)MoE架构,百万级上下文,支持深度推理和工具调用", - "contextWindow": 1000000, + "serviceType": [ + "chat", + "reasoning" + ], + "description": "MiniMax M2.5,204.8K 上下文,支持深度推理和工具调用", + "contextWindow": 204800, "maxOutputTokens": 131072, "capabilities": [ "chat", @@ -60,18 +84,24 @@ "tool_use", "long_context" ], - "inputPrice": 2.1, - "outputPrice": 8.4, + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.5-highspeed", "displayName": "MiniMax M2.5 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.5 高速推理版本(100TPS),适合低延迟场景", - "contextWindow": 200000, + "contextWindow": 204800, "maxOutputTokens": 131072, "capabilities": [ "chat", @@ -80,16 +110,22 @@ "tool_use", "fast" ], - "inputPrice": 2.1, - "outputPrice": 16.8, + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-M2.1", "displayName": "MiniMax M2.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "MiniMax 上一代主力模型,200K 上下文,性价比优秀", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -99,16 +135,22 @@ "tool_use", "reasoning" ], - "inputPrice": 2.1, - "outputPrice": 8.4, + "inputPrice": 0.3, + "outputPrice": 1.2, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 60 + } }, { "modelName": "MiniMax-M2.1-highspeed", "displayName": "MiniMax M2.1 高速版", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "MiniMax M2.1 高速推理版本,适合低延迟场景", "contextWindow": 204800, "maxOutputTokens": 131072, @@ -119,16 +161,22 @@ "tool_use", "fast" ], - "inputPrice": 2.1, - "outputPrice": 16.8, + "inputPrice": 0.6, + "outputPrice": 2.4, "defaultTemperature": 1, "defaultTopP": 1, - "extra": {} + "extra": { + "cacheReadPrice": 0.03, + "cacheWritePrice": 0.375, + "outputSpeedTps": 100 + } }, { "modelName": "MiniMax-Text-01", "displayName": "MiniMax Text 01", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "MiniMax 百万级长上下文文本模型,擅长长文档处理", "contextWindow": 1000000, "maxOutputTokens": 131072, @@ -138,8 +186,8 @@ "code", "long_context" ], - "inputPrice": 1.4, - "outputPrice": 7.7, + "inputPrice": 0.2, + "outputPrice": 1.1, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} diff --git a/compute/providers/mistral.json b/compute/providers/mistral.json index 44dc440..58b5b34 100644 --- a/compute/providers/mistral.json +++ b/compute/providers/mistral.json @@ -9,12 +9,17 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "USD", - "services": ["chat", "fast"], + "services": [ + "chat", + "fast" + ], "models": [ { "modelName": "mistral-large-latest", "displayName": "Mistral Large 3", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Mistral 旗舰模型,256K 上下文,支持视觉和工具调用", "contextWindow": 256000, "maxOutputTokens": 262144, @@ -26,8 +31,8 @@ "tool_use", "long_context" ], - "inputPrice": 0.50, - "outputPrice": 1.50, + "inputPrice": 0.5, + "outputPrice": 1.5, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -35,9 +40,11 @@ { "modelName": "mistral-small-latest", "displayName": "Mistral Small 3.2", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "Mistral 高效小模型,低延迟,适合快速推理场景", - "contextWindow": 130000, + "contextWindow": 128000, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -47,8 +54,8 @@ "fast", "tool_use" ], - "inputPrice": 0.10, - "outputPrice": 0.30, + "inputPrice": 0.1, + "outputPrice": 0.3, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -56,16 +63,18 @@ { "modelName": "codestral-latest", "displayName": "Codestral", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "Mistral 专业代码模型,支持 Fill-in-the-Middle 补全", - "contextWindow": 256000, + "contextWindow": 128000, "maxOutputTokens": 32768, "capabilities": [ "code", "fill_in_the_middle" ], - "inputPrice": 0.30, - "outputPrice": 0.90, + "inputPrice": 0.3, + "outputPrice": 0.9, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} diff --git a/compute/providers/moonshot.json b/compute/providers/moonshot.json index 99be6c9..8a89085 100644 --- a/compute/providers/moonshot.json +++ b/compute/providers/moonshot.json @@ -14,13 +14,64 @@ "reasoning" ], "models": [ + { + "modelName": "kimi-k2.6", + "displayName": "Kimi K2.6", + "serviceType": [ + "chat" + ], + "description": "月之暗面 Kimi K2.6,最新多模态模型,长程代码编写与 Agent 自主执行能力增强,256K 上下文,支持思考/非思考模式", + "contextWindow": 256000, + "maxOutputTokens": 32768, + "capabilities": [ + "chat", + "reasoning", + "code", + "tool_use", + "agent", + "long_context", + "vision", + "video_understanding", + "image_understanding" + ], + "inputPrice": 6.5, + "outputPrice": 27, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "thinking": { + "default": "enabled", + "disabledTemperature": 0.6 + }, + "cacheHitPrice": 1.1, + "supportedImageFormats": [ + "png", + "jpeg", + "webp", + "gif" + ], + "supportedVideoFormats": [ + "mp4", + "mpeg", + "mov", + "avi", + "x-flv", + "mpg", + "webm", + "wmv", + "3gpp" + ] + } + }, { "modelName": "kimi-k2.5", "displayName": "Kimi K2.5", - "serviceType": ["chat"], - "description": "月之暗面Kimi K2.5,2026年1月发布的原生多模态模型,支持视觉编码和智能体集群", + "serviceType": [ + "chat" + ], + "description": "月之暗面Kimi K2.5,原生多模态模型,256K 上下文,支持思考/非思考模式", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32768, "capabilities": [ "chat", "reasoning", @@ -32,15 +83,40 @@ ], "inputPrice": 4, "outputPrice": 21, - "defaultTemperature": 0.7, - "defaultTopP": 0.9, - "extra": {} + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "thinking": { + "default": "enabled", + "disabledTemperature": 0.6 + }, + "cacheHitPrice": 0.7, + "supportedImageFormats": [ + "png", + "jpeg", + "webp", + "gif" + ], + "supportedVideoFormats": [ + "mp4", + "mpeg", + "mov", + "avi", + "x-flv", + "mpg", + "webm", + "wmv", + "3gpp" + ] + } }, { "modelName": "kimi-k2", "displayName": "Kimi K2", - "serviceType": ["chat"], - "description": "月之暗面Kimi K2,万亿参数MoE模型(320B激活),256K上下文,专为智能体设计", + "serviceType": [ + "chat" + ], + "description": "月之暗面Kimi K2,万亿参数MoE模型(32B激活),256K上下文,专为智能体设计", "contextWindow": 256000, "maxOutputTokens": 8192, "capabilities": [ @@ -49,19 +125,22 @@ "code", "tool_use", "agent", - "long_context", - "vision" + "long_context" ], "inputPrice": 4, "outputPrice": 16, "defaultTemperature": 0.7, "defaultTopP": 0.9, - "extra": {} + "extra": { + "cacheHitPrice": 1 + } }, { "modelName": "kimi-k2-thinking", "displayName": "Kimi K2 思考版", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "月之暗面Kimi K2思考版,256K上下文,深度推理能力", "contextWindow": 256000, "maxOutputTokens": 16384, @@ -76,12 +155,16 @@ "outputPrice": 16, "defaultTemperature": 0.7, "defaultTopP": 0.9, - "extra": {} + "extra": { + "cacheHitPrice": 1 + } }, { "modelName": "moonshot-v1-8k", "displayName": "Moonshot V1 8K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,8K上下文", "contextWindow": 8192, "maxOutputTokens": 4096, @@ -98,7 +181,9 @@ { "modelName": "moonshot-v1-32k", "displayName": "Moonshot V1 32K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,32K上下文", "contextWindow": 32768, "maxOutputTokens": 4096, @@ -116,7 +201,9 @@ { "modelName": "moonshot-v1-128k", "displayName": "Moonshot V1 128K", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "月之暗面标准模型,128K上下文", "contextWindow": 131072, "maxOutputTokens": 4096, diff --git a/compute/providers/ollama.json b/compute/providers/ollama.json index 3262dcf..87064ef 100644 --- a/compute/providers/ollama.json +++ b/compute/providers/ollama.json @@ -19,11 +19,13 @@ "serviceType": ["chat"], "description": "本地运行的 Llama 3.1 70B", "contextWindow": 131072, + "maxOutputTokens": 8192, "capabilities": [ "chat", "code", "reasoning" ], + "defaultTemperature": 0.7, "extra": {} } ] diff --git a/compute/providers/openai.json b/compute/providers/openai.json index 338bb9f..b0de87d 100644 --- a/compute/providers/openai.json +++ b/compute/providers/openai.json @@ -25,7 +25,9 @@ { "modelName": "gpt-5.2", "displayName": "GPT-5.2", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI 最新旗舰模型,400K 上下文,编码和智能体任务优化", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -46,7 +48,9 @@ { "modelName": "gpt-5.2-pro", "displayName": "GPT-5.2 Pro", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5.2 Pro 专业版,最高性能", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -67,7 +71,9 @@ { "modelName": "gpt-5.1", "displayName": "GPT-5.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5.1,400K 上下文,高性能旗舰", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -88,7 +94,9 @@ { "modelName": "gpt-5", "displayName": "GPT-5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-5 新一代旗舰模型,统一所有模型能力", "contextWindow": 400000, "maxOutputTokens": 128000, @@ -109,10 +117,12 @@ { "modelName": "gpt-5-pro", "displayName": "GPT-5 Pro", - "serviceType": ["chat"], - "description": "OpenAI GPT-5 Pro 专业版高性能模型", + "serviceType": [ + "chat" + ], + "description": "OpenAI GPT-5 Pro 专业版高性能推理模型", "contextWindow": 400000, - "maxOutputTokens": 128000, + "maxOutputTokens": 272000, "capabilities": [ "chat", "reasoning", @@ -130,10 +140,12 @@ { "modelName": "gpt-5-mini", "displayName": "GPT-5-mini", - "serviceType": ["chat"], - "description": "高性价比模型,适合日常对话", - "contextWindow": 128000, - "maxOutputTokens": 32768, + "serviceType": [ + "chat" + ], + "description": "高性价比模型,适合日常对话,400K 上下文", + "contextWindow": 400000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "fast", @@ -150,17 +162,19 @@ { "modelName": "gpt-5-nano", "displayName": "GPT-5-nano", - "serviceType": ["fast"], - "description": "极速响应模型,适合简单任务", - "contextWindow": 128000, - "maxOutputTokens": 16384, + "serviceType": [ + "fast" + ], + "description": "极速响应模型,适合简单任务,400K 上下文", + "contextWindow": 400000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "code", "fast" ], - "inputPrice": 0.02, - "outputPrice": 0.08, + "inputPrice": 0.05, + "outputPrice": 0.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -168,9 +182,11 @@ { "modelName": "gpt-4.1", "displayName": "GPT-4.1", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-4.1,支持 1M 上下文,编码和指令遵循能力大幅提升", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -180,8 +196,8 @@ "ultra_long_context", "tool_use" ], - "inputPrice": 2.00, - "outputPrice": 8.00, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -189,9 +205,11 @@ { "modelName": "gpt-4.1-mini", "displayName": "GPT-4.1 mini", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "OpenAI GPT-4.1 mini,1M 上下文,高性价比", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -200,8 +218,8 @@ "ultra_long_context", "tool_use" ], - "inputPrice": 0.40, - "outputPrice": 1.60, + "inputPrice": 0.4, + "outputPrice": 1.6, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -209,9 +227,11 @@ { "modelName": "gpt-4.1-nano", "displayName": "GPT-4.1 nano", - "serviceType": ["fast"], + "serviceType": [ + "fast" + ], "description": "OpenAI GPT-4.1 nano,1M 上下文,极致性价比", - "contextWindow": 1000000, + "contextWindow": 1047576, "maxOutputTokens": 32768, "capabilities": [ "chat", @@ -219,8 +239,8 @@ "ultra_long_context", "fast" ], - "inputPrice": 0.10, - "outputPrice": 0.40, + "inputPrice": 0.1, + "outputPrice": 0.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -228,7 +248,9 @@ { "modelName": "gpt-4o", "displayName": "GPT-4o", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "多模态模型,支持图像理解", "contextWindow": 128000, "maxOutputTokens": 16384, @@ -238,8 +260,8 @@ "image_understanding", "tool_use" ], - "inputPrice": 2.50, - "outputPrice": 10.00, + "inputPrice": 2.5, + "outputPrice": 10, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -247,7 +269,9 @@ { "modelName": "gpt-4o-mini", "displayName": "GPT-4o mini", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "OpenAI GPT-4o mini,高性价比多模态模型", "contextWindow": 128000, "maxOutputTokens": 16384, @@ -258,7 +282,7 @@ "tool_use" ], "inputPrice": 0.15, - "outputPrice": 0.60, + "outputPrice": 0.6, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -266,35 +290,51 @@ { "modelName": "text-embedding-3-small", "displayName": "text-embedding-3-small", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "轻量文本向量化模型,1536 维", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.02, + "defaultTemperature": 1, "extra": {} }, { "modelName": "text-embedding-3-large", "displayName": "text-embedding-3-large", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "高精度文本向量化模型,3072 维", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search" ], "inputPrice": 0.13, + "defaultTemperature": 1, "extra": {} }, { "modelName": "tts-1", "displayName": "TTS-1", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "标准语音合成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts" ], + "inputPrice": 15, + "defaultTemperature": 1, "extra": { "voices": [ "alloy", @@ -315,11 +355,17 @@ { "modelName": "tts-1-hd", "displayName": "TTS-1-HD", - "serviceType": ["tts"], + "serviceType": [ + "tts" + ], "description": "高清语音合成", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "tts" ], + "inputPrice": 30, + "defaultTemperature": 1, "extra": { "voices": [ "alloy", @@ -340,12 +386,18 @@ { "modelName": "whisper-1", "displayName": "Whisper", - "serviceType": ["asr"], + "serviceType": [ + "asr" + ], "description": "通用语音识别", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "asr", "multilingual" ], + "inputPrice": 0.006, + "defaultTemperature": 1, "extra": { "maxAudioLength": 600, "supportedInputFormats": [ @@ -363,7 +415,9 @@ { "modelName": "o3", "displayName": "o3", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o3 推理模型,200K 上下文,支持工具调用", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -375,8 +429,8 @@ "science", "tool_use" ], - "inputPrice": 2.00, - "outputPrice": 8.00, + "inputPrice": 2, + "outputPrice": 8, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -384,7 +438,9 @@ { "modelName": "o3-pro", "displayName": "o3-pro", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o3-pro 高级推理模型,200K 上下文", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -395,8 +451,8 @@ "math", "science" ], - "inputPrice": 20.00, - "outputPrice": 80.00, + "inputPrice": 20, + "outputPrice": 80, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -404,9 +460,11 @@ { "modelName": "o3-mini", "displayName": "o3-mini", - "serviceType": ["responses"], - "description": "OpenAI o3-mini 推理模型,128K 上下文", - "contextWindow": 128000, + "serviceType": [ + "responses" + ], + "description": "OpenAI o3-mini 推理模型,200K 上下文", + "contextWindow": 200000, "maxOutputTokens": 100000, "capabilities": [ "reasoning", @@ -414,8 +472,8 @@ "code", "fast" ], - "inputPrice": 1.10, - "outputPrice": 4.40, + "inputPrice": 1.1, + "outputPrice": 4.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -423,7 +481,9 @@ { "modelName": "o4-mini", "displayName": "o4-mini", - "serviceType": ["responses"], + "serviceType": [ + "responses" + ], "description": "OpenAI o4-mini 推理模型,200K 上下文,支持工具调用", "contextWindow": 200000, "maxOutputTokens": 100000, @@ -434,8 +494,8 @@ "tool_use", "vision" ], - "inputPrice": 1.10, - "outputPrice": 4.40, + "inputPrice": 1.1, + "outputPrice": 4.4, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} @@ -443,12 +503,17 @@ { "modelName": "dall-e-3", "displayName": "DALL-E 3", - "serviceType": ["image_gen"], + "serviceType": [ + "image_gen" + ], "description": "高质量文生图模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "text_rendering" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", @@ -464,9 +529,12 @@ { "modelName": "gpt-4o-realtime", "displayName": "GPT-4o Realtime", - "serviceType": ["omni"], + "serviceType": [ + "omni" + ], "description": "全能实时模型,支持语音 + 文本 + 视觉", - "contextWindow": 128000, + "contextWindow": 32000, + "maxOutputTokens": 4096, "capabilities": [ "chat", "vision", @@ -474,6 +542,9 @@ "asr", "realtime" ], + "inputPrice": 4, + "outputPrice": 16, + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech", @@ -485,13 +556,20 @@ { "modelName": "gpt-4o-realtime-preview", "displayName": "GPT-4o Realtime Preview", - "serviceType": ["realtime_voice"], + "serviceType": [ + "realtime_voice" + ], "description": "实时语音交互模型", + "contextWindow": 32000, + "maxOutputTokens": 4096, "capabilities": [ "realtime", "speech_to_speech", "low_latency" ], + "inputPrice": 5, + "outputPrice": 20, + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech", diff --git a/compute/providers/openrouter.json b/compute/providers/openrouter.json index 87647ca..2f0a5b1 100644 --- a/compute/providers/openrouter.json +++ b/compute/providers/openrouter.json @@ -16,7 +16,7 @@ "displayName": "OpenRouter Auto", "serviceType": ["chat"], "description": "OpenRouter 自动路由,智能选择最优模型", - "contextWindow": 200000, + "contextWindow": 2000000, "maxOutputTokens": 16384, "capabilities": [ "chat", @@ -29,19 +29,16 @@ "extra": {} }, { - "modelName": "google/gemini-2.5-flash-exp:free", - "displayName": "Gemini 2.5 Flash (免费)", + "modelName": "openai/gpt-oss-120b:free", + "displayName": "GPT-OSS 120B (免费)", "serviceType": ["chat"], - "description": "通过 OpenRouter 免费使用的 Gemini 2.5 Flash,1M 上下文", - "contextWindow": 1048576, - "maxOutputTokens": 65535, + "description": "通过 OpenRouter 免费使用的 OpenAI GPT-OSS 120B", + "contextWindow": 131072, + "maxOutputTokens": 131072, "capabilities": [ "chat", "reasoning", - "vision", - "tool_use", - "fast", - "long_context" + "code" ], "inputPrice": 0.00, "outputPrice": 0.00, @@ -54,8 +51,8 @@ "displayName": "Qwen3 Coder 480B (免费)", "serviceType": ["chat"], "description": "通过 OpenRouter 免费使用的 Qwen3 Coder 480B", - "contextWindow": 262144, - "maxOutputTokens": 32768, + "contextWindow": 262000, + "maxOutputTokens": 262000, "capabilities": [ "code", "reasoning", diff --git a/compute/providers/siliconflow.json b/compute/providers/siliconflow.json index e778373..97a12ee 100644 --- a/compute/providers/siliconflow.json +++ b/compute/providers/siliconflow.json @@ -15,12 +15,13 @@ "modelName": "Qwen/Qwen3-Coder-480B-A35B-Instruct", "displayName": "Qwen3 Coder 480B (硅基)", "serviceType": ["chat"], - "description": "开源最强代码模型,480B MoE 架构,擅长代码生成和 Agent 场景", + "description": "Qwen3-Coder-480B-A35B-Instruct,480B MoE(35B 激活),原生 256K 上下文,可通过外推扩展至 1M,面向 Agentic Coding", "contextWindow": 262144, - "maxOutputTokens": 32768, + "maxOutputTokens": 262144, "capabilities": [ + "chat", "code", - "reasoning", + "long_context", "agent", "tool_use" ], @@ -31,20 +32,19 @@ "extra": {} }, { - "modelName": "Qwen/Qwen3-235B-A22B-Instruct", + "modelName": "Qwen/Qwen3-235B-A22B-Instruct-2507", "displayName": "Qwen3 235B (硅基)", "serviceType": ["chat"], - "description": "Qwen3 旗舰通用模型,235B MoE 架构,多语言能力突出", + "description": "Qwen3-235B-A22B-Instruct-2507,235B MoE(22B 激活)通用指令模型,262K 上下文", "contextWindow": 262144, - "maxOutputTokens": 38912, + "maxOutputTokens": 262144, "capabilities": [ "chat", - "reasoning", "code", "multilingual", "tool_use", "agent", - "vision" + "long_context" ], "inputPrice": 2.5, "outputPrice": 10, @@ -65,6 +65,7 @@ ], "inputPrice": 0, "outputPrice": 0, + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/stability.json b/compute/providers/stability.json index e12b65d..0e8bc98 100644 --- a/compute/providers/stability.json +++ b/compute/providers/stability.json @@ -18,11 +18,14 @@ "displayName": "Stable Diffusion 3.5 Large", "serviceType": ["image_gen"], "description": "Stability AI 旗舰文生图模型", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "image_generation", "high_quality", "controllable" ], + "defaultTemperature": 1, "extra": { "supportedImageSizes": [ "1024x1024", diff --git a/compute/providers/tencent.json b/compute/providers/tencent.json index 92e097a..c98867c 100644 --- a/compute/providers/tencent.json +++ b/compute/providers/tencent.json @@ -9,14 +9,19 @@ "enabled": false, "status": "unconfigured", "priceCurrency": "CNY", - "services": ["chat", "reasoning"], + "services": [ + "chat", + "reasoning" + ], "models": [ { "modelName": "hunyuan-2.0-thinking-20251109", "displayName": "混元 2.0 Think", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "腾讯混元最新推理模型,128K输入/64K输出,MoE架构406B总参数", - "contextWindow": 131072, + "contextWindow": 128000, "maxOutputTokens": 65536, "capabilities": [ "chat", @@ -31,11 +36,13 @@ "extra": {} }, { - "modelName": "hunyuan-turbo-s", + "modelName": "hunyuan-turbos-latest", "displayName": "混元 Turbo S", - "serviceType": ["chat"], - "description": "腾讯混元高速模型,262K 上下文,支持推理和工具调用", - "contextWindow": 262144, + "serviceType": [ + "chat" + ], + "description": "腾讯混元高速模型,32K输入/16K输出,支持推理和工具调用", + "contextWindow": 32768, "maxOutputTokens": 16384, "capabilities": [ "chat", diff --git a/compute/providers/volcengine.json b/compute/providers/volcengine.json index ca8eef2..cea6456 100644 --- a/compute/providers/volcengine.json +++ b/compute/providers/volcengine.json @@ -23,10 +23,12 @@ { "modelName": "doubao-2.0-pro", "displayName": "豆包 2.0 Pro", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包2.0旗舰模型,256K上下文,相比Gemini 3 Pro和GPT 5.2有较大成本优势", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -44,10 +46,12 @@ { "modelName": "doubao-seed-1.8", "displayName": "豆包 Seed-1.8", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.8旗舰模型,256K上下文,支持深度思考和多模态", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -65,10 +69,12 @@ { "modelName": "doubao-seed-1.6", "displayName": "豆包 Seed-1.6", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6旗舰模型,256K上下文", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -86,7 +92,9 @@ { "modelName": "doubao-seed-1.6-thinking", "displayName": "豆包 Seed-1.6 思考版", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6深度思考模型,256K上下文", "contextWindow": 256000, "maxOutputTokens": 32768, @@ -105,10 +113,12 @@ { "modelName": "doubao-seed-1.6-flash", "displayName": "豆包 Seed-1.6 Flash", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6快速版,成本较前代下降63%", "contextWindow": 256000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32000, "capabilities": [ "chat", "code", @@ -124,10 +134,12 @@ { "modelName": "doubao-seed-1.6-lite", "displayName": "豆包 Seed-1.6 Lite", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包1.6轻量版,极致性价比", - "contextWindow": 128000, - "maxOutputTokens": 4096, + "contextWindow": 256000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "code", @@ -142,10 +154,12 @@ { "modelName": "doubao-seed-1.6-vision", "displayName": "豆包 Seed-1.6 视觉版", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "火山引擎豆包1.6视觉模型,256K上下文,支持视频理解", "contextWindow": 256000, - "maxOutputTokens": 16384, + "maxOutputTokens": 32000, "capabilities": [ "chat", "vision", @@ -162,7 +176,9 @@ { "modelName": "doubao-seed-code", "displayName": "豆包 Seed-Code", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎豆包编程专用模型,256K上下文", "contextWindow": 256000, "maxOutputTokens": 32768, @@ -180,10 +196,12 @@ { "modelName": "deepseek-v3.2", "displayName": "DeepSeek V3.2 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的DeepSeek V3.2,128K上下文", "contextWindow": 128000, - "maxOutputTokens": 8000, + "maxOutputTokens": 32000, "capabilities": [ "chat", "reasoning", @@ -199,10 +217,12 @@ { "modelName": "deepseek-r1", "displayName": "DeepSeek R1 (火山引擎)", - "serviceType": ["reasoning"], - "description": "火山引擎托管的DeepSeek R1推理模型,64K上下文", - "contextWindow": 64000, - "maxOutputTokens": 32768, + "serviceType": [ + "reasoning" + ], + "description": "火山引擎托管的DeepSeek R1推理模型,128K上下文", + "contextWindow": 128000, + "maxOutputTokens": 65536, "capabilities": [ "reasoning", "math", @@ -219,9 +239,11 @@ { "modelName": "kimi-k2-volcengine", "displayName": "Kimi K2 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的Kimi K2,万亿参数MoE模型,128K上下文", - "contextWindow": 128000, + "contextWindow": 256000, "maxOutputTokens": 8192, "capabilities": [ "chat", @@ -240,10 +262,12 @@ { "modelName": "glm-4-7", "displayName": "GLM-4.7 (火山引擎)", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "火山引擎托管的智谱GLM-4.7,200K上下文", "contextWindow": 200000, - "maxOutputTokens": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", @@ -261,9 +285,12 @@ { "modelName": "doubao-embedding", "displayName": "豆包 Embedding", - "serviceType": ["embedding"], + "serviceType": [ + "embedding" + ], "description": "火山引擎豆包标准向量模型,2560维度", "contextWindow": 4096, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", @@ -271,18 +298,24 @@ "chinese_optimized" ], "inputPrice": 0.5, + "defaultTemperature": 1, "extra": {} }, { "modelName": "volc-mega-tts-clone", "displayName": "火山声音复刻", - "serviceType": ["voice_clone"], + "serviceType": [ + "voice_clone" + ], "description": "火山引擎声音复刻,支持极少样本", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "voice_clone", "chinese_optimized", "few_shot" ], + "defaultTemperature": 1, "extra": { "maxCloneSamples": 3, "minCloneDuration": 5 @@ -291,14 +324,19 @@ { "modelName": "volc-realtime-voice", "displayName": "火山实时语音", - "serviceType": ["realtime_voice"], + "serviceType": [ + "realtime_voice" + ], "description": "火山引擎实时语音交互", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "realtime", "speech_to_speech", "low_latency", "chinese_optimized" ], + "defaultTemperature": 1, "extra": { "supportedModes": [ "speech-to-speech" @@ -309,13 +347,18 @@ { "modelName": "volc-simultaneous", "displayName": "火山同声传译", - "serviceType": ["simultaneous_interpret"], + "serviceType": [ + "simultaneous_interpret" + ], "description": "火山引擎同声传译,支持中英双向", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "simultaneous_interpretation", "chinese_optimized", "low_latency" ], + "defaultTemperature": 1, "extra": { "streamingSupported": true } @@ -323,13 +366,18 @@ { "modelName": "volc-translation", "displayName": "火山翻译", - "serviceType": ["translation"], + "serviceType": [ + "translation" + ], "description": "火山引擎机器翻译,支持多语种互译", + "contextWindow": 0, + "maxOutputTokens": 0, "capabilities": [ "translation", "multilingual", "chinese_optimized" ], + "defaultTemperature": 1, "extra": {} } ] diff --git a/compute/providers/xai.json b/compute/providers/xai.json index a06693e..6f8e2ed 100644 --- a/compute/providers/xai.json +++ b/compute/providers/xai.json @@ -12,12 +12,12 @@ "services": ["chat", "reasoning"], "models": [ { - "modelName": "grok-4-0709", - "displayName": "Grok 4", + "modelName": "grok-4.20-0309-reasoning", + "displayName": "Grok 4.20 Reasoning", "serviceType": ["chat", "reasoning"], - "description": "xAI 最新旗舰推理模型,262K 上下文,支持工具调用", - "contextWindow": 262144, - "maxOutputTokens": 8192, + "description": "xAI 旗舰推理模型,支持函数调用与结构化输出", + "contextWindow": 2000000, + "maxOutputTokens": 16384, "capabilities": [ "chat", "reasoning", @@ -25,17 +25,17 @@ "vision", "tool_use" ], - "inputPrice": 3.00, - "outputPrice": 15.00, + "inputPrice": 2.00, + "outputPrice": 6.00, "defaultTemperature": 1, "defaultTopP": 1, "extra": {} }, { - "modelName": "grok-4-1-fast", - "displayName": "Grok 4.1 Fast", - "serviceType": ["chat"], - "description": "xAI 超长上下文高速模型,2M token 窗口", + "modelName": "grok-4-1-fast-reasoning", + "displayName": "Grok 4.1 Fast Reasoning", + "serviceType": ["chat", "reasoning"], + "description": "xAI 高速推理模型,2M 上下文窗口", "contextWindow": 2000000, "maxOutputTokens": 16384, "capabilities": [ diff --git a/compute/providers/xunfei.json b/compute/providers/xunfei.json index fc6eff5..6889f5b 100644 --- a/compute/providers/xunfei.json +++ b/compute/providers/xunfei.json @@ -12,12 +12,12 @@ "services": ["chat", "reasoning"], "models": [ { - "modelName": "x1", + "modelName": "spark-x", "displayName": "讯飞星火 X1", "serviceType": ["reasoning"], - "description": "讯飞最新推理模型,基于全国产算力训练,擅长数学和代码推理", - "contextWindow": 32768, - "maxOutputTokens": 16384, + "description": "讯飞深度推理模型(X2),输入64K/输出128K,支持思考模式与函数调用", + "contextWindow": 65536, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", diff --git a/compute/providers/zhipu-embedding.json b/compute/providers/zhipu-embedding.json index 76151c8..6031ad8 100644 --- a/compute/providers/zhipu-embedding.json +++ b/compute/providers/zhipu-embedding.json @@ -18,15 +18,22 @@ "modelName": "embedding-3", "displayName": "智谱 embedding-3", "serviceType": ["embedding"], - "description": "智谱嵌入模型v3,支持自定义维度,单条最大3072 tokens。走 OpenAI 兼容 /embeddings 端点(Anthropic 协议不提供 embeddings)", - "contextWindow": 3072, + "description": "智谱嵌入模型v3,支持自定义维度;模型上下文窗口 8K,单条输入最多 3072 tokens。走 OpenAI 兼容 /embeddings 端点(Anthropic 协议不提供 embeddings)", + "contextWindow": 8192, + "maxOutputTokens": 0, "capabilities": [ "text_embedding", "semantic_search", - "rag" + "rag", + "custom_dimensions" ], "inputPrice": 0.5, - "extra": {} + "defaultTemperature": 1, + "extra": { + "maxInputTokensPerItem": 3072, + "maxBatchItems": 64, + "vectorDimensions": "256-2048" + } } ] } diff --git a/compute/providers/zhipu.json b/compute/providers/zhipu.json index f0197a1..c30074f 100644 --- a/compute/providers/zhipu.json +++ b/compute/providers/zhipu.json @@ -8,7 +8,7 @@ "apiKeyVerified": false, "enabled": false, "status": "unconfigured", - "priceCurrency": "CNY", + "priceCurrency": "USD", "services": [ "chat", "vision", @@ -18,10 +18,72 @@ "embedding-3" ], "models": [ + { + "modelName": "glm-5.1", + "displayName": "GLM-5.1", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5.1 最新旗舰模型,面向长程 Agentic Coding 与 Autonomous Agent 场景,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "reasoning", + "code", + "multilingual", + "deep_thinking", + "long_context", + "math", + "tool_use", + "agent" + ], + "inputPrice": 1.4, + "outputPrice": 4.4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.26, + "thinking": { + "default": "enabled" + } + } + }, + { + "modelName": "glm-5-turbo", + "displayName": "GLM-5-Turbo", + "serviceType": [ + "chat" + ], + "description": "智谱 GLM-5-Turbo,面向 OpenClaw 等长链路任务优化,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "inputPrice": 1.2, + "outputPrice": 4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.24, + "thinking": { + "default": "enabled" + } + } + }, { "modelName": "glm-5", "displayName": "GLM-5", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "智谱GLM-5,744B参数旗舰基座模型,2026年2月发布,面向Agentic Engineering,编程能力接近Claude Opus", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -36,16 +98,20 @@ "tool_use", "agent" ], - "inputPrice": 4, - "outputPrice": 18, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 1, + "outputPrice": 3.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.2 + } }, { "modelName": "glm-4.7", "displayName": "GLM-4.7", - "serviceType": ["chat"], + "serviceType": [ + "chat" + ], "description": "智谱GLM-4.7,355B参数MoE架构旗舰模型,200K上下文,编程能力对齐Claude Sonnet", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -58,16 +124,20 @@ "long_context", "tool_use" ], - "inputPrice": 4, - "outputPrice": 16, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11 + } }, { "modelName": "glm-4.7-thinking", "displayName": "GLM-4.7 Thinking", - "serviceType": ["reasoning"], + "serviceType": [ + "reasoning" + ], "description": "智谱GLM-4.7深度思考模式,200K上下文,交错式/保留式/轮级思考", "contextWindow": 200000, "maxOutputTokens": 128000, @@ -78,19 +148,57 @@ "deep_thinking", "long_context" ], - "inputPrice": 8, - "outputPrice": 32, - "defaultTemperature": 0.95, - "defaultTopP": 0.7, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11, + "aliasOf": "glm-4.7" + } + }, + { + "modelName": "glm-5v-turbo", + "displayName": "GLM-5V-Turbo", + "serviceType": [ + "vision" + ], + "description": "智谱首个多模态 Coding 基座模型,支持视频、图像、文本和文件输入,200K 上下文,128K 最大输出", + "contextWindow": 200000, + "maxOutputTokens": 128000, + "capabilities": [ + "chat", + "vision", + "video_understanding", + "image_understanding", + "file_understanding", + "reasoning", + "code", + "deep_thinking", + "long_context", + "tool_use", + "agent" + ], + "inputPrice": 1.2, + "outputPrice": 4, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.24, + "thinking": { + "default": "enabled" + } + } }, { "modelName": "glm-4.6v", "displayName": "GLM-4.6V", - "serviceType": ["vision"], + "serviceType": [ + "vision" + ], "description": "智谱GLM-4.6V多模态版,106B/12B MoE,支持图像视频理解与工具调用,128K上下文", "contextWindow": 128000, - "maxOutputTokens": 8192, + "maxOutputTokens": 32768, "capabilities": [ "chat", "vision", @@ -99,28 +207,37 @@ "long_context", "tool_use" ], - "inputPrice": 8, - "outputPrice": 32, - "extra": {} + "inputPrice": 0.3, + "outputPrice": 0.9, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.05 + } }, { "modelName": "glm-4.6", "displayName": "GLM-4.6", - "serviceType": ["chat"], - "description": "智谱GLM-4.6,增强推理能力,128K上下文", - "contextWindow": 128000, - "maxOutputTokens": 8192, + "serviceType": [ + "chat" + ], + "description": "智谱GLM-4.6,增强推理能力,200K上下文", + "contextWindow": 200000, + "maxOutputTokens": 128000, "capabilities": [ "chat", "reasoning", "code", "multilingual", - "deep_thinking", - "vision" + "deep_thinking" ], - "inputPrice": 5, - "outputPrice": 5, - "extra": {} + "inputPrice": 0.6, + "outputPrice": 2.2, + "defaultTemperature": 1, + "defaultTopP": 0.95, + "extra": { + "cacheHitPrice": 0.11 + } } ] } diff --git a/manifest.json b/manifest.json index 8a447d7..18dc263 100644 --- a/manifest.json +++ b/manifest.json @@ -1,6 +1,6 @@ { "version": "1.0.0", - "presetDataVersion": 24, - "updatedAt": "2026-04-20", + "presetDataVersion": 29, + "updatedAt": "2026-04-24", "description": "DesireCore 官方配置中心" } diff --git a/字段取值表/anthropic/未确认字段报告.md b/字段取值表/anthropic/未确认字段报告.md new file mode 100644 index 0000000..77d4488 --- /dev/null +++ b/字段取值表/anthropic/未确认字段报告.md @@ -0,0 +1,47 @@ +# 未确认字段报告 - compute/providers/anthropic.json + +- provider: `anthropic` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## claude-opus-4-6 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.6 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-opus-4-5 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-opus-4.5 +- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4-5 + +- `modelName`: ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## claude-sonnet-4-5-computer + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 +- `maxOutputTokens`: 已查 https://platform.claude.com/docs/en/about-claude/models/overview 和 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/anthropic/详细字段取值表.md b/字段取值表/anthropic/详细字段取值表.md new file mode 100644 index 0000000..ca89d3f --- /dev/null +++ b/字段取值表/anthropic/详细字段取值表.md @@ -0,0 +1,114 @@ +# 详细字段取值表 - compute/providers/anthropic.json + +- provider: `anthropic` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.claude.com/docs/en/about-claude/models/overview +- https://platform.claude.com/docs/en/about-claude/pricing +- https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 +- https://www.anthropic.com/news/claude-opus-4-5 +- https://www.anthropic.com/news/claude-sonnet-4-5 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## claude-opus-4-6 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-opus-4.6` +- ZenMux候选: `anthropic/claude-opus-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-opus-4-6"` | `"claude-opus-4.6"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.6 | +| `displayName` | `"Claude Opus 4.6"` | `"Claude Opus 4.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 为 `1M tokens` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Opus 4.6 的 Max output 为 `128k tokens` | +| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.6) prompt=5 USD/MTokens | +| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.6) completion=25 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-opus-4-5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-opus-4.5` +- ZenMux候选: `anthropic/claude-opus-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-opus-4-5"` | `"claude-opus-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-opus-4.5 | +| `displayName` | `"Claude Opus 4.5"` | `"Claude Opus 4.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | ZenMux(anthropic/claude-opus-4.5)口径近似(≤3%) | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/pricing 与 https://www.anthropic.com/news/claude-opus-4-5 ,官方可确认 `Claude Opus 4.5` 型号存在与价格,但公开页面未给独立 max output tokens | +| `inputPrice` | `5` | `5` | 保持 | ZenMux(anthropic/claude-opus-4.5) prompt=5 USD/MTokens | +| `outputPrice` | `25` | `25` | 保持 | ZenMux(anthropic/claude-opus-4.5) completion=25 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4-5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `anthropic/claude-sonnet-4.5` +- ZenMux候选: `anthropic/claude-sonnet-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4-5"` | `"claude-sonnet-4.5"` | 待确认 | ZenMux匹配(normalized): anthropic/claude-sonnet-4.5 | +| `displayName` | `"Claude Sonnet 4.5"` | `"Claude Sonnet 4.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `200K tokens / 1M tokens (beta)`;本项目 `contextWindow` 取标准口径 `200000` | +| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览历史版本索引 https://platform.claude.com/docs/es/about-claude/models/whats-new-claude-4-5 将 `Claude Sonnet 4.5` 标为 `64K tokens` 最大输出 | +| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) prompt=3 USD/MTokens | +| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4.5) completion=15 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `anthropic/claude-sonnet-4` +- ZenMux候选: `anthropic/claude-sonnet-4` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4"` | `"claude-sonnet-4"` | 保持 | ZenMux匹配(exact): anthropic/claude-sonnet-4 | +| `displayName` | `"Claude Sonnet 4"` | `"Claude Sonnet 4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 context window 为 `200k tokens` | +| `maxOutputTokens` | `64000` | `64000` | 保持 | Anthropic 官方模型总览 https://platform.claude.com/docs/en/about-claude/models/overview 标注 Claude Sonnet 4 的 Max output 为 `64k tokens` | +| `inputPrice` | `3` | `3` | 保持 | ZenMux(anthropic/claude-sonnet-4) prompt=3 USD/MTokens | +| `outputPrice` | `15` | `15` | 保持 | ZenMux(anthropic/claude-sonnet-4) completion=15 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## claude-sonnet-4-5-computer + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `anthropic/claude-sonnet-4.5`、`anthropic/claude-sonnet-4`、`anthropic/claude-sonnet-4.6`、`anthropic/claude-opus-4.5`、`anthropic/claude-haiku-4.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"claude-sonnet-4-5-computer"` | `"claude-sonnet-4-5-computer"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Claude Sonnet 4.5 Computer Use"` | `"Claude Sonnet 4.5 Computer Use"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["computer_use"]` | `["computer_use"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | +| `maxOutputTokens` | `64000` | `64000` | 待确认 | 已查 https://platform.claude.com/docs/en/about-claude/models/overview 与 https://platform.claude.com/docs/en/about-claude/pricing ,未找到 `claude-sonnet-4-5-computer` 这一独立官方模型规格 | +| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","computer_use","tool_use","reasoning"]` | `["chat","vision","computer_use","tool_use","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/anthropic/逐条处置记录-2026-04-23.md b/字段取值表/anthropic/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..14231c8 --- /dev/null +++ b/字段取值表/anthropic/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# anthropic ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Anthropic Models: https://docs.anthropic.com/en/docs/about-claude/models +- Anthropic Pricing: https://www.anthropic.com/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `claude-sonnet-4-5-computer`(ambiguous) +处置:不修改。 +原因:ZenMux 候选覆盖 `sonnet/opus/haiku` 多分支;本地条目为 `computer_use` 专用路由,不能按通用 chat 候选直接覆盖。 + +## 本轮 anthropic 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/baichuan/未确认字段报告.md b/字段取值表/baichuan/未确认字段报告.md new file mode 100644 index 0000000..10ac6b4 --- /dev/null +++ b/字段取值表/baichuan/未确认字段报告.md @@ -0,0 +1,44 @@ +# 未确认字段报告 - compute/providers/baichuan.json + +- provider: `baichuan` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## Baichuan-M3-Plus + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3-Plus` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M3 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M3` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M2-Plus + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2-Plus` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Baichuan-M2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖 `Baichuan-M2` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baichuan/详细字段取值表.md b/字段取值表/baichuan/详细字段取值表.md new file mode 100644 index 0000000..34471fb --- /dev/null +++ b/字段取值表/baichuan/详细字段取值表.md @@ -0,0 +1,89 @@ +# 详细字段取值表 - compute/providers/baichuan.json + +- provider: `baichuan` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.baichuan-ai.com/prices +- https://platform.baichuan-ai.com/docs/api +- https://platform.baichuan-ai.com/docs/knowledgeBase +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## Baichuan-M3-Plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M3-Plus"` | `"Baichuan-M3-Plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M3-Plus"` | `"百川 M3-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3-Plus`,因此不能直接据此回填 | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `9` | `9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | `["chat","reasoning","code","multilingual","vision","long_context","medical"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M3"` | `"Baichuan-M3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M3"` | `"百川 M3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M3`,因此不能直接据此回填 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","vision","medical"]` | `["chat","reasoning","code","multilingual","vision","medical"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M2-Plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M2-Plus"` | `"Baichuan-M2-Plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M2-Plus"` | `"百川 M2-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2-Plus`,因此不能直接据此回填 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Baichuan-M2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Baichuan-M2"` | `"Baichuan-M2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"百川 M2"` | `"百川 M2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | 百川价格页 https://platform.baichuan-ai.com/prices 将 `Baichuan-M3-Plus` / `Baichuan-M3` / `Baichuan-M2-Plus` / `Baichuan-M2` 的上下文长度均列为 `32k` | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已复核 https://platform.baichuan-ai.com/docs/api ,官方接口文档确有 `max_tokens` 参数且取值范围为 `[1,2048]`,但当前正文支持模型仅列 `Baichuan4-Turbo` / `Baichuan4-Air` / `Baichuan4` / `Baichuan3-Turbo` / `Baichuan3-Turbo-128k` / `Baichuan2-Turbo`,未覆盖本地 `Baichuan-M2`,因此不能直接据此回填 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/baidu/未确认字段报告.md b/字段取值表/baidu/未确认字段报告.md new file mode 100644 index 0000000..ba90482 --- /dev/null +++ b/字段取值表/baidu/未确认字段报告.md @@ -0,0 +1,22 @@ +# 未确认字段报告 - compute/providers/baidu.json + +- provider: `baidu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## ernie-5.0-thinking-latest + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## ernie-4.5-turbo-128k-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/baidu/详细字段取值表.md b/字段取值表/baidu/详细字段取值表.md new file mode 100644 index 0000000..d6c126e --- /dev/null +++ b/字段取值表/baidu/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/baidu.json + +- provider: `baidu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://cloud.baidu.com/doc/qianfan/ +- https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## ernie-5.0-thinking-latest + +- ZenMux匹配级别: `stripped` +- ZenMux命中: `baidu/ernie-5.0-thinking-preview` +- ZenMux候选: `baidu/ernie-5.0-thinking-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-5.0-thinking-latest"` | `"ernie-5.0-thinking-latest"` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 直接列出 `ernie-5.0-thinking-latest` | +| `displayName` | `"文心 ERNIE 5.0"` | `"文心 ERNIE 5.0"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0-thinking-latest` 上下文长度为 `128k` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-5.0-thinking-latest` 最大输出为 `[1,65536]` | +| `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","vision","multimodal","tool_use"]` | `["chat","reasoning","vision","multimodal","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## ernie-4.5-turbo-128k-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ernie-4.5-turbo-128k-latest"` | `"ernie-4.5-turbo-128k-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"文心 ERNIE 4.5 Turbo"` | `"文心 ERNIE 4.5 Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-4.5-turbo-128k` 上下文长度为 `128k`;当前值 `131072` 为按 `128 * 1024` 换算 | +| `maxOutputTokens` | `12288` | `12288` | 保持 | 百度千帆模型列表 https://cloud.baidu.com/doc/qianfan/s/rmh4stp0j 标注 `ernie-4.5-turbo-128k` 最大输出为 `[2,12288]` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","vision","long_context","fast"]` | `["chat","code","vision","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/cohere/未确认字段报告.md b/字段取值表/cohere/未确认字段报告.md new file mode 100644 index 0000000..f348175 --- /dev/null +++ b/字段取值表/cohere/未确认字段报告.md @@ -0,0 +1,31 @@ +# 未确认字段报告 - compute/providers/cohere.json + +- provider: `cohere` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## command-a-03-2025 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## embed-v4.0 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## rerank-v3.5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/cohere/详细字段取值表.md b/字段取值表/cohere/详细字段取值表.md new file mode 100644 index 0000000..2966d2b --- /dev/null +++ b/字段取值表/cohere/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/cohere.json + +- provider: `cohere` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.cohere.com/v1/docs/models/command +- https://docs.cohere.com/v2/docs/models +- https://docs.cohere.com/docs/cohere-embed +- https://docs.cohere.com/v2/docs/rerank +- https://cohere.com/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## command-a-03-2025 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"command-a-03-2025"` | `"command-a-03-2025"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Command A"` | `"Command A"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 context 为 `256,000` tokens | +| `maxOutputTokens` | `8000` | `8000` | 保持 | Cohere 官方 Command A 模型页 https://docs.cohere.com/v1/docs/models/command 与模型总览 https://docs.cohere.com/v2/docs/models 均标注 max output 为 `8,000` tokens | +| `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | `["chat","reasoning","code","vision","tool_use","rag","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## embed-v4.0 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"embed-v4.0"` | `"embed-v4.0"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Embed V4"` | `"Embed V4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Cohere Embed 文档 https://docs.cohere.com/docs/cohere-embed 与模型总览 https://docs.cohere.com/v1/docs/models 均标注 `embed-v4.0` 上下文为 `128k` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/docs/cohere-embed 与 https://docs.cohere.com/v1/docs/models ,`embed-v4.0` 输出为向量表示,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.12` | `0.12` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## rerank-v3.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"rerank-v3.5"` | `"rerank-v3.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Rerank V3.5"` | `"Rerank V3.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["rerank"]` | `["rerank"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `4096` | `4096` | 保持 | Cohere Rerank 文档 https://docs.cohere.com/v2/docs/rerank 标注 `rerank-v3.5` context length 为 `4096` tokens | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.cohere.com/v2/docs/rerank ,`rerank-v3.5` 返回相关性分数而非文本 completion,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["rerank","semantic_reranking"]` | `["rerank","semantic_reranking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope-coding/未确认字段报告.md b/字段取值表/dashscope-coding/未确认字段报告.md new file mode 100644 index 0000000..d16c003 --- /dev/null +++ b/字段取值表/dashscope-coding/未确认字段报告.md @@ -0,0 +1,20 @@ +# 未确认字段报告 - compute/coding-plans/dashscope-coding.json + +- provider: `dashscope` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## qwen3-coder-plus + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-2026-01-23 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope-coding/详细字段取值表.md b/字段取值表/dashscope-coding/详细字段取值表.md new file mode 100644 index 0000000..7571f9d --- /dev/null +++ b/字段取值表/dashscope-coding/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/coding-plans/dashscope-coding.json + +- provider: `dashscope` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://help.aliyun.com/zh/model-studio/getting-started/models +- https://help.aliyun.com/zh/model-studio/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## qwen3-coder-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-coder-plus` +- ZenMux候选: `qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-coder-plus"` | `"qwen3-coder-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3-coder-plus | +| `displayName` | `"Qwen3 Coder Plus (Coding)"` | `"Qwen3 Coder Plus (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云百炼模型列表列明 `qwen3-coder-plus` 上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云百炼模型列表列明 `qwen3-coder-plus` 最大输出为 `65,536` | +| `inputPrice` | `1` | `1` | 保持 | ZenMux(qwen/qwen3-coder-plus) prompt=1 USD/MTokens | +| `outputPrice` | `5` | `5` | 保持 | ZenMux(qwen/qwen3-coder-plus) completion=5 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-2026-01-23 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-2026-01-23"` | `"qwen3-max-2026-01-23"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Max (Coding)"` | `"Qwen3 Max (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云百炼模型列表写明稳定版 `qwen3-max` 当前与 `qwen3-max-2026-01-23` 能力相同,且上下文长度为 `262,144` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 同一官方模型列表写明 `qwen3-max` 最大输出为 `65,536`,并注明其当前与 `qwen3-max-2026-01-23` 能力相同 | +| `inputPrice` | `1.2` | `1.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | `["chat","reasoning","code","multilingual","tool_use","long_context","vision"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md b/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..8aedfb6 --- /dev/null +++ b/字段取值表/dashscope-coding/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# dashscope-coding ambiguous/similar 逐条处置记录(2026-04-23) + +## 范围 + +- 文件:`compute/coding-plans/dashscope-coding.json` +- 目标条目:`qwen3-max-2026-01-23` +- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models` + +## 逐条结论 + +| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 | +|---|---|---|---|---| +| `qwen3-max-2026-01-23` | `qwen/qwen3-max`、`qwen/qwen3-max-preview` | 保持现状(确认) | 否 | 本地 `contextWindow=262144` 与 `qwen/qwen3-max-preview` 精确一致;`inputPrice=1.2`、`outputPrice=6` 与该候选阶梯首档一致。当前值已对齐,无需改动。 | + +## 备注 + +- 此项由“ambiguous”提升为“可解释匹配(通过上下文长度和命名语义)”,但因字段已一致,所以仅记录处置,不产生 JSON 差异。 diff --git a/字段取值表/dashscope/未确认字段报告.md b/字段取值表/dashscope/未确认字段报告.md new file mode 100644 index 0000000..7475592 --- /dev/null +++ b/字段取值表/dashscope/未确认字段报告.md @@ -0,0 +1,168 @@ +# 未确认字段报告 - compute/providers/dashscope.json + +- provider: `dashscope` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## qwen3.5-plus + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-max + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-long + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-vl-plus + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-vl-flash + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-v3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-v4 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-rerank + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## cosyvoice-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## paraformer-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## wanx-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## wanx-video + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## cosyvoice-clone + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen-omni-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-trans + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应 +- `maxOutputTokens`: 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/dashscope/详细字段取值表.md b/字段取值表/dashscope/详细字段取值表.md new file mode 100644 index 0000000..05a3c20 --- /dev/null +++ b/字段取值表/dashscope/详细字段取值表.md @@ -0,0 +1,362 @@ +# 详细字段取值表 - compute/providers/dashscope.json + +- provider: `dashscope` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://help.aliyun.com/zh/model-studio/model +- https://help.aliyun.com/zh/model-studio/models +- https://help.aliyun.com/zh/model-studio/rerank +- https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api +- https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni +- https://help.aliyun.com/zh/model-studio/machine-translation +- https://help.aliyun.com/zh/model-studio/user-guide/machine-translation +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## qwen3.5-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3.5-plus` +- ZenMux候选: `qwen/qwen3.5-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-plus"` | `"qwen3.5-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3.5-plus | +| `displayName` | `"阿里云 Qwen3.5-Plus"` | `"阿里云 Qwen3.5-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `4.8` | `4.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":4.8},{"maxInputTokens":256000,"inputPrice":2,"outputPrice":12},{"maxInputTokens":1000000,"inputPrice":4,"outputPrice":24}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-max + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-max"` | `"qwen-max"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-max"` | `"阿里云 qwen-max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-max` 稳定版当前与 `qwen-max-2025-01-25` 能力相同,上下文长度为 `32,768` | +| `maxOutputTokens` | `8192` | `8192` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-max` 稳定版最大输出为 `8,192` | +| `inputPrice` | `2.4` | `2.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `9.6` | `9.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context"]` | `["chat","reasoning","code","multilingual","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-plus + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-plus"` | `"qwen-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-plus"` | `"阿里云 qwen-plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-plus` 稳定版非思考模式上下文为 `1,000,000`,思考模式为 `995,904`;当前字段按稳定版上限保留 `1,000,000` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-plus` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","thinking_mode"]` | `["chat","reasoning","code","thinking_mode"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.6` | `0.6` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | `{"pricingTiers":[{"maxInputTokens":128000,"inputPrice":0.8,"outputPrice":2,"thinkingOutputPrice":8},{"maxInputTokens":256000,"inputPrice":2.4,"outputPrice":20,"thinkingOutputPrice":24},{"maxInputTokens":1000000,"inputPrice":4.8,"outputPrice":48,"thinkingOutputPrice":64}],"thinkingMaxTokens":81920}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-turbo"` | `"qwen-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-turbo"` | `"阿里云 qwen-turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-turbo` 稳定版非思考模式上下文为 `1,000,000`,思考模式为 `131,072`;当前字段按非思考模式上限保留 `1,000,000` | +| `maxOutputTokens` | `16384` | `16384` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen-turbo` 稳定版最大输出为 `16,384` | +| `inputPrice` | `0.367` | `0.367` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1.468` | `1.468` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context","fast"]` | `["chat","code","long_context","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | `{"thinkingContextWindow":131072,"thinkingOutputPrice":3.67,"thinkingMaxTokens":38912}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-long + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-long"` | `"qwen-long"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 qwen-long"` | `"阿里云 qwen-long"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `10000000` | `10000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-long` 稳定版上下文长度为 `10,000,000` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen-long` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","ultra_long_context","document_processing"]` | `["chat","ultra_long_context","document_processing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-max` +- ZenMux候选: `qwen/qwen3-max` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max"` | `"qwen3-max"` | 保持 | ZenMux匹配(exact): qwen/qwen3-max | +| `displayName` | `"阿里云 Qwen3-Max"` | `"阿里云 Qwen3-Max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max` 稳定版上下文长度为 `262,144` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max` 非思考模式最大输出为 `65,536`,思考模式为 `32,768`;当前字段按单模型绝对最大输出保留 `65,536` | +| `inputPrice` | `2.5` | `2.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | `["chat","reasoning","code","multilingual","long_context","tool_use","agent","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.8` | `0.8` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-vl-plus + +- ZenMux匹配级别: `exact` +- ZenMux命中: `qwen/qwen3-vl-plus` +- ZenMux候选: `qwen/qwen3-vl-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-vl-plus"` | `"qwen3-vl-plus"` | 保持 | ZenMux匹配(exact): qwen/qwen3-vl-plus | +| `displayName` | `"阿里云 Qwen3-VL-Plus"` | `"阿里云 Qwen3-VL-Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | ZenMux(qwen/qwen3-vl-plus)口径近似(≤3%) | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-plus` 稳定版最大输出为 `32,768` | +| `inputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | `["chat","vision","image_understanding","ocr","chart_analysis"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-vl-flash + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-vl-flash"` | `"qwen3-vl-flash"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 Qwen3-VL-Flash"` | `"阿里云 Qwen3-VL-Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-flash` 稳定版上下文长度为 `262,144` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 标注 `qwen3-vl-flash` 稳定版最大输出为 `32,768` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","fast"]` | `["chat","vision","image_understanding","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-v3"` | `"text-embedding-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"text-embedding-v3"` | `"text-embedding-v3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 标注 `text-embedding-v3` 单行最大 Token 数为 `8,192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 说明 `text-embedding-v3` 输出为向量维度,不定义 max output tokens | +| `inputPrice` | `0.7` | `0.7` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","chinese_optimized"]` | `["text_embedding","semantic_search","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-v4 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-v4"` | `"text-embedding-v4"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"阿里云 text-embedding-v4"` | `"阿里云 text-embedding-v4"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 标注 `text-embedding-v4` 单行最大 Token 数为 `8,192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Embedding 同步接口文档 https://help.aliyun.com/zh/model-studio/text-embedding-synchronous-api 说明 `text-embedding-v4` 输出为向量维度,不定义 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag"]` | `["text_embedding","semantic_search","rag"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-rerank + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-rerank"` | `"qwen3-rerank"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3-Rerank"` | `"Qwen3-Rerank"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["rerank"]` | `["rerank"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `30000` | `120000` | 建议修改 | 阿里云 Rerank 文档 https://help.aliyun.com/zh/model-studio/rerank 标注 `qwen3-rerank` 单次请求最大 Token 数为 `120,000` | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 Rerank 文档 https://help.aliyun.com/zh/model-studio/rerank 说明 `qwen3-rerank` 输出为排序分数与文档顺序,不定义 max output tokens | +| `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["rerank","semantic_reranking","multilingual"]` | `["rerank","semantic_reranking","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## cosyvoice-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"cosyvoice-v2"` | `"cosyvoice-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"CosyVoice V2"` | `"CosyVoice V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云语音合成文档 https://help.aliyun.com/model-studio/developer-reference/quick-start-cosyvoice 对 `cosyvoice-v2` 描述为 TTS 模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云语音合成文档 https://help.aliyun.com/model-studio/developer-reference/quick-start-cosyvoice 对 `cosyvoice-v2` 描述为 TTS 模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts","multilingual","chinese_optimized"]` | `["tts","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | `{"voices":["longxiaochun","longxiaoxia","longlaotie","longshu"],"supportedAudioFormats":["mp3","wav","pcm"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## paraformer-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"paraformer-v2"` | `"paraformer-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Paraformer V2"` | `"Paraformer V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云 ASR 文档 https://help.aliyun.com/document_detail/2840914.html 对 `paraformer-v2` 描述为语音识别模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云 ASR 文档 https://help.aliyun.com/document_detail/2840914.html 对 `paraformer-v2` 描述为语音识别模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","chinese_optimized"]` | `["asr","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | `{"maxAudioLength":3600,"supportedInputFormats":["wav","mp3","pcm","ogg"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## wanx-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"wanx-v2"` | `"wanx-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"通义万相 V2"` | `"通义万相 V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-v2` 归为图像生成模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-v2` 归为图像生成模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","chinese_optimized"]` | `["image_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | `{"supportedImageSizes":["1024x1024","720x1280","1280x720"],"supportedStyles":["auto","photography","anime","3d_cartoon"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## wanx-video + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"wanx-video"` | `"wanx-video"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"通义万相视频"` | `"通义万相视频"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-video` 归为视频生成模型,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将 `wanx-video` 归为视频生成模型,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized"]` | `["video_generation","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## cosyvoice-clone + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"cosyvoice-clone"` | `"cosyvoice-clone"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"CosyVoice 声音复刻"` | `"CosyVoice 声音复刻"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["voice_clone"]` | `["voice_clone"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将该能力归为语音/声音定制类服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/models 将该能力归为语音/声音定制类服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxCloneSamples":5,"minCloneDuration":3}` | `{"maxCloneSamples":5,"minCloneDuration":3}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen-omni-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen-omni-turbo"` | `"qwen-omni-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen-Omni-Turbo"` | `"Qwen-Omni-Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["omni"]` | `["omni"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 阿里云 Qwen-Omni 文档 https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni 标注 `qwen-omni-turbo` 上下文长度为 `32,768` | +| `maxOutputTokens` | `2048` | `2048` | 保持 | 阿里云 Qwen-Omni 文档 https://help.aliyun.com/zh/model-studio/user-guide/qwen-omni 标注 `qwen-omni-turbo` 最大输出为 `2,048` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","tts","asr","multimodal","tool_use"]` | `["chat","vision","tts","asr","multimodal","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-trans + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-trans"` | `"qwen3-max-trans"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3-Max(翻译)"` | `"Qwen3-Max(翻译)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["translation"]` | `["translation"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅出现 `qwen-mt-plus/flash/turbo/lite`,未出现 `qwen3-max-trans` 这一名称,也未说明本地别名与哪一官方型号对应;当前值暂保留待确认 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://help.aliyun.com/zh/model-studio/machine-translation 、https://help.aliyun.com/zh/model-studio/user-guide/machine-translation 与 https://help.aliyun.com/zh/model-studio/model ,官方页面仅公开 `qwen-mt-plus/flash/turbo/lite` 的最大输出,未出现 `qwen3-max-trans` 这一名称,也未说明其与哪一官方型号一一对应;当前值暂保留待确认 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/dashscope/逐条处置记录-2026-04-23.md b/字段取值表/dashscope/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..c858048 --- /dev/null +++ b/字段取值表/dashscope/逐条处置记录-2026-04-23.md @@ -0,0 +1,38 @@ +# dashscope ambiguous/similar 逐条处置记录(2026-04-23) + +## 范围 + +- 文件:`compute/providers/dashscope.json` +- 目标条目:`qwen-max`、`qwen-plus`、`qwen3-vl-flash`、`qwen3-rerank`、`qwen3-max-trans` +- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models` + +## 逐条结论 + +| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 | +|---|---|---|---|---| +| `qwen-max` | `qwen/qwen3-max`、`qwen/qwen3-max-preview` | 不修改 | 否 | 本地为 legacy 命名(`qwen-max`,32K);ZenMux 候选是 Qwen3 Max 系列,规格口径不一致,不能直接覆盖。 | +| `qwen-plus` | `qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus` | 不修改 | 否 | 候选跨模型族(chat/vl/coder),且价格阶梯与本地 `qwen-plus` 不可唯一对齐,拒绝强匹配。 | +| `qwen3-vl-flash` | `qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | ZenMux 未给出 `qwen3-vl-flash` 同名条目;候选包含非视觉模型,无法唯一映射。 | +| `qwen3-rerank` | `qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash` | 不修改 | 否 | 本地是 `rerank` 服务类型,ZenMux 候选均为生成模型,服务类型不一致。 | +| `qwen3-max-trans` | `qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | 本地是翻译专用路由(`translation`),ZenMux 候选为通用生成模型,无法安全映射。 | + +## 备注 + +- 本批次没有可“唯一确认且与本地值不同”的字段,因此 `compute/providers/dashscope.json` 无变更。 + +## none 条目补齐(第2轮) + +依据(官方): +- 阿里云百炼模型概览:`https://help.aliyun.com/zh/model-studio/models` +- 文本向量模型 v3/v4 文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3` +- 文本排序(Rerank)文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api` + +已执行: +1. `text-embedding-v3`:新增 `contextWindow: 8192` +2. `text-embedding-v4`:新增 `contextWindow: 8192` +3. `qwen3-rerank`:新增 `contextWindow: 30000`(按官方“单次请求最大 Token”) + +未改项(说明): +- `text-embedding-v3/v4` 的 `maxOutputTokens` 与 `outputPrice` 保持缺省:Embedding 为输入向量化,不走 completion token 口径。 +- `qwen3-rerank` 的 `maxOutputTokens` 保持缺省:Rerank 返回排序结果,不是文本生成输出。 +- 语音/图像/视频模型(`cosyvoice`/`paraformer`/`wanx`)的 token 上下文与输出上限口径不统一,继续待官方明确 token 语义映射。 diff --git a/字段取值表/deepseek/未确认字段报告.md b/字段取值表/deepseek/未确认字段报告.md new file mode 100644 index 0000000..3e67e70 --- /dev/null +++ b/字段取值表/deepseek/未确认字段报告.md @@ -0,0 +1,23 @@ +# 未确认字段报告 - compute/providers/deepseek.json + +- provider: `deepseek` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## deepseek-chat + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-reasoner + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/deepseek/详细字段取值表.md b/字段取值表/deepseek/详细字段取值表.md new file mode 100644 index 0000000..9a713e0 --- /dev/null +++ b/字段取值表/deepseek/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/deepseek.json + +- provider: `deepseek` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://api-docs.deepseek.com/quick_start/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## deepseek-chat + +- ZenMux匹配级别: `exact` +- ZenMux命中: `deepseek/deepseek-chat` +- ZenMux候选: `deepseek/deepseek-chat` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-chat"` | `"deepseek-chat"` | 保持 | ZenMux匹配(exact): deepseek/deepseek-chat | +| `displayName` | `"DeepSeek V3.2"` | `"DeepSeek V3.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | ZenMux(deepseek/deepseek-chat)口径近似(≤3%) | +| `maxOutputTokens` | `8192` | `8192` | 保持 | DeepSeek 官方模型与价格页 https://api-docs.deepseek.com/quick_start/pricing/ 标注 `deepseek-chat` 最大输出为 8K | +| `inputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","code","reasoning","multilingual"]` | `["chat","code","reasoning","multilingual"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-reasoner + +- ZenMux匹配级别: `exact` +- ZenMux命中: `deepseek/deepseek-reasoner` +- ZenMux候选: `deepseek/deepseek-reasoner` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-reasoner"` | `"deepseek-reasoner"` | 保持 | ZenMux匹配(exact): deepseek/deepseek-reasoner | +| `displayName` | `"DeepSeek R1"` | `"DeepSeek R1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | ZenMux(deepseek/deepseek-reasoner)口径近似(≤3%) | +| `maxOutputTokens` | `65536` | `65536` | 保持 | DeepSeek 官方模型与价格页 https://api-docs.deepseek.com/quick_start/pricing/ 与推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 均标注 `deepseek-reasoner` 最大输出为 64K | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","code","math"]` | `["chat","reasoning","deep_thinking","code","math"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/google/未确认字段报告.md b/字段取值表/google/未确认字段报告.md new file mode 100644 index 0000000..d7434b6 --- /dev/null +++ b/字段取值表/google/未确认字段报告.md @@ -0,0 +1,27 @@ +# 未确认字段报告 - compute/providers/google.json + +- provider: `google` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## gemini-2.5-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gemini-2.5-flash + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-005 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/google/详细字段取值表.md b/字段取值表/google/详细字段取值表.md new file mode 100644 index 0000000..c2e35ad --- /dev/null +++ b/字段取值表/google/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/google.json + +- provider: `google` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://ai.google.dev/gemini-api/docs/models/gemini +- https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings +- https://ai.google.dev/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## gemini-2.5-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `google/gemini-2.5-pro` +- ZenMux候选: `google/gemini-2.5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gemini-2.5-pro"` | `"gemini-2.5-pro"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-pro | +| `displayName` | `"Gemini 2.5 Pro"` | `"Gemini 2.5 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(google/gemini-2.5-pro) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(google/gemini-2.5-pro) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gemini-2.5-flash + +- ZenMux匹配级别: `exact` +- ZenMux命中: `google/gemini-2.5-flash` +- ZenMux候选: `google/gemini-2.5-flash` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gemini-2.5-flash"` | `"gemini-2.5-flash"` | 保持 | ZenMux匹配(exact): google/gemini-2.5-flash | +| `displayName` | `"Gemini 2.5 Flash"` | `"Gemini 2.5 Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1048576` | `1048576` | 保持 | Google 官方 Gemini models 页 Token limits 列明输入上限 `1,048,576` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | Google 官方 Gemini models 页 Token limits 列明输出上限 `65,536` | +| `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(google/gemini-2.5-flash) prompt=0.3 USD/MTokens | +| `outputPrice` | `2.5` | `2.5` | 保持 | ZenMux(google/gemini-2.5-flash) completion=2.5 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-005 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-005"` | `"text-embedding-005"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Text Embedding 005"` | `"Text Embedding 005"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2048` | `2048` | 保持 | Google Cloud Vertex AI Embeddings 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 直接列出 `text-embedding-005` 的 `Max sequence length` 为 `2048 tokens` | +| `maxOutputTokens` | `0` | `0` | 保持 | 同一官方 Vertex AI 文档 https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings 仅定义输出维度与最大序列长度,`text-embedding-005` 输出为向量而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/google/逐条处置记录-2026-04-23.md b/字段取值表/google/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..69658fc --- /dev/null +++ b/字段取值表/google/逐条处置记录-2026-04-23.md @@ -0,0 +1,15 @@ +# google none 条目处置记录(2026-04-23,第2轮) + +依据: +- Google 官方模型文档(Gemini API / Vertex AI)中 `text-embedding-005` 最大输入长度为 `2048` tokens。 +- https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings + +已执行: +1. `text-embedding-005`:新增 `contextWindow: 2048` + +未改项(说明): +- `maxOutputTokens` / `outputPrice` 保持缺省:Embedding 仅输入计费,无生成输出 token 口径。 + +## 本轮 google 落库结果 + +- JSON 变更:1 模型 / 1 字段 diff --git a/字段取值表/infini-coding/未确认字段报告.md b/字段取值表/infini-coding/未确认字段报告.md new file mode 100644 index 0000000..0b2539f --- /dev/null +++ b/字段取值表/infini-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/infini-coding.json + +- provider: `infini` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## deepseek-v3 + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` +- `maxOutputTokens`: 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/infini-coding/详细字段取值表.md b/字段取值表/infini-coding/详细字段取值表.md new file mode 100644 index 0000000..e3dd778 --- /dev/null +++ b/字段取值表/infini-coding/详细字段取值表.md @@ -0,0 +1,33 @@ +# 详细字段取值表 - compute/coding-plans/infini-coding.json + +- provider: `infini` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html +- https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html +- https://docs.infini-ai.com/public/models/deepseek-v3.html +- https://api-docs.deepseek.com/quick_start/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## deepseek-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-v3"` | `"deepseek-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek V3 (芯穹 Coding)"` | `"DeepSeek V3 (芯穹 Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html ,当前 Coding Plan 公布的模型名是 `deepseek-v3.2` / `deepseek-v3.2-thinking`,未出现本地别名 `deepseek-v3`;已查官方 OpenClaw 接入文档 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,其中示例把 `deepseek-v3.2` 写为 `contextWindow: 128000`、`maxTokens: 128000`,但文档同时注明该 JSON 示例可能与实际值不一致,且未说明 `deepseek-v3` 与 `deepseek-v3.2` 为同一固定别名,因此不能直接据此确认本地 `deepseek-v3` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.infini-ai.com/gen-studio-coding-plan/supported-models.html 与 https://docs.infini-ai.com/shared/gen-studio/coding-tools/cp-use-openclaw.html ,官方仅对 `deepseek-v3.2` 示例展示 `maxTokens: 128000`,同时声明示例值可能与实际值不一致;本地配置使用的 `deepseek-v3` 别名未在官方当前 Coding Plan 模型列表中出现,无法确认其固定最大输出值 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/internal-testing/未确认字段报告.md b/字段取值表/internal-testing/未确认字段报告.md new file mode 100644 index 0000000..aaad51b --- /dev/null +++ b/字段取值表/internal-testing/未确认字段报告.md @@ -0,0 +1,132 @@ +# 未确认字段报告 - compute/providers/internal-testing.json + +- provider: `internal-testing` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.7-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `8192` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5.1 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-5-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2.6-code-preview + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2.5 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `8192` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.6-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-plus + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-35b-a3b + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3.5-27b + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen3-max-2026-01-23 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-2-0-code-preview-260215 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/internal-testing/详细字段取值表.md b/字段取值表/internal-testing/详细字段取值表.md new file mode 100644 index 0000000..4793e00 --- /dev/null +++ b/字段取值表/internal-testing/详细字段取值表.md @@ -0,0 +1,289 @@ +# 详细字段取值表 - compute/providers/internal-testing.json + +- provider: `internal-testing` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://help.aliyun.com/zh/model-studio/model +- https://developer.volcengine.com/articles/7615528054736945158 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.7-highspeed + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7-highspeed"` | `"MiniMax-M2.7-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax-M2.7 高速版"` | `"MiniMax-M2.7 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.7-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出;当前值暂保留待确认 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5.1 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5.1"` | `"glm-5.1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5.1"` | `"GLM-5.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5.1 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5.1 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5.1 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | `["chat","reasoning","code","deep_thinking","tool_use","agent"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5"` | `"GLM-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-5-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5-turbo"` | `"glm-5-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-5-Turbo"` | `"GLM-5-Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `200000` | 建议修改 | 智谱官方 GLM-5-Turbo 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `8192` | `128000` | 建议修改 | 智谱官方 GLM-5-Turbo 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-5-turbo 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7"` | `"GLM-4.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2.6-code-preview + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.6-code-preview"` | `"kimi-k2.6-code-preview"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2.6 Code Preview"` | `"Kimi K2.6 Code Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart 说明 `kimi-k2.6` 提供 `256K` 上下文窗口;本地别名 `kimi-k2.6-code-preview` 可按同规格理解 | +| `maxOutputTokens` | `16384` | `32768` | 建议修改 | Moonshot 官方 Kimi K2.6 文档 https://platform.kimi.com/docs/guide/kimi-k2-6-quickstart “参数变动说明”列明 `max_tokens` 默认值为 `32k`,即 `32768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi-2.5"` | `"Kimi-2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | Moonshot 官方 Kimi K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 标注模型上下文长度为 `256k` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | Moonshot 官方 Kimi K2.5 文档 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart “参数变动说明”列明 `max_tokens` 默认值为 `32k`,即 `32768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"MiniMax-M2.5"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax-M2.5"` | `"MiniMax-M2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出;当前值暂保留待确认 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.6-plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.6-plus"` | `"qwen3.6-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.6 Plus"` | `"Qwen3.6 Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.6-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.6-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | `["chat","reasoning","code","vision","tool_use","agent","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-plus + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-plus"` | `"qwen3.5-plus"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 Plus"` | `"Qwen3.5 Plus"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `1000000` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版上下文长度为 `1,000,000` | +| `maxOutputTokens` | `8192` | `65536` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3.5-plus` 稳定版最大输出为 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-35b-a3b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-35b-a3b"` | `"qwen3.5-35b-a3b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 35B-A3B"` | `"Qwen3.5 35B-A3B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-35b-a3b` 标注为 `262,144` 上下文 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-35b-a3b` 标注为最大回复长度 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3.5-27b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3.5-27b"` | `"qwen3.5-27b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3.5 27B"` | `"Qwen3.5 27B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-27b` 标注为 `262,144` 上下文 | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 将 `qwen3.5-27b` 标注为最大回复长度 `65,536` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen3-max-2026-01-23 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen3-max-2026-01-23"` | `"qwen3-max-2026-01-23"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Max"` | `"Qwen3 Max"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `262144` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max-2026-01-23` 对应的 `qwen3-max` 上下文长度为 `262,144` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 阿里云模型总表 https://help.aliyun.com/zh/model-studio/model 标注 `qwen3-max-2026-01-23` 思考模式最大输出为 `32,768` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | `["chat","reasoning","code","tool_use","agent","vision","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-2-0-code-preview-260215 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-2-0-code-preview-260215"` | `"doubao-seed-2-0-code-preview-260215"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed 2.0 Code Preview"` | `"豆包 Seed 2.0 Code Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 `doubao-seed-2.0-code` contextWindow 为 `256000`;本地快照别名 `doubao-seed-2-0-code-preview-260215` 可按同规格理解 | +| `maxOutputTokens` | `8192` | `128000` | 建议修改 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 `doubao-seed-2.0-code` maxTokens 为 `128000`;本地快照别名 `doubao-seed-2-0-code-preview-260215` 可按同规格理解 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kling/未确认字段报告.md b/字段取值表/kling/未确认字段报告.md new file mode 100644 index 0000000..6983f76 --- /dev/null +++ b/字段取值表/kling/未确认字段报告.md @@ -0,0 +1,40 @@ +# 未确认字段报告 - compute/providers/kling.json + +- provider: `kling` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kling-v2-5-turbo + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2-5-turbo-pro + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kling-v2-master + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kling/详细字段取值表.md b/字段取值表/kling/详细字段取值表.md new file mode 100644 index 0000000..b152449 --- /dev/null +++ b/字段取值表/kling/详细字段取值表.md @@ -0,0 +1,87 @@ +# 详细字段取值表 - compute/providers/kling.json + +- provider: `kling` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kling-v2-5-turbo + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-5-turbo"` | `"kling-v2-5-turbo"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2.5 Turbo"` | `"可灵 V2.5 Turbo"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","high_quality","fast"]` | `["video_generation","chinese_optimized","high_quality","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"],"pricePerGeneration":1.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2-5-turbo-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-5-turbo-pro"` | `"kling-v2-5-turbo-pro"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2.5 Turbo Pro"` | `"可灵 V2.5 Turbo Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"],"pricePerGeneration":2.5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2"` | `"kling-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2"` | `"可灵 V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","high_quality"]` | `["video_generation","chinese_optimized","high_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | `{"maxVideoDuration":10,"supportedResolutions":["720p","1080p"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kling-v2-master + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kling-v2-master"` | `"kling-v2-master"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"可灵 V2 Master"` | `"可灵 V2 Master"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["video_gen"]` | `["video_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,可灵视频模型按时长/分辨率生成视频,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://app.klingai.com/cn/quickstart/klingai-video-3-model-user-guide ,官网公开了输出时长与分辨率能力,但视频模型不以 token completion 计量,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["video_generation","chinese_optimized","ultra_quality"]` | `["video_generation","chinese_optimized","ultra_quality"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | `{"maxVideoDuration":10,"supportedResolutions":["1080p","4k"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/kwai-coding/未确认字段报告.md b/字段取值表/kwai-coding/未确认字段报告.md new file mode 100644 index 0000000..26edb1e --- /dev/null +++ b/字段取值表/kwai-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/kwai-coding.json + +- provider: `kwai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kwai-coder + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 +- `maxOutputTokens`: 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/kwai-coding/详细字段取值表.md b/字段取值表/kwai-coding/详细字段取值表.md new file mode 100644 index 0000000..f2527ef --- /dev/null +++ b/字段取值表/kwai-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/kwai-coding.json + +- provider: `kwai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.streamlake.com/product/kat-coder +- https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 +- https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kwai-coder + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kwai-coder"` | `"kwai-coder"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"KwaiKAT Coder (Coding)"` | `"KwaiKAT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查产品页 https://www.streamlake.com/product/kat-coder 与官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,Coding Plan 官方要求使用的模型名为 `kat-coder-pro-v2`,而本地配置使用的是别名 `kwai-coder`;已查发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方确认存在 `KAT-Coder-Pro-V2`,但未公开其上下文窗口,也未说明 `kwai-coder` 与该官方型号的一一映射 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查官方接入指南 https://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9 ,其中 Droid 示例为 `kat-coder-pro-v2` 填写了 `maxOutputTokens: 128000`,但这是客户端配置样例,不是正式模型规格页;结合产品页 https://www.streamlake.com/product/kat-coder 与发布公告 https://www.streamlake.com/document/WANQING/mdptas54hptu5uvllco ,官方仍未发布 `kwai-coder` / `kat-coder-pro-v2` 的正式固定最大输出说明,不能直接据此回填 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/lingyiwanwu/未确认字段报告.md b/字段取值表/lingyiwanwu/未确认字段报告.md new file mode 100644 index 0000000..5926295 --- /dev/null +++ b/字段取值表/lingyiwanwu/未确认字段报告.md @@ -0,0 +1,26 @@ +# 未确认字段报告 - compute/providers/lingyiwanwu.json + +- provider: `lingyiwanwu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## yi-lightning + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 +- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## yi-vision-v2 + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 +- `maxOutputTokens`: 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/lingyiwanwu/详细字段取值表.md b/字段取值表/lingyiwanwu/详细字段取值表.md new file mode 100644 index 0000000..6d93d67 --- /dev/null +++ b/字段取值表/lingyiwanwu/详细字段取值表.md @@ -0,0 +1,51 @@ +# 详细字段取值表 - compute/providers/lingyiwanwu.json + +- provider: `lingyiwanwu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.lingyiwanwu.com/billing +- https://platform.lingyiwanwu.com/playground +- https://platform.lingyiwanwu.com/useragreement +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## yi-lightning + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"yi-lightning"` | `"yi-lightning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Yi Lightning"` | `"Yi Lightning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `inputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.99` | `0.99` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","fast","smart_routing"]` | `["chat","reasoning","code","fast","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## yi-vision-v2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"yi-vision-v2"` | `"yi-vision-v2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Yi Vision V2"` | `"Yi Vision V2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `16000` | `16000` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 与 https://platform.lingyiwanwu.com/playground ,公开页面可见平台入口、计费入口和文档入口,但未公开 `yi-lightning` / `yi-vision-v2` 的独立模型卡片;已查 https://platform.lingyiwanwu.com/useragreement ,官方明确该开放平台为“多模型聚合平台”,会根据任务进行智能路由,但未给这两个公开别名提供固定上下文规格 | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.lingyiwanwu.com/billing 、https://platform.lingyiwanwu.com/playground 与 https://platform.lingyiwanwu.com/useragreement ,当前官方公开页面未提供 `yi-lightning` / `yi-vision-v2` 的独立最大输出规格;且平台声明存在智能路由,不足以从聚合平台入口反推固定 `maxOutputTokens` | +| `inputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | `["chat","vision","image_understanding","ocr","chart_analysis","smart_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/local-whisper/未确认字段报告.md b/字段取值表/local-whisper/未确认字段报告.md new file mode 100644 index 0000000..73735d9 --- /dev/null +++ b/字段取值表/local-whisper/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/local-whisper.json + +- provider: `local-whisper` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## whisper-large-v3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/local-whisper/详细字段取值表.md b/字段取值表/local-whisper/详细字段取值表.md new file mode 100644 index 0000000..a8682a5 --- /dev/null +++ b/字段取值表/local-whisper/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/local-whisper.json + +- provider: `local-whisper` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://huggingface.co/openai/whisper-large-v3 +- https://github.com/openai/whisper +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## whisper-large-v3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"whisper-large-v3"` | `"whisper-large-v3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Whisper Large V3"` | `"Whisper Large V3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://huggingface.co/openai/whisper-large-v3 与 https://github.com/openai/whisper ,`whisper-large-v3` 为语音转文本模型,官方未定义与聊天模型同口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://huggingface.co/openai/whisper-large-v3 与 https://github.com/openai/whisper ,官方未提供 transcription 模型的 max output tokens 规格,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | `{"maxAudioLength":7200,"supportedInputFormats":["wav","mp3","flac","ogg","webm"],"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax-coding/未确认字段报告.md b/字段取值表/minimax-coding/未确认字段报告.md new file mode 100644 index 0000000..95f9c86 --- /dev/null +++ b/字段取值表/minimax-coding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/coding-plans/minimax-coding.json + +- provider: `minimax` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.5 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.5 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `32768` +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax-coding/详细字段取值表.md b/字段取值表/minimax-coding/详细字段取值表.md new file mode 100644 index 0000000..c734923 --- /dev/null +++ b/字段取值表/minimax-coding/详细字段取值表.md @@ -0,0 +1,36 @@ +# 详细字段取值表 - compute/coding-plans/minimax-coding.json + +- provider: `minimax` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://platform.minimax.io/docs/guides/pricing-paygo +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.5` +- ZenMux候选: `minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"minimax-m2.5"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.5 | +| `displayName` | `"MiniMax-M2.5 (Coding)"` | `"MiniMax-M2.5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `32768` | +| `inputPrice` | `0.3` | `0.3` | 保持 | ZenMux(minimax/minimax-m2.5) prompt=0.3 USD/MTokens | +| `outputPrice` | `1.2` | `1.2` | 保持 | ZenMux(minimax/minimax-m2.5) completion=1.2 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax/未确认字段报告.md b/字段取值表/minimax/未确认字段报告.md new file mode 100644 index 0000000..bb602cd --- /dev/null +++ b/字段取值表/minimax/未确认字段报告.md @@ -0,0 +1,80 @@ +# 未确认字段报告 - compute/providers/minimax.json + +- provider: `minimax` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## MiniMax-M2.7 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.7 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.7-highspeed + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.7-highspeed +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.5 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.5-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.1 + +- `modelName`: ZenMux匹配(normalized): minimax/minimax-m2.1 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-M2.1-highspeed + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## MiniMax-Text-01 + +- `modelName`: ZenMux匹配(similar): minimax/minimax-m2 +- `contextWindow`: 已查 https://platform.minimax.io/docs/guides/text-vllm-deployment 与 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 ,官方仅给开源/本地部署口径:vLLM 部署按硬件可支持 `2M` / `5M` context,官方模型卡写明训练上下文 `1M`、推理最高可到 `4M`;MiniMax 托管 API 文档未公布固定 hosted context window,因此无法用官网确认当前 `1000000` +- `maxOutputTokens`: 已查 https://platform.minimax.io/docs/api-reference/text-post ,官方仅对 `MiniMax-Text-01` 给出废弃 Text Generation 接口的默认 `max_completion_tokens=2048`,未公布 `MiniMax-Text-01` 在托管 API 下的独立模型级最大输出;开源模型卡 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 也未给固定 `max_new_tokens` 上限,因此无法用官网确认当前 `131072` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/minimax/详细字段取值表.md b/字段取值表/minimax/详细字段取值表.md new file mode 100644 index 0000000..9695de4 --- /dev/null +++ b/字段取值表/minimax/详细字段取值表.md @@ -0,0 +1,157 @@ +# 详细字段取值表 - compute/providers/minimax.json + +- provider: `minimax` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.minimax.io/docs/api-reference/api-overview +- https://platform.minimax.io/docs/api-reference/text-chat-anthropic +- https://platform.minimax.io/docs/api-reference/text-chat-openai +- https://platform.minimax.io/docs/api-reference/text-post +- https://platform.minimax.io/docs/guides/text-generation +- https://platform.minimax.io/docs/guides/models-intro +- https://platform.minimax.io/docs/guides/pricing-paygo +- https://platform.minimax.io/docs/guides/text-vllm-deployment +- https://huggingface.co/MiniMaxAI/MiniMax-Text-01 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## MiniMax-M2.7 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.7` +- ZenMux候选: `minimax/minimax-m2.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7"` | `"minimax-m2.7"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.7 | +| `displayName` | `"MiniMax M2.7"` | `"MiniMax M2.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 与 Text Generation 文档 https://platform.minimax.io/docs/guides/text-generation 均标注 `MiniMax-M2.7` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.7-highspeed + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.7-highspeed` +- ZenMux候选: `minimax/minimax-m2.7-highspeed` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.7-highspeed"` | `"minimax-m2.7-highspeed"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.7-highspeed | +| `displayName` | `"MiniMax M2.7 高速版"` | `"MiniMax M2.7 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.7-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.7-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.42,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.5` +- ZenMux候选: `minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5"` | `"minimax-m2.5"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.5 | +| `displayName` | `"MiniMax M2.5"` | `"MiniMax M2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","long_context"]` | `["chat","reasoning","code","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.5-highspeed + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `minimax/minimax-m2.5`、`minimax/minimax-m2.7-highspeed`、`minimax/minimax-m2.5-lightning`、`minimax/minimax-m2`、`minimax/minimax-m2.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.5-highspeed"` | `"MiniMax-M2.5-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax M2.5 高速版"` | `"MiniMax M2.5 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.5-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.5-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.1 + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `minimax/minimax-m2.1` +- ZenMux候选: `minimax/minimax-m2.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.1"` | `"minimax-m2.1"` | 待确认 | ZenMux匹配(normalized): minimax/minimax-m2.1 | +| `displayName` | `"MiniMax M2.1"` | `"MiniMax M2.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.1` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8.4` | `8.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","code","tool_use","reasoning"]` | `["chat","code","tool_use","reasoning"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":60}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-M2.1-highspeed + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `minimax/minimax-m2.1`、`minimax/minimax-m2.7-highspeed`、`minimax/minimax-m2`、`minimax/minimax-m2.7`、`minimax/minimax-m2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-M2.1-highspeed"` | `"MiniMax-M2.1-highspeed"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MiniMax M2.1 高速版"` | `"MiniMax M2.1 高速版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `204800` | `204800` | 保持 | MiniMax API Overview https://platform.minimax.io/docs/api-reference/api-overview 标注 `MiniMax-M2.1-highspeed` context window 为 `204,800` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-chat-anthropic 与 https://platform.minimax.io/docs/api-reference/text-chat-openai ,当前兼容接口仅把 `max_tokens` / `max_completion_tokens` 写成接口参数上限 `2048`;另查 https://platform.minimax.io/docs/api-reference/text-post ,废弃 Text Generation 接口只给出 `MiniMax-M2` / `MiniMax-M1` / `MiniMax-Text-01` 的默认值 `10240` / `8192` / `2048`,未公布 `MiniMax-M2.1-highspeed` 的独立模型级最大输出,因此无法用官网确认当前 `131072` | +| `inputPrice` | `2.1` | `2.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16.8` | `16.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","fast"]` | `["chat","reasoning","code","tool_use","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | `{"cacheReadPrice":0.21,"cacheWritePrice":2.625,"outputSpeedTps":100}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## MiniMax-Text-01 + +- ZenMux匹配级别: `similar` +- ZenMux命中: `minimax/minimax-m2` +- ZenMux候选: `minimax/minimax-m2` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"MiniMax-Text-01"` | `"minimax-m2"` | 待确认 | ZenMux匹配(similar): minimax/minimax-m2 | +| `displayName` | `"MiniMax Text 01"` | `"MiniMax Text 01"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1000000` | `1000000` | 待确认 | 已查 https://platform.minimax.io/docs/guides/text-vllm-deployment 与 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 ,官方仅给开源/本地部署口径:vLLM 部署按硬件可支持 `2M` / `5M` context,官方模型卡写明训练上下文 `1M`、推理最高可到 `4M`;MiniMax 托管 API 文档未公布固定 hosted context window,因此无法用官网确认当前 `1000000` | +| `maxOutputTokens` | `131072` | `131072` | 待确认 | 已查 https://platform.minimax.io/docs/api-reference/text-post ,官方仅对 `MiniMax-Text-01` 给出废弃 Text Generation 接口的默认 `max_completion_tokens=2048`,未公布 `MiniMax-Text-01` 在托管 API 下的独立模型级最大输出;开源模型卡 https://huggingface.co/MiniMaxAI/MiniMax-Text-01 也未给固定 `max_new_tokens` 上限,因此无法用官网确认当前 `131072` | +| `inputPrice` | `1.4` | `1.4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `7.7` | `7.7` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","long_context"]` | `["chat","reasoning","code","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/minimax/逐条处置记录-2026-04-23.md b/字段取值表/minimax/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..2fcb31d --- /dev/null +++ b/字段取值表/minimax/逐条处置记录-2026-04-23.md @@ -0,0 +1,25 @@ +# minimax ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- MiniMax API/模型文档: https://platform.minimaxi.com/document/ChatCompletion?key=66701c8c1d57f38758d581b2 +- MiniMax 定价: https://www.minimaxi.com/platform/price +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `MiniMax-M2.5-highspeed`(ambiguous) +处置:不修改。 +原因:候选混入 `m2.5/m2.5-lightning/m2.7/m2`,无法只凭 ZenMux 唯一确认高速版映射。 + +2. `MiniMax-M2.1-highspeed`(ambiguous) +处置:不修改。 +原因:候选混入 `m2.1/m2.7-highspeed/m2/m2.5`,候选族冲突,缺少唯一锚点。 + +3. `MiniMax-Text-01`(similar) +处置:不修改。 +原因:`similar` 命中 `minimax-m2`,但 `Text-01` 与 `M2` 不是同名同版模型,禁止跨族覆盖。 + +## 本轮 minimax 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/mistral/未确认字段报告.md b/字段取值表/mistral/未确认字段报告.md new file mode 100644 index 0000000..3afcab3 --- /dev/null +++ b/字段取值表/mistral/未确认字段报告.md @@ -0,0 +1,37 @@ +# 未确认字段报告 - compute/providers/mistral.json + +- provider: `mistral` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## mistral-large-latest + +- `modelName`: ZenMux匹配(similar): mistralai/mistral-large-2512 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens +- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## mistral-small-latest + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## codestral-latest + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/mistral/详细字段取值表.md b/字段取值表/mistral/详细字段取值表.md new file mode 100644 index 0000000..110b816 --- /dev/null +++ b/字段取值表/mistral/详细字段取值表.md @@ -0,0 +1,70 @@ +# 详细字段取值表 - compute/providers/mistral.json + +- provider: `mistral` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.mistral.ai/getting-started/models +- https://mistral.ai/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## mistral-large-latest + +- ZenMux匹配级别: `similar` +- ZenMux命中: `mistralai/mistral-large-2512` +- ZenMux候选: `mistralai/mistral-large-2512` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mistral-large-latest"` | `"mistral-large-2512"` | 待确认 | ZenMux匹配(similar): mistralai/mistral-large-2512 | +| `displayName` | `"Mistral Large 3"` | `"Mistral Large 3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Mistral 官方模型页 https://docs.mistral.ai/models/mistral-large-3-25-12 标注 `mistral-large-2512` / Mistral Large 3 的 Context 为 `256k` | +| `maxOutputTokens` | `262144` | `262144` | 待确认 | 已查 https://docs.mistral.ai/models/mistral-large-3-25-12 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `1.5` | `1.5` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","long_context"]` | `["chat","reasoning","code","vision","tool_use","long_context"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## mistral-small-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mistral-small-latest"` | `"mistral-small-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Mistral Small 3.2"` | `"Mistral Small 3.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,页面说明了 `mistral-small-latest` 能力但未给出该 latest 别名的独立 context 数值 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.mistral.ai/capabilities/reasoning/adjustable 与 https://docs.mistral.ai/getting-started/models ,官方页面未给出 `mistral-small-latest` 的独立 max output tokens | +| `inputPrice` | `0.1` | `0.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","vision","reasoning","fast","tool_use"]` | `["chat","code","vision","reasoning","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## codestral-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"codestral-latest"` | `"codestral-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Codestral"` | `"Codestral"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `128000` | 建议修改 | Mistral 官方模型页 https://docs.mistral.ai/models/codestral-25-08 标注 Codestral 的 Context 为 `128k` | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://docs.mistral.ai/models/codestral-25-08 与 https://docs.mistral.ai/getting-started/models ,官方页面给出 context 但未给出独立 max output tokens | +| `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.9` | `0.9` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","fill_in_the_middle"]` | `["code","fill_in_the_middle"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/mistral/逐条处置记录-2026-04-23.md b/字段取值表/mistral/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..a90d9aa --- /dev/null +++ b/字段取值表/mistral/逐条处置记录-2026-04-23.md @@ -0,0 +1,17 @@ +# mistral ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Mistral Models: https://docs.mistral.ai/getting-started/models +- Mistral Pricing: https://mistral.ai/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `mistral-large-latest`(similar) +处置:不修改。 +原因:`latest` 是滚动别名,ZenMux 命中固定快照 `mistral-large-2512`;版本锚定策略不同,避免直接替换 `modelName`。 + +## 本轮 mistral 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/moonshot-coding/未确认字段报告.md b/字段取值表/moonshot-coding/未确认字段报告.md new file mode 100644 index 0000000..6be185d --- /dev/null +++ b/字段取值表/moonshot-coding/未确认字段报告.md @@ -0,0 +1,11 @@ +# 未确认字段报告 - compute/coding-plans/moonshot-coding.json + +- provider: `moonshot` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kimi-k2.5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot-coding/详细字段取值表.md b/字段取值表/moonshot-coding/详细字段取值表.md new file mode 100644 index 0000000..bd12ce6 --- /dev/null +++ b/字段取值表/moonshot-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/moonshot-coding.json + +- provider: `moonshot` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://platform.kimi.com/docs/pricing/chat-k25 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kimi-k2.5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2.5` +- ZenMux候选: `moonshotai/kimi-k2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2.5 | +| `displayName` | `"Kimi K2.5 (Coding)"` | `"Kimi K2.5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.5 文档注明“模型上下文长度 256k” | +| `maxOutputTokens` | `32768` | `32768` | 保持 | Moonshot 官方 Kimi K2.5 文档“参数变动说明”给出 `max_tokens` 默认值为 32k,即 `32768` | +| `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(moonshotai/kimi-k2.5) prompt=0.58 USD/MTokens | +| `outputPrice` | `3.02` | `3.02` | 保持 | ZenMux(moonshotai/kimi-k2.5) completion=3.02 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/moonshot/未确认字段报告.md b/字段取值表/moonshot/未确认字段报告.md new file mode 100644 index 0000000..d67463d --- /dev/null +++ b/字段取值表/moonshot/未确认字段报告.md @@ -0,0 +1,61 @@ +# 未确认字段报告 - compute/providers/moonshot.json + +- provider: `moonshot` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## kimi-k2.5 + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2-thinking + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-8k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-32k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## moonshot-v1-128k + +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moonshot/详细字段取值表.md b/字段取值表/moonshot/详细字段取值表.md new file mode 100644 index 0000000..0e8528f --- /dev/null +++ b/字段取值表/moonshot/详细字段取值表.md @@ -0,0 +1,134 @@ +# 详细字段取值表 - compute/providers/moonshot.json + +- provider: `moonshot` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://platform.kimi.com/docs/guide/kimi-k2-quickstart +- https://platform.kimi.com/docs/guide/faq +- https://platform.kimi.com/docs/models +- https://platform.kimi.com/docs/pricing/chat-k25 +- https://platform.kimi.com/docs/pricing/chat-k2 +- https://platform.kimi.com/docs/pricing/chat-v1 +- https://platform.kimi.com/docs/api/models-overview +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## kimi-k2.5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2.5` +- ZenMux候选: `moonshotai/kimi-k2.5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2.5"` | `"kimi-k2.5"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2.5 | +| `displayName` | `"Kimi K2.5"` | `"Kimi K2.5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方 Kimi K2.5 文档注明“模型上下文长度 256k” | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart 与 https://platform.kimi.com/docs/guide/faq ,官方 K2.5 快速开始页给出的 `32k` 是 `max_tokens` 默认值,不是模型固定上限;FAQ 明确 `kimi-k2.5` 的最大输出长度是 `256*1024 - prompt_tokens`,因此无法把 `32768` 视为固定 `maxOutputTokens` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `21` | `21` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | `["chat","reasoning","code","tool_use","agent","long_context","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | `{"thinking":{"default":"enabled","disabledTemperature":0.6},"cacheHitPrice":0.7,"supportedImageFormats":["png","jpeg","webp","gif"],"supportedVideoFormats":["mp4","mpeg","mov","avi","x-flv","mpg","webm","wmv","3gpp"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `moonshotai/kimi-k2.6`、`moonshotai/kimi-k2.5`、`moonshotai/kimi-k2-thinking`、`moonshotai/kimi-k2-0905`、`moonshotai/kimi-k2-0711` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2"` | `"kimi-k2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2"` | `"Kimi K2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 与 K2 定价页 https://platform.kimi.com/docs/pricing/chat-k2 均标注 Kimi K2 上下文长度为 `256k` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方给出了 `kimi-k2` 系列的上下文和参数默认值,但未给本地别名 `kimi-k2` 的固定最大输出值;FAQ 中关于“最大输出长度 = 256*1024 - prompt_tokens”的结论只明确覆盖 `kimi-k2.6`、`kimi-k2.5`、`kimi-k2-0905-preview` 和 `kimi-k2-turbo-preview`,未直接点名 `kimi-k2` | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2-thinking + +- ZenMux匹配级别: `exact` +- ZenMux命中: `moonshotai/kimi-k2-thinking` +- ZenMux候选: `moonshotai/kimi-k2-thinking` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2-thinking"` | `"kimi-k2-thinking"` | 保持 | ZenMux匹配(exact): moonshotai/kimi-k2-thinking | +| `displayName` | `"Kimi K2 思考版"` | `"Kimi K2 思考版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | Moonshot 官方模型列表 https://platform.kimi.com/docs/models 标注 `kimi-k2-thinking` 支持 `256k` 上下文 | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://platform.kimi.com/docs/models 、https://platform.kimi.com/docs/pricing/chat-k2 、https://platform.kimi.com/docs/guide/kimi-k2-quickstart 与 https://platform.kimi.com/docs/api/models-overview ,官方确认 `kimi-k2-thinking` 支持 `256k` 上下文并给出参数默认值/约束,但未公开固定 `maxOutputTokens` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"cacheHitPrice":1}` | `{"cacheHitPrice":1}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-8k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-8k"` | `"moonshot-v1-8k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 8K"` | `"Moonshot V1 8K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-8k` 上下文窗口为 `8,192 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-8k` 最大输出为 `8*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-32k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-32k"` | `"moonshot-v1-32k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 32K"` | `"Moonshot V1 32K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-32k` 上下文窗口为 `32,768 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-32k` 最大输出为 `32*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## moonshot-v1-128k + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"moonshot-v1-128k"` | `"moonshot-v1-128k"` | 保持 | Moonshot 官方模型列表与定价页直接使用该模型名 | +| `displayName` | `"Moonshot V1 128K"` | `"Moonshot V1 128K"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | Moonshot 官方 V1 定价页 https://platform.kimi.com/docs/pricing/chat-v1 标注 `moonshot-v1-128k` 上下文窗口为 `131,072 tokens` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://platform.kimi.com/docs/guide/faq 、https://platform.kimi.com/docs/pricing/chat-v1 与 https://platform.kimi.com/docs/models ,官方 FAQ 明确 `moonshot-v1-128k` 最大输出为 `128*1024 - prompt_tokens`,不是固定常数 | +| `inputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context"]` | `["chat","code","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/moonshot/逐条处置记录-2026-04-23.md b/字段取值表/moonshot/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..2a60b7b --- /dev/null +++ b/字段取值表/moonshot/逐条处置记录-2026-04-23.md @@ -0,0 +1,16 @@ +# moonshot ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- Moonshot 定价文档: https://platform.moonshot.cn/docs/pricing/chat +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `kimi-k2`(ambiguous) +处置:不修改。 +原因:候选包含 `k2.6/k2.5/k2-thinking/k2-0905/k2-0711`,属于不同版本/模式,无法唯一确定该条应映射到哪个具体版本。 + +## 本轮 moonshot 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/moorethread-coding/未确认字段报告.md b/字段取值表/moorethread-coding/未确认字段报告.md new file mode 100644 index 0000000..c938ed8 --- /dev/null +++ b/字段取值表/moorethread-coding/未确认字段报告.md @@ -0,0 +1,15 @@ +# 未确认字段报告 - compute/coding-plans/moorethread-coding.json + +- provider: `moorethread` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## mt-coder + +- `modelName`: ZenMux无稳定匹配 +- `contextWindow`: 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 +- `maxOutputTokens`: 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/moorethread-coding/详细字段取值表.md b/字段取值表/moorethread-coding/详细字段取值表.md new file mode 100644 index 0000000..039db28 --- /dev/null +++ b/字段取值表/moorethread-coding/详细字段取值表.md @@ -0,0 +1,32 @@ +# 详细字段取值表 - compute/coding-plans/moorethread-coding.json + +- provider: `moorethread` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.mthreads.com/news/277 +- https://www.mthreads.com/solution/AIInference +- https://www.mthreads.com/product/AIInferenceSuite +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## mt-coder + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"mt-coder"` | `"mt-coder"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"MT Coder (Coding)"` | `"MT Coder (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 待确认 | 已查新闻页 https://www.mthreads.com/news/277 、方案页 https://www.mthreads.com/solution/AIInference 与产品页 https://www.mthreads.com/product/AIInferenceSuite ,当前官网仅说明摩尔线程提供 AI Coding / AI 推理方案,但没有 `mt-coder` 独立模型卡片,也没有上下文长度字段 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://www.mthreads.com/news/277 、https://www.mthreads.com/solution/AIInference 与 https://www.mthreads.com/product/AIInferenceSuite ,官网未公开 `mt-coder` 的固定最大输出长度 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code"]` | `["chat","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/ollama/未确认字段报告.md b/字段取值表/ollama/未确认字段报告.md new file mode 100644 index 0000000..c805598 --- /dev/null +++ b/字段取值表/ollama/未确认字段报告.md @@ -0,0 +1,14 @@ +# 未确认字段报告 - compute/providers/ollama.json + +- provider: `ollama` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## llama3.1:70b + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/ollama/详细字段取值表.md b/字段取值表/ollama/详细字段取值表.md new file mode 100644 index 0000000..be1ecfe --- /dev/null +++ b/字段取值表/ollama/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/ollama.json + +- provider: `ollama` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://ollama.com/library/llama3.1 +- https://ai.meta.com/blog/meta-llama-3-1/ +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## llama3.1:70b + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"llama3.1:70b"` | `"llama3.1:70b"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Llama 3.1 70B"` | `"Llama 3.1 70B"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | Ollama 官方模型库 https://ollama.com/library/llama3.1 列出 `llama3.1:70b` 为 `128K context window`;当前值 `131072` 为按 `128 * 1024` 换算 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://ollama.com/library/llama3.1 与 https://ai.meta.com/blog/meta-llama-3-1/ ,官方仅确认 `llama3.1:70b` 为 `128K context window`,但未给 Ollama 变体单独定义固定 `maxOutputTokens`;Meta 官方发布页也未给该部署变体的固定最大输出值 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","reasoning"]` | `["chat","code","reasoning"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/openai/未确认字段报告.md b/字段取值表/openai/未确认字段报告.md new file mode 100644 index 0000000..3af7b60 --- /dev/null +++ b/字段取值表/openai/未确认字段报告.md @@ -0,0 +1,181 @@ +# 未确认字段报告 - compute/providers/openai.json + +- provider: `openai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## gpt-5.2 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5.2-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5.1 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-pro + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-mini + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-5-nano + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1 + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1-mini + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4.1-nano + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-mini + +- `capabilities`: ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-3-small + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## text-embedding-3-large + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## tts-1 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## tts-1-hd +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## whisper-1 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3-pro + +- `inputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o3-mini + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## o4-mini + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## dall-e-3 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-realtime +- `modelName`: 已查 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 、https://developers.openai.com/api/docs/models/gpt-realtime 与 https://developers.openai.com/api/docs/models ,未找到 `gpt-4o-realtime` 这一独立官方模型页 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## gpt-4o-realtime-preview + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/openai/详细字段取值表.md b/字段取值表/openai/详细字段取值表.md new file mode 100644 index 0000000..57539c2 --- /dev/null +++ b/字段取值表/openai/详细字段取值表.md @@ -0,0 +1,485 @@ +# 详细字段取值表 - compute/providers/openai.json + +- provider: `openai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://platform.openai.com/docs/models +- https://platform.openai.com/docs/pricing +- https://platform.openai.com/docs/guides/embeddings +- https://developers.openai.com/cookbook/examples/prompt_caching_201 +- https://developers.openai.com/api/docs/guides/realtime-costs +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## gpt-5.2 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.2` +- ZenMux候选: `openai/gpt-5.2` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.2"` | `"gpt-5.2"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2 | +| `displayName` | `"GPT-5.2"` | `"GPT-5.2"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2 标注 `128,000` max output tokens | +| `inputPrice` | `1.75` | `1.75` | 保持 | ZenMux(openai/gpt-5.2) prompt=1.75 USD/MTokens | +| `outputPrice` | `14` | `14` | 保持 | ZenMux(openai/gpt-5.2) completion=14 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5.2-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.2-pro` +- ZenMux候选: `openai/gpt-5.2-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.2-pro"` | `"gpt-5.2-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5.2-pro | +| `displayName` | `"GPT-5.2 Pro"` | `"GPT-5.2 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.2-pro 标注 `128,000` max output tokens | +| `inputPrice` | `21` | `21` | 保持 | ZenMux(openai/gpt-5.2-pro) prompt=21 USD/MTokens | +| `outputPrice` | `168` | `168` | 保持 | ZenMux(openai/gpt-5.2-pro) completion=168 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5.1 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5.1` +- ZenMux候选: `openai/gpt-5.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5.1"` | `"gpt-5.1"` | 保持 | ZenMux匹配(exact): openai/gpt-5.1 | +| `displayName` | `"GPT-5.1"` | `"GPT-5.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5.1 标注 `128,000` max output tokens | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5.1) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5.1) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5` +- ZenMux候选: `openai/gpt-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5"` | `"gpt-5"` | 保持 | ZenMux匹配(exact): openai/gpt-5 | +| `displayName` | `"GPT-5"` | `"GPT-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5 标注 `128,000` max output tokens | +| `inputPrice` | `1.25` | `1.25` | 保持 | ZenMux(openai/gpt-5) prompt=1.25 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-5) completion=10 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-pro + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-pro` +- ZenMux候选: `openai/gpt-5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-pro"` | `"gpt-5-pro"` | 保持 | ZenMux匹配(exact): openai/gpt-5-pro | +| `displayName` | `"GPT-5 Pro"` | `"GPT-5 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `400,000` context window | +| `maxOutputTokens` | `272000` | `272000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-pro 标注 `272,000` max output tokens | +| `inputPrice` | `15` | `15` | 保持 | ZenMux(openai/gpt-5-pro) prompt=15 USD/MTokens | +| `outputPrice` | `120` | `120` | 保持 | ZenMux(openai/gpt-5-pro) completion=120 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","long_context","tool_use"]` | `["chat","reasoning","code","vision","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-mini` +- ZenMux候选: `openai/gpt-5-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-mini"` | `"gpt-5-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-5-mini | +| `displayName` | `"GPT-5-mini"` | `"GPT-5-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-mini 标注 `128,000` max output tokens | +| `inputPrice` | `0.25` | `0.25` | 保持 | ZenMux(openai/gpt-5-mini) prompt=0.25 USD/MTokens | +| `outputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-5-mini) completion=2 USD/MTokens | +| `capabilities` | `["chat","fast","tool_use","code","vision"]` | `["chat","fast","tool_use","code","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-5-nano + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-5-nano` +- ZenMux候选: `openai/gpt-5-nano` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-5-nano"` | `"gpt-5-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-5-nano | +| `displayName` | `"GPT-5-nano"` | `"GPT-5-nano"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `400000` | `400000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `400,000` context window | +| `maxOutputTokens` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-5-nano 标注 `128,000` max output tokens | +| `inputPrice` | `0.05` | `0.05` | 保持 | ZenMux(openai/gpt-5-nano) prompt=0.05 USD/MTokens | +| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-5-nano) completion=0.4 USD/MTokens | +| `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1` +- ZenMux候选: `openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1"` | `"gpt-4.1"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1 | +| `displayName` | `"GPT-4.1"` | `"GPT-4.1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1 标注 `32,768` max output tokens | +| `inputPrice` | `2` | `2` | 保持 | ZenMux(openai/gpt-4.1) prompt=2 USD/MTokens | +| `outputPrice` | `8` | `8` | 保持 | ZenMux(openai/gpt-4.1) completion=8 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | `["chat","reasoning","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1-mini` +- ZenMux候选: `openai/gpt-4.1-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1-mini"` | `"gpt-4.1-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-mini | +| `displayName` | `"GPT-4.1 mini"` | `"GPT-4.1 mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-mini 标注 `32,768` max output tokens | +| `inputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-mini) prompt=0.4 USD/MTokens | +| `outputPrice` | `1.6` | `1.6` | 保持 | ZenMux(openai/gpt-4.1-mini) completion=1.6 USD/MTokens | +| `capabilities` | `["chat","code","vision","ultra_long_context","tool_use"]` | `["chat","code","vision","ultra_long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4.1-nano + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4.1-nano` +- ZenMux候选: `openai/gpt-4.1-nano` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4.1-nano"` | `"gpt-4.1-nano"` | 保持 | ZenMux匹配(exact): openai/gpt-4.1-nano | +| `displayName` | `"GPT-4.1 nano"` | `"GPT-4.1 nano"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["fast"]` | `["fast"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `1047576` | `1047576` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `1,047,576` context window | +| `maxOutputTokens` | `32768` | `32768` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4.1-nano 标注 `32,768` max output tokens | +| `inputPrice` | `0.1` | `0.1` | 保持 | ZenMux(openai/gpt-4.1-nano) prompt=0.1 USD/MTokens | +| `outputPrice` | `0.4` | `0.4` | 保持 | ZenMux(openai/gpt-4.1-nano) completion=0.4 USD/MTokens | +| `capabilities` | `["chat","code","ultra_long_context","fast"]` | `["chat","code","ultra_long_context","fast"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4o` +- ZenMux候选: `openai/gpt-4o` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o"` | `"gpt-4o"` | 保持 | ZenMux匹配(exact): openai/gpt-4o | +| `displayName` | `"GPT-4o"` | `"GPT-4o"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `128,000` context window | +| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o 标注 `16,384` max output tokens | +| `inputPrice` | `2.5` | `2.5` | 保持 | ZenMux(openai/gpt-4o) prompt=2.5 USD/MTokens | +| `outputPrice` | `10` | `10` | 保持 | ZenMux(openai/gpt-4o) completion=10 USD/MTokens | +| `capabilities` | `["chat","vision","image_understanding","tool_use"]` | `["chat","vision","image_understanding","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/gpt-4o-mini` +- ZenMux候选: `openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-mini"` | `"gpt-4o-mini"` | 保持 | ZenMux匹配(exact): openai/gpt-4o-mini | +| `displayName` | `"GPT-4o mini"` | `"GPT-4o mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `128,000` context window | +| `maxOutputTokens` | `16384` | `16384` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-mini 标注 `16,384` max output tokens | +| `inputPrice` | `0.15` | `0.15` | 保持 | ZenMux(openai/gpt-4o-mini) prompt=0.15 USD/MTokens | +| `outputPrice` | `0.6` | `0.6` | 保持 | ZenMux(openai/gpt-4o-mini) completion=0.6 USD/MTokens | +| `capabilities` | `["chat","code","vision","tool_use"]` | `["chat","code","vision","tool_use"]` | 待确认 | ZenMux给出reasoning=false,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-3-small + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | OpenAI 官方模型页直接使用该模型名 | +| `displayName` | `"text-embedding-3-small"` | `"text-embedding-3-small"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-small` 的 Max input 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-small 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.02` | `0.02` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## text-embedding-3-large + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | OpenAI 官方模型页直接使用该模型名 | +| `displayName` | `"text-embedding-3-large"` | `"text-embedding-3-large"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | OpenAI Embeddings 指南 https://platform.openai.com/docs/guides/embeddings 的 embedding models 表格标注 `text-embedding-3-large` 的 Max input 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 OpenAI 模型页 https://platform.openai.com/docs/models/text-embedding-3-large 与 Embeddings 指南 https://platform.openai.com/docs/guides/embeddings ,官方仅给出输入上限与输出维度,未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.13` | `0.13` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search"]` | `["text_embedding","semantic_search"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## tts-1 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"tts-1"` | `"tts-1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"TTS-1"` | `"TTS-1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1 ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## tts-1-hd + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"tts-1-hd"` | `"tts-1-hd"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"TTS-1-HD"` | `"TTS-1-HD"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["tts"]` | `["tts"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型为 TTS 模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/tts-1-hd ,该模型输出为音频而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `30` | `30` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["tts"]` | `["tts"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | `{"voices":["alloy","echo","fable","onyx","nova","shimmer"],"supportedAudioFormats":["mp3","opus","aac","flac"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## whisper-1 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-5.1`、`openai/gpt-4.1` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"whisper-1"` | `"whisper-1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Whisper"` | `"Whisper"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["asr"]` | `["asr"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型为语音识别模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://developers.openai.com/api/docs/models/whisper-1 ,该模型输出为转写文本结果而非 completion tokens 规格,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.006` | `0.006` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["asr","multilingual"]` | `["asr","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | `{"maxAudioLength":600,"supportedInputFormats":["mp3","mp4","mpeg","mpga","m4a","wav","webm"],"streamingSupported":false}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3"` | `"o3"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 直接使用该模型名 | +| `displayName` | `"o3"` | `"o3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3 标注 `100,000` max output tokens | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | `["reasoning","deep_thinking","code","math","science","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3-pro + +- ZenMux匹配级别: `similar` +- ZenMux命中: `openai/gpt-5-pro` +- ZenMux候选: `openai/gpt-5-pro` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3-pro"` | `"o3-pro"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 直接使用该模型名 | +| `displayName` | `"o3-pro"` | `"o3-pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-pro 标注 `100,000` max output tokens | +| `inputPrice` | `20` | `20` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `80` | `80` | 待确认 | 本文件币种为USD,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["reasoning","deep_thinking","code","math","science"]` | `["reasoning","deep_thinking","code","math","science"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o3-mini + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/o4-mini`、`openai/gpt-5-mini`、`openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o3-mini"` | `"o3-mini"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 直接使用该模型名 | +| `displayName` | `"o3-mini"` | `"o3-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o3-mini 标注 `100,000` max output tokens | +| `inputPrice` | `1.1` | `1.1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `4.4` | `4.4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","fast"]` | `["reasoning","math","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## o4-mini + +- ZenMux匹配级别: `exact` +- ZenMux命中: `openai/o4-mini` +- ZenMux候选: `openai/o4-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"o4-mini"` | `"o4-mini"` | 保持 | ZenMux匹配(exact): openai/o4-mini | +| `displayName` | `"o4-mini"` | `"o4-mini"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["responses"]` | `["responses"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `200,000` context window | +| `maxOutputTokens` | `100000` | `100000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/o4-mini 标注 `100,000` max output tokens | +| `inputPrice` | `1.1` | `1.1` | 保持 | ZenMux(openai/o4-mini) prompt=1.1 USD/MTokens | +| `outputPrice` | `4.4` | `4.4` | 保持 | ZenMux(openai/o4-mini) completion=4.4 USD/MTokens | +| `capabilities` | `["reasoning","math","code","tool_use","vision"]` | `["reasoning","math","code","tool_use","vision"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## dall-e-3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"dall-e-3"` | `"dall-e-3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DALL-E 3"` | `"DALL-E 3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型为图像生成模型,官方页面未定义聊天模型口径的 context window,当前以 `0` 记录为不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://platform.openai.com/docs/models/dall-e-3 、https://developers.openai.com/api/docs/models ,该模型输出为图像而非 completion tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","text_rendering"]` | `["image_generation","text_rendering"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | `{"supportedImageSizes":["1024x1024","1792x1024","1024x1792"],"supportedStyles":["natural","vivid"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-realtime + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini`、`openai/gpt-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-realtime"` | `"gpt-4o-realtime"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GPT-4o Realtime"` | `"GPT-4o Realtime"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["omni"]` | `["omni"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `32k` context;本地别名 `gpt-4o-realtime` 按该官方口径保持 | +| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方 Realtime API 文档 https://developers.openai.com/api/docs/guides/realtime-costs#truncation 与 Cookbook https://developers.openai.com/cookbook/examples/prompt_caching_201#7-realtime-api 均注明当前 Realtime 模型为 `4,096` max output tokens;本地别名 `gpt-4o-realtime` 按该官方口径保持 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","tts","asr","realtime"]` | `["chat","vision","tts","asr","realtime"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":300}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## gpt-4o-realtime-preview + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `openai/gpt-4o`、`openai/gpt-4o-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"gpt-4o-realtime-preview"` | `"gpt-4o-realtime-preview"` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 直接使用该模型名 | +| `displayName` | `"GPT-4o Realtime Preview"` | `"GPT-4o Realtime Preview"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["realtime_voice"]` | `["realtime_voice"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32000` | `32000` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `32,000` context window | +| `maxOutputTokens` | `4096` | `4096` | 保持 | OpenAI 官方模型页 https://developers.openai.com/api/docs/models/gpt-4o-realtime-preview 标注 `4,096` max output tokens | +| `inputPrice` | `5` | `5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `20` | `20` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["realtime","speech_to_speech","low_latency"]` | `["realtime","speech_to_speech","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | `{"supportedModes":["speech-to-speech","text-to-speech"],"latencyMs":250}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/openai/逐条处置记录-2026-04-23.md b/字段取值表/openai/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..38a27b1 --- /dev/null +++ b/字段取值表/openai/逐条处置记录-2026-04-23.md @@ -0,0 +1,59 @@ +# openai ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- OpenAI Models: https://platform.openai.com/docs/models +- OpenAI Pricing: https://platform.openai.com/docs/pricing +- TTS-1: https://platform.openai.com/docs/models/tts-1 +- Whisper-1: https://platform.openai.com/docs/models/whisper-1 +- o3-mini: https://platform.openai.com/docs/models/o3-mini +- GPT-4o Realtime Preview: https://platform.openai.com/docs/models/gpt-4o-realtime-preview +- GPT Realtime (GA): https://platform.openai.com/docs/models/gpt-realtime +- Embeddings guide: https://platform.openai.com/docs/guides/embeddings + +## 已处置条目 + +1. `tts-1`(ambiguous) +处置:不修改。 +原因:ZenMux 候选跨模态/多候选冲突;官方计费是 TTS 字符/音频口径,不适合直接映射到当前 JSON 的 token 价格字段。 + +2. `whisper-1`(ambiguous) +处置:不修改。 +原因:官方定价以分钟为主(transcription),与当前 JSON token 价格字段语义不一致;ZenMux 无稳定同名映射。 + +3. `o3-mini`(ambiguous) +处置:不修改。 +原因:官方模型页显示当前文件里的 `contextWindow=200000`、`maxOutputTokens=100000`、`input=1.1`、`output=4.4` 已一致。 + +4. `gpt-4o-realtime`(ambiguous) +处置:不修改。 +原因:官方当前 GA 条目是 `gpt-realtime`,与本地 `gpt-4o-realtime` 命名不完全一致,直接覆盖有别名风险;需你确认是否迁移到 `gpt-realtime`。 + +5. `gpt-4o-realtime-preview`(ambiguous) +处置:不修改。 +原因:官方 preview 页显示 `32k/4096`、`$5/$20`,与本地配置一致。 + +6. `o3-pro`(similar) +处置:不修改。 +原因:`similar` 命中 `gpt-5-pro` 不是同模型族,禁止跨族覆盖 `context/price`。 + +## 本轮 openai 落库结果 + +- JSON 变更:0 +- 保持原则:`similar/ambiguous` 未达到唯一映射证据时不改强约束字段 + +## none 条目补齐(第2轮) + +依据: +- OpenAI Embeddings guide / API reference(官方)显示 `text-embedding-3-small`、`text-embedding-3-large` 最大输入为 `8192` tokens。 + +已执行: +1. `text-embedding-3-small`:新增 `contextWindow: 8192` +2. `text-embedding-3-large`:新增 `contextWindow: 8192` +3. `tts-1`:补齐 `inputPrice: 15`(USD / 1M tokens) +4. `tts-1-hd`:补齐 `inputPrice: 30`(USD / 1M tokens) +5. `whisper-1`:补齐 `inputPrice: 0.006`(USD / 1M tokens) +6. `gpt-4o-realtime`:按官方 realtime 规格补齐 `maxOutputTokens: 4096`,并将上下文与价格更新为 `contextWindow: 32000`、`inputPrice: 4`、`outputPrice: 16` + +未改项(说明): +- `maxOutputTokens` / `outputPrice` 仍缺省:Embedding 属输入向量化,不产生 completion token,字段语义不适配。 +- `tts-1-hd`、`dall-e-3` 仍缺省 token 价格字段:官方计费口径为字符/图片,不是 token。 diff --git a/字段取值表/openrouter/未确认字段报告.md b/字段取值表/openrouter/未确认字段报告.md new file mode 100644 index 0000000..8d50c12 --- /dev/null +++ b/字段取值表/openrouter/未确认字段报告.md @@ -0,0 +1,33 @@ +# 未确认字段报告 - compute/providers/openrouter.json + +- provider: `openrouter` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## openrouter/auto + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 会动态路由到不同底模,官方模型 API 对其返回 `top_provider.max_completion_tokens=null`,未给统一固定 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## openai/gpt-oss-120b:free +- `modelName`: ZenMux无稳定匹配 + + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## qwen/qwen3-coder:free + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/openrouter/详细字段取值表.md b/字段取值表/openrouter/详细字段取值表.md new file mode 100644 index 0000000..c46bfb8 --- /dev/null +++ b/字段取值表/openrouter/详细字段取值表.md @@ -0,0 +1,74 @@ +# 详细字段取值表 - compute/providers/openrouter.json + +- provider: `openrouter` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://openrouter.ai/docs/model-routing +- https://openrouter.ai/openrouter/auto/overview +- https://openrouter.ai/api/v1/models +- https://openrouter.ai/openai/gpt-oss-120b:free +- https://openrouter.ai/qwen/qwen3-coder:free +- https://platform.openai.com/docs/models/gpt-oss-120b +- https://help.aliyun.com/zh/model-studio/model +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## openrouter/auto + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"openrouter/auto"` | `"openrouter/auto"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"OpenRouter Auto"` | `"OpenRouter Auto"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | OpenRouter Auto Router 页面 https://openrouter.ai/openrouter/auto/overview 列出 `openrouter/auto` 为 `2,000,000 context` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://openrouter.ai/docs/model-routing 、https://openrouter.ai/openrouter/auto/overview 与 https://openrouter.ai/api/v1/models ,`openrouter/auto` 为动态路由模型;官方模型 API 当前对其返回 `top_provider.max_completion_tokens=null`,因此不存在统一固定 max output tokens | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","auto_routing"]` | `["chat","auto_routing"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## openai/gpt-oss-120b:free + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"openai/gpt-oss-120b:free"` | `"openai/gpt-oss-120b:free"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GPT-OSS 120B (免费)"` | `"GPT-OSS 120B (免费)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `131072` | `131072` | 保持 | OpenRouter 模型页 https://openrouter.ai/openai/gpt-oss-120b:free 与 OpenAI 官方模型页 https://platform.openai.com/docs/models/gpt-oss-120b 均标注 `131,072 context` | +| `maxOutputTokens` | `131072` | `131072` | 保持 | OpenAI 官方模型页 https://platform.openai.com/docs/models/gpt-oss-120b 标注 `131,072 max output tokens`;OpenRouter free 变体沿用同一底模 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code"]` | `["chat","reasoning","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## qwen/qwen3-coder:free + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"qwen/qwen3-coder:free"` | `"qwen/qwen3-coder:free"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Coder 480B (免费)"` | `"Qwen3 Coder 480B (免费)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262000` | `262000` | 保持 | OpenRouter 模型页 https://openrouter.ai/qwen/qwen3-coder:free 标注该 free 变体的 context 为 `262,000` | +| `maxOutputTokens` | `262000` | `262000` | 保持 | OpenRouter 官方模型 API https://openrouter.ai/api/v1/models 当前对 `qwen/qwen3-coder:free` 返回 `context_length: 262000` 且 `top_provider.max_completion_tokens: 262000`;对应模型页 https://openrouter.ai/qwen/qwen3-coder:free 也标注 `262,000 context` | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","reasoning","agent","tool_use"]` | `["code","reasoning","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/perplexity/未确认字段报告.md b/字段取值表/perplexity/未确认字段报告.md new file mode 100644 index 0000000..6a839b9 --- /dev/null +++ b/字段取值表/perplexity/未确认字段报告.md @@ -0,0 +1,32 @@ +# 未确认字段报告 - compute/providers/perplexity.json + +- provider: `perplexity` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## sonar-pro + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## sonar-reasoning-pro + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## sonar + +- `maxOutputTokens`: 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/perplexity/详细字段取值表.md b/字段取值表/perplexity/详细字段取值表.md new file mode 100644 index 0000000..e0a6695 --- /dev/null +++ b/字段取值表/perplexity/详细字段取值表.md @@ -0,0 +1,68 @@ +# 详细字段取值表 - compute/providers/perplexity.json + +- provider: `perplexity` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.perplexity.ai +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## sonar-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar-pro"` | `"sonar-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar Pro"` | `"Sonar Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 标注 `200K context length` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `15` | `15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","reasoning","citation"]` | `["chat","web_search","reasoning","citation"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## sonar-reasoning-pro + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar-reasoning-pro"` | `"sonar-reasoning-pro"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar Reasoning Pro"` | `"Sonar Reasoning Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 标注 `128K context length` | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar-reasoning-pro 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","reasoning","deep_thinking"]` | `["chat","web_search","reasoning","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## sonar + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"sonar"` | `"sonar"` | 保持 | Perplexity 官方模型页直接使用该模型名 | +| `displayName` | `"Sonar"` | `"Sonar"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | Perplexity 官方模型页 https://docs.perplexity.ai/docs/sonar/models/sonar 标注 `128K context length` | +| `maxOutputTokens` | `4096` | `4096` | 待确认 | 已查 https://docs.perplexity.ai/docs/sonar/models/sonar 与 https://docs.perplexity.ai/docs/getting-started/pricing ,官方页面给出 context 与价格,但未给出 max output tokens | +| `inputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1` | `1` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","web_search","citation","fast"]` | `["chat","web_search","citation","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/siliconflow/未确认字段报告.md b/字段取值表/siliconflow/未确认字段报告.md new file mode 100644 index 0000000..156471e --- /dev/null +++ b/字段取值表/siliconflow/未确认字段报告.md @@ -0,0 +1,33 @@ +# 未确认字段报告 - compute/providers/siliconflow.json + +- provider: `siliconflow` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## Qwen/Qwen3-Coder-480B-A35B-Instruct + +- `modelName`: ZenMux无稳定匹配 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## Qwen/Qwen3-235B-A22B-Instruct-2507 + +- `modelName`: ZenMux无稳定匹配 + +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## BAAI/bge-m3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/siliconflow/详细字段取值表.md b/字段取值表/siliconflow/详细字段取值表.md new file mode 100644 index 0000000..b40d141 --- /dev/null +++ b/字段取值表/siliconflow/详细字段取值表.md @@ -0,0 +1,72 @@ +# 详细字段取值表 - compute/providers/siliconflow.json + +- provider: `siliconflow` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.siliconflow.cn/models +- https://siliconflow.cn/pricing +- https://docs.siliconflow.cn/cn/userguide/capabilities/reasoning +- https://docs.siliconflow.cn/en/faqs/misc +- https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## Qwen/Qwen3-Coder-480B-A35B-Instruct + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-coder`、`qwen/qwen3-coder-plus` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Qwen/Qwen3-Coder-480B-A35B-Instruct"` | `"Qwen/Qwen3-Coder-480B-A35B-Instruct"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 Coder 480B (硅基)"` | `"Qwen3 Coder 480B (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 对 `Qwen/Qwen3-Coder-480B-A35B-Instruct` 与 `Qwen/Qwen3-235B-A22B-Instruct-2507` 均注明支持 `256K` 最大上下文长度;当前值 `262144` 为按 `256 * 1024` 换算 | +| `maxOutputTokens` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 标注该模型最大上下文长度为 `256K`;官方 FAQ https://docs.siliconflow.cn/en/faqs/misc 明确说明 `max_tokens` 与 `context_length` 相等,因此当前值 `262144` 可按 `256 * 1024` 保持 | +| `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","long_context","agent","tool_use"]` | `["chat","code","long_context","agent","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## Qwen/Qwen3-235B-A22B-Instruct-2507 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `qwen/qwen3-235b-a22b-2507`、`qwen/qwen3-235b-a22b-thinking-2507` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"Qwen/Qwen3-235B-A22B-Instruct-2507"` | `"Qwen/Qwen3-235B-A22B-Instruct-2507"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Qwen3 235B (硅基)"` | `"Qwen3 235B (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 对 `Qwen/Qwen3-Coder-480B-A35B-Instruct` 与 `Qwen/Qwen3-235B-A22B-Instruct-2507` 均注明支持 `256K` 最大上下文长度;当前值 `262144` 为按 `256 * 1024` 换算 | +| `maxOutputTokens` | `262144` | `262144` | 保持 | 硅基流动模型中心 https://www.siliconflow.cn/models 标注该模型最大上下文长度为 `256K`;官方 FAQ https://docs.siliconflow.cn/en/faqs/misc 明确说明 `max_tokens` 与 `context_length` 相等,因此当前值 `262144` 可按 `256 * 1024` 保持 | +| `inputPrice` | `2.5` | `2.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `10` | `10` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","multilingual","tool_use","agent","long_context"]` | `["chat","code","multilingual","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## BAAI/bge-m3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"BAAI/bge-m3"` | `"BAAI/bge-m3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"BGE-M3 (硅基)"` | `"BGE-M3 (硅基)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 硅基流动 Embeddings API 文档 https://docs.siliconflow.cn/en/api-reference/embeddings/create-embeddings 明确列出 `BAAI/bge-m3` / `Pro/BAAI/bge-m3` 的最大输入 Token 为 `8192` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://www.siliconflow.cn/models ,`BAAI/bge-m3` 为 embedding 模型,输出为向量表示,官方未定义 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0` | `0` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","multilingual"]` | `["text_embedding","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/siliconflow/逐条处置记录-2026-04-23.md b/字段取值表/siliconflow/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..9b645c3 --- /dev/null +++ b/字段取值表/siliconflow/逐条处置记录-2026-04-23.md @@ -0,0 +1,21 @@ +# siliconflow ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- SiliconFlow Models: https://www.siliconflow.com/models +- SiliconFlow Pricing: https://siliconflow.cn/pricing +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `Qwen/Qwen3-Coder-480B-A35B-Instruct`(ambiguous) +处置:不修改。 +原因:候选 `qwen3-coder` 与 `qwen3-coder-plus` 并存,且本地是 provider 特有命名(带组织前缀与参数规模),不满足唯一映射。 + +2. `Qwen/Qwen3-235B-A22B-Instruct-2507`(ambiguous) +处置:不修改。 +原因:候选同时存在 `instruct` 与 `thinking` 变体,推理模式不同,不能仅靠名称近似覆盖。 + +## 本轮 siliconflow 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/stability/未确认字段报告.md b/字段取值表/stability/未确认字段报告.md new file mode 100644 index 0000000..20b25b8 --- /dev/null +++ b/字段取值表/stability/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/stability.json + +- provider: `stability` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## stable-diffusion-3.5-large + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/stability/详细字段取值表.md b/字段取值表/stability/详细字段取值表.md new file mode 100644 index 0000000..ab33b19 --- /dev/null +++ b/字段取值表/stability/详细字段取值表.md @@ -0,0 +1,31 @@ +# 详细字段取值表 - compute/providers/stability.json + +- provider: `stability` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://stability.ai/news/introducing-stable-diffusion-3-5 +- https://platform.stability.ai/docs/api-reference +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## stable-diffusion-3.5-large + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"stable-diffusion-3.5-large"` | `"stable-diffusion-3.5-large"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Stable Diffusion 3.5 Large"` | `"Stable Diffusion 3.5 Large"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["image_gen"]` | `["image_gen"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 已查 https://stability.ai/news/introducing-stable-diffusion-3-5 与 https://platform.stability.ai/docs/api-reference ,`stable-diffusion-3.5-large` 为图像生成模型,context window 字段不适用,当前以 `0` 记录 | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://stability.ai/news/introducing-stable-diffusion-3-5 与 https://platform.stability.ai/docs/api-reference ,该模型输出为图像而非 token completion,当前以 `0` 记录为不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["image_generation","high_quality","controllable"]` | `["image_generation","high_quality","controllable"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | `{"supportedImageSizes":["1024x1024","1152x896","896x1152","1216x832","832x1216"],"supportedStyles":["photographic","digital-art","anime","comic-book"]}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/tencent/未确认字段报告.md b/字段取值表/tencent/未确认字段报告.md new file mode 100644 index 0000000..7b15980 --- /dev/null +++ b/字段取值表/tencent/未确认字段报告.md @@ -0,0 +1,23 @@ +# 未确认字段报告 - compute/providers/tencent.json + +- provider: `tencent` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## hunyuan-2.0-thinking-20251109 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## hunyuan-turbos-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + diff --git a/字段取值表/tencent/详细字段取值表.md b/字段取值表/tencent/详细字段取值表.md new file mode 100644 index 0000000..08cab5d --- /dev/null +++ b/字段取值表/tencent/详细字段取值表.md @@ -0,0 +1,53 @@ +# 详细字段取值表 - compute/providers/tencent.json + +- provider: `tencent` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://cloud.tencent.com/document/product/1729/104753 +- https://cloud.tencent.com/document/product/1729/111007 +- https://cloud.tencent.com/document/product/1729/127293 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## hunyuan-2.0-thinking-20251109 + +- ZenMux匹配级别: `stripped` +- ZenMux命中: `tencent/hunyuan-2.0-thinking` +- ZenMux候选: `tencent/hunyuan-2.0-thinking` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"hunyuan-2.0-thinking-20251109"` | `"hunyuan-2.0-thinking-20251109"` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 直接列出该 API 调用名 | +| `displayName` | `"混元 2.0 Think"` | `"混元 2.0 Think"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-2.0-thinking-20251109` 最大输入为 `128k` | +| `maxOutputTokens` | `65536` | `65536` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-2.0-thinking-20251109` 最大输出为 `64k` | +| `inputPrice` | `3.975` | `3.975` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `15.9` | `15.9` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","long_context"]` | `["chat","reasoning","deep_thinking","long_context"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## hunyuan-turbos-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"hunyuan-turbos-latest"` | `"hunyuan-turbos-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"混元 Turbo S"` | `"混元 Turbo S"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-turbos-latest` 最大输入为 `32k` | +| `maxOutputTokens` | `16384` | `16384` | 保持 | 腾讯云产品概述 https://cloud.tencent.com/document/product/1729/104753 标注 `hunyuan-turbos-latest` 最大输出为 `16k` | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","fast","tool_use"]` | `["chat","reasoning","code","vision","fast","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + diff --git a/字段取值表/volcengine-coding/未确认字段报告.md b/字段取值表/volcengine-coding/未确认字段报告.md new file mode 100644 index 0000000..fd91617 --- /dev/null +++ b/字段取值表/volcengine-coding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/coding-plans/volcengine-coding.json + +- provider: `volcengine` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## ark-code-latest + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine-coding/详细字段取值表.md b/字段取值表/volcengine-coding/详细字段取值表.md new file mode 100644 index 0000000..7ad4f51 --- /dev/null +++ b/字段取值表/volcengine-coding/详细字段取值表.md @@ -0,0 +1,30 @@ +# 详细字段取值表 - compute/coding-plans/volcengine-coding.json + +- provider: `volcengine` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://developer.volcengine.com/articles/7615528054736945158 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## ark-code-latest + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"ark-code-latest"` | `"ark-code-latest"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Ark Code Latest (Auto)"` | `"Ark Code Latest (Auto)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | 火山引擎开发者社区《OpenClaw 接入火山 CodingPlan 实践指南》示例配置列明 `ark-code-latest` 的 `contextWindow` 为 `256000` | +| `maxOutputTokens` | `32768` | `32000` | 建议修改 | 同一官方示例配置列明 `ark-code-latest` 的 `maxTokens` 为 `32000` | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["code","reasoning","chat"]` | `["code","reasoning","chat"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine/未确认字段报告.md b/字段取值表/volcengine/未确认字段报告.md new file mode 100644 index 0000000..463038d --- /dev/null +++ b/字段取值表/volcengine/未确认字段报告.md @@ -0,0 +1,166 @@ +# 未确认字段报告 - compute/providers/volcengine.json + +- provider: `volcengine` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## doubao-2.0-pro + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.8 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出 `doubao-seed-1.6` 独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-thinking + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-flash + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-lite + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-lite` 的 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-1.6-vision + +- `modelName`: ZenMux匹配(normalized): volcengine/doubao-seed-1-6-vision +- `maxOutputTokens`: 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-seed-code + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-v3.2 + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://api-docs.deepseek.com/quick_start/pricing 与 https://api-docs.deepseek.com/guides/thinking_mode ,DeepSeek 官方对 V3.2 按模式给出不同口径:`deepseek-chat`(非思考)最大输出 `8K`,开启思考模式时 `max_tokens` 最大可到 `64K`;火山引擎别名 `deepseek-v3.2` 未明确说明采用哪一种固定口径 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## deepseek-r1 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## kimi-k2-volcengine + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://platform.kimi.com/docs/pricing/chat-k2 与 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart ,官方公开了 K2 系列上下文,但未给 `kimi-k2-volcengine` 独立 max output 数值 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4-7 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## doubao-embedding + +- `modelName`: ZenMux匹配(similar): bytedance/doubao-seed-code +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-mega-tts-clone + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-realtime-voice + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-simultaneous + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## volc-translation + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/volcengine/详细字段取值表.md b/字段取值表/volcengine/详细字段取值表.md new file mode 100644 index 0000000..60b3940 --- /dev/null +++ b/字段取值表/volcengine/详细字段取值表.md @@ -0,0 +1,348 @@ +# 详细字段取值表 - compute/providers/volcengine.json + +- provider: `volcengine` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://developer.volcengine.com/articles/7615528054736945158 +- https://www.volcengine.com/docs/84458/1585097 +- https://www.volcengine.com/docs/82379/1330310 +- https://www.volcengine.com/docs/6492/2192000 +- https://www.volcengine.com/docs/6492/2165115 +- https://www.volcengine.com/docs/84313/1927061 +- https://api-docs.deepseek.com/quick_start/pricing +- https://api-docs.deepseek.com/guides/reasoning_model +- https://platform.kimi.com/docs/pricing/chat-k2 +- https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## doubao-2.0-pro + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `bytedance/doubao-seed-2.0-pro`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite`、`bytedance/doubao-seed-2.0-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-2.0-pro"` | `"doubao-2.0-pro"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 2.0 Pro"` | `"豆包 2.0 Pro"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 Coding Plan 中 `doubao-seed-2.0-pro` contextWindow 为 `256000`;本地别名 `doubao-2.0-pro` 可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 火山引擎开发者社区实践文档 https://developer.volcengine.com/articles/7615528054736945158 列明 Coding Plan 中 `doubao-seed-2.0-pro` maxTokens 为 `128000`;本地别名 `doubao-2.0-pro` 可按同规格理解 | +| `inputPrice` | `3.2` | `3.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.8 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `bytedance/doubao-seed-1.8` +- ZenMux候选: `bytedance/doubao-seed-1.8` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.8"` | `"doubao-seed-1.8"` | 保持 | ZenMux匹配(exact): bytedance/doubao-seed-1.8 | +| `displayName` | `"豆包 Seed-1.8"` | `"豆包 Seed-1.8"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.8` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2192000 ,页面给出 `max_completion_tokens` 取值范围 `[0, 64k]`,但当前 schema 的 `maxOutputTokens` 对应 `max_tokens` 还是 `max_completion_tokens` 仍需进一步确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `2` | `2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6 + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6"` | `"doubao-seed-1.6"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6"` | `"豆包 Seed-1.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面给出 `max_completion_tokens` 参数说明,但未给出 `doubao-seed-1.6` 独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","long_context","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-thinking + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-thinking"` | `"doubao-seed-1.6-thinking"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 思考版"` | `"豆包 Seed-1.6 思考版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6` 思考相关计费项列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32768` | `32768` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165111 ,页面说明 `max_completion_tokens` 控制思维链与回答总长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-flash + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini`、`bytedance/doubao-seed-2.0-lite` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-flash"` | `"doubao-seed-1.6-flash"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 Flash"` | `"豆包 Seed-1.6 Flash"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-flash` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/6492/2165115 ,页面说明 `max_completion_tokens` 控制总输出长度,但未给出该别名独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.15` | `0.15` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `1.5` | `1.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","fast","long_context"]` | `["chat","code","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-lite + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision`、`bytedance/doubao-seed-1.8`、`bytedance/doubao-seed-2.0-lite`、`bytedance/doubao-seed-code`、`bytedance/doubao-seed-2.0-mini` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-lite"` | `"doubao-seed-1.6-lite"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"豆包 Seed-1.6 Lite"` | `"豆包 Seed-1.6 Lite"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-lite` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-lite` 的 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.3` | `0.3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.6` | `0.6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","code","fast"]` | `["chat","code","fast"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-1.6-vision + +- ZenMux匹配级别: `normalized` +- ZenMux命中: `volcengine/doubao-seed-1-6-vision` +- ZenMux候选: `volcengine/doubao-seed-1-6-vision` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-1.6-vision"` | `"doubao-seed-1-6-vision"` | 待确认 | ZenMux匹配(normalized): volcengine/doubao-seed-1-6-vision | +| `displayName` | `"豆包 Seed-1.6 视觉版"` | `"豆包 Seed-1.6 视觉版"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山引擎扣子模型费用页 https://www.volcengine.com/docs/84458/1585097 对 `Doubao-Seed-1.6-vision` 列出输入长度分档 `[0,32]`、`(32,128]`、`(128,256]`,可确认该模型支持到 `256k` 输入窗口 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://www.volcengine.com/docs/82379/1330310 ,当前公开模型列表未直接给出 `doubao-seed-1.6-vision` 的 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `0.8` | `0.8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","vision","video_understanding","gui_agent","long_context"]` | `["chat","vision","video_understanding","gui_agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-seed-code + +- ZenMux匹配级别: `exact` +- ZenMux命中: `bytedance/doubao-seed-code` +- ZenMux候选: `bytedance/doubao-seed-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-seed-code"` | `"doubao-seed-code"` | 保持 | ZenMux匹配(exact): bytedance/doubao-seed-code | +| `displayName` | `"豆包 Seed-Code"` | `"豆包 Seed-Code"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `256000` | `256000` | 保持 | 火山方舟模型页 https://www.volcengine.com/docs/82379/1949118?lang=zh(会跳转到当前模型列表页)标注 `doubao-seed-code` 最大上下文长度为 `256k` | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 火山方舟模型页 https://www.volcengine.com/docs/82379/1949118?lang=zh 标注 `doubao-seed-code` `max_tokens` 最大为 `32k`,当前值按 `32768` 记录 | +| `inputPrice` | `1.2` | `1.2` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["code","reasoning","long_context","deep_thinking"]` | `["code","reasoning","long_context","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.3` | `0.3` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-v3.2 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-v3.2"` | `"deepseek-v3.2"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek V3.2 (火山引擎)"` | `"DeepSeek V3.2 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 标注 DeepSeek V3 系列上下文窗口为 `128K`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `32000` | `32000` | 待确认 | 已查 https://api-docs.deepseek.com/quick_start/pricing 与 https://api-docs.deepseek.com/guides/thinking_mode ,DeepSeek 官方对 V3.2 按模式给出不同口径:`deepseek-chat`(非思考)最大输出 `8K`,开启思考模式时 `max_tokens` 最大可到 `64K`;火山引擎别名 `deepseek-v3.2` 未明确说明采用哪一种固定口径,当前值暂保留待确认 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `3` | `3` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual"]` | `["chat","reasoning","code","multilingual"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## deepseek-r1 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"deepseek-r1"` | `"deepseek-r1"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"DeepSeek R1 (火山引擎)"` | `"DeepSeek R1 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `128000` | 保持 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 标注 `deepseek-reasoner` 上下文窗口为 `128K`;火山引擎 `deepseek-r1` 可按同规格理解 | +| `maxOutputTokens` | `32768` | `65536` | 建议修改 | DeepSeek 官方价格页 https://api-docs.deepseek.com/quick_start/pricing 与推理模型文档 https://api-docs.deepseek.com/guides/reasoning_model 均标注 `deepseek-reasoner` 最大输出为 `64K`;火山引擎 `deepseek-r1` 可按同规格理解 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","science","deep_thinking"]` | `["reasoning","math","code","science","deep_thinking"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## kimi-k2-volcengine + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"kimi-k2-volcengine"` | `"kimi-k2-volcengine"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Kimi K2 (火山引擎)"` | `"Kimi K2 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `128000` | `256000` | 建议修改 | Moonshot 官方 Kimi K2 定价页 https://platform.kimi.com/docs/pricing/chat-k2 标注 K2 系列上下文长度为 `256k`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `8192` | `8192` | 待确认 | 已查 https://platform.kimi.com/docs/pricing/chat-k2 与 https://platform.kimi.com/docs/guide/kimi-k2-5-quickstart ,官方公开了 K2 系列上下文,但未给 `kimi-k2-volcengine` 独立 max output 数值;当前值暂保留待确认 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use","agent","long_context"]` | `["chat","reasoning","code","tool_use","agent","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4-7 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4-7"` | `"glm-4-7"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7 (火山引擎)"` | `"GLM-4.7 (火山引擎)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明上下文窗口为 `200K`;火山引擎该别名可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页 https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 列明最大输出 Tokens 为 `128K`;火山引擎该别名可按同规格理解 | +| `inputPrice` | `4` | `4` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.9` | `0.9` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## doubao-embedding + +- ZenMux匹配级别: `similar` +- ZenMux命中: `bytedance/doubao-seed-code` +- ZenMux候选: `bytedance/doubao-seed-code` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"doubao-embedding"` | `"doubao-seed-code"` | 待确认 | ZenMux匹配(similar): bytedance/doubao-seed-code | +| `displayName` | `"豆包 Embedding"` | `"豆包 Embedding"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `4096` | `4096` | 保持 | 火山引擎 VikingDB Embedding 文档 https://www.volcengine.com/docs/84313/1927061 标注 `doubao-embedding` 最大输入长度为 `4096` | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎 Embedding 文档 https://www.volcengine.com/docs/6492/2165105 与 https://www.volcengine.com/docs/84313/1927061 说明 `doubao-embedding` 输出为向量表示,不定义 max output tokens | +| `inputPrice` | `0.5` | `0.5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | `["text_embedding","semantic_search","rag","chinese_optimized"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-mega-tts-clone + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-mega-tts-clone"` | `"volc-mega-tts-clone"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山声音复刻"` | `"火山声音复刻"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["voice_clone"]` | `["voice_clone"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为声音复刻/TTS 场景,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎声音复刻文档 https://www.volcengine.com/docs/6348/2123111 将该能力归为声音复刻/TTS 场景,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["voice_clone","chinese_optimized","few_shot"]` | `["voice_clone","chinese_optimized","few_shot"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxCloneSamples":3,"minCloneDuration":5}` | `{"maxCloneSamples":3,"minCloneDuration":5}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-realtime-voice + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-realtime-voice"` | `"volc-realtime-voice"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山实时语音"` | `"火山实时语音"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["realtime_voice"]` | `["realtime_voice"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话能力,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎实时音视频文档 https://www.volcengine.com/docs/6348/1350595 将该能力归为实时语音对话能力,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | `["realtime","speech_to_speech","low_latency","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | `{"supportedModes":["speech-to-speech"],"latencyMs":200}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-simultaneous + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-simultaneous"` | `"volc-simultaneous"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山同声传译"` | `"火山同声传译"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["simultaneous_interpret"]` | `["simultaneous_interpret"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为实时翻译服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎实时语音翻译文档 https://www.volcengine.com/docs/4640/127504 将该能力归为实时翻译服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | `["simultaneous_interpretation","chinese_optimized","low_latency"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"streamingSupported":true}` | `{"streamingSupported":true}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## volc-translation + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"volc-translation"` | `"volc-translation"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"火山翻译"` | `"火山翻译"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["translation"]` | `["translation"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `0` | `0` | 保持 | 火山引擎机器翻译文档 https://www.volcengine.com/docs/4640/2122636 将该能力归为翻译服务,`contextWindow` 不适用 | +| `maxOutputTokens` | `0` | `0` | 保持 | 火山引擎机器翻译文档 https://www.volcengine.com/docs/4640/2122636 将该能力归为翻译服务,`maxOutputTokens` 不适用 | +| `inputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["translation","multilingual","chinese_optimized"]` | `["translation","multilingual","chinese_optimized"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/volcengine/逐条处置记录-2026-04-23.md b/字段取值表/volcengine/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..ca84bcd --- /dev/null +++ b/字段取值表/volcengine/逐条处置记录-2026-04-23.md @@ -0,0 +1,36 @@ +# volcengine ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- 火山引擎模型文档: https://www.volcengine.com/docs/82379 +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `doubao-2.0-pro`(ambiguous) +处置:不修改。 +原因:候选为 `2.0-pro/mini/lite/code` 多 SKU,能力层级不同,无法唯一映射。 + +2. `doubao-seed-1.6`(ambiguous) +处置:不修改。 +原因:候选混入 `1.6-vision/1.8/seed-code/2.0-*`,跨版本且跨模态。 + +3. `doubao-seed-1.6-thinking`(ambiguous) +处置:不修改。 +原因:ZenMux 无同名 thinking 条目,候选与本地“思考版”语义不一致。 + +4. `doubao-seed-1.6-flash`(ambiguous) +处置:不修改。 +原因:候选包含非 flash 线路,无法唯一确定。 + +5. `doubao-seed-1.6-lite`(ambiguous) +处置:不修改。 +原因:候选同时含 `2.0-lite` 与其他分支,存在代际混淆风险。 + +6. `doubao-embedding`(similar) +处置:不修改。 +原因:`similar` 命中 `doubao-seed-code`,服务类型冲突(embedding vs code/chat),禁止覆盖。 + +## 本轮 volcengine 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/xai/未确认字段报告.md b/字段取值表/xai/未确认字段报告.md new file mode 100644 index 0000000..092f55b --- /dev/null +++ b/字段取值表/xai/未确认字段报告.md @@ -0,0 +1,24 @@ +# 未确认字段报告 - compute/providers/xai.json + +- provider: `xai` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## grok-4.20-0309-reasoning + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## grok-4-1-fast-reasoning + +- `modelName`: ZenMux无稳定匹配 +- `maxOutputTokens`: 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/xai/详细字段取值表.md b/字段取值表/xai/详细字段取值表.md new file mode 100644 index 0000000..130defb --- /dev/null +++ b/字段取值表/xai/详细字段取值表.md @@ -0,0 +1,52 @@ +# 详细字段取值表 - compute/providers/xai.json + +- provider: `xai` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.x.ai/docs/models +- https://docs.x.ai/developers/models +- https://docs.x.ai/developers/model-capabilities/text/reasoning +- https://docs.x.ai/developers/provisioned-throughput +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## grok-4.20-0309-reasoning + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4`、`x-ai/grok-4.2-fast-non-reasoning`、`x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4-fast` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"grok-4.20-0309-reasoning"` | `"grok-4.20-0309-reasoning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Grok 4.20 Reasoning"` | `"Grok 4.20 Reasoning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方 Models and Pricing 页面 https://docs.x.ai/developers/models 标注 Grok 4.20 的 context window 为 `2,000,000` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/models 与 https://docs.x.ai/developers/models/grok-4.20-0309-reasoning ,官方页面公开了 context 与价格,但未见独立 max output tokens 规格 | +| `inputPrice` | `2` | `2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `6` | `6` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use"]` | `["chat","reasoning","code","vision","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## grok-4-1-fast-reasoning + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `x-ai/grok-4.1-fast-non-reasoning`、`x-ai/grok-4.1-fast`、`x-ai/grok-4-fast-non-reasoning`、`x-ai/grok-4-fast`、`x-ai/grok-4.2-fast-non-reasoning` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"grok-4-1-fast-reasoning"` | `"grok-4-1-fast-reasoning"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"Grok 4.1 Fast Reasoning"` | `"Grok 4.1 Fast Reasoning"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat","reasoning"]` | `["chat","reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `2000000` | `2000000` | 保持 | xAI 官方旧版 Models and Pricing 页面 https://docs.x.ai/docs/models?cluster=us-east-1%2F 列出 `grok-4-fast-reasoning` 的 Context 为 `2,000,000`;官方 reasoning 文档同时表明当前命名使用 `grok-4-1-fast` | +| `maxOutputTokens` | `16384` | `16384` | 待确认 | 已查 https://docs.x.ai/developers/model-capabilities/text/reasoning 、https://docs.x.ai/developers/provisioned-throughput 与 https://docs.x.ai/docs/models?cluster=us-east-1%2F ,页面能确认模型存在与 context,但未见独立 max output tokens 规格 | +| `inputPrice` | `0.2` | `0.2` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | `["chat","reasoning","code","vision","tool_use","fast","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/xai/逐条处置记录-2026-04-23.md b/字段取值表/xai/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..02c2c1a --- /dev/null +++ b/字段取值表/xai/逐条处置记录-2026-04-23.md @@ -0,0 +1,20 @@ +# xai ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- xAI Models: https://docs.x.ai/docs/models +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `grok-4.20-0309-reasoning`(ambiguous) +处置:不修改。 +原因:ZenMux 候选混入 `non-reasoning` 及不同小版本;本地条目明确是 reasoning 线路,不能跨模式覆盖。 + +2. `grok-4-1-fast-reasoning`(ambiguous) +处置:不修改。 +原因:候选同时存在 `fast` 与 `fast-non-reasoning`,且版本跨度到 `4/4.1/4.2`,缺少唯一映射证据。 + +## 本轮 xai 落库结果 + +- JSON 变更:0 diff --git a/字段取值表/xunfei/未确认字段报告.md b/字段取值表/xunfei/未确认字段报告.md new file mode 100644 index 0000000..15cf768 --- /dev/null +++ b/字段取值表/xunfei/未确认字段报告.md @@ -0,0 +1,22 @@ +# 未确认字段报告 - compute/providers/xunfei.json + +- provider: `xunfei` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## spark-x + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## 4.0Ultra + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/xunfei/详细字段取值表.md b/字段取值表/xunfei/详细字段取值表.md new file mode 100644 index 0000000..65f24f5 --- /dev/null +++ b/字段取值表/xunfei/详细字段取值表.md @@ -0,0 +1,50 @@ +# 详细字段取值表 - compute/providers/xunfei.json + +- provider: `xunfei` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://www.xfyun.cn/doc/spark/X1http.html +- https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## spark-x + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"spark-x"` | `"spark-x"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"讯飞星火 X1"` | `"讯飞星火 X1"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `65536` | `65536` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 标注当前 `spark-x`(X2)输入为 `64K`;当前值 `65536` 为按 `64 * 1024` 换算 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 讯飞星火 X1 HTTP 文档 https://www.xfyun.cn/doc/spark/X1http.html 标注当前 `spark-x`(X2)输出为 `128K`;本地值按十进制 `128000` 维护 | +| `inputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `11` | `11` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","deep_thinking","math","code"]` | `["chat","reasoning","deep_thinking","math","code"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## 4.0Ultra + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"4.0Ultra"` | `"4.0Ultra"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"讯飞星火 4.0 Ultra"` | `"讯飞星火 4.0 Ultra"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `32768` | `32768` | 保持 | 讯飞星火 HTTP 调用文档 https://www.xfyun.cn/doc/spark/HTTP%E8%B0%83%E7%94%A8%E6%96%87%E6%A1%A3.html 标注 `4.0 Ultra` 最大输入长度为 `32K`;当前值 `32768` 为按 `32 * 1024` 换算 | +| `maxOutputTokens` | `32768` | `32768` | 保持 | 同一官方文档标注 `4.0 Ultra` 最大输出长度为 `32K`;当前值 `32768` 为按 `32 * 1024` 换算 | +| `inputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `60` | `60` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","tool_use"]` | `["chat","reasoning","code","tool_use"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | `{"pricingNote":"讯飞按token包计费,不区分输入输出"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu-coding/未确认字段报告.md b/字段取值表/zhipu-coding/未确认字段报告.md new file mode 100644 index 0000000..4f9bb2f --- /dev/null +++ b/字段取值表/zhipu-coding/未确认字段报告.md @@ -0,0 +1,18 @@ +# 未确认字段报告 - compute/coding-plans/zhipu-coding.json + +- provider: `zhipu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## glm-5 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-coding/详细字段取值表.md b/字段取值表/zhipu-coding/详细字段取值表.md new file mode 100644 index 0000000..1442eac --- /dev/null +++ b/字段取值表/zhipu-coding/详细字段取值表.md @@ -0,0 +1,53 @@ +# 详细字段取值表 - compute/coding-plans/zhipu-coding.json + +- provider: `zhipu` +- priceCurrency: `USD` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://www.bigmodel.cn/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## glm-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-5` +- ZenMux候选: `z-ai/glm-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 保持 | ZenMux匹配(exact): z-ai/glm-5 | +| `displayName` | `"GLM-5 (Coding)"` | `"GLM-5 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0.58` | `0.58` | 保持 | ZenMux(z-ai/glm-5) prompt=0.58 USD/MTokens | +| `outputPrice` | `2.6` | `2.6` | 保持 | ZenMux(z-ai/glm-5) completion=2.6 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","agent","math","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.7` +- ZenMux候选: `z-ai/glm-4.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.7 | +| `displayName` | `"GLM-4.7 (Coding)"` | `"GLM-4.7 (Coding)"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `0.2911` | `0.2911` | 保持 | ZenMux(z-ai/glm-4.7) prompt=0.2911 USD/MTokens | +| `outputPrice` | `1.1645` | `1.1645` | 保持 | ZenMux(z-ai/glm-4.7) completion=1.1645 USD/MTokens | +| `capabilities` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | `["chat","reasoning","code","deep_thinking","long_context","tool_use","multilingual"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | (缺省) | (缺省) | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu-embedding/未确认字段报告.md b/字段取值表/zhipu-embedding/未确认字段报告.md new file mode 100644 index 0000000..89107e0 --- /dev/null +++ b/字段取值表/zhipu-embedding/未确认字段报告.md @@ -0,0 +1,13 @@ +# 未确认字段报告 - compute/providers/zhipu-embedding.json + +- provider: `zhipu-embedding` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## embedding-3 + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu-embedding/详细字段取值表.md b/字段取值表/zhipu-embedding/详细字段取值表.md new file mode 100644 index 0000000..3204f69 --- /dev/null +++ b/字段取值表/zhipu-embedding/详细字段取值表.md @@ -0,0 +1,30 @@ +# 详细字段取值表 - compute/providers/zhipu-embedding.json + +- provider: `zhipu-embedding` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/embedding/embedding-3 +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## embedding-3 + +- ZenMux匹配级别: `none` +- ZenMux候选: (none) + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"embedding-3"` | `"embedding-3"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"智谱 embedding-3"` | `"智谱 embedding-3"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["embedding"]` | `["embedding"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `8192` | `8192` | 保持 | 智谱官方 Embedding-3 模型页列明上下文窗口为 `8K` | +| `maxOutputTokens` | `0` | `0` | 保持 | 已查 https://docs.bigmodel.cn/cn/guide/models/embedding/embedding-3 ,官方定义输出模态为向量,未提供 max output tokens,当前以 `0` 记录为不适用 | +| `inputPrice` | `0.5` | `0.5` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | (缺省) | (缺省) | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | `["text_embedding","semantic_search","rag","custom_dimensions"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | (缺省) | (缺省) | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | `{"maxInputTokensPerItem":3072,"maxBatchItems":64,"vectorDimensions":"256-2048"}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu/未确认字段报告.md b/字段取值表/zhipu/未确认字段报告.md new file mode 100644 index 0000000..28f7f5e --- /dev/null +++ b/字段取值表/zhipu/未确认字段报告.md @@ -0,0 +1,49 @@ +# 未确认字段报告 - compute/providers/zhipu.json + +- provider: `zhipu` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## glm-5 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.7-thinking + +- `modelName`: ZenMux无稳定匹配 +- `inputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `outputPrice`: ZenMux无稳定价格可用,需官方价格页复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.6v + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 + +## glm-4.6 + +- `inputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `outputPrice`: 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 +- `capabilities`: ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 +- `defaultTemperature`: 官方通常不提供默认采样参数 +- `defaultTopP`: 官方通常不提供默认采样参数 +- `extra`: 扩展字段为本地schema,需业务侧定义 diff --git a/字段取值表/zhipu/详细字段取值表.md b/字段取值表/zhipu/详细字段取值表.md new file mode 100644 index 0000000..8f2a355 --- /dev/null +++ b/字段取值表/zhipu/详细字段取值表.md @@ -0,0 +1,116 @@ +# 详细字段取值表 - compute/providers/zhipu.json + +- provider: `zhipu` +- priceCurrency: `CNY` +- generatedAt: `2026-04-23T15:11:31.654Z` + +## 来源 + +- https://docs.bigmodel.cn/cn/guide/models/text/glm-5 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.7 +- https://docs.bigmodel.cn/cn/guide/models/text/glm-4.6 +- https://docs.bigmodel.cn/cn/guide/start/model-overview +- https://docs.bigmodel.cn/cn/guide/start/concept-param +- https://docs.bigmodel.cn/cn/guide/capabilities/thinking-mode +- https://www.bigmodel.cn/pricing +- https://zenmux.ai/models +- https://zenmux.ai/api/v1/models + +## glm-5 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-5` +- ZenMux候选: `z-ai/glm-5` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-5"` | `"glm-5"` | 保持 | ZenMux匹配(exact): z-ai/glm-5 | +| `displayName` | `"GLM-5"` | `"GLM-5"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-5 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-5 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `18` | `18` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","math","tool_use","agent"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.7` +- ZenMux候选: `z-ai/glm-4.7` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7"` | `"glm-4.7"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.7 | +| `displayName` | `"GLM-4.7"` | `"GLM-4.7"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `4` | `4` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `16` | `16` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | `["chat","reasoning","code","multilingual","deep_thinking","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.7-thinking + +- ZenMux匹配级别: `ambiguous` +- ZenMux候选: `z-ai/glm-4.7`、`z-ai/glm-4.7-flashx`、`z-ai/glm-4.7-flash-free`、`z-ai/glm-4.6v`、`z-ai/glm-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.7-thinking"` | `"glm-4.7-thinking"` | 待确认 | ZenMux无稳定匹配 | +| `displayName` | `"GLM-4.7 Thinking"` | `"GLM-4.7 Thinking"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["reasoning"]` | `["reasoning"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.7 模型页列明上下文窗口为 `200K`,且思考模式文档说明 `GLM-4.7` 默认开启 Thinking,本地别名 `glm-4.7-thinking` 可按同规格理解 | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.7 模型页列明最大输出 Tokens 为 `128K`,思考模式文档说明 `GLM-4.7` 默认开启 Thinking | +| `inputPrice` | `8` | `8` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | ZenMux无稳定价格可用,需官方价格页复核 | +| `capabilities` | `["reasoning","math","code","deep_thinking","long_context"]` | `["reasoning","math","code","deep_thinking","long_context"]` | 保持 | ZenMux无明确能力映射差异 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.6v + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.6v` +- ZenMux候选: `z-ai/glm-4.6v` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.6v"` | `"glm-4.6v"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.6v | +| `displayName` | `"GLM-4.6V"` | `"GLM-4.6V"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["vision"]` | `["vision"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `128000` | 建议修改 | 智谱官方 `GLM-4.6V` 模型页与模型概览页均列明上下文窗口为 `128K` | +| `maxOutputTokens` | `8192` | `32768` | 建议修改 | 智谱官方模型概览页与核心参数页均列明 `glm-4.6v` 最大输出为 `32K` / `32768` | +| `inputPrice` | `8` | `8` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `32` | `32` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | `["chat","vision","video_understanding","image_understanding","long_context","tool_use"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.7` | `0.7` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | + +## glm-4.6 + +- ZenMux匹配级别: `exact` +- ZenMux命中: `z-ai/glm-4.6` +- ZenMux候选: `z-ai/glm-4.6` + +| 字段 | 当前值 | 建议值 | 结论 | 依据/说明 | +|---|---|---|---|---| +| `modelName` | `"glm-4.6"` | `"glm-4.6"` | 保持 | ZenMux匹配(exact): z-ai/glm-4.6 | +| `displayName` | `"GLM-4.6"` | `"GLM-4.6"` | 保持 | 展示字段,需按产品命名策略 | +| `serviceType` | `["chat"]` | `["chat"]` | 保持 | 服务路由字段,优先本项目约定 | +| `contextWindow` | `200000` | `200000` | 保持 | 智谱官方 GLM-4.6 模型页列明上下文窗口为 `200K` | +| `maxOutputTokens` | `128000` | `128000` | 保持 | 智谱官方 GLM-4.6 模型页列明最大输出 Tokens 为 `128K` | +| `inputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `outputPrice` | `5` | `5` | 待确认 | 本文件币种为CNY,ZenMux价格为USD,需官方价格页复核 | +| `capabilities` | `["chat","reasoning","code","multilingual","deep_thinking"]` | `["chat","reasoning","code","multilingual","deep_thinking"]` | 待确认 | ZenMux给出reasoning=true,但capabilities是项目语义字段,需官方能力说明复核 | +| `defaultTemperature` | `1` | `1` | 待确认 | 官方通常不提供默认采样参数 | +| `defaultTopP` | `0.95` | `0.95` | 待确认 | 官方通常不提供默认采样参数 | +| `extra` | `{}` | `{}` | 待确认 | 扩展字段为本地schema,需业务侧定义 | diff --git a/字段取值表/zhipu/逐条处置记录-2026-04-23.md b/字段取值表/zhipu/逐条处置记录-2026-04-23.md new file mode 100644 index 0000000..fb587a7 --- /dev/null +++ b/字段取值表/zhipu/逐条处置记录-2026-04-23.md @@ -0,0 +1,25 @@ +# zhipu ambiguous/similar 逐条处置记录(2026-04-23) + +依据: +- 智谱开放平台文档: https://bigmodel.cn/dev/howuse/model +- ZenMux: https://zenmux.ai/models +- ZenMux API: https://zenmux.ai/api/v1/models + +## 已处置条目 + +1. `glm-4.7-thinking`(ambiguous) +处置:不修改。 +原因:ZenMux 候选含 `glm-4.7/4.7-flashx/4.7-flash-free/4.6v/4.6` 多分支;本地为 thinking 专线路由,无法唯一映射到某个候选。 + +## 本轮 zhipu 落库结果 + +- JSON 变更:0 + +## 默认采样参数补齐(非 ambiguous) + +依据: +- 智谱官方模型参数说明(GLM-4.6 默认 `temperature=1.0`、`top_p=0.95`) +- https://docs.bigmodel.cn/cn/guide/models/migrate-to-v4#glm-4.6 + +已执行: +1. `glm-4.6`:补齐 `defaultTemperature: 1`、`defaultTopP: 0.95` diff --git a/字段取值表/目录索引.json b/字段取值表/目录索引.json new file mode 100644 index 0000000..5384106 --- /dev/null +++ b/字段取值表/目录索引.json @@ -0,0 +1,240 @@ +[ + { + "file": "compute/coding-plans/dashscope-coding.json", + "folder": "字段取值表/dashscope-coding", + "detailed": "字段取值表/dashscope-coding/详细字段取值表.md", + "unresolved": "字段取值表/dashscope-coding/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/coding-plans/infini-coding.json", + "folder": "字段取值表/infini-coding", + "detailed": "字段取值表/infini-coding/详细字段取值表.md", + "unresolved": "字段取值表/infini-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/kwai-coding.json", + "folder": "字段取值表/kwai-coding", + "detailed": "字段取值表/kwai-coding/详细字段取值表.md", + "unresolved": "字段取值表/kwai-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/minimax-coding.json", + "folder": "字段取值表/minimax-coding", + "detailed": "字段取值表/minimax-coding/详细字段取值表.md", + "unresolved": "字段取值表/minimax-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/moonshot-coding.json", + "folder": "字段取值表/moonshot-coding", + "detailed": "字段取值表/moonshot-coding/详细字段取值表.md", + "unresolved": "字段取值表/moonshot-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/moorethread-coding.json", + "folder": "字段取值表/moorethread-coding", + "detailed": "字段取值表/moorethread-coding/详细字段取值表.md", + "unresolved": "字段取值表/moorethread-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/volcengine-coding.json", + "folder": "字段取值表/volcengine-coding", + "detailed": "字段取值表/volcengine-coding/详细字段取值表.md", + "unresolved": "字段取值表/volcengine-coding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/coding-plans/zhipu-coding.json", + "folder": "字段取值表/zhipu-coding", + "detailed": "字段取值表/zhipu-coding/详细字段取值表.md", + "unresolved": "字段取值表/zhipu-coding/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/anthropic.json", + "folder": "字段取值表/anthropic", + "detailed": "字段取值表/anthropic/详细字段取值表.md", + "unresolved": "字段取值表/anthropic/未确认字段报告.md", + "modelCount": 5 + }, + { + "file": "compute/providers/baichuan.json", + "folder": "字段取值表/baichuan", + "detailed": "字段取值表/baichuan/详细字段取值表.md", + "unresolved": "字段取值表/baichuan/未确认字段报告.md", + "modelCount": 4 + }, + { + "file": "compute/providers/baidu.json", + "folder": "字段取值表/baidu", + "detailed": "字段取值表/baidu/详细字段取值表.md", + "unresolved": "字段取值表/baidu/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/cohere.json", + "folder": "字段取值表/cohere", + "detailed": "字段取值表/cohere/详细字段取值表.md", + "unresolved": "字段取值表/cohere/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/dashscope.json", + "folder": "字段取值表/dashscope", + "detailed": "字段取值表/dashscope/详细字段取值表.md", + "unresolved": "字段取值表/dashscope/未确认字段报告.md", + "modelCount": 18 + }, + { + "file": "compute/providers/deepseek.json", + "folder": "字段取值表/deepseek", + "detailed": "字段取值表/deepseek/详细字段取值表.md", + "unresolved": "字段取值表/deepseek/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/google.json", + "folder": "字段取值表/google", + "detailed": "字段取值表/google/详细字段取值表.md", + "unresolved": "字段取值表/google/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/internal-testing.json", + "folder": "字段取值表/internal-testing", + "detailed": "字段取值表/internal-testing/详细字段取值表.md", + "unresolved": "字段取值表/internal-testing/未确认字段报告.md", + "modelCount": 14 + }, + { + "file": "compute/providers/kling.json", + "folder": "字段取值表/kling", + "detailed": "字段取值表/kling/详细字段取值表.md", + "unresolved": "字段取值表/kling/未确认字段报告.md", + "modelCount": 4 + }, + { + "file": "compute/providers/lingyiwanwu.json", + "folder": "字段取值表/lingyiwanwu", + "detailed": "字段取值表/lingyiwanwu/详细字段取值表.md", + "unresolved": "字段取值表/lingyiwanwu/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/local-whisper.json", + "folder": "字段取值表/local-whisper", + "detailed": "字段取值表/local-whisper/详细字段取值表.md", + "unresolved": "字段取值表/local-whisper/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/minimax.json", + "folder": "字段取值表/minimax", + "detailed": "字段取值表/minimax/详细字段取值表.md", + "unresolved": "字段取值表/minimax/未确认字段报告.md", + "modelCount": 7 + }, + { + "file": "compute/providers/mistral.json", + "folder": "字段取值表/mistral", + "detailed": "字段取值表/mistral/详细字段取值表.md", + "unresolved": "字段取值表/mistral/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/moonshot.json", + "folder": "字段取值表/moonshot", + "detailed": "字段取值表/moonshot/详细字段取值表.md", + "unresolved": "字段取值表/moonshot/未确认字段报告.md", + "modelCount": 6 + }, + { + "file": "compute/providers/ollama.json", + "folder": "字段取值表/ollama", + "detailed": "字段取值表/ollama/详细字段取值表.md", + "unresolved": "字段取值表/ollama/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/openai.json", + "folder": "字段取值表/openai", + "detailed": "字段取值表/openai/详细字段取值表.md", + "unresolved": "字段取值表/openai/未确认字段报告.md", + "modelCount": 24 + }, + { + "file": "compute/providers/openrouter.json", + "folder": "字段取值表/openrouter", + "detailed": "字段取值表/openrouter/详细字段取值表.md", + "unresolved": "字段取值表/openrouter/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/perplexity.json", + "folder": "字段取值表/perplexity", + "detailed": "字段取值表/perplexity/详细字段取值表.md", + "unresolved": "字段取值表/perplexity/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/siliconflow.json", + "folder": "字段取值表/siliconflow", + "detailed": "字段取值表/siliconflow/详细字段取值表.md", + "unresolved": "字段取值表/siliconflow/未确认字段报告.md", + "modelCount": 3 + }, + { + "file": "compute/providers/stability.json", + "folder": "字段取值表/stability", + "detailed": "字段取值表/stability/详细字段取值表.md", + "unresolved": "字段取值表/stability/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/tencent.json", + "folder": "字段取值表/tencent", + "detailed": "字段取值表/tencent/详细字段取值表.md", + "unresolved": "字段取值表/tencent/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/volcengine.json", + "folder": "字段取值表/volcengine", + "detailed": "字段取值表/volcengine/详细字段取值表.md", + "unresolved": "字段取值表/volcengine/未确认字段报告.md", + "modelCount": 17 + }, + { + "file": "compute/providers/xai.json", + "folder": "字段取值表/xai", + "detailed": "字段取值表/xai/详细字段取值表.md", + "unresolved": "字段取值表/xai/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/xunfei.json", + "folder": "字段取值表/xunfei", + "detailed": "字段取值表/xunfei/详细字段取值表.md", + "unresolved": "字段取值表/xunfei/未确认字段报告.md", + "modelCount": 2 + }, + { + "file": "compute/providers/zhipu-embedding.json", + "folder": "字段取值表/zhipu-embedding", + "detailed": "字段取值表/zhipu-embedding/详细字段取值表.md", + "unresolved": "字段取值表/zhipu-embedding/未确认字段报告.md", + "modelCount": 1 + }, + { + "file": "compute/providers/zhipu.json", + "folder": "字段取值表/zhipu", + "detailed": "字段取值表/zhipu/详细字段取值表.md", + "unresolved": "字段取值表/zhipu/未确认字段报告.md", + "modelCount": 5 + } +]