desirecore/config-center

mirror of https://git.openapi.site/https://github.com/desirecore/config-center.git synced 2026-06-06 05:50:50 +08:00

Files

xieyuanxiang c57cd4723d audit model field values against official docs

2026-04-24 12:20:24 +08:00

2.7 KiB

Raw Blame History

dashscope ambiguous/similar 逐条处置记录（2026-04-23）

范围

文件：compute/providers/dashscope.json
目标条目：qwen-max、qwen-plus、qwen3-vl-flash、qwen3-rerank、qwen3-max-trans
依据：阿里云百炼官方模型/计费页 + https://zenmux.ai/models + https://zenmux.ai/api/v1/models

逐条结论

条目	ZenMux候选	处置	是否改JSON	理由
`qwen-max`	`qwen/qwen3-max`、`qwen/qwen3-max-preview`	不修改	否	本地为 legacy 命名（`qwen-max`，32K）；ZenMux 候选是 Qwen3 Max 系列，规格口径不一致，不能直接覆盖。
`qwen-plus`	`qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus`	不修改	否	候选跨模型族（chat/vl/coder），且价格阶梯与本地 `qwen-plus` 不可唯一对齐，拒绝强匹配。
`qwen3-vl-flash`	`qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`	不修改	否	ZenMux 未给出 `qwen3-vl-flash` 同名条目；候选包含非视觉模型，无法唯一映射。
`qwen3-rerank`	`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash`	不修改	否	本地是 `rerank` 服务类型，ZenMux 候选均为生成模型，服务类型不一致。
`qwen3-max-trans`	`qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b`	不修改	否	本地是翻译专用路由（`translation`），ZenMux 候选为通用生成模型，无法安全映射。

备注

本批次没有可“唯一确认且与本地值不同”的字段，因此 compute/providers/dashscope.json 无变更。

none 条目补齐（第2轮）

依据（官方）：

阿里云百炼模型概览：https://help.aliyun.com/zh/model-studio/models
文本向量模型 v3/v4 文档：https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3
文本排序（Rerank）文档：https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api

已执行：

text-embedding-v3：新增 contextWindow: 8192
text-embedding-v4：新增 contextWindow: 8192
qwen3-rerank：新增 contextWindow: 30000（按官方“单次请求最大 Token”）

未改项（说明）：

text-embedding-v3/v4 的 maxOutputTokens 与 outputPrice 保持缺省：Embedding 为输入向量化，不走 completion token 口径。
qwen3-rerank 的 maxOutputTokens 保持缺省：Rerank 返回排序结果，不是文本生成输出。
语音/图像/视频模型（cosyvoice/paraformer/wanx）的 token 上下文与输出上限口径不统一，继续待官方明确 token 语义映射。