mirror of
https://git.openapi.site/https://github.com/desirecore/config-center.git
synced 2026-06-06 05:50:50 +08:00
2.7 KiB
2.7 KiB
dashscope ambiguous/similar 逐条处置记录(2026-04-23)
范围
- 文件:
compute/providers/dashscope.json - 目标条目:
qwen-max、qwen-plus、qwen3-vl-flash、qwen3-rerank、qwen3-max-trans - 依据:阿里云百炼官方模型/计费页 +
https://zenmux.ai/models+https://zenmux.ai/api/v1/models
逐条结论
| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 |
|---|---|---|---|---|
qwen-max |
qwen/qwen3-max、qwen/qwen3-max-preview |
不修改 | 否 | 本地为 legacy 命名(qwen-max,32K);ZenMux 候选是 Qwen3 Max 系列,规格口径不一致,不能直接覆盖。 |
qwen-plus |
qwen/qwen3.6-plus、qwen/qwen3.5-plus、qwen/qwen3-vl-plus、qwen/qwen3-coder-plus |
不修改 | 否 | 候选跨模型族(chat/vl/coder),且价格阶梯与本地 qwen-plus 不可唯一对齐,拒绝强匹配。 |
qwen3-vl-flash |
qwen/qwen3.5-flash、qwen/qwen3-vl-plus、qwen/qwen3-max、qwen/qwen3-coder、qwen/qwen3-14b |
不修改 | 否 | ZenMux 未给出 qwen3-vl-flash 同名条目;候选包含非视觉模型,无法唯一映射。 |
qwen3-rerank |
qwen/qwen3-max、qwen/qwen3-coder、qwen/qwen3-14b、qwen/qwen3.6-plus、qwen/qwen3.5-flash |
不修改 | 否 | 本地是 rerank 服务类型,ZenMux 候选均为生成模型,服务类型不一致。 |
qwen3-max-trans |
qwen/qwen3-max、qwen/qwen3-max-preview、qwen/qwen3-coder、qwen/qwen3-14b |
不修改 | 否 | 本地是翻译专用路由(translation),ZenMux 候选为通用生成模型,无法安全映射。 |
备注
- 本批次没有可“唯一确认且与本地值不同”的字段,因此
compute/providers/dashscope.json无变更。
none 条目补齐(第2轮)
依据(官方):
- 阿里云百炼模型概览:
https://help.aliyun.com/zh/model-studio/models - 文本向量模型 v3/v4 文档:
https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3 - 文本排序(Rerank)文档:
https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api
已执行:
text-embedding-v3:新增contextWindow: 8192text-embedding-v4:新增contextWindow: 8192qwen3-rerank:新增contextWindow: 30000(按官方“单次请求最大 Token”)
未改项(说明):
text-embedding-v3/v4的maxOutputTokens与outputPrice保持缺省:Embedding 为输入向量化,不走 completion token 口径。qwen3-rerank的maxOutputTokens保持缺省:Rerank 返回排序结果,不是文本生成输出。- 语音/图像/视频模型(
cosyvoice/paraformer/wanx)的 token 上下文与输出上限口径不统一,继续待官方明确 token 语义映射。