Files
config-center/字段取值表/dashscope/逐条处置记录-2026-04-23.md

39 lines
2.7 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters
This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.
# dashscope ambiguous/similar 逐条处置记录2026-04-23
## 范围
- 文件:`compute/providers/dashscope.json`
- 目标条目:`qwen-max``qwen-plus``qwen3-vl-flash``qwen3-rerank``qwen3-max-trans`
- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models`
## 逐条结论
| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 |
|---|---|---|---|---|
| `qwen-max` | `qwen/qwen3-max``qwen/qwen3-max-preview` | 不修改 | 否 | 本地为 legacy 命名(`qwen-max`32KZenMux 候选是 Qwen3 Max 系列,规格口径不一致,不能直接覆盖。 |
| `qwen-plus` | `qwen/qwen3.6-plus``qwen/qwen3.5-plus``qwen/qwen3-vl-plus``qwen/qwen3-coder-plus` | 不修改 | 否 | 候选跨模型族chat/vl/coder且价格阶梯与本地 `qwen-plus` 不可唯一对齐,拒绝强匹配。 |
| `qwen3-vl-flash` | `qwen/qwen3.5-flash``qwen/qwen3-vl-plus``qwen/qwen3-max``qwen/qwen3-coder``qwen/qwen3-14b` | 不修改 | 否 | ZenMux 未给出 `qwen3-vl-flash` 同名条目;候选包含非视觉模型,无法唯一映射。 |
| `qwen3-rerank` | `qwen/qwen3-max``qwen/qwen3-coder``qwen/qwen3-14b``qwen/qwen3.6-plus``qwen/qwen3.5-flash` | 不修改 | 否 | 本地是 `rerank` 服务类型ZenMux 候选均为生成模型,服务类型不一致。 |
| `qwen3-max-trans` | `qwen/qwen3-max``qwen/qwen3-max-preview``qwen/qwen3-coder``qwen/qwen3-14b` | 不修改 | 否 | 本地是翻译专用路由(`translation`ZenMux 候选为通用生成模型,无法安全映射。 |
## 备注
- 本批次没有可“唯一确认且与本地值不同”的字段,因此 `compute/providers/dashscope.json` 无变更。
## none 条目补齐第2轮
依据(官方):
- 阿里云百炼模型概览:`https://help.aliyun.com/zh/model-studio/models`
- 文本向量模型 v3/v4 文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3`
- 文本排序Rerank文档`https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api`
已执行:
1. `text-embedding-v3`:新增 `contextWindow: 8192`
2. `text-embedding-v4`:新增 `contextWindow: 8192`
3. `qwen3-rerank`:新增 `contextWindow: 30000`(按官方“单次请求最大 Token”
未改项(说明):
- `text-embedding-v3/v4``maxOutputTokens``outputPrice` 保持缺省Embedding 为输入向量化,不走 completion token 口径。
- `qwen3-rerank``maxOutputTokens` 保持缺省Rerank 返回排序结果,不是文本生成输出。
- 语音/图像/视频模型(`cosyvoice`/`paraformer`/`wanx`)的 token 上下文与输出上限口径不统一,继续待官方明确 token 语义映射。