mirror of
https://git.openapi.site/https://github.com/desirecore/config-center.git
synced 2026-06-06 07:10:54 +08:00
39 lines
2.7 KiB
Markdown
39 lines
2.7 KiB
Markdown
# dashscope ambiguous/similar 逐条处置记录(2026-04-23)
|
||
|
||
## 范围
|
||
|
||
- 文件:`compute/providers/dashscope.json`
|
||
- 目标条目:`qwen-max`、`qwen-plus`、`qwen3-vl-flash`、`qwen3-rerank`、`qwen3-max-trans`
|
||
- 依据:阿里云百炼官方模型/计费页 + `https://zenmux.ai/models` + `https://zenmux.ai/api/v1/models`
|
||
|
||
## 逐条结论
|
||
|
||
| 条目 | ZenMux候选 | 处置 | 是否改JSON | 理由 |
|
||
|---|---|---|---|---|
|
||
| `qwen-max` | `qwen/qwen3-max`、`qwen/qwen3-max-preview` | 不修改 | 否 | 本地为 legacy 命名(`qwen-max`,32K);ZenMux 候选是 Qwen3 Max 系列,规格口径不一致,不能直接覆盖。 |
|
||
| `qwen-plus` | `qwen/qwen3.6-plus`、`qwen/qwen3.5-plus`、`qwen/qwen3-vl-plus`、`qwen/qwen3-coder-plus` | 不修改 | 否 | 候选跨模型族(chat/vl/coder),且价格阶梯与本地 `qwen-plus` 不可唯一对齐,拒绝强匹配。 |
|
||
| `qwen3-vl-flash` | `qwen/qwen3.5-flash`、`qwen/qwen3-vl-plus`、`qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | ZenMux 未给出 `qwen3-vl-flash` 同名条目;候选包含非视觉模型,无法唯一映射。 |
|
||
| `qwen3-rerank` | `qwen/qwen3-max`、`qwen/qwen3-coder`、`qwen/qwen3-14b`、`qwen/qwen3.6-plus`、`qwen/qwen3.5-flash` | 不修改 | 否 | 本地是 `rerank` 服务类型,ZenMux 候选均为生成模型,服务类型不一致。 |
|
||
| `qwen3-max-trans` | `qwen/qwen3-max`、`qwen/qwen3-max-preview`、`qwen/qwen3-coder`、`qwen/qwen3-14b` | 不修改 | 否 | 本地是翻译专用路由(`translation`),ZenMux 候选为通用生成模型,无法安全映射。 |
|
||
|
||
## 备注
|
||
|
||
- 本批次没有可“唯一确认且与本地值不同”的字段,因此 `compute/providers/dashscope.json` 无变更。
|
||
|
||
## none 条目补齐(第2轮)
|
||
|
||
依据(官方):
|
||
- 阿里云百炼模型概览:`https://help.aliyun.com/zh/model-studio/models`
|
||
- 文本向量模型 v3/v4 文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-embedding-v3`
|
||
- 文本排序(Rerank)文档:`https://help.aliyun.com/zh/model-studio/developer-reference/text-rerank-api`
|
||
|
||
已执行:
|
||
1. `text-embedding-v3`:新增 `contextWindow: 8192`
|
||
2. `text-embedding-v4`:新增 `contextWindow: 8192`
|
||
3. `qwen3-rerank`:新增 `contextWindow: 30000`(按官方“单次请求最大 Token”)
|
||
|
||
未改项(说明):
|
||
- `text-embedding-v3/v4` 的 `maxOutputTokens` 与 `outputPrice` 保持缺省:Embedding 为输入向量化,不走 completion token 口径。
|
||
- `qwen3-rerank` 的 `maxOutputTokens` 保持缺省:Rerank 返回排序结果,不是文本生成输出。
|
||
- 语音/图像/视频模型(`cosyvoice`/`paraformer`/`wanx`)的 token 上下文与输出上限口径不统一,继续待官方明确 token 语义映射。
|