61 Commits

Author SHA1 Message Date
Johnson-LYS
e84edec964 feat(model-specs): 新增模型规格库——跨 provider 模型参数统一维护(presetDataVersion 54→58)
* feat(model-specs): 新增模型规格库与 schema 契约

- compute/model-specs/:按厂商维护模型内在参数(上下文窗口/最大输出/能力/serviceType/默认温度,不含价签)
- schemas/model-spec.schema.json:Draft-07 契约,spec 允许 null(新文件不影响老客户端 frozen 契约)
- scripts/validate.mjs:pickSchemaKey 纳入 model-specs 校验
- manifest.presetDataVersion 54→55

* feat(model-specs): 新增小米 MiMo 系列模型规格;bump presetDataVersion 55→56

* feat(model-specs): 补全全量模型规格;presetDataVersion 56→57

* feat(model-specs): 新增 releasedAt/retiredAt 时间戳字段;补充 mimo 退役日期
2026-06-01 19:45:14 +08:00
9633df0219 chore(internal-testing): 默认模型改为 MiMo V2.5 Pro(小米 Pro);bump presetDataVersion to 54 (#29) 2026-05-30 15:05:04 +08:00
xyx
161eb04d39 fix(deepseek): 更新 DeepSeek 模型至 V4 系列,修正价格与参数 (#28)
- 新增 deepseek-v4-flash(主力)和 deepseek-v4-pro(旗舰)
- 上下文窗口 128K → 1M,最大输出 8K/64K → 384K
- 价格更新:V4 Flash 输入 1 元/M 输出 2 元/M;V4 Pro 输入 3 元/M 输出 6 元/M
- 保留 deepseek-chat / deepseek-reasoner 作为旧别名(标记 2026-07-24 弃用)
- bump presetDataVersion to 52

Co-authored-by: Yige <a@wyr.me>
2026-05-28 14:50:28 +08:00
xyx
55f948a725 fix: mark internal testing models as tool-capable (#27) 2026-05-28 14:49:07 +08:00
e17a00d48b chore(internal-testing): 新增 Qwen3.7 Max 并设为默认模型;bump presetDataVersion to 51 (#25) 2026-05-23 10:24:58 +08:00
cc3f0b53da chore(internal-testing): 回退 DeepSeek V4 Pro/Flash 视觉与 OCR 能力(实测不支持);bump presetDataVersion to 50 (#24) 2026-05-20 13:37:45 +08:00
b8019c4a30 chore(internal-testing): DeepSeek V4 Pro/Flash 新增视觉(图像理解)与 OCR 能力;bump presetDataVersion to 49 (#23) 2026-05-20 12:35:23 +08:00
72163bac46 chore(internal-testing): 默认模型改为 DeepSeek V4 Pro;bump presetDataVersion to 48 (#22) 2026-05-18 22:37:08 +08:00
fffa2b1980 chore(internal-testing): 新增 DeepSeek V4 Pro/Flash;bump presetDataVersion to 47 (#21)
- deepseek-v4-pro:1.6T/49B MoE 旗舰,1M 上下文,思考型(reasoning),省略温度参数
- deepseek-v4-flash:284B/13B MoE 高速版,1M 上下文,serviceType=[chat, fast]
- 价格统一保持 0,遵循内测专用 provider 惯例
- manifest: presetDataVersion 46→47,updatedAt 2026-05-12
2026-05-12 11:29:19 +08:00
xyx
00e148af8e feat: 算力配置全面审计 — 6 家供应商 + Token/Coding Plan 对齐官方文档 (#20)
Providers:
- moonshot: 移除到期模型 kimi-k2/k2-thinking,修正 k2.6 maxOutputTokens 32768、k2.5 contextWindow 262144
- tencent: 修正 hunyuan-t1-latest 上下文/输出/价格,新增 hunyuan-t1-vision/turbos-vision
- volcengine: doubao-seed-2.0-lite/mini 新增 audio_understanding/video_understanding
- internal-testing: services 扩展为全部 18 种类型,新增 mediaBaseUrl

Coding Plans:
- dashscope-token-plan: baseUrl 修正为 coding.dashscope.aliyuncs.com,移除非 Coding Plan 模型,新增 kimi-k2.5/qwen3.5-plus/qwen3-coder-plus/glm-4.7
- minimax-coding: 修正 usageTracking 端点,services 扩展为 7 种含媒体类型
- moonshot-coding: maxOutputTokens 修正为 32768
- zhipu-coding: 新增 glm-5.1/glm-5-turbo/glm-4.5-air,修正 glm-5 contextWindow 200000
- volcengine-coding: 新增 glm-5.1/kimi-k2.6/minimax-m2.7
- tencent-token: 新增腾讯云 Token Plan(10 个模型)

presetDataVersion: 45 → 46
2026-05-10 00:58:56 +08:00
xyx
82ad03d9eb feat: 新增小米 MiMo Provider 配置 (#19)
- 添加 xiaomi.json:MiMo-V2.5-Pro(chat/reasoning)+ TTS 系列(tts/voicedesign/voiceclone)
- 更新 _index.json 加载顺序
- presetDataVersion 42 → 43
2026-05-09 15:04:55 +08:00
34a75a7b25 chore(internal-testing): 默认模型改为 GLM-5;bump presetDataVersion to 43
Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-05-08 15:48:20 +08:00
xyx
8a4a08b642 fix(dashscope): Token Plan 回退为客户端兼容字段 (#15)
线上客户端 schema 尚未支持 tokenPlan/accessMode:"token-plan",
同步后导致 compute.json 校验失败。临时回退为 codingPlan + coding-plan,
待主仓库升级 schema 后再切换为语义正确的字段。
2026-05-07 22:05:30 +08:00
37d51e6e4d feat(schema): 扩展 provider schema 支持 Token Plan
- accessMode enum 新增 "token-plan"
- 新增顶层 tokenPlan 属性(与 codingPlan 结构对齐)
- usageTracking.method enum 新增 "credits"(Token Plan 使用 Credits 计量)
- dashscope-token-plan.json 恢复语义正确的 tokenPlan 配置
2026-05-07 20:15:58 +08:00
f4706b1558 fix: Token Plan schema 兼容修复(accessMode/codingPlan/method) 2026-05-07 20:12:45 +08:00
01764d447d feat(dashscope): 更新 Coding Plan 模型 + 新增 Token Plan + providers 补充 qwen-image 系列
Coding Plan:
- 更新模型列表至最新(qwen3.6-plus、kimi-k2.5、glm-5 等 9 个模型)
- 修正上下文窗口参数(qwen3.6-plus: 1M, glm-5: 200K 等)
- label 从 "Token (Coding) Plan" 改回 "Coding Plan"

Token Plan(新增):
- 新增 dashscope-token-plan.json 配置
- baseUrl: token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
- 包含文本模型 4 个 + 图像模型 4 个(wan2.7 + qwen-image-2.0)
- accessMode: "token-plan",usageTracking: credits

Providers (dashscope.json):
- 补充 qwen-image-2.0-pro 和 qwen-image-2.0 两个图像生成模型
2026-05-07 20:09:25 +08:00
199a2bc528 feat(dashscope): 添加 mediaBaseUrl 和万相新模型系列
- 添加 mediaBaseUrl: https://dashscope.aliyuncs.com/api/v1
- 替换旧 wanx-v2 为 5 个最新模型:wan2.7-image-pro、wan2.7-image、wan2.6-t2i、wan2.2-t2i-plus、wan2.2-t2i-flash
- 更新 wanx-video 为 wan2.6-t2v,补充 endpoint 元数据
- 修正尺寸格式为阿里云 API 标准(`*` 分隔符)
- 各模型 extra 中记录 endpoint/asyncHeader/taskQueryEndpoint 供技能直接引用
2026-05-07 19:09:30 +08:00
648839c5dd feat(internal-testing): add Xiaomi MiMo V2.5 and V2.5 Pro models (#12)
在内测渠道挂载小米 MiMo V2.5 / V2.5 Pro 两款模型:

- mimo-v2.5-pro:1.02T/42B 激活 MoE 旗舰,1M 上下文,长程代码与 Agent 自治
- mimo-v2.5:原生全模态(文本/图像/视频/音频),1M 上下文

沿用 internal-testing 渠道的 anthropic-messages(Claude 兼容)协议
和 https://api.yizhioa.cn/v1 端点;价格保持 0(内测免费)。

manifest.presetDataVersion: 31 -> 32
2026-05-02 00:57:54 +08:00
f29e6966dc fix(schema): allow mediaBaseUrl in provider schema 2026-04-29 21:43:28 +08:00
7ac60f9c3c fix(volcengine): update provider and coding plan models 2026-04-29 21:24:59 +08:00
xyx
2d98f45fbc Merge pull request #10 from desirecore/fix/halve-context-window-internal-testing
fix: 临时将 internal-testing contextWindow 减半
2026-04-29 21:01:35 +08:00
244154ee06 fix: 临时将 internal-testing 所有模型 contextWindow 减半
为排查上下文窗口相关问题,将所有模型的 contextWindow 临时减半。
每个模型添加了 _contextWindowNote 字段记录原始值,便于后续恢复。

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-29 20:14:24 +08:00
e65c3f4c23 fix(minimax): Token Plan 改用 anthropic-messages 格式(与 API provider 一致) 2026-04-28 22:04:17 +08:00
32203fb2a9 fix(minimax): codingPlan 结构适配 schema(移除不兼容的嵌套配额) 2026-04-28 21:36:22 +08:00
9da3d12a4f chore: Coding Plan 统一改名为 Token (Coding) Plan 2026-04-28 21:14:03 +08:00
a1c9c7351b fix(minimax): 补全模型列表,Token Plan 升级为全模态
providers/minimax.json(API 按量计费):
- 新增文本模型:MiniMax-M2、M2-her
- 新增历史语音模型:speech-2.6-hd/turbo、speech-02-hd/turbo
- 新增历史视频模型:MiniMax-Hailuo-02、S2V-01
- 新增历史音乐模型:music-2.5+、music-2.5
- 标记历史版本 extra.legacy: true
- services 补充 vision

coding-plans/minimax-coding.json(Token Plan):
- label 从 "Coding Plan" 改为 "Token Plan"(MiniMax 2026.3 升级)
- 从仅 M1 扩展为全模态:M2.7、Speech 2.8、image-01、Hailuo-2.3、Music-2.6
- 补充完整配额信息(6 个套餐等级 × 5 个模态)
- 补充定价信息(月付/年付)

presetDataVersion: 34 → 35
2026-04-28 20:55:45 +08:00
ad0f83ead5 fix: MiniMax 切换为 Anthropic 消息格式 + mediaBaseUrl
- apiFormat: openai-completions → anthropic-messages
- baseUrl: api.minimaxi.com/v1 → api.minimaxi.com/anthropic
- 新增 mediaBaseUrl: api.minimaxi.com/v1(媒体 API 专用)

解决 pi-ai 注册表 api 字段与 compute.json apiFormat 冲突,
导致 chat 请求路径拼接为 /v1/v1/messages 而 404 的问题。
2026-04-28 12:01:23 +08:00
xyx
1c71483e25 feat: MiniMax Provider 合并媒体能力(图片/语音/视频/音乐) (#8)
将媒体生成模型直接合并到现有 provider-minimax-001,而非创建独立的媒体
Provider。原因:MiniMax 所有 API(聊天/图片/语音/视频/音乐)共享同一
域名(api.minimaxi.com)、同一认证方式(Bearer)和同一 API Key,与
OpenAI 的 provider 结构一致。

变更内容:
- 修改 compute/providers/minimax.json
  - services 新增:image_gen, tts, video_gen, music_gen
  - models 新增 10 个媒体模型(来源:官方文档):
    · image-01, image-01-live(文生图/图生图)
    · speech-2.8-hd, speech-2.8-turbo(语音合成,最新 2.8 系列)
    · MiniMax-Hailuo-2.3, Hailuo-2.3-Fast, T2V-01-Director(视频生成)
    · music-2.6, music-cover(音乐生成 + 翻唱)
- 更新 service-map.json:新增 music_gen → music-2.6 / provider-minimax-001
- 递增 manifest.json presetDataVersion 32 → 33

API 参数来源:MiniMax 国内开放平台官方文档
https://platform.minimaxi.com/docs/api-reference/api-overview
2026-04-27 22:17:12 +08:00
xyx
d1271bd894 fix: 补充缺失的 vision 能力声明 (#7)
以下模型实际支持图片理解但 capabilities 中缺少 vision,导致
DesireCore 前端误拦截图片消息:

minimax:
- MiniMax-M2.7(用户实测确认支持图片输入)
- MiniMax-M2.7-highspeed

volcengine:
- doubao-2.0-pro(官方:支持文字、图片、视频输入)
- doubao-seed-1.8(官方:升级多模态理解)
- doubao-seed-1.6(官方:All-in-One,支持多模态理解)
- doubao-seed-1.6-flash(官方:视觉理解能力比肩友商旗舰)

presetDataVersion: 31 → 32
2026-04-27 18:56:55 +08:00
380e99c577 修复算力模型采样默认值 2026-04-25 21:39:51 +08:00
371336cdd6 Revert "Merge pull request #1 from desirecore/model-field-official-audit"
This reverts commit 88a8cf2db6, reversing
changes made to ca99ea272f.
2026-04-25 19:34:29 +08:00
b0e0cead04 chore: update field audit tables and provider configs
Batch update from official docs audit - price corrections, context
window fixes, field report updates across all providers.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-24 20:12:57 +08:00
5b9c8ac61f fix: restore CNY pricing for MiniMax and Zhipu (Chinese providers)
MiniMax and Zhipu are Chinese providers whose priceCurrency was
incorrectly changed from CNY to USD, with prices converted to
USD values. Restored correct CNY pricing verified against official docs.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-24 20:06:24 +08:00
cc2fb7b9a5 fix: remove irrelevant text-model fields from non-text providers
Remove contextWindow: 0 and maxOutputTokens: 0 from non-text models
(tts, asr, image_gen, video_gen, voice_clone, translation, etc.) and
maxOutputTokens: 0 from embedding/rerank models across kling,
local-whisper, stability, openai, dashscope, google, volcengine,
and zhipu-embedding configs.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-24 19:53:57 +08:00
7159e1cf59 fix(coding-plans): revert incorrect model name suffix and align MiniMax Token Plan labels
- Revert qwen3-max-2026-01-23 back to qwen3-max in dashscope-coding
- Update minimax-coding labels/descriptions to "Token Plan" to match
  actual config params (endpoints, quotas, billing), since MiniMax
  upgraded Coding Plan to Token Plan in March 2026

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-24 15:12:13 +08:00
c57cd4723d audit model field values against official docs 2026-04-24 12:20:24 +08:00
ca99ea272f feat(internal-testing): restore MiniMax-M2.5
- \u53ea\u79fb\u9664 MiniMax-M2.7\uff0c\u4fdd\u7559 MiniMax-M2.5 \u4f5c\u4e3a\u5907\u9009
- MiniMax-M2.5 \u63d2\u5165\u5728 kimi-k2.5 \u4e4b\u540e (\u4e0e\u5176\u4ed6\u975e-highspeed MiniMax \u7cfb\u5217\u4e00\u81f4\u7684\u4f4d\u7f6e)
- MiniMax-M2.7-highspeed \u4ecd\u7136\u5728 models[0]\uff0c\u4f5c\u4e3a provider \u9ed8\u8ba4\u6a21\u578b
- tombstones: ["MiniMax-M2.7", "MiniMax-M2.5"] -> ["MiniMax-M2.7"]
- bump presetDataVersion 23 -> 24
2026-04-20 11:10:37 +08:00
719407d82c feat: add per-provider tombstones whitelist for explicit model deletion
引入 tombstones 字段用于区分"主动删除"和"数据缺失"两种语义。
当合并策略(新版本客户端)遇到 preset 缺失的本地 preset-source 模型时:
- 若 modelName 在 tombstones 白名单 → 真删除
- 若不在白名单 → 保留并标 extra.deprecated: true(软降级)

本次添加 tombstones 的场景:
- internal-testing: MiniMax-M2.7 / MiniMax-M2.5(改为只保留 highspeed 版本)
- zhipu: embedding-3(已拆到独立的 zhipu-embedding provider)

user-added / synced / ollama-discovery 来源始终不受 tombstones 影响。

bump presetDataVersion 22 -> 23
2026-04-20 00:42:35 +08:00
2ed86a9561 refactor(internal-testing): drop MiniMax-M2.5/M2.7, keep only M2.7-highspeed
- 用户反馈内测只需要高速版本, 移除 MiniMax-M2.7 和 MiniMax-M2.5 两个普通版本
- MiniMax-M2.7-highspeed 保留在首位作为 provider 默认模型
- bump presetDataVersion 21 -> 22
2026-04-19 23:43:10 +08:00
5276339aa5 feat(internal-testing): add MiniMax-M2.7-highspeed as provider default model
- 在内测专用 provider 新增模型 MiniMax-M2.7-highspeed (高速版)
- 插入到 models 数组最前面, 基于前端 fallback 逻辑 (app/utils/compute-helpers.ts:
  fallback.models.find(chat) ?? fallback.models[0]) 成为该 provider 的默认选项
- bump presetDataVersion 18 -> 19
2026-04-19 23:32:31 +08:00
c7a24a7acd feat(zhipu): switch to anthropic-messages endpoint and split embedding provider
- zhipu (chat/reasoning/vision): baseUrl -> /api/anthropic, apiFormat -> anthropic-messages
  启用 Anthropic 协议的 thinking 字段以支持 GLM 深度思考流式输出
- zhipu-embedding (new): 独立承载 embedding-3, 保留 /api/paas/v4 + openai-completions
  Anthropic 协议不提供 /embeddings 端点
- zhipu-coding (Coding Plan): baseUrl -> /api/anthropic, apiFormat -> anthropic-messages
  与非套餐端点共用同一协议, 计费维度由 API Key 区分
- bump presetDataVersion 17 -> 18
2026-04-19 23:31:45 +08:00
张馨元
b580622aa4 增加内测模型glm-4.7 2026-04-18 15:23:50 +08:00
张馨元
344a9fe4c6 feat: 内测渠道增加 Kimi K2.6 Code Preview 模型支持
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-16 15:34:44 +08:00
张馨元
97c2c16643 fix: 修复 22 处模型能力标签与实际能力不一致的问题
- 为 kimi-k2、qwen3-max、glm-4.6、grok-4 等 12 个模型补充 vision 标签
- 为 minimax-m2.1-highspeed、mistral-small-latest 补充 reasoning 标签
- 对齐 coding-plan 版本与主版本的能力标签(zhipu/dashscope/moonshot)
- 补全 internal-testing 内测版过度简化的能力标签
- bump presetDataVersion: 17 -> 18

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-04-15 15:30:00 +08:00
c8d4061422 feat: 内测 provider 新增 qwen3.6-plus、qwen3.5-35b-a3b、qwen3.5-27b 三个模型 2026-04-08 16:52:35 +08:00
8ea6fa7bba feat: 内测渠道增加 GLM-5.1 模型支持
Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-28 23:36:33 +08:00
a35b268011 feat: add MiniMax M2.7 to official minimax provider 2026-03-19 23:17:37 +08:00
3a655077b0 feat: 内测供应商增加 GLM-5-Turbo 并设为默认
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-19 20:29:54 +08:00
9d5f1df7cb feat: 内测供应商增加 MiniMax-M2.7
Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-19 16:32:27 +08:00
d44541ca74 feat: 添加内测专用供应商 (internal-testing)
- 端点: https://api.yizhioa.cn/v1
- 协议: anthropic-messages
- 模型: GLM-5, Kimi-2.5, MiniMax-M2.5, Qwen3 Max, Qwen3.5 Plus, 豆包 Seed 2.0 Code Preview
- presetDataVersion: 10 → 11

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-17 01:57:40 +08:00