feat: skills i18n 改造（schemaVersion 1.1，零向后兼容） (#1)

* feat: skills i18n 改造 — schemaVersion 1.1，零向后兼容把 21 个 skills + 1 个 agent + manifest/categories 全量迁移到 schemaVersion 1.1 的 i18n 结构，配套 CI AI 翻译流水线（GitHub Models）与本地工具链。 ## 关键变更 ### 数据结构（破坏性，schemaVersion 1.0 → 1.1） - SKILL.md: 顶层 name 改为 ASCII slug（== 目录名，符合 agentskills.io 规范）；中文显示名/short_desc/description 全部迁入 metadata.i18n.<locale> - agents/<id>/agent.json: shortDesc/fullDesc/tags/persona.{role,traits} 迁入 i18n.<locale>；changelog[].changes 改为 { <locale>: string[] } 对象 - categories.json: 每个分类的 label/description 迁入 i18n.<locale>，顶层只剩 color/icon - manifest.json: 加 supportedLocales / defaultLocale；顶层 description 迁入 i18n.<locale> ### Body 文件结构 - 根 SKILL.md = frontmatter + default_locale (en-US) body - SKILL.<locale>.md = 各 locale 的 markdown body（首行  自校验） ### 工具链（scripts/i18n/） - glossary.json: zh→en 术语表 + do_not_translate 白名单 - schema/skill-frontmatter.schema.json: i18n frontmatter JSON Schema - validate-i18n.py: 8 条校验规则（name 合规 / locale 完整性 / hash 一致性等） - translate.py: GitHub Models / Anthropic 双 backend，sha256 增量翻译 - migrate.py: 一次性迁移脚本（旧格式 → i18n 结构） ### CI（.github/workflows/） - i18n-validate.yml: PR 触发跑 validate + translate --check - i18n-translate.yml: PR 触发用 GitHub Models（默认 openai/gpt-5-mini）翻译缺失 locale，自动追加 commit；可切到 ANTHROPIC_API_KEY 走 Claude ### 文档 - docs/I18N.md: 作者贡献指南（schema 说明 / 提交流程 / 常见问题） - README.md: 加多语言段落 ## 验证 - uv run scripts/i18n/validate-i18n.py: OK，49 文件 0 错误 - uv run scripts/i18n/translate.py --check: 0 stale locale - 21 skills 标题数 zh-CN == en-US 严格对齐（最大 66=66） - skills-ref 规范校验：全部通过（顶层 name ASCII slug + description 单字段） Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com> * fix(i18n): 修复 PR #1 review 反馈的 6 项问题 - schema: translated_by 正则放宽为 ^(human|ai:[A-Za-z0-9._:/-]+)$，接受 'ai:github:openai/gpt-5-mini' 这类 backend:model 形式（CI 翻译输出格式） - README + docs/I18N.md: 修正"CI 用 Claude API"误导描述，正确说明默认是 GitHub Models（openai/gpt-5-mini）+ GITHUB_TOKEN，可选切到 Anthropic - skills/minimax-tts/SKILL.md & SKILL.zh-CN.md: 删除多余的 ``` 闭合，避免 Markdown 后续渲染错乱 - skills/docx/SKILL.md: 翻译时丢失的 • Unicode escape 示例已恢复，与 zh-CN 版本对齐 Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com> --------- Co-authored-by: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
2026-07-23 06:03:45 +08:00 · 2026-05-05 00:26:33 +08:00
parent 1c107a9344
commit 1f7c8b9673
59 changed files with 10533 additions and 2014 deletions
--- a/skills/minimax-music-gen/SKILL.zh-CN.md
+++ b/skills/minimax-music-gen/SKILL.zh-CN.md
@@ -0,0 +1,230 @@
+<!-- locale: zh-CN -->
+
+# minimax-music-gen 技能
+
+## 强制规则（违反将导致功能失败）
+
+1. **必须用 HTTPS 访问 agent-service** — `https://127.0.0.1:${PORT}` 加 `-k` 跳过证书验证
+2. **全程使用 Bash curl** — 不要使用 HttpRequest 工具或 Python
+3. **禁止使用 `output_format: "url"`** — URL 下载在 Token Plan 等场景下会因 CDN 鉴权失败返回空文件。必须使用默认的 hex 格式，音频数据直接在 API 响应中返回
+
+## 完整执行流程
+
+### 前置条件
+
+- 用户已在资源管理器-算力中配置 MiniMax Provider（常规 API 或 Token Plan）并填写 API Key
+- agent-service 正在运行
+
+### 核心概念
+
+MiniMax Music Generation 是**同步 API**（非异步任务模式），调用后直接返回音频数据。支持三种模式：
+
+| 模式 | model | 说明 |
+|------|-------|------|
+| 歌曲生成 | `music-2.6` | 提供 prompt + lyrics，生成带人声的歌曲 |
+| 纯器乐 | `music-2.6` | 设置 `is_instrumental: true`，仅需 prompt |
+| 翻唱/Cover | `music-cover` | 提供参考音频 + prompt，基于旋律骨架重新编曲 |
+
+### 歌词结构标签
+
+lyrics 字段支持以下结构标签来组织歌曲段落：
+
+| 标签 | 含义 |
+|------|------|
+| `[verse]` | 主歌 |
+| `[chorus]` | 副歌 |
+| `[bridge]` | 桥段 |
+| `[intro]` | 前奏 |
+| `[outro]` | 尾声 |
+| `[interlude]` | 间奏 |
+
+示例歌词格式：
+```
+[verse]
+夜晚的城市灯火阑珊
+我独自走在回家的路上
+
+[chorus]
+这一刻时间仿佛停止
+所有的喧嚣都已远去
+```
+
+### 生成歌曲（带人声）
+
+**注意：不要传 `output_format` 参数，使用默认的 hex 格式。**
+
+```bash
+PORT=$(cat ~/.desirecore/agent-service.port)
+curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "provider": "minimax",
+    "endpoint": "/music_generation",
+    "body": {
+      "model": "music-2.6",
+      "prompt": "独立民谣,温暖,治愈,吉他伴奏",
+      "lyrics": "[verse]\n歌词内容\n\n[chorus]\n副歌内容",
+      "audio_setting": {
+        "format": "mp3",
+        "sample_rate": 44100,
+        "bitrate": 256000
+      }
+    },
+    "responseType": "json"
+  }'
+```
+
+### 生成纯器乐
+
+```bash
+PORT=$(cat ~/.desirecore/agent-service.port)
+curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "provider": "minimax",
+    "endpoint": "/music_generation",
+    "body": {
+      "model": "music-2.6",
+      "prompt": "电子音乐,氛围感,空灵,合成器铺底",
+      "is_instrumental": true,
+      "audio_setting": {
+        "format": "mp3",
+        "sample_rate": 44100,
+        "bitrate": 256000
+      }
+    },
+    "responseType": "json"
+  }'
+```
+
+### 响应处理与保存
+
+API 返回 JSON，音频数据以 hex 编码存放在 `data.data.audio.data` 字段中。
+
+**响应结构**：
+```json
+{
+  "success": true,
+  "data": {
+    "data": {
+      "audio": {
+        "data": "hex编码的音频数据...",
+        "status": 2
+      }
+    },
+    "extra_info": {
+      "music_duration": 180000,
+      "music_sample_rate": 44100,
+      "music_channel": 2,
+      "bitrate": 256000,
+      "music_size": 1234567
+    },
+    "base_resp": { "status_code": 0, "status_msg": "success" }
+  },
+  "statusCode": 200
+}
+```
+
+**注意**：`status` 字段含义为 1=合成中（流式场景）、2=合成完成。非流式模式下返回时 status 为 2。
+
+### 将 hex 音频数据保存到 media-store
+
+从响应 JSON 中提取 `data.data.audio.data` 字段的 hex 字符串，转为二进制后上传：
+
+```bash
+PORT=$(cat ~/.desirecore/agent-service.port)
+# 将 API 响应保存到临时文件（避免 hex 数据过大撑爆 shell 变量）
+# 假设上一步的 curl 输出已保存到 /tmp/minimax-music-resp.json
+
+# 提取 hex 数据并转为二进制（纯 Bash，不依赖 Python）
+jq -r '.data.data.audio.data' /tmp/minimax-music-resp.json | xxd -r -p > /tmp/minimax-music.mp3
+
+# 验证文件有效（大于 1KB 且为音频格式）
+FILE_SIZE=$(stat -f%z /tmp/minimax-music.mp3 2>/dev/null || stat -c%s /tmp/minimax-music.mp3 2>/dev/null)
+if [ "$FILE_SIZE" -lt 1024 ]; then
+  echo "ERROR: 音频文件异常（${FILE_SIZE} 字节），可能生成失败"
+  exit 1
+fi
+
+# 上传到 media-store
+curl -sk -X POST "https://127.0.0.1:${PORT}/api/media/upload" \
+  -F "file=@/tmp/minimax-music.mp3;type=audio/mpeg"
+```
+
+从上传响应 JSON 中提取 `mediaId` 字段。
+
+### 展示结果
+
+在回复中使用 dc-media 协议引用（前端会自动识别音频扩展名并渲染播放器）：
+
+```
+![音乐生成结果](dc-media://这里替换为mediaId)
+```
+
+### 参数说明
+
+| 参数 | 说明 | 必填 | 默认值 |
+|------|------|------|--------|
+| model | 模型名称 | 是 | "music-2.6" |
+| prompt | 音乐风格/情绪描述 | 有歌词时可选，纯器乐/cover 必填 | — |
+| lyrics | 歌词（支持结构标签） | 非纯器乐模式必填 | — |
+| is_instrumental | 是否生成纯器乐 | 否 | false |
+| lyrics_optimizer | 根据 prompt 自动生成歌词 | 否 | false |
+| audio_setting.format | 音频格式：mp3/wav/pcm | 否 | "mp3" |
+| audio_setting.sample_rate | 采样率：16000/24000/32000/44100 | 否 | 32000 |
+| audio_setting.bitrate | 比特率：32000/64000/128000/256000 | 否 | 128000 |
+
+### prompt 写法建议
+
+prompt 用于描述音乐的风格、情绪和乐器编排，建议用逗号分隔关键词：
+
+- 风格：`独立民谣`、`电子舞曲`、`古典钢琴`、`摇滚`、`R&B`、`爵士`、`嘻哈`
+- 情绪：`温暖`、`忧郁`、`欢快`、`史诗感`、`空灵`、`治愈`
+- 乐器：`吉他伴奏`、`钢琴独奏`、`弦乐铺底`、`合成器`、`鼓点强劲`
+- 结构：`渐进式编曲`、`开场留白渐入高潮`、`轻柔开头爆发副歌`
+
+示例：`"独立民谣,温暖治愈,木吉他为主,轻柔的鼓点,渐进式编曲"`
+
+### 自动生成歌词模式
+
+如果用户只描述了想要的音乐风格但没有提供歌词，可以设置 `lyrics_optimizer: true`，模型会根据 prompt 自动生成歌词：
+
+```bash
+PORT=$(cat ~/.desirecore/agent-service.port)
+curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
+  -H "Content-Type: application/json" \
+  -d '{
+    "provider": "minimax",
+    "endpoint": "/music_generation",
+    "body": {
+      "model": "music-2.6",
+      "prompt": "一首关于夏日海边回忆的歌,独立民谣,温暖,吉他",
+      "lyrics_optimizer": true,
+      "audio_setting": {
+        "format": "mp3",
+        "sample_rate": 44100,
+        "bitrate": 256000
+      }
+    },
+    "responseType": "json"
+  }'
+```
+
+### 错误处理
+
+- `base_resp.status_code: 1002`：频率限制，稍后重试
+- `base_resp.status_code: 1004`：API Key 认证失败
+- `base_resp.status_code: 1008`：余额不足
+- `base_resp.status_code: 1026`：内容敏感，修改歌词或 prompt 后重试
+- `base_resp.status_code: 2013`：参数错误，检查必填字段
+- `success: false` + `error: "未找到匹配的供应商"`：未配置 MiniMax Provider
+
+### 注意事项
+
+- prompt 长度限制 1-2000 字符，lyrics 长度限制 1-3500 字符
+- Token Plan 用户：所有套餐免费使用 music-2.6（100 首/天，每首 ≤5 分钟）
+- 如果用户未明确要求，默认使用 `music-2.6` + `mp3` 格式 + 44100 采样率
+- 如果用户只给了主题没给歌词，使用 `lyrics_optimizer: true` 自动生成歌词
+- 如果用户要求纯音乐/伴奏，设置 `is_instrumental: true`
+- 音乐生成耗时较长（通常 30-90 秒），请耐心等待
+- hex 数据量较大（几 MB），务必用临时文件中转，不要用 shell 变量存储