feat: skills i18n 改造(schemaVersion 1.1,零向后兼容) (#1)

* feat: skills i18n 改造 — schemaVersion 1.1,零向后兼容

把 21 个 skills + 1 个 agent + manifest/categories 全量迁移到 schemaVersion 1.1
的 i18n 结构,配套 CI AI 翻译流水线(GitHub Models)与本地工具链。

## 关键变更

### 数据结构(破坏性,schemaVersion 1.0 → 1.1)
- SKILL.md: 顶层 name 改为 ASCII slug(== 目录名,符合 agentskills.io 规范);
  中文显示名/short_desc/description 全部迁入 metadata.i18n.<locale>
- agents/<id>/agent.json: shortDesc/fullDesc/tags/persona.{role,traits} 迁入
  i18n.<locale>;changelog[].changes 改为 { <locale>: string[] } 对象
- categories.json: 每个分类的 label/description 迁入 i18n.<locale>,顶层只剩
  color/icon
- manifest.json: 加 supportedLocales / defaultLocale;顶层 description 迁入
  i18n.<locale>

### Body 文件结构
- 根 SKILL.md = frontmatter + default_locale (en-US) body
- SKILL.<locale>.md = 各 locale 的 markdown body(首行 <!-- locale: xx --> 自校验)

### 工具链(scripts/i18n/)
- glossary.json: zh→en 术语表 + do_not_translate 白名单
- schema/skill-frontmatter.schema.json: i18n frontmatter JSON Schema
- validate-i18n.py: 8 条校验规则(name 合规 / locale 完整性 / hash 一致性等)
- translate.py: GitHub Models / Anthropic 双 backend,sha256 增量翻译
- migrate.py: 一次性迁移脚本(旧格式 → i18n 结构)

### CI(.github/workflows/)
- i18n-validate.yml: PR 触发跑 validate + translate --check
- i18n-translate.yml: PR 触发用 GitHub Models(默认 openai/gpt-5-mini)翻译缺失
  locale,自动追加 commit;可切到 ANTHROPIC_API_KEY 走 Claude

### 文档
- docs/I18N.md: 作者贡献指南(schema 说明 / 提交流程 / 常见问题)
- README.md: 加多语言段落

## 验证

- uv run scripts/i18n/validate-i18n.py: OK,49 文件 0 错误
- uv run scripts/i18n/translate.py --check: 0 stale locale
- 21 skills 标题数 zh-CN == en-US 严格对齐(最大 66=66)
- skills-ref 规范校验:全部通过(顶层 name ASCII slug + description 单字段)

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

* fix(i18n): 修复 PR #1 review 反馈的 6 项问题

- schema: translated_by 正则放宽为 ^(human|ai:[A-Za-z0-9._:/-]+)$,接受
  'ai:github:openai/gpt-5-mini' 这类 backend:model 形式(CI 翻译输出格式)
- README + docs/I18N.md: 修正"CI 用 Claude API"误导描述,正确说明默认是
  GitHub Models(openai/gpt-5-mini)+ GITHUB_TOKEN,可选切到 Anthropic
- skills/minimax-tts/SKILL.md & SKILL.zh-CN.md: 删除多余的 ``` 闭合,避免
  Markdown 后续渲染错乱
- skills/docx/SKILL.md: 翻译时丢失的 • Unicode escape 示例已恢复,
  与 zh-CN 版本对齐

Co-Authored-By: Claude Opus 4.7 (1M context) <noreply@anthropic.com>

---------

Co-authored-by: Claude Opus 4.7 (1M context) <noreply@anthropic.com>
This commit is contained in:
2026-05-05 00:26:33 +08:00
committed by GitHub
parent 1c107a9344
commit 1f7c8b9673
59 changed files with 10533 additions and 2014 deletions

View File

@@ -0,0 +1,230 @@
<!-- locale: zh-CN -->
# minimax-music-gen 技能
## 强制规则(违反将导致功能失败)
1. **必须用 HTTPS 访问 agent-service**`https://127.0.0.1:${PORT}``-k` 跳过证书验证
2. **全程使用 Bash curl** — 不要使用 HttpRequest 工具或 Python
3. **禁止使用 `output_format: "url"`** — URL 下载在 Token Plan 等场景下会因 CDN 鉴权失败返回空文件。必须使用默认的 hex 格式,音频数据直接在 API 响应中返回
## 完整执行流程
### 前置条件
- 用户已在资源管理器-算力中配置 MiniMax Provider常规 API 或 Token Plan并填写 API Key
- agent-service 正在运行
### 核心概念
MiniMax Music Generation 是**同步 API**(非异步任务模式),调用后直接返回音频数据。支持三种模式:
| 模式 | model | 说明 |
|------|-------|------|
| 歌曲生成 | `music-2.6` | 提供 prompt + lyrics生成带人声的歌曲 |
| 纯器乐 | `music-2.6` | 设置 `is_instrumental: true`,仅需 prompt |
| 翻唱/Cover | `music-cover` | 提供参考音频 + prompt基于旋律骨架重新编曲 |
### 歌词结构标签
lyrics 字段支持以下结构标签来组织歌曲段落:
| 标签 | 含义 |
|------|------|
| `[verse]` | 主歌 |
| `[chorus]` | 副歌 |
| `[bridge]` | 桥段 |
| `[intro]` | 前奏 |
| `[outro]` | 尾声 |
| `[interlude]` | 间奏 |
示例歌词格式:
```
[verse]
夜晚的城市灯火阑珊
我独自走在回家的路上
[chorus]
这一刻时间仿佛停止
所有的喧嚣都已远去
```
### 生成歌曲(带人声)
**注意:不要传 `output_format` 参数,使用默认的 hex 格式。**
```bash
PORT=$(cat ~/.desirecore/agent-service.port)
curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
-H "Content-Type: application/json" \
-d '{
"provider": "minimax",
"endpoint": "/music_generation",
"body": {
"model": "music-2.6",
"prompt": "独立民谣,温暖,治愈,吉他伴奏",
"lyrics": "[verse]\n歌词内容\n\n[chorus]\n副歌内容",
"audio_setting": {
"format": "mp3",
"sample_rate": 44100,
"bitrate": 256000
}
},
"responseType": "json"
}'
```
### 生成纯器乐
```bash
PORT=$(cat ~/.desirecore/agent-service.port)
curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
-H "Content-Type: application/json" \
-d '{
"provider": "minimax",
"endpoint": "/music_generation",
"body": {
"model": "music-2.6",
"prompt": "电子音乐,氛围感,空灵,合成器铺底",
"is_instrumental": true,
"audio_setting": {
"format": "mp3",
"sample_rate": 44100,
"bitrate": 256000
}
},
"responseType": "json"
}'
```
### 响应处理与保存
API 返回 JSON音频数据以 hex 编码存放在 `data.data.audio.data` 字段中。
**响应结构**
```json
{
"success": true,
"data": {
"data": {
"audio": {
"data": "hex编码的音频数据...",
"status": 2
}
},
"extra_info": {
"music_duration": 180000,
"music_sample_rate": 44100,
"music_channel": 2,
"bitrate": 256000,
"music_size": 1234567
},
"base_resp": { "status_code": 0, "status_msg": "success" }
},
"statusCode": 200
}
```
**注意**`status` 字段含义为 1=合成中流式场景、2=合成完成。非流式模式下返回时 status 为 2。
### 将 hex 音频数据保存到 media-store
从响应 JSON 中提取 `data.data.audio.data` 字段的 hex 字符串,转为二进制后上传:
```bash
PORT=$(cat ~/.desirecore/agent-service.port)
# 将 API 响应保存到临时文件(避免 hex 数据过大撑爆 shell 变量)
# 假设上一步的 curl 输出已保存到 /tmp/minimax-music-resp.json
# 提取 hex 数据并转为二进制(纯 Bash不依赖 Python
jq -r '.data.data.audio.data' /tmp/minimax-music-resp.json | xxd -r -p > /tmp/minimax-music.mp3
# 验证文件有效(大于 1KB 且为音频格式)
FILE_SIZE=$(stat -f%z /tmp/minimax-music.mp3 2>/dev/null || stat -c%s /tmp/minimax-music.mp3 2>/dev/null)
if [ "$FILE_SIZE" -lt 1024 ]; then
echo "ERROR: 音频文件异常(${FILE_SIZE} 字节),可能生成失败"
exit 1
fi
# 上传到 media-store
curl -sk -X POST "https://127.0.0.1:${PORT}/api/media/upload" \
-F "file=@/tmp/minimax-music.mp3;type=audio/mpeg"
```
从上传响应 JSON 中提取 `mediaId` 字段。
### 展示结果
在回复中使用 dc-media 协议引用(前端会自动识别音频扩展名并渲染播放器):
```
![音乐生成结果](dc-media://这里替换为mediaId)
```
### 参数说明
| 参数 | 说明 | 必填 | 默认值 |
|------|------|------|--------|
| model | 模型名称 | 是 | "music-2.6" |
| prompt | 音乐风格/情绪描述 | 有歌词时可选,纯器乐/cover 必填 | — |
| lyrics | 歌词(支持结构标签) | 非纯器乐模式必填 | — |
| is_instrumental | 是否生成纯器乐 | 否 | false |
| lyrics_optimizer | 根据 prompt 自动生成歌词 | 否 | false |
| audio_setting.format | 音频格式mp3/wav/pcm | 否 | "mp3" |
| audio_setting.sample_rate | 采样率16000/24000/32000/44100 | 否 | 32000 |
| audio_setting.bitrate | 比特率32000/64000/128000/256000 | 否 | 128000 |
### prompt 写法建议
prompt 用于描述音乐的风格、情绪和乐器编排,建议用逗号分隔关键词:
- 风格:`独立民谣``电子舞曲``古典钢琴``摇滚``R&B``爵士``嘻哈`
- 情绪:`温暖``忧郁``欢快``史诗感``空灵``治愈`
- 乐器:`吉他伴奏``钢琴独奏``弦乐铺底``合成器``鼓点强劲`
- 结构:`渐进式编曲``开场留白渐入高潮``轻柔开头爆发副歌`
示例:`"独立民谣,温暖治愈,木吉他为主,轻柔的鼓点,渐进式编曲"`
### 自动生成歌词模式
如果用户只描述了想要的音乐风格但没有提供歌词,可以设置 `lyrics_optimizer: true`,模型会根据 prompt 自动生成歌词:
```bash
PORT=$(cat ~/.desirecore/agent-service.port)
curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
-H "Content-Type: application/json" \
-d '{
"provider": "minimax",
"endpoint": "/music_generation",
"body": {
"model": "music-2.6",
"prompt": "一首关于夏日海边回忆的歌,独立民谣,温暖,吉他",
"lyrics_optimizer": true,
"audio_setting": {
"format": "mp3",
"sample_rate": 44100,
"bitrate": 256000
}
},
"responseType": "json"
}'
```
### 错误处理
- `base_resp.status_code: 1002`:频率限制,稍后重试
- `base_resp.status_code: 1004`API Key 认证失败
- `base_resp.status_code: 1008`:余额不足
- `base_resp.status_code: 1026`:内容敏感,修改歌词或 prompt 后重试
- `base_resp.status_code: 2013`:参数错误,检查必填字段
- `success: false` + `error: "未找到匹配的供应商"`:未配置 MiniMax Provider
### 注意事项
- prompt 长度限制 1-2000 字符lyrics 长度限制 1-3500 字符
- Token Plan 用户:所有套餐免费使用 music-2.6100 首/天,每首 ≤5 分钟)
- 如果用户未明确要求,默认使用 `music-2.6` + `mp3` 格式 + 44100 采样率
- 如果用户只给了主题没给歌词,使用 `lyrics_optimizer: true` 自动生成歌词
- 如果用户要求纯音乐/伴奏,设置 `is_instrumental: true`
- 音乐生成耗时较长(通常 30-90 秒),请耐心等待
- hex 数据量较大(几 MB务必用临时文件中转不要用 shell 变量存储