feat: 新增 minimax-music-gen 内置技能 (v1.1.1)

- 基于 music-2.6 模型，使用 hex 格式避免 CDN 鉴权失败 - 修复 hex→二进制转码：用 jq + xxd 替代 python3，与强制规则一致 - 加入 builtin-skills.json 清单
2026-07-23 04:44:36 +08:00 · 2026-05-03 22:45:12 +08:00
parent 1a50969b93
commit 64a7bf0096
3 changed files with 276 additions and 2 deletions
--- a/builtin-skills.json
+++ b/builtin-skills.json
@@ -10,6 +10,7 @@
    "manage-skills",
    "manage-teams",
    "minimax-image-gen",
    "minimax-music-gen",
    "minimax-tts",
    "minimax-video-gen",
    "nodejs-runtime",
--- a/manifest.json
+++ b/manifest.json
@@ -15,8 +15,8 @@
  },
  "stats": {
    "totalAgents": 1,
-    "totalSkills": 21,
+    "totalSkills": 22,
-    "lastUpdated": "2026-05-02"
+    "lastUpdated": "2026-05-03"
  },
  "features": [
    "verified-only",
--- a/skills/minimax-music-gen/SKILL.md
+++ b/skills/minimax-music-gen/SKILL.md
@@ -0,0 +1,273 @@
 ---
 name: MiniMax 音乐生成
 description: >-
  Use this skill when the user wants to generate music using MiniMax's
  Music Generation API. Supports text-to-music with lyrics, instrumental
  generation, and music cover. Use when 用户提到 生成音乐、文生音乐、
  AI 作曲、创作歌曲、写一首歌、音乐生成、AI 音乐、MiniMax 音乐、
  作词作曲、纯音乐、伴奏、翻唱、cover。
 license: Complete terms in LICENSE.txt
 version: 1.1.1
 type: procedural
 risk_level: low
 status: enabled
 disable-model-invocation: true
 provider: minimax
 tags:
  - media
  - audio
  - music
  - generation
  - minimax
 requires:
  tools:
    - Bash
 metadata:
  author: desirecore
  updated_at: '2026-05-03'
 market:
  icon: >-
    <svg xmlns="http://www.w3.org/2000/svg" width="24" height="24" viewBox="0 0
    24 24" fill="none"><rect x="3" y="3" width="18" height="18" rx="3"
    stroke="#AF52DE" stroke-width="1.5" fill="#AF52DE"
    fill-opacity="0.1"/><path d="M9 18V6l10-2v12" stroke="#AF52DE"
    stroke-width="1.5" stroke-linecap="round"
    stroke-linejoin="round"/><circle cx="6.5" cy="18" r="2.5" fill="#AF52DE"
    fill-opacity="0.6"/><circle cx="16.5" cy="16" r="2.5" fill="#AF52DE"
    fill-opacity="0.6"/></svg>
  short_desc: 基于 MiniMax Music 2.6 的文本生成音乐技能
  category: media
  maintainer:
    name: DesireCore Official
    verified: true
  channel: latest
 ---
 # minimax-music-gen 技能
 ## 强制规则（违反将导致功能失败）
 1. **必须用 HTTPS 访问 agent-service** — `https://127.0.0.1:${PORT}` 加 `-k` 跳过证书验证
 2. **全程使用 Bash curl** — 不要使用 HttpRequest 工具或 Python
 3. **禁止使用 `output_format: "url"`** — URL 下载在 Token Plan 等场景下会因 CDN 鉴权失败返回空文件。必须使用默认的 hex 格式，音频数据直接在 API 响应中返回
 ## 完整执行流程
 ### 前置条件
 - 用户已在资源管理器-算力中配置 MiniMax Provider（常规 API 或 Token Plan）并填写 API Key
 - agent-service 正在运行
 ### 核心概念
 MiniMax Music Generation 是**同步 API**（非异步任务模式），调用后直接返回音频数据。支持三种模式：
 | 模式 | model | 说明 |
 |------|-------|------|
 | 歌曲生成 | `music-2.6` | 提供 prompt + lyrics，生成带人声的歌曲 |
 | 纯器乐 | `music-2.6` | 设置 `is_instrumental: true`，仅需 prompt |
 | 翻唱/Cover | `music-cover` | 提供参考音频 + prompt，基于旋律骨架重新编曲 |
 ### 歌词结构标签
 lyrics 字段支持以下结构标签来组织歌曲段落：
 | 标签 | 含义 |
 |------|------|
 | `[verse]` | 主歌 |
 | `[chorus]` | 副歌 |
 | `[bridge]` | 桥段 |
 | `[intro]` | 前奏 |
 | `[outro]` | 尾声 |
 | `[interlude]` | 间奏 |
 示例歌词格式：
 ```
 [verse]
 夜晚的城市灯火阑珊
 我独自走在回家的路上
 [chorus]
 这一刻时间仿佛停止
 所有的喧嚣都已远去
 ```
 ### 生成歌曲（带人声）
 **注意：不要传 `output_format` 参数，使用默认的 hex 格式。**
 ```bash
 PORT=$(cat ~/.desirecore/agent-service.port)
 curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
  -H "Content-Type: application/json" \
  -d '{
    "provider": "minimax",
    "endpoint": "/music_generation",
    "body": {
      "model": "music-2.6",
      "prompt": "独立民谣,温暖,治愈,吉他伴奏",
      "lyrics": "[verse]\n歌词内容\n\n[chorus]\n副歌内容",
      "audio_setting": {
        "format": "mp3",
        "sample_rate": 44100,
        "bitrate": 256000
      }
    },
    "responseType": "json"
  }'
 ```
 ### 生成纯器乐
 ```bash
 PORT=$(cat ~/.desirecore/agent-service.port)
 curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
  -H "Content-Type: application/json" \
  -d '{
    "provider": "minimax",
    "endpoint": "/music_generation",
    "body": {
      "model": "music-2.6",
      "prompt": "电子音乐,氛围感,空灵,合成器铺底",
      "is_instrumental": true,
      "audio_setting": {
        "format": "mp3",
        "sample_rate": 44100,
        "bitrate": 256000
      }
    },
    "responseType": "json"
  }'
 ```
 ### 响应处理与保存
 API 返回 JSON，音频数据以 hex 编码存放在 `data.data.audio.data` 字段中。
 **响应结构**：
 ```json
 {
  "success": true,
  "data": {
    "data": {
      "audio": {
        "data": "hex编码的音频数据...",
        "status": 2
      }
    },
    "extra_info": {
      "music_duration": 180000,
      "music_sample_rate": 44100,
      "music_channel": 2,
      "bitrate": 256000,
      "music_size": 1234567
    },
    "base_resp": { "status_code": 0, "status_msg": "success" }
  },
  "statusCode": 200
 }
 ```
 **注意**：`status` 字段含义为 1=合成中（流式场景）、2=合成完成。非流式模式下返回时 status 为 2。
 ### 将 hex 音频数据保存到 media-store
 从响应 JSON 中提取 `data.data.audio.data` 字段的 hex 字符串，转为二进制后上传：
 ```bash
 PORT=$(cat ~/.desirecore/agent-service.port)
 # 将 API 响应保存到临时文件（避免 hex 数据过大撑爆 shell 变量）
 # 假设上一步的 curl 输出已保存到 /tmp/minimax-music-resp.json
 # 提取 hex 数据并转为二进制（纯 Bash，不依赖 Python）
 jq -r '.data.data.audio.data' /tmp/minimax-music-resp.json | xxd -r -p > /tmp/minimax-music.mp3
 # 验证文件有效（大于 1KB 且为音频格式）
 FILE_SIZE=$(stat -f%z /tmp/minimax-music.mp3 2>/dev/null || stat -c%s /tmp/minimax-music.mp3 2>/dev/null)
 if [ "$FILE_SIZE" -lt 1024 ]; then
  echo "ERROR: 音频文件异常（${FILE_SIZE} 字节），可能生成失败"
  exit 1
 fi
 # 上传到 media-store
 curl -sk -X POST "https://127.0.0.1:${PORT}/api/media/upload" \
  -F "file=@/tmp/minimax-music.mp3;type=audio/mpeg"
 ```
 从上传响应 JSON 中提取 `mediaId` 字段。
 ### 展示结果
 在回复中使用 dc-media 协议引用（前端会自动识别音频扩展名并渲染播放器）：
 ```
 ![音乐生成结果](dc-media://这里替换为mediaId)
 ```
 ### 参数说明
 | 参数 | 说明 | 必填 | 默认值 |
 |------|------|------|--------|
 | model | 模型名称 | 是 | "music-2.6" |
 | prompt | 音乐风格/情绪描述 | 有歌词时可选，纯器乐/cover 必填 | — |
 | lyrics | 歌词（支持结构标签） | 非纯器乐模式必填 | — |
 | is_instrumental | 是否生成纯器乐 | 否 | false |
 | lyrics_optimizer | 根据 prompt 自动生成歌词 | 否 | false |
 | audio_setting.format | 音频格式：mp3/wav/pcm | 否 | "mp3" |
 | audio_setting.sample_rate | 采样率：16000/24000/32000/44100 | 否 | 32000 |
 | audio_setting.bitrate | 比特率：32000/64000/128000/256000 | 否 | 128000 |
 ### prompt 写法建议
 prompt 用于描述音乐的风格、情绪和乐器编排，建议用逗号分隔关键词：
 - 风格：`独立民谣`、`电子舞曲`、`古典钢琴`、`摇滚`、`R&B`、`爵士`、`嘻哈`
 - 情绪：`温暖`、`忧郁`、`欢快`、`史诗感`、`空灵`、`治愈`
 - 乐器：`吉他伴奏`、`钢琴独奏`、`弦乐铺底`、`合成器`、`鼓点强劲`
 - 结构：`渐进式编曲`、`开场留白渐入高潮`、`轻柔开头爆发副歌`
 示例：`"独立民谣,温暖治愈,木吉他为主,轻柔的鼓点,渐进式编曲"`
 ### 自动生成歌词模式
 如果用户只描述了想要的音乐风格但没有提供歌词，可以设置 `lyrics_optimizer: true`，模型会根据 prompt 自动生成歌词：
 ```bash
 PORT=$(cat ~/.desirecore/agent-service.port)
 curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \
  -H "Content-Type: application/json" \
  -d '{
    "provider": "minimax",
    "endpoint": "/music_generation",
    "body": {
      "model": "music-2.6",
      "prompt": "一首关于夏日海边回忆的歌,独立民谣,温暖,吉他",
      "lyrics_optimizer": true,
      "audio_setting": {
        "format": "mp3",
        "sample_rate": 44100,
        "bitrate": 256000
      }
    },
    "responseType": "json"
  }'
 ```
 ### 错误处理
 - `base_resp.status_code: 1002`：频率限制，稍后重试
 - `base_resp.status_code: 1004`：API Key 认证失败
 - `base_resp.status_code: 1008`：余额不足
 - `base_resp.status_code: 1026`：内容敏感，修改歌词或 prompt 后重试
 - `base_resp.status_code: 2013`：参数错误，检查必填字段
 - `success: false` + `error: "未找到匹配的供应商"`：未配置 MiniMax Provider
 ### 注意事项
 - prompt 长度限制 1-2000 字符，lyrics 长度限制 1-3500 字符
 - Token Plan 用户：所有套餐免费使用 music-2.6（100 首/天，每首 ≤5 分钟）
 - 如果用户未明确要求，默认使用 `music-2.6` + `mp3` 格式 + 44100 采样率
 - 如果用户只给了主题没给歌词，使用 `lyrics_optimizer: true` 自动生成歌词
 - 如果用户要求纯音乐/伴奏，设置 `is_instrumental: true`
 - 音乐生成耗时较长（通常 30-90 秒），请耐心等待
 - hex 数据量较大（几 MB），务必用临时文件中转，不要用 shell 变量存储