From 64a7bf009689ee79d68a685cac92628d869c9083 Mon Sep 17 00:00:00 2001 From: xieyuanxiang <124608760@qq.com> Date: Sun, 3 May 2026 22:45:12 +0800 Subject: [PATCH] =?UTF-8?q?feat:=20=E6=96=B0=E5=A2=9E=20minimax-music-gen?= =?UTF-8?q?=20=E5=86=85=E7=BD=AE=E6=8A=80=E8=83=BD=20(v1.1.1)?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit - 基于 music-2.6 模型,使用 hex 格式避免 CDN 鉴权失败 - 修复 hex→二进制转码:用 jq + xxd 替代 python3,与强制规则一致 - 加入 builtin-skills.json 清单 --- builtin-skills.json | 1 + manifest.json | 4 +- skills/minimax-music-gen/SKILL.md | 273 ++++++++++++++++++++++++++++++ 3 files changed, 276 insertions(+), 2 deletions(-) create mode 100644 skills/minimax-music-gen/SKILL.md diff --git a/builtin-skills.json b/builtin-skills.json index 8a4ddc6..0905cd7 100644 --- a/builtin-skills.json +++ b/builtin-skills.json @@ -10,6 +10,7 @@ "manage-skills", "manage-teams", "minimax-image-gen", + "minimax-music-gen", "minimax-tts", "minimax-video-gen", "nodejs-runtime", diff --git a/manifest.json b/manifest.json index 7a9e1ce..54ef75c 100644 --- a/manifest.json +++ b/manifest.json @@ -15,8 +15,8 @@ }, "stats": { "totalAgents": 1, - "totalSkills": 21, - "lastUpdated": "2026-05-02" + "totalSkills": 22, + "lastUpdated": "2026-05-03" }, "features": [ "verified-only", diff --git a/skills/minimax-music-gen/SKILL.md b/skills/minimax-music-gen/SKILL.md new file mode 100644 index 0000000..c39d5e4 --- /dev/null +++ b/skills/minimax-music-gen/SKILL.md @@ -0,0 +1,273 @@ +--- +name: MiniMax 音乐生成 +description: >- + Use this skill when the user wants to generate music using MiniMax's + Music Generation API. Supports text-to-music with lyrics, instrumental + generation, and music cover. Use when 用户提到 生成音乐、文生音乐、 + AI 作曲、创作歌曲、写一首歌、音乐生成、AI 音乐、MiniMax 音乐、 + 作词作曲、纯音乐、伴奏、翻唱、cover。 +license: Complete terms in LICENSE.txt +version: 1.1.1 +type: procedural +risk_level: low +status: enabled +disable-model-invocation: true +provider: minimax +tags: + - media + - audio + - music + - generation + - minimax +requires: + tools: + - Bash +metadata: + author: desirecore + updated_at: '2026-05-03' +market: + icon: >- + + short_desc: 基于 MiniMax Music 2.6 的文本生成音乐技能 + category: media + maintainer: + name: DesireCore Official + verified: true + channel: latest +--- + +# minimax-music-gen 技能 + +## 强制规则(违反将导致功能失败) + +1. **必须用 HTTPS 访问 agent-service** — `https://127.0.0.1:${PORT}` 加 `-k` 跳过证书验证 +2. **全程使用 Bash curl** — 不要使用 HttpRequest 工具或 Python +3. **禁止使用 `output_format: "url"`** — URL 下载在 Token Plan 等场景下会因 CDN 鉴权失败返回空文件。必须使用默认的 hex 格式,音频数据直接在 API 响应中返回 + +## 完整执行流程 + +### 前置条件 + +- 用户已在资源管理器-算力中配置 MiniMax Provider(常规 API 或 Token Plan)并填写 API Key +- agent-service 正在运行 + +### 核心概念 + +MiniMax Music Generation 是**同步 API**(非异步任务模式),调用后直接返回音频数据。支持三种模式: + +| 模式 | model | 说明 | +|------|-------|------| +| 歌曲生成 | `music-2.6` | 提供 prompt + lyrics,生成带人声的歌曲 | +| 纯器乐 | `music-2.6` | 设置 `is_instrumental: true`,仅需 prompt | +| 翻唱/Cover | `music-cover` | 提供参考音频 + prompt,基于旋律骨架重新编曲 | + +### 歌词结构标签 + +lyrics 字段支持以下结构标签来组织歌曲段落: + +| 标签 | 含义 | +|------|------| +| `[verse]` | 主歌 | +| `[chorus]` | 副歌 | +| `[bridge]` | 桥段 | +| `[intro]` | 前奏 | +| `[outro]` | 尾声 | +| `[interlude]` | 间奏 | + +示例歌词格式: +``` +[verse] +夜晚的城市灯火阑珊 +我独自走在回家的路上 + +[chorus] +这一刻时间仿佛停止 +所有的喧嚣都已远去 +``` + +### 生成歌曲(带人声) + +**注意:不要传 `output_format` 参数,使用默认的 hex 格式。** + +```bash +PORT=$(cat ~/.desirecore/agent-service.port) +curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \ + -H "Content-Type: application/json" \ + -d '{ + "provider": "minimax", + "endpoint": "/music_generation", + "body": { + "model": "music-2.6", + "prompt": "独立民谣,温暖,治愈,吉他伴奏", + "lyrics": "[verse]\n歌词内容\n\n[chorus]\n副歌内容", + "audio_setting": { + "format": "mp3", + "sample_rate": 44100, + "bitrate": 256000 + } + }, + "responseType": "json" + }' +``` + +### 生成纯器乐 + +```bash +PORT=$(cat ~/.desirecore/agent-service.port) +curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \ + -H "Content-Type: application/json" \ + -d '{ + "provider": "minimax", + "endpoint": "/music_generation", + "body": { + "model": "music-2.6", + "prompt": "电子音乐,氛围感,空灵,合成器铺底", + "is_instrumental": true, + "audio_setting": { + "format": "mp3", + "sample_rate": 44100, + "bitrate": 256000 + } + }, + "responseType": "json" + }' +``` + +### 响应处理与保存 + +API 返回 JSON,音频数据以 hex 编码存放在 `data.data.audio.data` 字段中。 + +**响应结构**: +```json +{ + "success": true, + "data": { + "data": { + "audio": { + "data": "hex编码的音频数据...", + "status": 2 + } + }, + "extra_info": { + "music_duration": 180000, + "music_sample_rate": 44100, + "music_channel": 2, + "bitrate": 256000, + "music_size": 1234567 + }, + "base_resp": { "status_code": 0, "status_msg": "success" } + }, + "statusCode": 200 +} +``` + +**注意**:`status` 字段含义为 1=合成中(流式场景)、2=合成完成。非流式模式下返回时 status 为 2。 + +### 将 hex 音频数据保存到 media-store + +从响应 JSON 中提取 `data.data.audio.data` 字段的 hex 字符串,转为二进制后上传: + +```bash +PORT=$(cat ~/.desirecore/agent-service.port) +# 将 API 响应保存到临时文件(避免 hex 数据过大撑爆 shell 变量) +# 假设上一步的 curl 输出已保存到 /tmp/minimax-music-resp.json + +# 提取 hex 数据并转为二进制(纯 Bash,不依赖 Python) +jq -r '.data.data.audio.data' /tmp/minimax-music-resp.json | xxd -r -p > /tmp/minimax-music.mp3 + +# 验证文件有效(大于 1KB 且为音频格式) +FILE_SIZE=$(stat -f%z /tmp/minimax-music.mp3 2>/dev/null || stat -c%s /tmp/minimax-music.mp3 2>/dev/null) +if [ "$FILE_SIZE" -lt 1024 ]; then + echo "ERROR: 音频文件异常(${FILE_SIZE} 字节),可能生成失败" + exit 1 +fi + +# 上传到 media-store +curl -sk -X POST "https://127.0.0.1:${PORT}/api/media/upload" \ + -F "file=@/tmp/minimax-music.mp3;type=audio/mpeg" +``` + +从上传响应 JSON 中提取 `mediaId` 字段。 + +### 展示结果 + +在回复中使用 dc-media 协议引用(前端会自动识别音频扩展名并渲染播放器): + +``` +![音乐生成结果](dc-media://这里替换为mediaId) +``` + +### 参数说明 + +| 参数 | 说明 | 必填 | 默认值 | +|------|------|------|--------| +| model | 模型名称 | 是 | "music-2.6" | +| prompt | 音乐风格/情绪描述 | 有歌词时可选,纯器乐/cover 必填 | — | +| lyrics | 歌词(支持结构标签) | 非纯器乐模式必填 | — | +| is_instrumental | 是否生成纯器乐 | 否 | false | +| lyrics_optimizer | 根据 prompt 自动生成歌词 | 否 | false | +| audio_setting.format | 音频格式:mp3/wav/pcm | 否 | "mp3" | +| audio_setting.sample_rate | 采样率:16000/24000/32000/44100 | 否 | 32000 | +| audio_setting.bitrate | 比特率:32000/64000/128000/256000 | 否 | 128000 | + +### prompt 写法建议 + +prompt 用于描述音乐的风格、情绪和乐器编排,建议用逗号分隔关键词: + +- 风格:`独立民谣`、`电子舞曲`、`古典钢琴`、`摇滚`、`R&B`、`爵士`、`嘻哈` +- 情绪:`温暖`、`忧郁`、`欢快`、`史诗感`、`空灵`、`治愈` +- 乐器:`吉他伴奏`、`钢琴独奏`、`弦乐铺底`、`合成器`、`鼓点强劲` +- 结构:`渐进式编曲`、`开场留白渐入高潮`、`轻柔开头爆发副歌` + +示例:`"独立民谣,温暖治愈,木吉他为主,轻柔的鼓点,渐进式编曲"` + +### 自动生成歌词模式 + +如果用户只描述了想要的音乐风格但没有提供歌词,可以设置 `lyrics_optimizer: true`,模型会根据 prompt 自动生成歌词: + +```bash +PORT=$(cat ~/.desirecore/agent-service.port) +curl -sk -X POST "https://127.0.0.1:${PORT}/api/media-proxy" \ + -H "Content-Type: application/json" \ + -d '{ + "provider": "minimax", + "endpoint": "/music_generation", + "body": { + "model": "music-2.6", + "prompt": "一首关于夏日海边回忆的歌,独立民谣,温暖,吉他", + "lyrics_optimizer": true, + "audio_setting": { + "format": "mp3", + "sample_rate": 44100, + "bitrate": 256000 + } + }, + "responseType": "json" + }' +``` + +### 错误处理 + +- `base_resp.status_code: 1002`:频率限制,稍后重试 +- `base_resp.status_code: 1004`:API Key 认证失败 +- `base_resp.status_code: 1008`:余额不足 +- `base_resp.status_code: 1026`:内容敏感,修改歌词或 prompt 后重试 +- `base_resp.status_code: 2013`:参数错误,检查必填字段 +- `success: false` + `error: "未找到匹配的供应商"`:未配置 MiniMax Provider + +### 注意事项 + +- prompt 长度限制 1-2000 字符,lyrics 长度限制 1-3500 字符 +- Token Plan 用户:所有套餐免费使用 music-2.6(100 首/天,每首 ≤5 分钟) +- 如果用户未明确要求,默认使用 `music-2.6` + `mp3` 格式 + 44100 采样率 +- 如果用户只给了主题没给歌词,使用 `lyrics_optimizer: true` 自动生成歌词 +- 如果用户要求纯音乐/伴奏,设置 `is_instrumental: true` +- 音乐生成耗时较长(通常 30-90 秒),请耐心等待 +- hex 数据量较大(几 MB),务必用临时文件中转,不要用 shell 变量存储