🎬 多媒体团队 - 角色能力定义

👥 团队成员

1. 视频剪辑师 🎬

职责: 视频压缩、转码、剪辑、帧提取能力:

多格式支持：mp4, avi, mov, mkv, webm, flv
智能压缩：根据目标大小自动调整CRF
帧提取：精确到秒的视频帧提取
视频转码：支持多种编码格式

默认配置:

{
  "format": "mp4",
  "codec": "libx264",
  "crf": 23,
  "preset": "medium"
}

使用示例:

# 压缩视频
压缩这个视频 /path/to/video.mp4

# 提取帧
提取视频第10秒的帧 /path/to/video.mp4

2. 视频创作师 🎥

职责: AI视频生成、文生视频、图生视频能力:

文生视频：根据文字描述生成视频
图生视频：图片转视频
多平台支持：可灵/Runway/Pika/Sora/即梦

支持平台:

平台	类型	定价	推荐
可灵AI	🇨🇳 国内	免费额度 + 付费	⭐ 推荐
即梦AI	🇨🇳 国内	免费额度 + 付费	⭐
Runway	🌍 国际	$12/月起	⭐
Pika Labs	🌍 国际	免费额度 + 付费
OpenAI Sora	🌍 国际	ChatGPT Plus $20/月

使用示例:

生成一个视频：猫咪在阳光下打盹

3. 字幕生成器 📝

职责: 自动生成字幕、字幕翻译能力:

语音识别：Whisper 模型
多语言支持：中文、英文等
格式输出：srt, vtt, ass

默认配置:

{
  "whisper_model": "medium",
  "language": "zh",
  "output_format": "srt"
}

4. 图片处理师 🖼️

职责: 图片压缩、格式转换、缩放能力:

多格式支持：jpg, jpeg, png, gif, webp, bmp
智能压缩：根据目标大小动态调整质量
批量处理：支持批量图片处理

默认配置:

{
  "format": "jpg",
  "quality": 85,
  "max_size_mb": 10
}

使用示例:

压缩这张图片 /path/to/image.png
批量压缩这个文件夹的图片 /path/to/images/

5. AI绘图师 🎨

职责: AI生成图片、图片风格转换能力:

文生图：DALL-E / Stable Diffusion
图生图：风格迁移
图片编辑：局部修改

支持平台:

DALL-E 3
Stable Diffusion
Midjourney (API待支持)

6. 音频处理师 🎵

职责: 音频提取、转码、剪辑能力:

多格式支持：mp3, wav, aac, flac, ogg, m4a
音频提取：从视频中提取音频
音频转码：格式转换

默认配置:

{
  "format": "mp3",
  "bitrate": "192k",
  "sample_rate": 44100
}

7. 质量检查员 📊

职责: 文件质量检查、格式验证能力:

格式检查：验证文件格式是否正确
分辨率检测：视频/图片分辨率
时长检测：视频/音频时长
码率检测：视频/音频码率

检查项:

格式是否正确
分辨率是否符合要求
文件大小是否超标
时长是否符合预期

📋 工作流

video_compress (视频压缩)

质量检查员检查视频
视频剪辑师压缩
质量检查员验证输出

video_create (视频生成)

视频创作师调用AI平台生成视频
质量检查员验证输出

video_subtitle (字幕生成)

字幕生成器提取音频并生成字幕
视频剪辑师嵌入字幕
质量检查员验证输出

image_batch (图片批量处理)

图片处理师处理图片
质量检查员验证输出

audio_extract (音频提取)

音频处理师提取音频
质量检查员验证输出

🎯 服务原则

原则	说明
质量	保持最佳画质/音质
效率	快速处理，及时交付
兼容	支持多种格式
智能	自动优化参数

ナビゲーション

Skillsとは？

リンク

🎬 多媒体团队 - 角色能力定义

🎬 多媒体团队 - 角色能力定义

👥 团队成员

1. 视频剪辑师 🎬

2. 视频创作师 🎥

3. 字幕生成器 📝

4. 图片处理师 🖼️

5. AI绘图师 🎨

6. 音频处理师 🎵

7. 质量检查员 📊

📋 工作流

video_compress (视频压缩)

video_create (视频生成)

video_subtitle (字幕生成)

image_batch (图片批量处理)

audio_extract (音频提取)

🎯 服务原则

関連スキル(🔧 開発ツール)