🎬 多媒体团队 - 角色能力定义
👥 团队成员
1. 视频剪辑师 🎬
职责: 视频压缩、转码、剪辑、帧提取 能力:
- 多格式支持:mp4, avi, mov, mkv, webm, flv
- 智能压缩:根据目标大小自动调整CRF
- 帧提取:精确到秒的视频帧提取
- 视频转码:支持多种编码格式
默认配置:
{
"format": "mp4",
"codec": "libx264",
"crf": 23,
"preset": "medium"
}
使用示例:
# 压缩视频
压缩这个视频 /path/to/video.mp4
# 提取帧
提取视频第10秒的帧 /path/to/video.mp4
2. 视频创作师 🎥
职责: AI视频生成、文生视频、图生视频 能力:
- 文生视频:根据文字描述生成视频
- 图生视频:图片转视频
- 多平台支持:可灵/Runway/Pika/Sora/即梦
支持平台:
| 平台 | 类型 | 定价 | 推荐 |
|---|---|---|---|
| 可灵AI | 🇨🇳 国内 | 免费额度 + 付费 | ⭐ 推荐 |
| 即梦AI | 🇨🇳 国内 | 免费额度 + 付费 | ⭐ |
| Runway | 🌍 国际 | $12/月起 | ⭐ |
| Pika Labs | 🌍 国际 | 免费额度 + 付费 | |
| OpenAI Sora | 🌍 国际 | ChatGPT Plus $20/月 |
使用示例:
生成一个视频:猫咪在阳光下打盹
3. 字幕生成器 📝
职责: 自动生成字幕、字幕翻译 能力:
- 语音识别:Whisper 模型
- 多语言支持:中文、英文等
- 格式输出:srt, vtt, ass
默认配置:
{
"whisper_model": "medium",
"language": "zh",
"output_format": "srt"
}
4. 图片处理师 🖼️
职责: 图片压缩、格式转换、缩放 能力:
- 多格式支持:jpg, jpeg, png, gif, webp, bmp
- 智能压缩:根据目标大小动态调整质量
- 批量处理:支持批量图片处理
默认配置:
{
"format": "jpg",
"quality": 85,
"max_size_mb": 10
}
使用示例:
压缩这张图片 /path/to/image.png
批量压缩这个文件夹的图片 /path/to/images/
5. AI绘图师 🎨
职责: AI生成图片、图片风格转换 能力:
- 文生图:DALL-E / Stable Diffusion
- 图生图:风格迁移
- 图片编辑:局部修改
支持平台:
- DALL-E 3
- Stable Diffusion
- Midjourney (API待支持)
6. 音频处理师 🎵
职责: 音频提取、转码、剪辑 能力:
- 多格式支持:mp3, wav, aac, flac, ogg, m4a
- 音频提取:从视频中提取音频
- 音频转码:格式转换
默认配置:
{
"format": "mp3",
"bitrate": "192k",
"sample_rate": 44100
}
7. 质量检查员 📊
职责: 文件质量检查、格式验证 能力:
- 格式检查:验证文件格式是否正确
- 分辨率检测:视频/图片分辨率
- 时长检测:视频/音频时长
- 码率检测:视频/音频码率
检查项:
- 格式是否正确
- 分辨率是否符合要求
- 文件大小是否超标
- 时长是否符合预期
📋 工作流
video_compress (视频压缩)
- 质量检查员检查视频
- 视频剪辑师压缩
- 质量检查员验证输出
video_create (视频生成)
- 视频创作师调用AI平台生成视频
- 质量检查员验证输出
video_subtitle (字幕生成)
- 字幕生成器提取音频并生成字幕
- 视频剪辑师嵌入字幕
- 质量检查员验证输出
image_batch (图片批量处理)
- 图片处理师处理图片
- 质量检查员验证输出
audio_extract (音频提取)
- 音频处理师提取音频
- 质量检查员验证输出
🎯 服务原则
| 原则 | 说明 |
|---|---|
| 质量 | 保持最佳画质/音质 |
| 效率 | 快速处理,及时交付 |
| 兼容 | 支持多种格式 |
| 智能 | 自动优化参数 |