媒体与流媒体 (Media & Streaming) - OpenClaw Skill 每日推荐
今天是 OpenClaw Skill 每日推荐的第17天!今天我们探索的是 媒体与流媒体 分类,这个分类包含 84个 技能,涵盖了音频、视频、流媒体播放、社交媒体等全方位的媒体处理和交互能力。
分类概述
媒体与流媒体分类是 OpenClaw 生态中最具娱乐性和实用性的分类之一,主要包含:
- 🎵 音乐控制:Apple Music、本地音频播放、流媒体音乐
- 🎬 视频处理:FFmpeg 视频编辑、格式转换、流媒体播放
- 📺 设备控制:Chromecast、Apple TV、智能音响
- 🎙️ AI 音频:语音合成、语音识别、声音克隆
- 📱 社交媒体:Instagram、YouTube 内容管理
- 🎥 内容生成:AI 视频、音乐生成、音效制作
精选 Skill 详解
1. 🍎 apple-music - Apple Music 深度集成
GitHub: epheterson/mcp-applemusic
推荐指数: ⭐⭐⭐⭐⭐
核心功能
这个 skill 提供了两种集成方式:
AppleScript (macOS)
- 零配置,立即可用
- 完整的播放控制(播放、暂停、跳过、音量)
- 播放列表管理(创建、编辑、删除)
- 音乐库搜索和管理
- AirPlay 设备控制
MusicKit API (跨平台)
- 需要 Apple Developer 账户($99/年)
- 支持跨平台(Windows、Linux)
- 曲目库搜索功能
- 个性化推荐和历史记录
技术实现
1 | # AppleScript 示例 - 控制播放 |
实用场景
- 自动化播放列表创建:根据心情、时间、活动自动生成播放列表
- 音乐数据分析:追踪听歌历史、统计最爱歌手和歌曲
- 智能推荐:基于听歌习惯推荐新音乐
- 多房间音响控制:通过 AirPlay 同步控制多个房间
重要提示
⚠️ 关键限制:不能直接将曲目库歌曲添加到播放列表,必须先添加到音乐库,然后使用库 ID 而非曲目库 ID。
2. 📺 chromecast - Chromecast 设备完全控制
GitHub: morozred/chromecast-control
推荐指数: ⭐⭐⭐⭐⭐
核心功能
基于 catt (Cast All The Things) CLI 工具,提供完整的 Chromecast 控制能力:
- 设备发现与管理:扫描网络中的所有 Chromecast 设备
- 媒体投射:支持 YouTube、Vimeo、本地文件等数百种视频源
- 播放控制:播放、暂停、跳过、音量控制
- 队列管理:添加视频到播放队列、保存/恢复播放状态
- 高级功能:字幕支持、时间戳跳转、格式选择
技术实现
1 | # 扫描所有设备 |
实用场景
- 自动化观影:定时投射视频、自动播放列表
- 多设备同步:同时控制多个房间的 Chromecast
- 内容分发:从 AI 生成的内容直接投射到电视
- 背景音乐:创建自动化音乐播放队列
网络要求
⚠️ Chromecast 和控制设备必须在同一网络,TCP 端口 45000-47000 需要开放用于本地文件投射。
3. 🎙️ elevenlabs-cli - AI 音频全功能平台
GitHub: hongkongkiwi/elevenlabs-cli
推荐指数: ⭐⭐⭐⭐⭐
核心功能
这是 ElevenLabs AI 音频平台的官方 CLI 客户端,提供 100% SDK 覆盖:
文本转语音 (TTS)
- 100+ 预设语音
- 29 种语言支持
- 可调节音质参数(稳定性、相似度、风格)
- 支持批量生成、音频播放
语音转文字 (STT)
- 高精度转录
- 说话人分离(Diarization)
- 时间戳标记
- 支持字幕输出(SRT、VTT)
声音克隆
- 从音频样本克隆声音
- 音色相似度调节
- 声音共享和发现
高级功能
- AI 音效生成
- 语音变换(Voice Changer)
- 降噪和声音隔离
- 多语言视频配音
- 对话生成
- 对话式 AI 代理管理
技术实现
1 | # 设置 API Key |
实用场景
- 有声书制作:自动生成高质量有声书
- 视频配音:为 AI 生成的视频添加多语言配音
- 播客转录:自动转录播客并生成字幕
- 个性化语音助手:克隆自己的声音创建语音助手
- 内容创作:生成背景音乐和音效
隐私说明
🔒 这是非官方社区维护的 CLI,会发送你的 API Key 和内容到 ElevenLabs 服务器。请注意数据隐私。
4. 🎬 ffmpeg-master - 专业视频音频处理
GitHub: liudu2326526/ffmpeg-master
推荐指数: ⭐⭐⭐⭐⭐
核心功能
FFmpeg 是业界最强大的多媒体处理框架,这个 skill 提供了全面的使用指南:
视频处理
- 格式转换(MP4、MKV、WebM 等)
- 编码转换(H.264、H.265/HEVC、VP9)
- 分辨率调整和裁剪
- 视频剪辑和拼接
- 速度调整(快进/慢动作)
- 水印添加
- 淡入淡出效果
音频处理
- 音频提取和转换
- 音量调整
- 音频降噪
- 音频拼接
高级功能
- 复杂滤镜链(filter_complex)
- 多视频合成(画中画、分屏)
- 过渡效果
- 硬件加速(NVIDIA、Intel、Apple)
- 元数据处理
技术实现
1 | # 基础转换 |
实用场景
- 视频编辑:自动化视频剪辑、格式转换
- 内容优化:调整视频大小、压缩、优化网络传输
- 批量处理:批量转换视频格式、添加水印
- AI 内容后处理:为 AI 生成的视频添加特效和转场
- 直播准备:调整视频参数以适应直播平台要求
性能提示
⚡ 使用 -ss 在 -i 之前进行快速定位(input seeking),但精度较低。需要精确剪辑时,放在 -i 之后(output seeking)。
5. 📱 instagram-api - Instagram 官方 API 集成
GitHub: lifeissea/instagram-api
推荐指数: ⭐⭐⭐⭐
核心功能
使用 Meta Graph API 直接发布内容到 Instagram 和 Threads:
Instagram 内容发布
- Feed 帖子:图片 + 文字
- Story 限时动态:竖屏图片
- Reels 短视频:短视频 + 文字
- Carousel 轮播:多图展示
Threads 发布
- 纯文字帖子
- 图片 + 文字帖子
媒体托管
- 集成 Imgur API 生成公开 URL
- 自动处理媒体上传流程
技术实现
1 | # 环境变量配置 |
实用场景
- 社交媒体自动化:定时发布内容
- 内容分发:从 AI 生成的内容自动发布到 Instagram
- 多平台同步:同时发布到 Instagram 和 Threads
- 批量管理:批量处理和发布内容
重要限制
⚠️ Instagram 只接受公开 URL 的媒体上传,因此需要 Imgur 作为中转。Reels 视频处理可能需要几分钟时间。
应用场景总结
娱乐与创作
- 自动化媒体中心:使用 chromecast + apple-music + ffmpeg 创建智能娱乐系统
- 内容创作流水线:AI 生成视频 → ffmpeg 编辑 → elevenlabs 配音 → 自动发布到 Instagram
- 个性化音频体验:克隆自己的声音,生成个性化语音助手
商业应用
- 社交媒体运营:自动化 Instagram 发布、视频制作、音频内容
- 内容营销:批量生成和发布视频、音频、图片内容
- 品牌管理:统一管理多平台的媒体内容和播放列表
技术开发
- 媒体处理自动化:使用 ffmpeg 进行批量视频处理
- AI 内容集成:将 AI 生成的内容快速发布到各大平台
- 智能设备控制:统一控制家庭中的媒体设备
推荐指数排名
| Skill | 推荐指数 | 适用人群 | 难度 |
|---|---|---|---|
| apple-music | ⭐⭐⭐⭐⭐ | Apple 用户、音乐爱好者 | ⭐⭐ |
| chromecast | ⭐⭐⭐⭐⭐ | Chromecast 用户、家庭影院 | ⭐⭐ |
| elevenlabs-cli | ⭐⭐⭐⭐⭐ | 内容创作者、AI 爱好者 | ⭐⭐⭐ |
| ffmpeg-master | ⭐⭐⭐⭐⭐ | 视频处理、媒体开发 | ⭐⭐⭐⭐ |
| instagram-api | ⭐⭐⭐⭐ | 社交媒体运营、内容营销 | ⭐⭐⭐ |
实用建议
入门推荐
如果你刚接触媒体与流媒体分类,建议从以下开始:
- chromecast:最实用,配置简单,立即见效
- apple-music:如果你是 Apple 用户,这是必备工具
- elevenlabs-cli:体验 AI 音频的强大功能
进阶路径
- 学习 ffmpeg-master 的基础命令
- 集成 instagram-api 实现自动化发布
- 组合使用多个 skill 创建完整的媒体处理流水线
注意事项
- 网络要求:chromecast 需要同一网络,确保端口开放
- API 密钥:elevenlabs-cli 和 instagram-api 需要注册获取 API 密钥
- 成本考虑:部分服务(ElevenLabs、Apple Developer)可能产生费用
- 隐私保护:注意第三方 API 的数据隐私政策
结语
媒体与流媒体分类展现了 OpenClaw 在娱乐和内容创作领域的强大能力。从简单的音乐播放到复杂的视频处理,从 AI 语音生成到社交媒体自动化,这些技能可以帮助你构建完整的媒体生态系统。
明天我们将继续探索下一个分类,敬请期待!
系列索引:
相关资源: