TorchCodec: 用于 PyTorch 的视频解码库
作者:15726608245 · 2025-03-12 · 阅读时间:2分钟
TorchCodec 文档格式优化
TorchCodec 简介
TorchCodec 用 CPU 或 GPU 将视频解码为 PyTorch 张量,进而用于机器学习模型的训练和推断。
GitHub:https://github.com/pytorch/torchcodec
用法示例
下面通过一个例子演示 TorchCodec 的基本功能。本示例改编自下列教程,选入本文时有改动。https://pytorch.org/torchcodec/stable/generated_examples/basic_example.html
下载视频
首先从网络上下载一个视频:(这个部分和 TorchCodec 无关)
构造译码器
然后构造一个 TorchCodec 译码器:
查看视频信息
查看视频的基本信息:
输出结果
输出结果为:
利用索引译码
利用索引得到视频译码结果:
输出
输出为
对译码器进行索引可以得到图像帧的 torch.Tensor 对象。默认情况下帧的形状为 (N, C, H, W) ,其中 N 是批大小,C 是通道数,H 是图像高度,W 是图像宽度。N 只有在对多个帧进行译码时才会存在。 可以修改 VideoDecoder 的参数 dimension_order 使得顺序改为 N, H, W, C。元素的类型总是 torch.uint8 。我们可以把得到的帧图像绘制出来。


安装方法
安装步骤
TorchCodec 的安装步骤如下:
- 安装 PyTorch。
- 安装 FFmpeg。很可能电脑上已经安装了。如果没有安装,可以用下列命令安装。
- 安装 TorchCodec。用 pip 安装即可。GPU 版本需要给额外的参数。
CPU版安装
# CPU 安装命令示例
GPU版安装
# GPU 安装命令示例
# 参数 --index-url 对应的 CUDA 版本应和 PyTorch 版本一致
点击“阅读原文”查看 TorchCodec 官方文档(英文)。↓↓↓
热门推荐
一个账号试用1000+ API
助力AI无缝链接物理世界 · 无需多次注册
3000+提示词助力AI大模型
和专业工程师共享工作效率翻倍的秘密
最新文章
- API和微服务:构筑现代软件架构的基石
- 如何免费调用高德经纬度定位API实现地理定位
- AI 驱动的 API 如何改变招聘:2024 年国内外顶级招聘相关API
- API治理:有效API管理的优秀实践和策略
- 企业 API 安全全解析:责任归属、最佳实践与 Boomi 控制平面管理
- WordPress: 从博客平台到AI驱动的内容管理巨人
- 2025 Mono 数据增强 API 使用指南|交易洞察与客户个性化服务实践
- Vector | Graph:蚂蚁首个开源Graph RAG框架设计解读
- 通过 Python 集成 英语名言 API 打造每日激励小工具,轻松获取每日名言
- 来自 openFDA、DailyMed、RxNorm、GoodRx、DrugBank、First Databank 等的药物和药物数据 API
- API设计:从基础到最佳实践
- 实战 | Python 实现 AI 语音合成技术
热门推荐
一个账号试用1000+ API
助力AI无缝链接物理世界 · 无需多次注册