使用C语言制作视频播放器(2)，将视频拆分成图片组，并存到磁盘

2019-12-01 21:58:28 IT劉小虎

视音频的基本概念

我们常说的视频文件（例如 avi 文件，MP4 文件等）本质上是一种“容器”，其内部存放一帧帧的视频信息和音频信息。因此，视频文件内部常常包含不止一个“信息流”，而是包含一组“信息流”（若干视频流和若干音频流）。

所谓的“信息流”，其实就是随时间分布的信息而已。比如视频可以看成是一组随时间分布的“图片”。

视频流中的一个数据元通常被称作“一帧（frame）”，每一种视频流都有属于自己的编解码器（enCOder/DECoder，在FFmpeg中被简写为 codec），用于说明该种视频流是如何编码和解码的。数据包（packets）则常常指从裸数据帧解析而来的数据片段。

处理音视频流是非常简单的

总体来说，处理音视频流是非常简单的，通常包含以下几个步骤：

step1. 打开音视频文件，获取音视频流
step2. 从数据流读取数据帧
step3. 如果数据帧不完整，就回到 step2
step4. 处理数据帧
step5. 回到 step2

事实上，使用 FFmpeg 处理多媒体音视频的基本步骤和上述“伪代码”没有太多不同，当然了，“step4. 处理数据帧”是一个暧昧的说法，毕竟这短短几个字背后的工作量可能非常巨大。

本节将尝试使用 FFmpeg 处理一段视音频文件，这里所谓的“处理”，其实就是将视频分解为若干个 ppm 图片，并存储到磁盘。

打开文件

首先，我们来看看如何打开一个视音频文件。使用 FFmpeg 之前，首先需要注册相关的库，这一过程是简单的，请参考下面的C语言代码：

#include <libavcodec>
#include <libavformat>
#include <libswscale> 


...
int main(int argc, char *argv[])
{
 if (argc < 2){
 printf("usage:\\n\\t %s filename\\n", argv[0]);
 return -1;
 }

 av_register_all();
.../<libswscale>/<libavformat>/<libavcodec>

调用av_register_all()函数

av_register_all()函数可以注册 FFmpeg 中所有可用的文件格式和编解码库 codecs，因为这个函数在项目中只需要也只应该调用一次，所以将其放在 main() 函数中了，这不是必须的，当然也可以将其放在项目中的其他地方。

现在我们可以打开相应的文件了：

AVFormatContext *pctx = NULL;
// 打开文件
if (avformat_open_input(&pctx, argv[1], NULL, NULL)!=0) {
 return -1;
}

从这段C语言代码可以看出，我们将要打开的文件名通过程序的第一个参数（argv[1]）指定，avformat_open_input() 函数可以读取文件头信息，并将其放在 pctx 中。后面的两个参数用于指定视频文件的格式，以及选项配置信息的，我们将其设置为 NULL，FFmpeg 库将自动探测这些信息。

只获取视频文件的头信息是不够的，因此需要进一步的探测视频文件的流信息，这一步可以通过下面这个函数实现，请看相关C语言代码：

// 进一步探测信息
assert(avformat_find_stream_info(pctx, NULL)>=0);

这个函数主要填充 pctx->streams 成员，可以使用下面这个函数显示 FFmpeg 的一些中间过程信息到终端：

// 显示中间过程信息
av_dump_format(pctx, 0, argv[1], 0);

下图是一个中间过程信息实例：

中间过程信息实例

pctx->streams 本质上是一组指针，每一个指针都对应着视频容器中存储的一种流，它的 size 等于 pctx->nb_streams，所以可以通过遍历对比的方式从这一组流中找到视频流，相关的C语言代码可以如下写：

 int i, video_stream = -1;
 for (i=0; i<pctx->nb_streams; i++) {
 // 查找第一个视频流
 if (pctx->streams[i]->codec->codec_type==AVMEDIA_TYPE_VIDEO) {
 video_stream =i;
 break;
 }
 }
 if (-1==video_stream) {
 printf("no video stream detected\\n");
 return -1;
 }
 // pcodec_ctx 指向第一个视频流
 AVCodecContext *pcodec_ctx = 
 pctx->streams[video_stream]->codec;/<pctx->

通过遍历对比的方式从这一组流中找到视频流

流信息的编解码器 codec 就存放在我们称作“codec context（编解码上下文）”中，它包含对应流信息使用的 codec 的所有信息，上述代码的最后定义了pcodec_ctx指针，并让其指向了对打开视频容器中的第一个视频流的 codec 上下文，现在可以根据上下文查找对应视频流的实际编解码器 codec 了，相应的C语言代码可以如下写：

 AVCodec *pcodec = NULL;
 // 查找视频流对应的解码器
 pcodec = avcodec_find_decoder(pcodec_ctx->codec_id);
 if (NULL == pcodec) {
 printf("unsupported codec.\\n");
 return -1;
 }
 // 拷贝上下文
 AVCodecContext *pcodec_ctx_orig =
 avcodec_alloc_context3(pcodec);
 if (avcodec_copy_context(pcodec_ctx_orig, pcodec_ctx) != 0) {
 printf("couldn't copy codec context\\n");
 return -1;
 }
 // 打开编解码器
 if (avcodec_open2(pcodec_ctx, pcodec, NULL) < 0) {
 printf("couldn't open codec\\n");
 return -1;
 }

根据上下文查找对应视频流的实际编解码器 codec

应注意，我们一定不能直接使用视频流的 AVCodecContext，所以不得不使用 avcodec_copy_context() 拷贝了一份上下文。当然了，在拷贝之前，需要先调用 avcodec_alloc_context3() 为其分配相应的内存。

存储数据帧

存储数据帧之前，肯定需要先分配一块内存，这一过程的C语言代码可以如下写：

 AVFrame *pframe = av_frame_alloc();
 AVFrame *pframe_rgb = av_frame_alloc();
 assert(pframe && pframe_rgb);

既然我们计划输出 24-bit RGB 格式的 PPM 文件，那么必须先将打开的输入视频文件从它原来的格式转换为 RGB 格式，因此上面的C语言代码还预先分配了额外的一块内存，用于存储转换后的数据。

上面的C语言代码分配的是输出数据的内存，我们还需要分配一块内存供原始数据使用，为此，首先要现知道需要多少内存，这一过程可以调用 avpicture_get_size() 函数得到，相关的C语言代码如下，请看：

 int num_bytes = avpicture_get_size(AV_PIX_FMT_RGB24, 
 pcodec_ctx->width, pcodec_ctx->height);
 uint8_t *buffer = av_malloc(num_bytes * sizeof(uint8_t));

av_malloc() 函数是 FFmpeg 的内存分配函数，它其实不过是 malloc() 函数的简单封装而已，只不过确保了内存地址对齐以提升程序的效率。使用它和使用 malloc() 是类似的，应注意避免内存泄漏，多重释放等问题。

应注意避免内存泄漏，多重释放等问题

现在我们可以使用 avpicture_fill() 函数将视频帧数据填充到新分配的 buffer 里了，这一过程的C语言代码是简单的：

avpicture_fill(
 (AVPicture *)pframe_rgb,
 buffer, 
 AV_PIX_FMT_RGB24,
 pcodec_ctx->width, 
 pcodec_ctx->height
);

终于，我们准备好从视频流里读取数据了！

读取数据

现在要做的就是从视频流中读取数据到 packet，然后解码成帧，将其转换为我们需要的格式，再保存到磁盘，相应的C语言代码如下，请看：

 int frame_finished;
 AVPacket pkt;
 // 初始化 sws 上下文，用于转换数据格式
 struct SwsContext *sws_ctx = sws_getContext(
 pcodec_ctx->width,
 pcodec_ctx->height,
 pcodec_ctx->pix_fmt,
 pcodec_ctx->width,
 pcodec_ctx->height,
 AV_PIX_FMT_RGB24,
 SWS_BILINEAR,
 NULL,
 NULL,
 NULL
 );
 i = 0; // 作为实例，只保存前 5 帧
 while (av_read_frame(pctx, &pkt) >= 0) {
 if (pkt.stream_index != video_stream) {
 continue;
 }
 avcodec_decode_video2(pcodec_ctx, pframe, &frame_finished, &pkt);
 if (!frame_finished)
 continue;
  

 sws_scale(sws_ctx, pframe->data, pframe->linesize,
 0, pcodec_ctx->height, pframe_rgb->data, pframe_rgb->linesize);
 if (++i<=5) {
 save_frame(pframe_rgb, pcodec_ctx->width, pcodec_ctx->height,i);
 }
 
 }
 
 av_free_packet(&pkt);

转换格式，保存到磁盘

这一过程的代码虽然稍稍长了点，但是很简单：av_read_frame()函数读取视频流信息，并将其存放到 AVPacket 结构的 pkt 变量中，应注意，我们只需分配 AVPacket 结构体的内存，数据（pkt->data）的内存则由 FFmpeg 在其内部自动分配，不过使用完毕后，要调用 av_free_packet()函数释放。

avcodec_decode_video()函数可以将 packet 转换成 frame，不过，解码一个 packet 不一定能够获得 frame 的全部信息，所以需要借助 frame_finished 标志位用于判断这一过程。

得到一个 frame 后，便可调用 sws_scale() 函数将 frame 从其原始的格式（pctx->pix_fmt）转换到我们期望的 RGB 格式，转换完毕后，就可以调用 save_frame() 函数将其保存到磁盘了。

save_frame()是一个自己定义的函数，它的相关C语言代码可以按照下面这样写，请看：

void save_frame(AVFrame *pframe, int width, int height, int iframe)
{
 char filename[32];
 int y;

 sprintf(filename, "frame%d.ppm", iframe);
 FILE *fp = fopen(filename, "w+");
 assert(fp!=NULL);

 fprintf(fp, "P6\\n%d %d\\n255\\n", width, height); // header

 for (y=0; y<height> fwrite(pframe->data[0]+y*pframe->linesize[0], 1, width*3, fp);
 fclose(fp);
}/<height>

save_frame()函数的C语言代码

save_frame()函数的C语言代码大都是基础库的使用，唯一需要说明的是下面这行代码：

fprintf(fp, "P6\\n%d %d\\n255\\n", width, height);

它为 PPM 文件添加了固定的头部信息。

关闭使用完毕的资源

现在文章开头计划的工作完成了，可以关闭所有使用完毕的资源了，具体的C语言代码如下，请看：

 // 释放内存
 av_free(buffer);
 av_free(pframe_rgb);
 av_free(pframe);
 // 关闭 codec
 avcodec_close(pcodec_ctx);
 avcodec_close(pcodec_ctx_orig);
 // 关闭打开的文件
 avformat_close_input(&pctx);

编译并执行

相应的 FFmpeg 库的编译安装请参考上一节FFmpeg的编译安装，编译时应指定 FFmpeg 的头文件以及库所在路径：

$ gcc t.c -I <ffmpeg>/include/ -L <ffmpeg>/lib/ -lavutil -lavformat -lavcodec -lavutil -lm -g -lswscale/<ffmpeg>/<ffmpeg>

在执行编译生成的C语言程序时，在命令行指定视频文件所在的路径，我在工程目录里放入了一个名为“test.avi”的视频文件，因此可以如下执行程序：

$ a.out ./test.avi

最终输出如下：

输出信息

这说明程序正常运行了，查看程序所在目录，的确有若干 PPM 文件生成，并且可以通过图片浏览器打开：

PPM 文件，点个关注吧

欢迎在评论区一起讨论，质疑。文章都是手打原创，每天最浅显的介绍C语言、linux等嵌入式开发，喜欢我的文章就关注一波吧，可以看到最新更新和之前的文章哦。

分享到:

閱讀更多 IT劉小虎 的文章

關鍵字: FFmpeg 视频文件 MP4

第二章 IoC容器和Bean配置

bean是一个对象，它是由Spring

运算里不得不说的python模块—math

Help

Devops度量--DevOps 现状快速检查表

今天主要分享一个DevOps

SOP是什么（解读）

SOP不是单个的，是一个体系，虽然我们可以单独地定义每一个SOP，但真正从企业管理来看，SOP不可能只是单个的，必然是一个整体和体系，也是企业不可或缺的。

还不知道交换机上如何配置DHCP，赶紧过来围观吧，一分钟包你学会

随着终端设备的越来越多，人工干预配置IP地址，不仅工作效率低，而且，还很容易导致IP冲突，影响正常的网络访问。到此已经完成了，DHCP服务的配置了，我们可以在终端验证。

还在手动配置IP地址吗？太Low了，一分钟教会您如何配置DHCP

Python爬虫自学笔记：分析头条文章网页源文件

这两天分析了一下头条文章网页的源文件，现在将分析的结果分享给大家。首先以一篇文章为例，其网址如下：https://www.toutiao.com/i6822245428176617998/如上图网页所示，文章中包含文字和图片。

DNS侦查工具

我们只需要打开浏览器输入例如:www.baidu.com就可以解析到该网站.为了便于记住不需要输入长长的IP地址去访问这就是DNS域名解析.关于域名域名的层次划分用点来分割这时DNS把相对应的域名解析成IP地址高的在右边.例如:www. NS简介访问某网站的时候最低在左边

国人开源的异步 Python ORM：GINO

程序测评：Create React App 3.3中有哪些酷炫新功能？

Create

“明学”的魅力？我只要我觉得：驾驭终端，提高生产力

最后一个要介绍的命令是

（必收藏系列）Linux面试题——命令集

关注，后台私信【Linux】分享Linux入门到进阶电子书、Linux入门到精通视频教程（免费）。文件管理命令cat

五分钟学会如何在 IPFS 上部署网站

原文标题:五分钟学会如何在

「正点原子NANO STM32F103开发板资料连载」第29章内存管理实验

1）实验平台：【正点原子】

小白怎么学Web前端开发如何成为技术达人

Web前端开发工程师已经成为了很多年轻人心中的理想工作，不仅入行门槛低、而且薪资待遇和发展前景都不错，自然吸引了大批人加入行业。

如何开发一个web静态服务器

我们都知道如今的web服务器有很多，比如著名的有apache，有nginx，有tomcat，有resin服务器，有sphere，有iis服务器等等，这些服务器都能提供web服务，并且几乎都能和多种语言进行搭配使用，那么一个web服务器都需要那些功能，开发一个web服务器都需要那些

学Java编程还有前景吗如何才能拿到高薪

需求大、薪资高似乎是Java开发人员的标签，不过学Java编程还有前景吗？它架构在操作系统之上，屏蔽了底层的差异，真正实现了“Writeonce run

Python网络爬虫之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例实现前后分离权限注解+JWT登录认证

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的运行效率太低？几行代码快速提升！

return的就是是你所需要的结果2.3、运行这一步就是最后一步了，只要像下面一样输入上述函数名，赋予参数值，点击运行Run，就能得到你想要的结果arg1=5

python的优点是什么？最新Python400集视频（附教程）

2020，最新Python零基础到精通资料教材，干货分享，新基础Python教材，稳稳找到过万工作，看这里，这里有你想要的所有资源哦，最强笔记，教你怎么入门提升！获取方式：私信小编“

MySQL中OOM故障应如何下手-爱可生

作者：孙祚龙爱可生南区分公司交付服务部成员，实习工程师。负责公司产品问题排查及日常运维工作。本文来源：原创投稿*爱可生开源社区出品，原创内容未经授权不得随意使用，转载请联系小编并注明来源。

像专家一样使用 panic

|go

30种不同的编程语言怎么写“Hello, World”

printfn

percona QAN 介绍

一、背景QAN慢查询日志分析工具是PMM

面试官：你可以用纯CSS判断鼠标进入的方向吗？

虽然没什么软用，但是对付面试官应该是够用了。感谢面试官提出的问题，让我实现了这个功能，对CSS

网络工程师职业生涯中，哪两点是最重要的？

网络工程师最重要的技能是扎实的基础和非常开放的思维，微观知识扎实、宏观能力突出。项目经验也会让网络工程师基础更牢靠，网络工程师是要实战的，要避免纸上谈兵，我认为对基础理论的理解，比你清楚配置更重要。

交换机中相关术语代表什么意思，有必要弄清楚

由浅入深了解以太坊 2.0：最常见问题和最全学习清单

有关以太坊2.0

【Linux简单实用小命令001】CentOS 7、8的防火墙端口开放

yuminstall

吃透这些IPFS硬核知识点，日后抢头矿随时“弯道超车”

今天的你捉住IPFS机遇了吗？我们都知道在Filecoin网络中作为一名存储矿工，信誉对于我们是非常重要的——信誉越高，爆块几率越大。那么信誉系统现在怎么样了呢？

Hive分桶表

fieldsterminated

Spring中资源的加载原来是这么一回事啊！

自己动手搭建邮件系统：怎样让Exchange Server 发出第一封邮件？

编辑Exchange

$【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库$

【MySQL】RDS物理备份文件(.idb\.frm)恢复到MySQL自建数据库

在阿里云控制台，我们能下载的文件是一个压缩包，解压之后，是.idb和.frm文件，你可能要问了，我可以直接把解压好的问题件覆盖到MySQL的data目录下吗？

NLP算法入门系列：隐含马尔可夫链(HMM)模型的简单介绍

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度学习这样实现人脸的年龄检测

前期的文章我们分享了人脸的识别以及如何进行人脸数据的训练，本期文章我们结合人脸识别的模型进行人脸年龄的检测人脸年龄的检测步骤1、首先需要进行人脸的检测2、把检测到的人脸数据给年龄检测模型去检测3、把检测结果呈现到图片上人脸年龄检测import

嵌入式linux网络编程之——5年程序员给你深度讲解socket套接字

图8-1

深入了解ProcessFunction的状态操作(Flink-1.10)

先反思为何会有上述疑惑上述疑惑产生的原因，应该是受到平时使用HashMap的影响，HashMap获取值就是在调用get方法时指定key，设置值也是在put时指定key，所以看到state.value，看懂了这些，其实也是在了解DataStream/DataSetAPI的设计思路：

Redis内存分析工具--rdr安装与使用

分析Redis

资深架构师教你源码讲解zookeeper实现分布式锁以及集群搭建步骤

//getData发现前一个子节点被删除，抛出异常

一行代码提升迁移性能

论文原址：https://arxiv.org/pdf/2003.12237.pdf开源地址：https://github.com/cuishuhao/BNM在发表在CVPR2020

利用相似几何信息，做可泛化3D形状分割模型

更具体的有以下三种典型的分割方案：FullyConvolutional-Like

这么好用的开源计算器SpeedCrunch，没有不尝试一下的道理

介绍SpeedCrunch是一款高精度科学计算器，具有快速，键盘驱动的用户界面。获取方式在GitHub上搜索SpeedCrunch，就可以去到

分布式缓存，真香

他是前易宝支付架构师、阿里云MVP、腾讯云

特征工程的力量

在本文中，我希望教给您一些有关特征工程的知识，以及如何使用它来对非线性决策边界进行建模。为了说明这一点，假设恢复时间与身高和体重具有以下关系：Y=β₀+β₁+β2+β₃+noise从第三项来看，我们可以看到Y与身高和体重没有线性关系。

java架构：天天写面向接口编程，你考虑过性能吗？大神都是这么写

public

SpringBoot如何优雅的使用RocketMQ

源码编译需要Maven3.2x，JDK8在根目录进行打包:Copymvn-Prelease-all

css代码规范工具stylelint

"mixin"