福州大学《嵌入式系统综合设计》实验八：FFMPEG视频编码

本文介绍: 掌握使用算能平台进行视频编码的流程，包括开发主机环境与云平台的配置，视频编码程序的编写与理解，代码的编译、运行以及学习使用码流分析工具分析视频压缩码流等。不仅可以检测音视频文件的整体封装格式，还可以分析其中每一路音频流或者视频流信息，甚至可以进一步分析音视频流的每一个码流包或图像帧的信息。Elec ar d Stre a mEye主界面为视频编码每一帧的信息，其中红色代表编码帧为I帧，绿色代表编码帧为P帧。的写法与前面的例程基本相同，如果是在云平台上测试，则可将编译好的执行文件通过云空间文件系统上传。

掌握使用算能平台进行视频编码的流程，包括开发主机环境与云平台的配置，视频编码程序的编写与理解，代码的编译、运行以及学习使用码流分析工具分析视频压缩码流等。

搭建实验开发环境，编译并运行编码程序，对视频文件进行编码。并学习利用ffprobe程序分析详细的封装格式和视频流信息，进一步学习利用码流软件Elecard Stre a mEye查看编码后视频码流文件。

开发主机：Ubuntu 20.04.6 LTS

硬件：算能SE5

开发主机 + 云平台（或SE5硬件）

FFMPEG是目前最为流行的视频编解码开源软件，大部分的音视频领域的开发者都会采用FFMPEG进行编解码。FFMPEG编解码软件不仅支持H264和H265编解码，还支持包括视频RTSP拉流、视频格式转换等功能。目前的OPENCV其内部的编解码部分也是采用FFMPEG进行视频编解码。算能平台也支持FFMPEG编解码接口，提供了和标准FFMPEG一样相对统一的编解码接口，只是在内部进行了硬件加速处理，相比开源FFMPEG实现更高效的视频编解码能力。以BM1684为例，支持最大支持1080P@960fps的H264解码和最大支持1080P@1000fps的H265解码。算能平台的FFMPEG简称BM-FFMPEG，在标准的FFMPEG上做了二次封装，其代码也实现开源，具体请参考https://gitee.com/sophon-ai/bm_ffmpeg

#include <iostream&gt;
extern "C" {
    #include "libavcodec/avcodec.h"
    #include "libswscale/swscale.h"
    #include "libavutil/imgutils.h"
    #include "libavformat/avformat.h"
    #include "libavfilter/buffersink.h"
    #include "libavfilter/buffersrc.h"
    #include "libavutil/opt.h"
    #include "libavutil/pixdesc.h"
}
#define STEP_ALIGNMENT 32

int main(int argc, char **argv)
{
    int soc_idx      = 0;
    int enc_id       = AV_CODEC_ID_H264;              //AV_CODEC_ID_H265
    int inputformat  = AV_PIX_FMT_YUV420P;
    int framerate    = 30;
    int width        = 1920;
    int height       = 1080;
    int bitrate      = 1000000;                       //bits per sencond
    char *input_file = "1080p.yuv";                   //input yuv file name
    char *output_file= "test.mp4";                    //output yuv file name
    int ret;

    av_log_set_level(AV_LOG_DEBUG);                   //set debug level

    int stride = (width + STEP_ALIGNMENT - 1) &amp; ~(STEP_ALIGNMENT - 1);
    int aligned_input_size = stride * height*3/2;

    // TODO
    uint8_t *aligned_input = (uint8_t*)av_mallocz(aligned_input_size);
    if (aligned_input==NULL) {
        av_log(NULL, AV_LOG_ERROR, "av_mallocz failedn");
        return -1;
    }

    FILE *in_file = fopen(input_file, "rb");   //Input raw YUV data
    if (in_file == NULL) {
        fprintf(stderr, "Failed to open input filen");
        return -1;
    }

    bool isFileEnd = false;
    VideoEnc_FFMPEG writer;
     ret = writer.openEnc(output_file, soc_idx, enc_id, framerate , width, height, inputformat, bitrate);
    if (ret !=0 ) {
        av_log(NULL, AV_LOG_ERROR,"writer.openEnc failedn");
        return -1;
    }

    //read raw data
    while(1) {
        for (int y = 0; y < height*3/2; y++) {
            ret = fread(aligned_input + y*stride, 1, width, in_file);
            if (ret < width) {
                if (ferror(in_file))
                    av_log(NULL, AV_LOG_ERROR, "Failed to read raw data!n");
                else if (feof(in_file))
                    av_log(NULL, AV_LOG_INFO, "The end of file!n");
                isFileEnd = true;
                break;
            }
        }
        if (isFileEnd)
            break;

        writer.writeFrame(aligned_input, stride, width, height);
    }

    writer.closeEnc();

    av_free(aligned_input);

    fclose(in_file);
    av_log(NULL, AV_LOG_INFO, "encode finish! n");
    return 0;
}

class VideoEnc_FFMPEG
{
public:
    VideoEnc_FFMPEG();
    ~VideoEnc_FFMPEG();

    int  openEnc(const char* filename, int soc_idx, int codecId, int framerate,
                 int width, int height,int inputformat,int bitrate);
    void closeEnc();
    int  writeFrame(const uint8_t* data, int step, int width, int height);
    int  flush_encoder();

private:
    AVFormatContext * ofmt_ctx;
    AVCodecContext  * enc_ctx;
    AVFrame         * picture;
    AVFrame         * input_picture;
    AVStream        * out_stream;
    uint8_t         * aligned_input;
    int               frame_width;
    int               frame_height;
    int               frame_idx;

    AVCodec* find_hw_video_encoder(int codecId)
    {
        AVCodec *encoder = NULL;
        switch (codecId)
        {
        case AV_CODEC_ID_H264:
            encoder = avcodec_find_encoder_by_name("h264_bm");
            break;
        case AV_CODEC_ID_H265:
            encoder = avcodec_find_encoder_by_name("h265_bm");
            break;
        default:
            break;
        }
        return encoder;
    }
};

int VideoEnc_FFMPEG::openEnc(const char* filename, int soc_idx, int codecId, int framerate, int width, int height, int inputformat, int bitrate)
{
    int ret = 0;
    AVCodec *encoder;
    AVDictionary *dict = NULL;
    frame_idx = 0;
    frame_width = width;
    frame_height = height;

    avformat_alloc_output_context2(&amp;ofmt_ctx, NULL, NULL, filename);
    if (!ofmt_ctx) {
        av_log(NULL, AV_LOG_ERROR, "Could not create output contextn");
        return AVERROR_UNKNOWN;
}
    encoder = find_hw_video_encoder(codecId);
    if (!encoder) {
        av_log(NULL, AV_LOG_FATAL, "hardware video encoder not foundn");
        return AVERROR_INVALIDDATA;
    }
    enc_ctx = avcodec_alloc_context3(encoder);
    if (!enc_ctx) {
        av_log(NULL, AV_LOG_FATAL, "Failed to allocate the encoder contextn");
        return AVERROR(ENOMEM);
}

//参数初始化
    enc_ctx->codec_id = (AVCodecID)codecId;
    enc_ctx->width    = width;
    enc_ctx->height   = height;
    enc_ctx->pix_fmt   = (AVPixelFormat)inputformat;
    enc_ctx->bit_rate_tolerance = bitrate;
    enc_ctx->bit_rate = (int64_t)bitrate;
    enc_ctx->gop_size = 32;
    enc_ctx->time_base.num = 1;
    enc_ctx->time_base.den = framerate;
    enc_ctx->framerate.num = framerate;
    enc_ctx->framerate.den = 1;
    av_log(NULL, AV_LOG_DEBUG, "enc_ctx->bit_rate = %ldn", enc_ctx->bit_rate);
 out_stream = avformat_new_stream(ofmt_ctx, encoder);
    out_stream->time_base = enc_ctx->time_base;
    out_stream->avg_frame_rate = enc_ctx->framerate;
    out_stream->r_frame_rate = out_stream->avg_frame_rate;
    av_dict_set_int(&amp;dict, "sophon_idx", soc_idx, 0);
    av_dict_set_int(&amp;dict, "gop_preset", 8, 0);
    /* Use system memory */
    av_dict_set_int(&amp;dict, "is_dma_buffer", 0, 0);
    av_dict_set_int(&amp;dict, "qp", 25, 0);   

/* Third parameter can be used to pass settings to encoder */
    ret = avcodec_open2(enc_ctx, encoder, &amp;dict);
    if (ret < 0) {
        av_log(NULL, AV_LOG_ERROR, "Cannot open video encoder ");
        return ret;
    }
    ret = avcodec_parameters_from_context(out_stream->codecpar, enc_ctx);
    if (ret < 0) {
        av_log(NULL, AV_LOG_ERROR, "Failed to copy encoder paras to output stream ");
        return ret;
    }
    if (!(ofmt_ctx->oformat->flags &amp; AVFMT_NOFILE)) {
        ret = avio_open(&ofmt_ctx->pb, filename, AVIO_FLAG_WRITE);
        if (ret < 0) {
            av_log(NULL, AV_LOG_ERROR, "Could not open output file '%s'", filename);
            return ret;
        }
    }
    /* init muxer, write output file header */
    ret = avformat_write_header(ofmt_ctx, NULL);
    if (ret < 0) {
        av_log(NULL, AV_LOG_ERROR, "Error occurred when opening output filen");
        return ret;
    }

    picture = av_frame_alloc();
    picture->format = enc_ctx->pix_fmt;
    picture->width = width;
    picture->height = height;

    return 0;
}

int VideoEnc_FFMPEG::writeFrame(const uint8_t* data, int step, int width, int height)
{
    int ret = 0 ;
    int got_output = 0;
    if (step % STEP_ALIGNMENT != 0) {
        av_log(NULL, AV_LOG_ERROR, "input step must align with STEP_ALIGNMENTn");
        return -1;
    }
 
    static unsigned int frame_nums = 0;
  
    frame_nums++;

    av_image_fill_arrays(picture->data, picture->linesize, (uint8_t *) data, enc_ctx->pix_fmt, width, height, 1);
    picture->linesize[0] = step;
    picture->pts = frame_idx;
    frame_idx++;

    av_log(NULL, AV_LOG_DEBUG, "Encoding framen");

    /* encode filtered frame */
    AVPacket enc_pkt;
    enc_pkt.data = NULL;
    enc_pkt.size = 0;
    av_init_packet(&enc_pkt);
    ret = avcodec_encode_video2(enc_ctx, &enc_pkt, picture, &got_output);
    if (ret < 0)
        return ret;
    if (got_output == 0) {
        av_log(NULL, AV_LOG_WARNING, "No output from encodern");
        return -1;
    }
    /* prepare packet for muxing */
    av_log(NULL, AV_LOG_DEBUG, "enc_pkt.pts=%ld, enc_pkt.dts=%ldn",
           enc_pkt.pts, enc_pkt.dts);
    av_packet_rescale_ts(&enc_pkt, enc_ctx->time_base,out_stream->time_base);
    av_log(NULL, AV_LOG_DEBUG, "rescaled enc_pkt.pts=%ld, enc_pkt.dts=%ldn",
           enc_pkt.pts,enc_pkt.dts);
    av_log(NULL, AV_LOG_DEBUG, "Muxing framen");

    /* mux encoded frame */
    ret = av_interleaved_write_frame(ofmt_ctx, &enc_pkt);
    return ret;
}

void VideoEnc_FFMPEG::closeEnc()
{
    flush_encoder();
    av_write_trailer(ofmt_ctx);
    av_frame_free(&picture);

    if (input_picture)
        av_free(input_picture);

    avcodec_free_context(&enc_ctx);

    if (ofmt_ctx && !(ofmt_ctx->oformat->flags & AVFMT_NOFILE))
        avio_closep(&ofmt_ctx->pb);
    avformat_free_context(ofmt_ctx);
}

int  VideoEnc_FFMPEG::flush_encoder()
{
    int ret;
    int got_frame = 0;

    if (!(enc_ctx->codec->capabilities & AV_CODEC_CAP_DELAY))
        return 0;

    while (1) {
        av_log(NULL, AV_LOG_INFO, "Flushing video encodern");
        AVPacket enc_pkt;
        enc_pkt.data = NULL;
        enc_pkt.size = 0;
        av_init_packet(&enc_pkt);

        ret = avcodec_encode_video2(enc_ctx, &enc_pkt, NULL, &got_frame);
        if (ret < 0)
            return ret;

        if (!got_frame)
            break;
        /* prepare packet for muxing */
        av_log(NULL, AV_LOG_DEBUG, "enc_pkt.pts=%ld, enc_pkt.dts=%ldn",
               enc_pkt.pts,enc_pkt.dts);
        av_packet_rescale_ts(&enc_pkt, enc_ctx->time_base,out_stream->time_base);
        av_log(NULL, AV_LOG_DEBUG, "rescaled enc_pkt.pts=%ld, enc_pkt.dts=%ldn",
               enc_pkt.pts,enc_pkt.dts);

        /* mux encoded frame */
        av_log(NULL, AV_LOG_DEBUG, "Muxing framen");
        ret = av_interleaved_write_frame(ofmt_ctx, &enc_pkt);
        if (ret < 0)
            break;
    }

    return ret;
}