系统化学习 H264视频编码(02) I帧 P帧 B帧 引入及相关概念解读

说明:我们参考黄金圈学习法(什么是黄金圈法则?->模型 黄金圈法则,本文使用:why-what)来学习音H264视频编码。本系列文章侧重于理解视频编码的知识体系和实践方法,理论方面会更多地讲清楚 音视频中概念的起源以及各个概念的联系。知其然,知其所以然。同时更强调知识系统的建立。

针对本文,我们主要讲清楚 I帧、P帧、B帧的概念及引入原因,基于I帧、P帧、B帧 展开的其他概念解读,比如GOP概念,就是基于 I帧、P帧、B帧的理解基础上,搞了一个以I帧为分割点的序列。而后面提到的运动补偿和运动矢量是P帧和B帧的关键技术,用于提高视频编码的压缩效率。

1  I帧、P帧、B帧概念解读

1.1 I帧、P帧、B帧是什么?(what)

视频经过压缩后 的图像帧 分别有 I帧、P帧、B帧,他们的概念解读分别如下:

I帧(Intra-coded Frame,内部编码帧):

  • I帧是一种关键帧,完全独立于其他帧进行编码。
  • 它使用帧内预测,即仅依赖于该帧本身的像素信息,类似于静态图片的编码方式。
  • I帧不包含时间上的预测或运动补偿,因此可以作为视频解码的起点。
  • 由于不依赖其他帧,I帧通常比其他类型的帧更大,需要更多的数据来存储。

P帧(Predictive-coded Frame,预测编码帧)

  • P帧是一种前向预测帧,它依赖于前面的I帧或P帧来进行时间上的预测。
  • 它使用帧间预测,通过比较当前帧与参考帧之间的差异(运动补偿)来减少数据量。
  • P帧不向未来帧提供信息,解码时仅需要前一个已解码的I帧或P帧作为参考。

B帧(Bi-directional predictive-coded Frame,双向预测编码帧)

  • B帧是一种双向预测帧,它同时参考前后的I帧或P帧来进行编码。
  • 与P帧相比,B帧可以利用更多的上下文信息来减少数据量,因此通常具有更高的压缩效率。
  • B帧解码时需要前后两个参考帧,这使得B帧的解码顺序与显示顺序不同。

总结下:I帧是关键帧。P帧基于I帧差异来进一步压缩,减少存储量。而B帧再基于I帧和P帧的差异,进一步减少存储量。这里思考一个问题,关于 I帧、P帧、B帧的引入,为什么只有这3类?而不是4类或者5类更多?先思考5分钟,再继续看效果更佳👇

============================================

1.2 关于 I帧、P帧、B帧的引入,为什么只有这3类,而不是更多?

帧、P帧、B帧的引入是视频编码标准中为了平衡压缩效率、解码复杂性和随机访问能力的结果。这三类帧类型提供了一种有效的折衷方案,其原因包括:

  •   压缩效率:I帧、P帧、B帧的组合提供了良好的压缩效率。I帧作为基准帧,P帧通过前向预测减少冗余,B帧通过双向预测进一步提高压缩效率。增加更多类型的帧可能会增加编码和解码的复杂性,而不一定能显著提高压缩效率。
  • 解码复杂性:每增加一种帧类型,就会增加解码的复杂性和计算量。I、P、B帧的模型已经相对复杂,因为B帧的解码依赖于前后帧。如果引入更多类型的帧,将使得解码过程更加复杂,可能导致硬件实现上的困难。
  • 随机访问和错误恢复:I帧提供了随机访问点,P帧和B帧可以快速从I帧恢复,这种结构有助于快速定位和错误恢复。如果帧类型过多,可能会影响这些功能的效率。
  • 编码效率:在大多数视频内容中,这三类帧已经能够很好地适应不同的场景和运动。增加更多类型的帧可能会带来边际效益的递减。
  • 标准化和兼容性:视频编码标准需要全球范围内的兼容性和广泛接受。I、P、B帧的模型已经被广泛采用并在多种设备和平台上实现。增加更多类型的帧可能会影响标准的普及和兼容性。
  • 实际需求:视频编码的主要目标是在保持可接受的视频质量的同时减少数据量。在大多数应用场景中,I、P、B帧已经能够满足这些需求,而不需要更多类型的帧。
  • 技术实现和成本:增加更多类型的帧会增加编码器和解码器的设计和实现难度,可能导致更高的开发和生产成本。

总之,I帧、P帧、B帧的引入是为了在压缩效率、解码复杂性和实际应用需求之间找到一个合适的平衡点。这三类帧类型已经能够满足大多数视频编码的需求,而引入更多类型的帧可能会带来不必要的复杂性和成本,而没有相应的效率提升。

基于对前面了解,我们继续探索。那么为什么要引入这几个概念呢?我们继续看👇

1.3 为什么要引入I帧、P帧、B帧?(why)

定义I帧、P帧、B帧主要是为了解决视频压缩和传输中的效率和质量平衡问题。这些不同类型的帧各自解决了以下关键问题:

  • 压缩效率:I帧作为关键帧,提供了一种无需参考其他帧即可独立解码的能力,但它们通常较大,因为不包含时间预测信息。P帧和B帧通过帧间预测减少了重复信息的存储,利用视频序列中时间上的冗余来提高压缩效率,其中B帧通过双向预测进一步提高了这一效率。

  • 解码的随机访问性:I帧使得视频流可以在任意点开始解码,这对于视频服务器和播放器来说是必要的,它们需要能够快速定位到视频流的特定位置并开始播放。

  • 错误传播控制:当视频流中出现错误时,由于P帧和B帧依赖于之前的帧,错误可能会传播到后续帧。I帧作为独立帧,可以限制错误传播的范围,从而提高视频播放的鲁棒性。

  • 编码复杂度与解码性能的平衡:B帧虽然可以提供更高的压缩效率,但它们的编码和解码过程更为复杂,因为需要处理双向预测。通过合理地在I帧和P帧之间分布B帧,可以在编码复杂度和解码性能之间取得平衡。

  • 视频质量与传输带宽的优化:在有限的带宽下,通过使用P帧和B帧减少需要传输的数据量,可以在保持视频质量的同时减少对带宽的需求。

  • 适应不同的网络条件:在网络状况良好时,可以增加B帧的使用来提高压缩率;在网络状况较差时,可以减少B帧的使用,以降低解码延迟和错误率。

  • 视频内容的动态特性适应:不同的视频内容具有不同的动态特性。例如,快速运动的场景可能需要更多的I帧来减少预测错误,而静止或慢速运动的场景则可以更多地使用P帧和B帧。

通过定义I帧、P帧、B帧,并在视频编码过程中灵活使用它们,可以有效地解决视频压缩、传输和解码中的多种问题,实现高效、可靠且高质量的视频播放。

基于I帧、P帧、B帧 展开的其他概念解读,比如GOP概念,就是基于 I帧、P帧、B帧的理解基础上,搞了一个以I帧为分割点的序列。而后面提到的运动补偿和运动矢量是P帧和B帧的关键技术,用于提高视频编码的压缩效率。

2. GOP概念解读

2.1 什么是GOP序列(what)

GOP概念:两个I帧之间是一个图像序列,在一个图像序列中只有一个I帧。如下图所示:

其主要特点和作用包括但不限于:

  • 独立解码单元:在传统的视频编码标准中,每个GOP可以作为一个独立的单元进行解码,即解码器可以从GOP中的任何一帧开始解码,而不需要之前GOP的数据。
  • 包含I帧:每个GOP通常以一个I帧开始,这个I帧称为关键帧或IDR帧(Instantaneous Decoding Refresh),它是一个完全自包含的帧,不依赖于其他帧的信息。
  • 帧间预测:GOP中的P帧和B帧利用帧间预测技术,通过参考其他帧(可以是前面的或后面的帧)来减少数据量。P帧通常只参考前面的帧,而B帧可以同时参考前后的帧。
  • 提高压缩效率:通过在GOP中使用I帧、P帧和B帧的组合,可以有效地利用视频内容的时间冗余,从而提高压缩效率。
  • 控制解码延迟:GOP的大小直接影响解码延迟。较小的GOP可以减少延迟,但可能会降低压缩效率;较大的GOP可以提高压缩效率,但会增加延迟。
  • 适应不同的编码策略:不同的编码场景和需求可能需要不同的GOP结构和大小。例如,实时通信可能需要较小的GOP以减少延迟,而视频存储和传输可能更注重压缩效率。

GOP的概念在视频编码标准如H.264和H.265中都有应用,它们通过合理组织帧的编码和预测关系,优化了视频的存储和传输效率。

2.2 为什么引入GOP序列?(why)

引入GOP(Group of Pictures)概念主要是为了解决视频编码和传输中的以下问题:

  • 提高压缩效率:通过在GOP中使用I帧、P帧和B帧的组合,可以更有效地利用视频内容的时间冗余,从而提高压缩效率。
  • 实现随机访问:GOP结构允许视频流在任意点进行随机访问和解码,因为每个GOP都可以作为一个独立的解码单元。
  • 控制解码延迟:通过调整GOP的大小,可以在压缩效率和解码延迟之间进行权衡。较小的GOP可以减少延迟,适用于实时视频通信;较大的GOP可以提高压缩效率,适用于视频存储和传输。
  • 优化编码和解码过程:GOP结构使得编码器可以更加灵活地组织帧的编码顺序,同时解码器可以按照GOP的顺序进行解码,简化了编码和解码的流程。
  • 增强错误恢复能力:在GOP结构中,由于P帧和B帧仅依赖于前面的帧,一旦出现数据错误,错误的影响可以被限制在当前GOP内,减少了错误传播。
  • 适应不同的编码策略:GOP允许编码器根据视频内容的特性和编码需求,灵活地选择I帧、P帧和B帧的比例,实现最优的编码策略。
  • 提高视频播放的流畅性:GOP结构使得播放器可以在不重新加载整个视频的情况下,快速跳转到视频的任意位置,提高了播放的流畅性和用户体验。
  • 降低存储和传输成本:通过提高压缩效率,GOP有助于减少视频存储所需的空间和传输所需的带宽,降低了视频分发的成本。

总的来说,GOP概念的引入是为了在保证视频质量的同时,提高视频编码的效率和灵活性,优化存储和传输过程,并改善视频播放的性能。

3 运动补偿和运动矢量的概念

3.1 运动补偿和运动矢量是什么?(what)

运动补偿和运动矢量是视频编码中的关键技术,用于提高压缩效率,具体概念如下:

运动矢量(Motion Vector):运动矢量是一种描述视频序列中物体运动的参数,它定义了从一帧到另一帧中特定区域(如宏块或编码单元)的运动方向和距离。主要用于帧间预测。在帧间预测中,运动矢量用于找到当前帧中某个区域与参考帧中相应区域之间的对应关系。运动矢量通常包含两个分量:水平分量和垂直分量,分别表示水平和垂直方向上的运动。

运动补偿(Motion Compensation):运动补偿是一种利用运动矢量信息来预测和补偿视频帧之间变化的技术。通过运动补偿,编码器可以预测当前帧中每个区域在参考帧中的对应位置,然后计算出实际像素与预测像素之间的差异(残差)。由于残差通常包含的信息量远小于原始像素,因此只对这些残差进行编码可以显著减少所需的数据量。

3.2 为什么引入运动补偿和运动矢量?(why)

引入运动补偿和运动矢量是为了解决视频编码中的以下几个关键问题:

  1. 减少时间冗余:视频序列中连续帧之间的内容具有高度相关性,运动补偿通过预测和补偿物体运动,有效减少这种时间上的冗余。

  2. 提高压缩效率:通过仅对帧间变化(残差)进行编码,而不是对每一帧的全部像素编码,运动补偿显著降低了编码后的数据量。

  3. 保持视频质量:准确的运动补偿有助于减少压缩过程中引入的伪影,从而在减小文件大小的同时保持视频的视觉质量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/780056.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【机器学习】机器学习重塑广告营销:精准触达,高效转化的未来之路

📝个人主页🌹:Eternity._ 🌹🌹期待您的关注 🌹🌹 ❀目录 📒1. 引言📙2. 机器学习基础与广告营销的结合🧩机器学习在广告营销中的核心应用领域🌹用…

cf 7.7

Problem - C - Codeforces 大致意思&#xff1a; 找前缀&#xff0c;排序后使得本位之前数字和等于该位 &#xff08;以下代码超时了&#xff09; #include<bits/stdc.h> typedef long long ll;#define IOS ios::sync_with_stdio(0),cin.tie(0),cout.tie(0) const ll …

阿里云存储应用

如何做好权限控制 小浩在梳理门户网站静态资源时&#xff0c;发现有些资源是仅内部员工可访问&#xff0c;有些资源是特定的注册客户可访问&#xff0c;还有些资源是匿名客户也可以访问。针对不同场景、不同用户&#xff0c;小浩该如何规划企业门户网站静态资源的权限控制呢&a…

MySQL第三次作业--DML语句(INSERT)

目录 一、在数据库中创建一个表student&#xff0c;用于存储学生信息 二、向student表中添加一条新记录&#xff0c;记录中id字段的值为1&#xff0c;name字段的值为"monkey"&#xff0c;grade字段的值为98.5 三、向student表中添加多条新记录&#xff1a; 2,&qu…

Docker 容器网络及其配置说明

Docker 容器网络及其配置说明 docker容器网络docker的4种网络模式bridge 模式container模式host 模式none 模式应用场景 docker 容器网络配置Linux 内核实现名称空间的创建创建 Network Namespace操作 Network Namespace 转移设备veth pair创建 veth pair实现 Network Namespac…

缓存-分布式锁-原理和基本使用

分布式锁原理和使用 自旋 public Map<String, List<Catelog2Vo>> getCatalogJsonFromDBWithRedisLock() {Boolean b redisTemplate.opsForValue().setIfAbsent(Lock, Lock, Duration.ofMinutes(1));if (!b) {int i 10;while (i > 0) {Object result redisTe…

【QT】容器类控件

目录 概述 Group Box 核心属性 Tab Widget 核心属性 核心信号 核心方法 使用示例&#xff1a; 布局管理器 垂直布局 核心属性 使用示例&#xff1a; 水平布局 核⼼属性 (和 QVBoxLayout 属性是⼀致的) 网格布局 核心属性 使用示例&#xff1a; 示例&#x…

【python】python猫眼电影数据抓取分析可视化(源码+数据集+论文)【独一无二】

&#x1f449;博__主&#x1f448;&#xff1a;米码收割机 &#x1f449;技__能&#x1f448;&#xff1a;C/Python语言 &#x1f449;公众号&#x1f448;&#xff1a;测试开发自动化【获取源码商业合作】 &#x1f449;荣__誉&#x1f448;&#xff1a;阿里云博客专家博主、5…

安卓虚拟位置修改

随着安卓系统的不断更新&#xff0c;确保软件和应用与最新系统版本的兼容性变得日益重要。本文档旨在指导用户如何在安卓14/15系统上使用特定的功能。 2. 系统兼容性更新 2.1 支持安卓14/15&#xff1a;更新了对安卓14/15版本的支持&#xff0c;确保了软件的兼容性。 2.2 路…

Xilinx FPGA:vivado串口输入输出控制fifo中的数据

一、实验要求 实现同步FIFO回环测试&#xff0c;通过串口产生数据&#xff0c;写入到FIFO内部&#xff0c;当检测到按键信号到来&#xff0c;将FIFO里面的数据依次读出。 二、信号流向图 三、状态转换图 四、程序设计 &#xff08;1&#xff09;按键消抖模块 timescale 1ns…

批量文本编辑管理神器:一键修改多处内容,轻松转换编码,助力工作效率飞跃提升!

在信息爆炸的时代&#xff0c;文本处理已成为我们日常工作中不可或缺的一部分。无论是处理文档、整理数据还是编辑资料&#xff0c;都需要对大量的文本进行管理和修改。然而&#xff0c;传统的文本编辑方式往往效率低下&#xff0c;容易出错&#xff0c;难以满足现代工作的高效…

QListWidget 缩略图IconMode示例

1、实现的效果如下&#xff1a; 2、实现代码 &#xff08;1&#xff09;头文件 #pragma once #include <QtWidgets/QMainWindow> #include "ui_QListViewDemo.h" enum ListDataType { ldtNone -1, ldtOne 0, ldtTwo 1, }; struct ListData…

树莓派4B_OpenCv学习笔记19:OpenCV舵机云台物体追踪

今日继续学习树莓派4B 4G&#xff1a;&#xff08;Raspberry Pi&#xff0c;简称RPi或RasPi&#xff09; 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1&#xff1a; Python 版本3.7.3&#xff1a; ​​ 今日学习&#xff1…

Apache Seata应用侧启动过程剖析——RM TM如何与TC建立连接

本文来自 Apache Seata官方文档&#xff0c;欢迎访问官网&#xff0c;查看更多深度文章。 本文来自 Apache Seata官方文档&#xff0c;欢迎访问官网&#xff0c;查看更多深度文章。 Apache Seata应用侧启动过程剖析——RM & TM如何与TC建立连接 前言 看过官网 README 的第…

Python | Leetcode Python题解之第217题存在重复元素

题目&#xff1a; 题解&#xff1a; class Solution(object):def containsDuplicate(self, nums):if len(set(nums)) ! len(nums):return Trueelse:return False

TCP一定可靠吗

背景 公司某个服务发送TCP报文后,得到的响应是非预期数据 原因竟然是:TCP包的 payload 数据某个bit位被翻转,但是 checksum 的值一样,错误的包被分发给了上层服务 Checksum介绍 IP 头有自己的 Checksum,TCP、UDP 也有自己的 Checksum,分别校验不同部分的数据 IP 头的 …

赛元单片机开发工具SOC_Programming_Tool_Enhance_V1.50 分享

下载地址&#xff1a; SOC_Programming_Tool_Enhance_V1.50(LIB0D30).rar: https://545c.com/f/45573183-1320016694-557ebd?p7526 (访问密码: 7526)

使用Spring Boot和自定义缓存注解优化应用性能

在现代应用开发中&#xff0c;缓存是提高系统性能和响应速度的关键技术之一。Spring Boot提供了强大的缓存支持&#xff0c;但有时我们需要更灵活的缓存控制。本文将介绍如何使用Spring Boot和自定义缓存注解来优化应用性能。 1. 为什么需要自定义缓存注解&#xff1f; Sprin…

干货 | 2024大模型场景下智算平台的设计与优化实践(免费下载)

诚挚邀请您微信扫描以下二维码加入方案驿站知识星球&#xff0c;获取上万份PPT/WORD解决方案&#xff01;&#xff01;&#xff01;感谢支持&#xff01;&#xff01;&#xff01;

在linux系统centos上面安装php7gmp扩展

ps:在ubuntu上面安装gmp(最简单) $ sudo apt-get install php7.0-gmp然后再php.ini添加extensionphp_gmp.so <<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<…