跳转到主要内容

影音科普#1 音视频格式与清晰度

还没写完

本文部分参考自 https://vcb-s.com 开放课程,但可惜 VCB-S 现在因为某些事闭站中,访问不了。

由于本文包含的知识点过多,为避免文章过长,部分知识点有所省略。

在日常影音生活中你是否有这样的疑问
同样是 1080P 的视频,为什么有的大有的小,有的清晰有的不清晰?
各种视频格式有什么区别,哪个好?
什么是 8bit 什么是 10bit?
码率和清晰度的关系是什么?

本文将为你解答这些疑问

1.格式

视频

在线就不讨论了

编码

对于我们日常所看到的图形图像视频而言,其最终通过计算机,通过显示器呈现给我们的数据实际上是对应于屏幕上一个一个的点,我们称之为像素,而这种像素格式一般来讲就是 RGB 格式。RGB 想必大家并不陌生,其就是与自然界的三原色而对应。我们知道,红绿蓝三色的值在计算机中比较常用的表示方法是用 0-255 之间的一个数字来表示,那么表示红色在计算机中就需要 1 bytes 的空间,那么一个像素如果含有 RGB 三个分量,那么其就需要占用 3 bytes。

假设一张 1920 * 1080 大小的图片,其占用的字节数是 1920 * 1080 * 3 个 bytes,大约 5 MB。不知道大家是否知道视频的本质是什么,姑且解释一下,我们通过计算机看到的任何动态的东西,其本质就是一些静止的图片,当这些图片在单位时间内的数量比较大时,人眼将会看到其是连续动作的,一般这个临界值大概在 25 左右。那么也就是说一个视频的本质是每秒钟大于 25 的一些图片序列的集合。


假设我们有一个 1920 * 1080 大小,时长 2 个小时的电影。我们不妨算一下其数据量的大小,每秒钟的图片张数姑且按 25 算,1920 * 1080 * 3 * 25 * 2 * 60 * 60,大约是 463 个G。而互联网的流量,是需要传播的,假设这一个视频要从 internet 内的 A 传送到 B,463 个 G 的带宽是什么概念。因此,我们便有了视频的编码,而所谓编码,其本质就是将数据压缩,进而减少带宽或存储空间的占用。

封装与媒体

你下载到的 MP4、MKV、WMV、AVI 等其实是一种多媒体封装格式。这些格式是一个容器,在容器可以独立存放视频、音频、字幕等。当你播放时,需要对容器进行分离(splitting),将里面存放的视频、音频、字幕等拆分出来,解码然后播放。

这些格式的主要区别在于:容器里面能放的媒体格式不同。

既然它们只是一个容器,就不能保证里面的东西是啥,也不能保证到底有多少东西。
包裹里面的每一件物品,称之为轨道(track),一般有这么几种:

  • 视频(Video):这个也是可以没有的,你要做一个 mp4 格式的音乐也不是不可以。
  • 音频(Audio):可以有、也可以没有。
  • 章节(Chapter): 如果带了,进度条上可以显示分段标签。
  • 字幕(Subtitles):可以放内封字幕

其他可能还有附件等,不一一列举。每个类型也不一定只有一条轨道,比如经常见到带多音轨的MKV。 

字幕有三种:内封,内嵌,外挂。
内嵌就是把字幕直接放到到视频本身,无法分离。
内封就是把字幕独立封装到文件中
外挂就是独立的文件,在播放时加载。

 

音频

模拟转数字

音频是一种模拟信号,计算机处理的是数字信号,因此我们需要将模拟信号变为数字信号。

  1. 采样:对模拟信号采集样本,例如每秒采集 44100 次,即采样频率 44.1 khz。
  2. 量化:每次采样记录多少信息,如记录 16 位长度的信息就是音频的位深度为 16bit 。
  3. 编码:编码就是按照一定的格式记录采样和量化后的数据,比如顺序存储或压缩存储等。编码后经由不同的算法,音频被保存为不同的格式。
压缩

人耳是听不到所有信息的,这些人耳听不到的信息,就可以被去掉。如:

  • 频谱掩蔽效应: 例如,在 1kHz 频率上发出的声强较大的声音,可能会将在 1.1kHz 频率上声强较小的声音掩盖。
  • 时域掩蔽效应: 当一个声强较大的声音和一个声强较小的声音出现的时间较为接近的时候,声强较小的声音可能会听不到。

这些人耳听不到的声音就可以被作为多余的信息去掉,实现有损压缩。

格式

大多数情况下,你的选择可以很简单:

  • 如果你录制和编辑音频,那么你需要选择无损格式。
  • 如果你是发烧友,有很多储存空间,那么选择无损格式吧。
  • 如果你对音质没有特别的追求,或者觉得有损和无损听上去没什么区别,再或者是缺少储存空间,选择有损压缩格式就可以了。事实上,在适当的压缩设置下,大多数人都听不出有损和无损的区别。

无损格式首选:FLAC、ALAC、APE
有损格式首选:AAC、M4A

注意:你可以把有损音频转换为无损格式,无损格式不等于无损音频。

你可以在这里找到几乎所有音频格式的介绍:https://www.wanweibaike.net/wiki-%E9%9F%B3%E9%A2%91%E7%BC%96%E7%A0%81%E6%A0%BC%E5%BC%8F%E7%9A%84%E6%AF%94%E8%BE%83