图像和视频编码的国际标准有哪些?

   2023-02-12 15:32:12 网络1000
核心提示:摘要:本文浅显地讨论了图像视频编码的国际标准以及每种图像和视频编码的技术特点。关键词:图像 视频编辑 国际特性 �近10年来,图像编码技术得到了迅速发展和广泛应用,关且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,即国际标准化组织I

图像和视频编码的国际标准有哪些?

摘要:本文浅显地讨论了图像视频编码的国际标准以及每种图像和视频编码的技术特点。

关键词:图像 视频编辑 国际特性 �

近10年来,图像编码技术得到了迅速发展和广泛应用,关且日臻成熟,其标志就是几个关于图像编码的国际标准的制定,即国际标准化组织ISO和国际电工委员会IEC关于静止图像的编码标准JPEG、国际电信联盟ITU-T关于电视电话/会议电视的视频编码标准 H261,H.263和ISO/IEC关于活动图像的编码标准MPEG-1,MPEG-2和MPEG-4等。这些标准图像编码算法融合了各种性能优良的图像编码方法,代表了目前图像编码的发展水平。表1给出了各种图像与视频编码国际标准的标题,制定日期、目标比特率、应用场合以及所采用的主要编码技术等。

表1图像视频编码的国际标准�

1、JPEG(Joint Photographic Expert Group)�

JPEG是ISO/IEC联合图像专家组制定的静止图像压缩标准,是适用于连续色调(包括灰度和彩色)静止图像压缩算法的国际标准。JPEC算法共有4种运行模式,其中一种是基于空间预测(DPCM)的无损压缩算法,另外3种是基于DCT的有损压缩算法。�

1)无损压缩算法,可以保证无失真地重建原始图像。�

2)基于DCT的顺序模式,按从上到下,从左到右的顺序对图像进行编码,称为基本系统。�

3)基于DCT的递进模式,指对一幅图像按由粗到细对图像进行编码。

4)分层模式。以各种分辨率对图像进行编码,可以根据不同的要求,获得不同分辨率的图像。�

JEPG对图像的压缩有很大的伸缩性,图像质量与比特率的关系如下:�

a)1�5~2�0比特/像素:与原始图像基本没有区别(transparent quality)。�

b)0�75~1�5比特/像素:极好(excellent quality),满足大多数应用。�

c)0�5~0�75比特/像素:好至很好(good to very good quality),满足多数应用。�

d)0�25~0�5比特/像素:中至好(moderate to very good quality),满足某些应用。

2、JPEG-2000�

与以往的JPEG标准相比,JPEG-2000压缩率比JPEG高约30%,它有许多原先的标准所不可比拟的优点。JPEG-2000与传统JPEG最大的不同,在于它放弃了JPEG所采用的以DCT变换为主的分块编码方式,而改为以小波变换为主的多分辨率编码方式。�

首先,JPEG-2000能实现无损压缩(lossless compression)。在实际应用中,有一些重要的图像,如卫星遥感图像、医学图像、文物照片等,通常需要进行无损压缩。对图像进行无损编码的经典方法——预测法已经发展成熟,并作为一个标准写入了JPEG-2000中。�

JPEG-2000还有一个很好的优点就是误码鲁棒性(robustness to bit error)好。因此使用JPEG-2000的系统稳定性好,运行平稳,抗干扰性好,易于操作。

JPEG-2000能实现渐进运输(progressive transmission),这是JPEG-2000的 一个极其重要的特征。它可以先传输图像的轮廓,然后逐步传输数据,不断提高图像质量,以满足用户的需要,这在网络传输中具有非常重大的意义。使用JPEG-2000下载一个图片,用户可先看到这个图片的轮廓或缩影,然后再决定是否下载。而且,下载时可以根据用户需要和带宽来决定下载图像质量的好坏,从而控制数据量的大小。

JPEG-2000另一个极其重要的优点就是感兴趣区(ROI,Region Of Interest)特性。用户在处理的图像中可以指定感兴趣区,对这些区域进行压缩时可以指定特定的压缩质量,或在恢复时指定特定的解压缩要求,这给人们带来了极大的方便。在有些情况下,图像中只有一小块区域对用户是有用的,对这些区域采用高压缩比。在保证不丢失重要信息的同时,又能有效地压缩数据量,这就是感兴趣区的编码方案所采取的压缩策略。基于感兴趣区压缩方法的优点,在于它结合了接收方对压缩的主观要求,实现了交互式压缩。

3、MPEG-1�

国际标准化组织ISO/IEC的运动图像专家组MPEG(Moving Picture Expert Group)一直致力于运动图像及其伴音编码标准化工作,并制定了一系列关于一般活动图像的国际标准。1993年制定的MPEG-1标准是针对1�5Mbit/s速率的数字存储媒体运动图像及其伴音编码制定的国际标准,该标准的制定使得基于CD-ROM的数字视频以及MP3等产品成为可能。MPEG-1的带宽最多为1�5Mbit/s,其中11Mbit/s用于视频,128Kbit/s用于音频,其余带宽用于MPEG系统本身。�

为了追求高的压缩效率,去除图像序列的时间冗余度,同时满足多媒体等应用所必须的随机存取要求,MPEG-1视频把图像编码分成I帧、P帧、B帧和D帧共4种类型。I帧为帧内编码帧(intra coded frame),编码时采用类似JPEG的帧内DCT编码,I帧的压缩率是几种编码类型中最低的。P帧为预测编码帧(predictive coded rame),采用前向运动补偿预测和误差的DCT编码,由其前面的I或P帧进行预测。B帧为双向预测编码帧(bi-directionally predictive coded frame),采用双向运动补偿预测和误差的DCT编码,由前面和后面的I或P帧进行预测,所以B帧的压缩效率最高。D帧为直流编码帧(DC coded frame),只包含每个块的直流分量。MPEG-1采用运动补偿支除图像序列时间轴上的冗余度,可使对P帧和B帧图像的压缩倍数比I帧提高很多。

4、MPEG-2�

MPEG组织1995年推出的MPEG-2标准是在MPEG-1标准基础上的进一步扩展和改进,主要是针对数字视频广播、高清晰度电视和数字视盘等制定的4~9Mbit/s运动图像及其伴音的编码标准,MPEG-2是数字电视机顶盒与DVD等产品的基础。MPEG-2系统要求必须与MPEG-l系统向下兼容,因此其语法的最大特点在于兼容性好并可扩展。MPEG-2的目标与MPEG-1相同,仍然是提高压缩比,改善音频、视频质量,采用的核心技术还是分块DCT和帧间运动补偿预测技术。MPEG-2视频允许数据速率高达100Mbit/s,支持隔行扫描视频格式和许多高级性能。考虑到视频信号隔行扫描的特点,MPEG-2专门设置了“按帧编码”和“按场编码”两种模式,并相应地对运动补偿和DCT方法进行了扩展,从而显著提高了压缩编码的效率。考虑到标准的通用性,增大了重要的参数值,允许有更大的画面格式、比特率和运动矢量长度。除此之外,MPEG-2视频压缩编码还进行了以下扩展:

1)输入/输出图像彩色分量之比可以是4∶2∶0,4∶2∶2,4∶4∶4。�

2)输入/输出图像格式不限定。

3)可以直接对隔行扫描视频信号进行处理。�

4)在空间分辨率、时间分辨率、信噪比方面的可分级性适合于不同用途的解码图像要求,并可给出传输上不同等级的优先级。�

5)码流结构的可分级性,比如头部信息、运动矢量等部分可以给予较高的优先级,而对于DCT系数的高频分量部分则给予较低的优先级。�

6)输出码率可以是恒定的也可以是变化的, 以适应同步和异步传输。�

MPEG-2视频是一系列的系统,每一个系统具有安排好的共性和兼容程度。它允许对四种源格式或者级别进行编码,从简单清晰度(CIF格式)到完全的高清晰度电视HDTV(High Definition Television)。除了源格式的这种灵活性外,MPEG-2还规定了分辨率从低到高的4级5类共11种单独的技术规范,同一种类不同级别间的图像分辨率和编码速率相差甚远。表2给出了MPEG-2允许的级别和类的组合。�

5、MPEG-4�

1992年11月,MPEG专家组决定开发新的适应于极低码率的音频/视频(AV,Audio-Visual)编码的国际标准,即MPEG-4。对于学术界来说,极低码率(即小于64Kbit/s)是视频编码标准的最后一个比特率范围。

表2 MPEG-2视频规范

注:简单规范(无B帧,不可缩放);主规范(B祯不可缩放) SNR缩放(B帧,空间或SNR可缩放) 空间可缩放的规范(B帧,空间或SNR可缩放);高级规范(B帧,空间或SNR 可缩放)。

MPEG-4专家组深入分析了AV领域中电视(television)、计算机(computer)、通信(communication)以及其交叉融合的发展趋势后,认为MPEG-4应该提供用于通信的新方式,其核心是基于内容content-based)的AV信息存储、处理与操作,支持交互性、高压缩比以及通用存储性等功能。同时在其结构上应具有适应性与可扩展性,以适应硬、软件技术的不断发展,便于及时融合新的技术。�

相对于MPEG的前两个压缩标准,MPEG-4已不再是一个单纯的视频音频编解码标准,它将内容与交互性作为核心,从而为多媒体提供了一个更为广阔的平台。它更多定义的是一种格式和框架,而不是具体的算法,这样人们可以在系统中加入许多新的算法。除了一些压缩工具和算法外,各种各样的多媒体技术如图像分析与合成、计算机视觉、语音合成等也可以充分应用于编码中。�

H.261是ITU-T针对可视电话和会议电视、窄带ISDN等要求实时编解码和低延时应用提出的一个编码标准。该标准包含的比特率为p*64Kbit/s,其中p是一个整数,取值范围为1~30,对应比特率为64Kbit/s~92Mbit/s。�

6、H.261

H.261标准大体上分为两种编码模式:帧内模式和帧间模式。对于缓和运动的人头肩像,帧间编码模式将占主导位置;而对画面切换频繁或运动剧烈的序列图像,则帧间编码模式要频繁地向帧内编码模式切换。

为了减少信道误码,采用一种叫做BCH(511,493)的纠错编码方式。这种纠错码可以在493比特中自动纠正2比特的错误。按H�261规定,源编码器必须具备纠错编码的功能,而纠错编码是选用的。

7、H.263

1995年,ITU-T总结当时国际上视频图像编码的最新进展,针对低比特率视频应用制定了H.263标准,该标准被公认为是以像素为基础的采用第一代编码技术的混合编码方案所能达到的最佳结果。随后几年中,ITU-T又对其进行了多次补充,以提高编码效率,增强编码功能。补充修订的版本有1998年的H�263+,2000年的H�263++。H�263系列标准特别适合于PSTN网络、无线网络与因特网等环境下的视频传输。

H.263已被几种可视电话采纳为终端标准,如支持PSTN与无线网的H�324,支持N-ISDN的H.320,支持B-ISDN的H�310等。H�263信源编码算法的核心仍然是H�261标准中采用的DPCM/DCT混和编码算法,原理框图也和H�261十分相似。

8、MPEG-7与MPEG-21�

MPEG-7是为“多媒体内容描述接口”,是用于信息表示的,PEG-7是“基于语义的表示”。MPEG-7定义了一个描述符标准集,用于描述各种类型的多媒体信息,与之相应的描述方案可以用于规范多媒体描述符的生成和不同描述符之间的有机联系。�

这些描述符与指定的多媒体对象的内容紧密联系,采用提取对象特征的方法为实现基于内容和语义的准确检索提供接口。在此基础上,MPEG-7定义了一种描述定义语言(DDL,Description Definition Language)用于指定和生成描述方案,即希望提出新的视频、音频信息表示方式,它既不同于基于波形和基于压缩的表示方式(如MPEG-1和MPEG-2),又不同于基于对象的表示方式(MPEG-4)。这一表示方式允许对信息的含义进行一定程度的解释,它可以被一个设备或计算机解码器存取。MPEG-7的目的在于提供一个标准化的核心技,以便描述多媒环境下的视频和音频内容,最终使视频和音频搜集像文本搜集一样简单方便。�

MPEG-7可以描述的多媒体对象范围极其广泛,其核心部分DDL语言将充分吸收现有的各种媒体描述语言的特点,以达到对多媒体数据的普遍适应性。MPEG-4中提出的基于对象编码的思想将成为对多媒体数据库中的视频、音频对象进行处理(包括特征提取、压缩编码等)的基本手段。而MPEG-7的多媒体内容描述功能对MPEG-1,MPEG-2,MPEG-4起到性能提高和功能扩展的作用。

最后,MPEG-7将提供内容的描述而不是内容本身,它将不能替代已有的MPEG标准(MPEG-1,MPEG-2,MPEG-4),仅仅是已有3个标准的补充。�

正在研制的新标准MPEG-21是一个支持通过异构网络和设备,使用户透明方便地使用多媒体资源的标准,其目的是建立一个交互的多媒体对象,实现多种业务模型,包括对版权和交易的自动管理,对内容使用者隐私的尊重等。

什么是音视频格式

编码格式对应的就是音频编码和视频编码,

音频编码标准和视频编码标准,每种编码标准都对应的编码算法,其目的是通过一定编码算法实现数据的压缩、减少数据的冗余。

视频编码指的是通过特定的压缩技术,将某个视频文件格式转换为另一种视频格式文件的方式

可变码率指的是输出码流的码率是可变的,因为视频信源本身的高峰信息量是变化的,从确保视频传输质量和充分利用信息的角度来说,可变码率视频编码才是最合理的。

相关资料免费分享,领取方式见下方腾讯文档

C++音视频开发学习资料 :点击领取 音视频开发(资料文档+视频教程+面试题)(FFmpeg+WebRTC+RTMP+RTSP+HLS+RTP)

是指视频成像产品所形成的图像大小或尺寸,常见的 1080P、4K 等又代表什么呢,P 本身的含义是逐行扫描,表示视频像素的总行数,

1080P 表示总共有 1080 行的像素数,而 K 表示视频像素的总列数,4K 表示有 4000 列的像素数,

通常来说,1080P 就是指 1080 x 1920 的分辨率,4 k 指 3840 x 2160 的分辨率。

视频编码:

Xvid(旧称为XviD)

是一个开放源代码的MPEG-4影像编解码器,是由一群原OpenDivX开发者在OpenDivX于2001年7月停止开发后自行开发的。

Xvid支持量化(Quantization)、范围控制的运动侦测(Motion Search)、码率曲线分配(Curve)、动态关键帧距(I-frame interval)、心理视觉亮度修正、演职员表选项、外部自定义控制、运动向量加速(Hinted ME)编码、画面优化解码等众多编码技术,对用户来说功能十分强大。

DivX是由MPEG-4衍生出的一种视频编码(压缩)标准,也即我们通常所说的DVDrip格式,

它采用了MPEG4的压缩算法,同时又综合了MPEG-4与MP3各方面的技术,说白了就是使用DivX压缩技术对DVD盘片的视频图像进行高质量压缩,

同时用MP3或AC3对音频进行压缩,然后再将视频与音频合成,并加上相应的外挂字幕文件而形成的视频格式。其画质直逼DVD,而体积只有DVD的数分之 一。

XviD与DivX几乎相同,是开源的DivX,不收费,而使用DivX要收费。

H.264是一种高性能的视频编解码技术。

目前国际上制定视频编解码技术的组织有两个,一个是“国际电联(ITU-T)”,它制定的标准有H.261、H.263、H.263+等,

另一个是“国际标准化组织(ISO)”它制定的标准有MPEG-1、MPEG-2、MPEG-4等。

而H.264则是由两个组织联合组建的联合视频组(JVT)共同制定的新数字视频编码标准,

所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高级视频编码(Advanced Video Coding,AVC),而且它将成为MPEG-4标准的第10部分。

因此,不论是MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。

H.264最具价值的部分是更高的数据压缩比,在同等的图像质量,H.264的数据压缩比能比DVD系统中使用的 MPEG-2高2 3倍,比MPEG-4高1.5 2倍。

举个例子,原始文件的大小如果为100GB,采用MPEG-2压缩标准压缩后变成4GB,压缩比为25 1,而采用H.264压缩标准压缩后变为1GB,从100GB到1GB,H.264的压缩比达到惊人的100 1。尤其值得一提的是,H.264在具有高压缩比的同时还拥有高质量流畅的图像。

微软是在2003年9月递交VC-1编码格式的,目前已经得到了MovieBeam、Modeo等不少公司的采纳,同时也包含在HD DVD和蓝光中,包括华纳和环球等影业公司也有采用这种格式的意向。

VC-1基于微软Windows Media Video9(WMV9)格式,而WMV9格式现在已经成为VC-1标准的实际执行部分。WMV (Windows Media

Video)是微软公司的视频编解码器家族,包括WMV7、WMV8、WMV9、WPV10。这一族的编解码器可以应用在从拨号上网的窄带视频到高清晰度电视HDTV)的宽带视频。使用Windows Media Video用户还可以将视频文件刻录到CD、DVD或者其它一些设备上。它也

适用于用作媒体服务器。

WMV可以被看作是MPEG-4的一个增强版本。最新的由SMPTE(电视电影工程师协会)承认的WMV-9,也就是我们说的上面的VC-1。

同一个 AVCodecID 可能对应多个不同的编解码器 (AVCodec) MPEG-4 AVC、MPEG-4 Part 10,还是ISO/IEC 14496-10,都是指H.264。

在编码方式相同相同的情况下,.avi, .mkv, .mp4只是封装格式的区别(文件后缀格式),而封装格式是不影响画质的。

就相当于你的100块钱折一下,或者两下,或者两下后不管是放在你的口袋里,钱包里还是存钱罐里都是100块钱。

这里的100块钱就是就是视频数据,你把100块折一下,或者两下,或者两下就是编码格式,钱包,口袋,存钱罐就是封装格式。

音频格式是指要在计算机内播放或是处理音频文件,是对声音文件进行数、模转换的过程。音频格式最大带宽是20KHZ,速率介于40~50KHZ之间,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。

目录

特点

发展

CD

WAVE

AIFF

AU

MPEG

MP3

MPEG-4

MIDI

WMA

RealAudio

VQF

OggVorbis

比较特点

发展

CD

WAVE

AIFF

AU

MPEG

MP3

MPEG-4MIDIWMARealAudioVQFOggVorbis比较展开 编辑本段特点

音频文件格式常见的特点有:要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成,人耳所能听到的声音,最低的频率是从20Hz起一直到最高频率20KHZ,20KHz以上人耳是听不到的,因此音频文件格式的最大带宽是20KHZ,故而采样速率需要介于40~50KHZ之间,而且对每个样本需要更多的量化比特数。音频数字化的标准是每个样本16位-96dB的信噪比,采用线性脉冲编码调制PCM,每一量化步长都具有相等的长度。在音频文件的制作中,正是采用这一标准。

编辑本段发展

音频格式日新月异,到2008年音频格式包括:CD格式、WAVE(*.WAV)、AIFF、AU、MP3、MIDI、WMA、RealAudio、VQF、OggVorbis、AAC、APE。

编辑本段CD

cd光盘用于储存cd格式文件

CD格式音质比较音频格式。因此要讲音频格式,CD自然是打头阵的先锋。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式也就是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是忠于原声的,因此如果你如果是一个音响发烧友的话,CD是你的首选。它会让你感受到天籁之音。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的“*.cda文件”都是44字节长。注意:不能直接的复制CD格式的*.cda文件到硬盘上播放,需要使用象EAC这样的抓音轨软件把CD格式的文件转换成WAV,这个转换过程如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音频。推荐大家使用这种方法。

编辑本段WAVE

WAVE格式文件音频图

WAVE(*.WAV)是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存WINDOWS平台的音频信息资源,被WINDOWS平台及其应用程序所支持。“*.WAV”格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的WAV文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,看到了吧,WAV格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都“认识”WAV格式。

编辑本段AIFF

AIFF(Audio Interchange File Format)格式和AU格式,它们都和WAV非常相像,在大多数的音频编辑软件中也都支持它们这几种常见的音乐格式。 AIFF格式存储的数据图

AIFF是音频交换文件格式的英文缩写。是APPLE公司开发的一种音频文件格式,被MACINTOSH平台及其应用程序所支持,NETSCAPE浏览器中LIVEAUDIO也支持AIFF格式。所以大家都不常见。AIFF是Apple苹果电脑上面的标准音频格式,属于QuickTime技术的一部分。这一格式的特点就是格式本身与数据的意义无关,因此受到了Microsoft的青睐,并据此搞出来WAV格式。AIFF虽然是一种很优秀的文件格式,但由于它是苹果电脑上的格式,因此在PC平台上并没有得到很大的流行。不过由于Apple电脑多用于多媒体制作出版行业,因此几乎所有的音频编辑软件和播放软件都或多或少地支持AIFF格式。只要苹果电脑还在,AIFF就始终还占有一席之地。由于AIFF的包容特性,所以它支持许多压缩技术。

编辑本段AU

AUDIO文件是SUN公司推出的一种数字音频格式。AU文件原先是UNIX操作系统下的数字声音文件。由于早期INTERNET上的WEB服务器主要是基于UNIX的,所以,AU格式的文件在如今的INTERNET中也是常用的声音文件格式。

编辑本段MPEG

嵌入式MPEG4解码系统

MPEG是动态图象专家组的英文缩写。这个专家组始建于1988年,专门负责为CD建立视频和音频压缩标准。MPEG音频文件指的是MPEG标准中的声音部分即MPEG音频层。目前INTERNET上的音乐格式以MP3最为常见。虽然它是一种有损压缩,但是它的最大优势是以极小的声音失真换来了较高的压缩比。MPEG含有格式包括:MP1、MP2、MP3、MP4

编辑本段MP3

MP3格式诞生于八十年代的德国,所谓的MP3也就是指的是MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应“*.mp1"/“*.mp2”/“*.mp3”这3种声音文件。需要提醒大家注意的地方是:MPEG音频文件的压缩是一种有损压缩,MPEG3音频编码具有10:1~12:1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而音质要次于CD格式或WAV格式的声音文件。由于其文件尺寸小,音质好;所以在它问世之初还没有什么别的音频格式可以与之匹敌,因而为*.mp3格式的发展提供了良好的条件。直到现在,这种格式还是风靡一时,作为主流音频格式的地位难以被撼动。但是树大招风,MP3音乐的版权问题也一直是找不到办法解决,因为MP3没有版权保护技术,说白了也就是谁都可以用。 MP3格式压缩音乐的采样频率有很多种,可以用64Kbps或更低的采样频率节省空间,也可以用320Kbps的标准达到极高的音质。用装有Fraunhofer IIS Mpeg Lyaer3的 MP3编码器(现在效果最好的编码器)MusicMatch Jukebox 6.0在128Kbps的频率下编码一首3分钟的歌曲,得到2.82MB的MP3文件。采用缺省的CBR(固定采样频率)技术可以以固定的频率采样一首歌曲,而VBR(可变采样频率)则可以在音乐“忙”的时候加大采样的频率获取更高的音质,不过产生的MP3文件可能在某些播放器上无法播放。把VBR的级别设定成为与前面的CBR文件的音质基本一样,生成的VBR MP3文件为2.9MB。 MP3是到2008年止使用用户最多的有损压缩数字音频格式了。它的全称是MPEG(MPEG:MovingPictureExpertsGroup)AudioLayer-3,刚出现时它的编码技术并不完善,它更像一个编码标准框架,留待人们去完善。早期的MP3编码采用的的是固定编码率的方式(CBR),看到的128KBPS,就是代表它是以128KBPS固定数据速率编码——你可以提高这个编码率,最高可以到320KBPS,音质会更好,自然,文件的体积会相应增大。 因为MP3的编码方式是开放的,可以在这个标准框架的基础上自己选择不同的声学原理进行压缩处理,所以,很快由Xing公司推出可变编码率的压缩方式(VBR)。它的原理就是利用将一首歌的复杂部分用高bitrate编码,简单部分用低bitrate编码,通过这种方式,进一步取得质量和体积的统一。当然,早期的Xing编码器的VBR算法很差,音质与CBR(固定码率)相去甚远。但是,这种算法指明了一种方向,其他开发者纷纷推出自己的VBR算法,使得效果一直在改进。目前公认比较好的首推LAME,它完美地实现了VBR算法,而且它是是完全免费的软件,并且由爱好者组成的开发团队一直在不断的发展完善。 而在VBR的基础上,LAME更加发展出ABR算法。ABR(AverageBitrate)平均比特率,是VBR的一种插值参数。LAME针对CBR不佳的文件体积比和VBR生成文件大小不定的特点独创了这种编码模式。ABR在指定的文件大小内,以每50帧(30帧约1秒)为一段,低频和不敏感频率使用相对低的流量,高频和大动态表现时使用高流量,可以做为VBR和CBR的一种折衷选择。 MP3问世不久,就凭这较高的压缩比12:1和较好的音质创造了一个全新的音乐领域,然而MP3的开放性却最终不可避免的导致了版权之争,在这样的背景之下,文件更小,音质更佳,同时还能有效保护版权的MP4就应运而生了。MP3和MP4之间其实并没有必然的联系,首先MP3是一种音频压缩的国际技术标准,而MP4确实一个商标的名称。

编辑本段MPEG-4

MPEG-4标准是由国际运动图像专家组于2000年10月公布的一种面向多媒体应用的视频压缩标准。它采用了基于对象的压缩编码技术,在编码前首先对视频序列进行分析,从原始图像中分割出各个视频对象,然后再分别对每个视频对象的形状信息、运动信息、纹理信息单独编码,并通过比MPEG-2更优的运动预测和运动补偿来去除连续帧之间的时间冗余。其核心是基于内容的尺度可变性(Content-basedscalability),可以对图像中各个对象分配优先级,对比较重要的对象用高的空间和时间分辩率表示,对不甚重要的对象(如监控系统的背景)以较低的分辩率表示,甚至不显示。因此它具有自适应调配资源能力,可以实现高质量低速率的图像通信和视频传输。 MPEG-4以其高质量、低传输速率等优点已经被广泛应用到网络多媒体、视频会议和多媒体监控等图像传输系统中。中国内外大部分成熟的MPEG-4应用均为基于PC层面的客户端和服务器模式,应用在嵌入式系统上的并不多,且多数嵌入式MPEG-4解码系统大多使用商业的嵌入式操作系统,如WindowsCE、VxWorks等,成本高、灵活性差。如以嵌入式Linux作为操作系统不仅开发方便,且可以节约成本,并可以根据实际情况进行裁减,占用资源少、灵活性强,网络性能好,适用范围更广。

编辑本段MIDI

MIDI格式输出原理图

MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖声卡的档次。*.mid格式的最大用处是在电脑作曲领域。*.mid文件可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

编辑本段WMA

WMA (Windows Media Audio) 格式是来自于微软的重量级选手,后台强硬,音质要强于MP3格式,更远胜于RA格式,它和日本YAMAHA公司开发的VQF格式一样,是以减少数据流量但保持音质的方法来达到比MP3压缩率更高的目的,WMA的压缩率一般都可以达到1:18左右,WMA的另一个优点是内容提供商可以通过DRM(Digital Rights Management)方案如Windows Media Rights Manager 7加入防拷贝保护。这种内置了版权保护技术可以限制播放时间和播放次数甚至于播放的机器等等,这对被盗版搅得焦头乱额的音乐公司来说可是一个福音,另外WMA还支持音频流(Stream)技术,适合在网络上在线播放,作为微软抢占网络音乐的开路先锋可以说是技术领先、风头强劲,更方便的是不用象MP3那样需要安装额外的播放器,而Windows操作系统和Windows Media Player的无缝捆绑让你只要安装了windows操作系统就可以直接播放WMA音乐,新版本的Windows Media Player7.0更是增加了直接把CD光盘转换为WMA声音格式的功能,在新出品的操作系统Windows XP中,WMA是默认的编码格式,大家知道Netscape的遭遇,现在“狼”又来了。WMA这种格式在录制时可以对音质进行调节。同一格式,音质好的可与CD媲美,压缩率较高的可用于网络广播。虽然现在网络上还不是很流行,但是在微软的大规模推广下已经是得到了越来越多站点的承认和大力支持,在网络音乐领域中直逼*.mp3,在网络广播方面,也正在瓜分Real打下的天下。因此,几乎所有的音频格式都感受到了WMA格式的压力。 WMA格式文件结构图

微软官方宣布的资料中称WMA格式的可保护性极强,甚至可以限定播放机器、播放时间及播放次数,具有相当的版权保护能力。应该说,WMA的推出,就是针对MP3没有版权限制的缺点而来——普通用户可能很欢迎这种格式,但作为版权拥有者的唱片公司来说,它们更喜欢难以复制拷贝的音乐压缩技术,而微软的WMA则照顾到了这些唱片公司的需求。 除了版权保护外,WMA还在压缩比上进行了深化,它的目标是在相同音质条件下文件体积可以变的更小(当然,只在MP3低于192KBPS码率的情况下有效,实际上当采用LAME算法压缩MP3格式时,高于192KBPS时普遍的反映是MP3的音质要好于WMA)。

编辑本段RealAudio

RealAudio主要适用于在网络上的在线音 RealAudio格式和网站服务器连接图

乐欣赏,现在大多数的用户仍然在使用56Kbps或更低速率的Modem,所以典型的回放并非最好的音质。有的下载站点会提示你根据你的Modem速率选择最佳的Real文件。real的的文件格式主要有这么几种:有RA(RealAudio)、RM(RealMedia,RealAudio G2)、RMX(RealAudio Secured),还有更多。这些格式的特点是可以随网络带宽的不同而改变声音的质量,在保证大多数人听到流畅声音的前提下,令带宽较富裕的听众获得较好的音质。 近来随着网络带宽的普遍改善,Real公司正推出用于网络广播的、达到CD音质的格式。如果你的RealPlayer软件不能处理这种格式,它就会提醒你下载一个免费的升级包。许多音乐网站 提供了歌曲的Real格式的试听版本。现在最新的版本是RealPlayer 9.0,第39期《电脑报》也对RealPlayer 9.0作了详细的介绍,这里不再赘述。

编辑本段VQF

雅马哈公司另一种格式是*.vqf,它的核心是减少数据流量但保持音质的方法来达到更高的压缩比,VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍,可以达到18:1左右甚至更高。也就是说把一首4分钟的歌曲(WAV文件)压成MP3,大约需要4MB左右的硬盘空间,而同一首歌曲,如果使用VQF音频压缩技术的话,那只需要2MB左右的硬盘空间。因此,在音频压缩率方面,MP3和RA都不是VQF的对手。相同情况下压缩后VQF的文件体积比MP3小30%~50%,更便利于网上传播,同时音质极佳,接近CD音质(16位44.1kHz立体声)。可以说技术上也是很先进的,但是由于宣传不力,这种格式难有用武之地。*.vqf可以用雅马哈的播放器播放。同时雅马哈也提供从*.wav文件转换到*.vqf文件的软件。 此文件缺少特点外加缺乏宣传。 当VQF以44KHz、80kbit/s的音频采样率压缩音乐时,它的音质优于44KHz、128kbit/s的MP3,当VQF以44KHz、96kbit/s的频率压缩时,它的音质几乎等于44KHz、256kbit/s的MP3。经SoundVQ压缩后的音频文件在进行回放效果试听时,几乎没有人能听出它与原音频文件的差异。 VQF音频文件个格式

播放VQF对计算机的配置要求仅为奔腾75或更高,当然如果您用奔腾100或以上的机器,VQF能够运行得更加出色。实际上,播放VQF对CPU的要求仅比Mp3高5~10%左右。 VQF即TwinVQ技术虽然是由NTT和YAMAHA开发的,但它们的应用软件都是免费的。只是NTT和YAMAHA并没有公布VQF的源代码。

编辑本段OggVorbis

OggVorbis是一种新的音频压缩格式,类似于MP3等现有的音乐格式。但有一点不同的是,它是完全免费、开放和没有专利限制的。Vorbis是这种音频压缩机制的名字,而Ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了OggVorbis这一部分。 OggVorbis文件的扩展名是*.OGG。这种文件的设计格式是非常先进的。这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。 VORBIS采用有损压缩,但通过使用更加先进的声学模型去减少损失,因此,同样位速率(BitRate)编码的OGG与MP3相比听起来更好一些。另外,还有一个原因,MP3格式是受专利保护的。如果你想使用MP3格式发布自己的作品,则需要付给Fraunhofer(发明MP3的公司)专利使用费。而VORBIS就完全没有这个问题。 OggVorbis格式

对于乐迷来说,使用OGG文件的显著好处是可以用更小的文件获得优越的声音质量。而且,由于OGG是完全开放和免费的,制作OGG文件将不受任何专利限制,可望可以获得大量的编码器和播放器。这也是为何现在MP3编码器如此少而且大多是商业软件的原因,因为Fraunhofer要收取专利使用费。Vorbis使用了与MP3相比完全不同的数学原理,因此在压缩音乐时受到的挑战也不同。同样位速率编码的Vorbis和MP3文件具有同等的声音质量。Vorbis具有一个设计良好、灵活的注释,避免了象MP3文件的ID3标记那样烦琐的操作;Vorbis还具有位速率缩放:可以不用重新编码便可调节文件的位速率。Vorbis文件可以被分成小块并以样本粒度进行编辑;Vorbis支持多通道;Vorbis文件可以以逻辑方式相连接等。

编辑本段比较

作为数字音乐文件格式的标准,WAV格式容量过大,因而使用起来很不方便。因此,一般情况下我们把它压缩为MP3或WMA格式。压缩方法有无损压缩,有损压缩,以及混成压缩。MPEG,JPEG就属于混成压缩,如果把压缩的数据还原回去,数据其实是不一样的。当然,人耳是无法分辨的。因此,如果把MP3,OGG格式从压缩的状态还原回去的话,就会产生损失。然而,APE格式即使还原,也能毫无损失地保留原有音质。所以,APE可以无损失高音质地压缩和还原。在完全保持音质的前提下,APE的压缩容量有了适当的减小。拿一个最为常见的38MBWAV文件为例,压缩为APE格式后为25MB左右,比开始足足少了13MB。而且MP3容量越来越大的今天,25M的歌曲已经算不上什么庞然大物了。以1GB的mp3来说可以放入4张CD,那就是40多首歌曲,已经足够了! MP3支持格式有MP3和WMA。MP3由于是有损压缩,因此讲求采样率,一般是44.1KHZ。另外,还有比特率,即数据流,一般为8---320KBPS。在MP3编码时,还看看它是否支持可变比特率(VBR),现在出的MP3机大部分都支持,这样可以减小有效文件的体积。WMA则是微软力推的一种音频格式,相对来说要比MP3体积更小。 [1]

以上就是关于图像和视频编码的国际标准有哪些?全部的内容,如果了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

 
举报收藏 0打赏 0评论 0
 
更多>同类百科头条
推荐图文
推荐百科头条
最新发布
点击排行
推荐产品
网站首页  |  公司简介  |  意见建议  |  法律申明  |  隐私政策  |  广告投放  |  如何免费信息发布?  |  如何开通福步贸易网VIP?  |  VIP会员能享受到什么服务?  |  怎样让客户第一时间找到您的商铺?  |  如何推荐产品到自己商铺的首页?  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备15082249号-2