激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

音頻壓縮的成功者-感知編碼

時(shí)間：2024-08-03 10:16:17 計算機畢業(yè)論文我要投稿

相關(guān)推薦

音頻壓縮的成功者-感知編碼

音頻壓縮的成功者——感知編碼

2004年中南地區省級電視臺技術(shù)年會(huì )論文二等獎

近年來(lái)，隨著(zhù)現代通信的發(fā)展，數字化日益滲透人們的日常生活，人們對各種多媒體業(yè)務(wù)的需求日益增長(cháng)，我們正享受著(zhù)數字化帶來(lái)的方便和快捷，衛星電視、數字電視、各種數碼音樂(lè )產(chǎn)品正改變著(zhù)我們的生活。于是便要求得到更多更好的音頻產(chǎn)品和服務(wù)。數字聲音作為一種存儲、處理和傳輸高保真聲音的方法，在消費電子、專(zhuān)業(yè)聲音等眾多領(lǐng)域已得到廣泛應用。但是如果沒(méi)有通用有效的高質(zhì)量音頻編解碼方案，數字存儲和傳輸技術(shù)的進(jìn)一步發(fā)展將會(huì )受到嚴重的束縛。在音頻數字壓縮技術(shù)中，當前比較成功的編碼方式被稱(chēng)為“感知型編碼（ Perceptual Coding ）”，現在比較常用的 MP3 、 MD 等都是感知編碼原理。

一般來(lái)說(shuō)，數據壓縮有兩種方法。一種方法是利用信號的統計性質(zhì)，完全不丟失信息的高效率編碼法，稱(chēng)為平均信息量編碼或熵編碼。第二種方法是利用接收信號的人的感覺(jué)特性，省略不必要的信息，壓縮信息量，這種方法稱(chēng)為感覺(jué)編碼。

因為熵編碼可通過(guò)解碼完全再現編碼前的數據，故應用范圍廣泛 ,例如可用于磁盤(pán)壓縮、文件壓縮等，在保存信息方面，完全不用擔心劣化。不過(guò)遺憾的是，僅依靠熵編碼不能將音頻信號進(jìn)行大幅度的數據壓縮。這是因為在音頻信號中會(huì )有白噪聲信號，這種完全隨機的信號，根據信息論是決不能用熵編碼進(jìn)行壓縮的。因此在音頻壓縮中，必須同時(shí)采用感知編碼。

感知編碼是利用人耳聽(tīng)覺(jué)的心理聲學(xué)特性（頻譜掩蔽特性和時(shí)間掩蔽特性）、人耳對信號幅度、頻率、時(shí)間的有限分辨能力，凡是人耳感覺(jué)不到的成分不編碼，不傳送，即凡是對人耳辨別聲音信號的強度、音調、方位有貢獻的部分（稱(chēng)為不相關(guān)部分或無(wú)關(guān)部分）都不編碼和傳送。對感覺(jué)到的部分進(jìn)行編碼時(shí)，允許有較大的量化失真、并使其處于聽(tīng)閾以下，人耳仍然感覺(jué)不到。簡(jiǎn)單的說(shuō)感知編碼是建立在人類(lèi)聽(tīng)覺(jué)系統的心理聲學(xué)原理為基礎，只記錄那些能被人的聽(tīng)覺(jué)所感知的聲音信號，從而達到減少數據量而又不降低音質(zhì)的目的。

目前音頻壓縮編碼已成為標準的是 MPEG-1 （ ISO/IEC11172-3 ）、 MPEG-2 （ ISO/IEC13818-3 ）和美國大聯(lián)盟的 AC-3 。他們都是感知編碼。

一、為什么壓縮

了解數字音頻首先要提到脈沖編碼調制 PCM （ Pulse Code Modulation ），它是概念上最簡(jiǎn)單、理論上最完善的編碼系統，是最早研制成功、使用最為廣泛的編碼系統，但也是數據量最大的編碼系統。 PCM 指模擬音頻信號只經(jīng)過(guò)采樣、量化、編碼，模數轉換成 PCM 信號，得到標準的數字音頻碼流，而未經(jīng)過(guò)任何編碼和壓縮處理。

根據奈奎斯特采樣定律，通常其采樣頻率至少應當是信號中的最高頻率分量的兩倍。對于高質(zhì)量的音頻信號，其頻率范圍是從 20Hz ～ 20kHz 。所以其采樣頻率必須在 40kHz 以上。在 CD 中采用了 44.1kHz 的采樣頻率。普通 CD 線(xiàn)性 PCM 的取樣頻率為 44.1kHz ，量化精度為 16bit ，動(dòng)態(tài)范圍為 98db 。（在對模擬信號采樣以后，還必須對其幅度上加以分層。在 CD 中，其分層以后的幅度信號用 16 bit 的二進(jìn)制信號來(lái)表示，也就是把模擬的音頻信號在幅度上分為 65536 （ 2 16 ）層。這樣，它的動(dòng)態(tài)范圍就可以達到 96 分貝（ 6 分貝 / 比特）。）

PCM 的編碼原理比較直觀(guān)和簡(jiǎn)單，它的原理框圖如圖所示。

在這個(gè)編碼框圖中，它的輸入是模擬聲音信號，它的輸出是 PCM 樣本。圖中的“防失真濾波器”是一個(gè)低通濾波器，用來(lái)濾除聲音頻帶以外的信號；“波形編碼器”可暫時(shí)理解為“采樣器”，“量化器”可理解為“量化階大小 (step-size) ”生成器或者稱(chēng)為“量化間隔”生成器。

那么這種未經(jīng)壓縮的 PCM 信號的數據量具體有多大呢？以 CD 音質(zhì)的信號為例，它的單通道的采樣率是 44.1k Hz ，每個(gè)樣值是 16bit 的量化，而立體聲 CD 音質(zhì)信號，有兩個(gè)通道，它每秒的碼流是 44.1K × 16 × 2 ≈ 1.4Mbit/s 。（數字信號傳輸率 = 取樣頻率 × 量化比特 × 通道數）一張 CD 唱片的容量約為 680MB ，可以容納約 1 小時(shí)的雙聲道 PCM 數字音頻節目，由于這種編碼方式所產(chǎn)生的數據量太大，存儲和傳輸都既不方便也不經(jīng)濟，有時(shí)甚至是行不通的。對于電視廣播來(lái)說(shuō)，數據傳輸速率越高，每套節目所需的頻寬就越大，在頻帶資源日趨緊張的今天，過(guò)寬的頻帶是不能允許的，同時(shí)對于有形載體（激光碟、磁帶等），每種載體的記錄密度都是有限的（受當時(shí)技術(shù)發(fā)展程度的制約），增大數據量就意味著(zhù)縮短節目長(cháng)度。因此需要開(kāi)發(fā)一種新的編碼方式，它應該使用較少的數據量，而又不會(huì )導致音質(zhì)的主觀(guān)聽(tīng)感有明顯的下降。

二、感知編碼原理

1 、理論基礎——聞?dòng)蚝团R界頻段

音頻壓縮理論是建立在心理聲學(xué)模型基礎上，從研究人耳的聽(tīng)感系統開(kāi)始的。

人耳實(shí)際上可看成一個(gè)多頻段的聽(tīng)感分析器，在接收端的最后，它對瞬間的頻譜功率進(jìn)行了重新分配，這就為音頻的數據壓縮提供了依據。

眾所周知，聲源振動(dòng)的能量通過(guò)聲波傳入人耳，使耳膜發(fā)生振動(dòng)，人們就產(chǎn)生了聲音的感覺(jué)。但是人耳能聽(tīng)到的振動(dòng)頻率約在 20 Hz 到 20KHz 之間，低于 20 Hz 或高于 20K Hz 的振動(dòng)，不能引起人類(lèi)聽(tīng)覺(jué)器官的感覺(jué)。心理聲學(xué)模型中一個(gè)基本的概念就是聽(tīng)覺(jué)系統中存在一個(gè)聽(tīng)覺(jué)閾值電平，低于這個(gè)電平的聲音信號就聽(tīng)不到，因此就可以把這部分信號去掉。聽(tīng)覺(jué)閾值的大小隨聲音頻率的改變而改變，各個(gè)人的聽(tīng)覺(jué)閾值也不同。大多數人的聽(tīng)覺(jué)系統對 2kHz ～ 5kHz 之間的聲音最敏感。一個(gè)人是否能聽(tīng)到聲音取決于聲音的頻率，以及聲音的幅度是否高于這種頻率下的聽(tīng)覺(jué)閾值。這就是說(shuō)在聽(tīng)覺(jué)閾值以外的電平可以去掉，相當于壓縮了數據。另外，聽(tīng)覺(jué)閾值電平是自適應的，即聽(tīng)覺(jué)閾值電平會(huì )隨聽(tīng)到的不同頻率的聲音而發(fā)生變化。也許你有這樣的體驗，在一安靜房間里的普通談話(huà)可以聽(tīng)得很清楚，但在播放搖滾樂(lè )的環(huán)境下同樣的普通談話(huà)就聽(tīng)不清楚了。聲音壓縮算法也同樣可以確立這種特性的模型來(lái)取消更多的冗余數據。

音頻壓縮的成功者-感知編碼

【音頻壓縮的成功者-感知編碼】相關(guān)文章：

視音頻素材的編碼轉換03-19

視頻壓縮編碼的差錯復原技術(shù)03-21

用于壓縮感知的無(wú)線(xiàn)傳感網(wǎng)測量矩陣設計方法01-06

多相編碼脈沖壓縮信號及其旁瓣抑制性能研究03-07

Tunstall編碼與自適應編碼算法03-07

淺析音頻失真11-27

工程音頻電纜論文03-18

Video Object編碼技術(shù)01-07

藍牙技術(shù)在音頻網(wǎng)關(guān)中的應用01-07

最新推薦

激情欧美日韩一区二区,浪货撅高贱屁股求主人调教视频,精品无码成人片一区二区98,国产高清av在线播放,色翁荡息又大又硬又粗视频

<style id="rdqms"></style>

<td id="rdqms"></td>

<sub id="rdqms"><input id="rdqms"></input></sub>