close
說起mp3我想恐怕現在沒有什麼人會說沒聽說過它的,就算您不是mp3的使用者,但就城市裡無處不在的廣告,宣傳活動,朋友們相互間的討論,網絡上的豐富資源,這些總能讓您有點印象吧?對時尚的年輕一族,特別是喜歡音樂的朋友和喜歡數碼設備的朋友來說,mp3恐怕是個天天都要念叨的詞彙,但是到底什麼才是mp3,mp3的音質怎樣定論,怎樣才是好壞和怎樣才能聽到高品質的mp3呢???我想下面的這片文章能夠幫助你解決很多疑問。

  縱觀現在的mp3使用者中,比較公認的通用製作標準是EAC抓軌+Lame的壓縮,我自己也是使用這樣的搭配,在這樣的製作過程中有經驗的朋友會摸索出一些訣竅,針對不同的音樂使用不同的參數設置和壓縮比例,從標準的128kbps到最大的320kbps不等,但是這些碼率間的效果差距和區別到底有多少??如何才是最合適的壓縮比例,cbr和vbr應該選取那個更好等這些問題都是大家常討論的,為了弄清楚這些細節,我又特地有針對性地做了一次試驗,下面和大家一起分享一下我得一些感受。

  我自己平時是很喜歡聽古典音樂的,所以這次測試的曲目選擇的就是巴赫的《格蘭登堡協奏曲》第一軌,慕尼黑巴赫樂團演奏,抓軌軟件EAC,壓縮軟件CDex,播放軟件Fooba2000 v0.8版本,測聽耳機器材是音特美的er6和舒爾的e3c。因為古典曲目細節多,樂隊大,對聲音素質的各方面要求都比較高,所以能比較明顯的反映各個不同處理方法之間的細節差別。

  我先用EAC抓了軌,然後用CDex軟件裡面的lame mp3 encoder(vision 1.92 engine 3.92)引擎對wav文件進行處理,lame參數上面我進行了逐個試驗來選擇好的效果:


  
第一個參數thread priority 分別選擇最高和最低,其他參數相同的情況下壓縮對比,發現線程優先是否的程度對聲音是沒有影響的,生成的文件大小都一樣,對比聽起來也是一樣的,所以這個參數對音質沒有任何影響。

  第二個參數是version,可以選擇的有mpegI、mpegII和mpegII.V,同樣的,別的參數都確定,分別用這三個選項壓縮了三次,對比聽下來,雖然三種方式的文件大小都相同,但是還是mpegI的實際聽感要好一些,中低頻的壓縮比率要略小,但是高頻失真略微多一點,聽人聲和流行音樂著一種是比較適合的,聽古典的用mpegI型也不錯,聲底比較好,但是如果是小提琴等中高頻多的獨奏類音樂,可以推薦使用mpegII.v類型的,會有比較好的效果。

  第三個參數是最重要的,這就是碼率,選擇他直接影響到你的mp3文件尺寸大小和聽感,壓縮比高的失真大,壓縮比小的失真小,但是怎麼才能找到一個我們自己兩方面都能接受的平衡點呢?這就需要在實驗裡仔細摸索,考慮到低碼率的文件聲音素質不太適合播放音樂,所以最低定為128kbps,依次使用128、192、256、320共四種固定碼率的文件來進行對比和測試。

  128kbps的壓縮比還是比較粗糙的,高頻部分壓縮後失真非常明顯,聽起來空洞,乾癟、刺耳,還時常有忽悠忽悠的聲音,樂器的質感很差,部分樂器都變了味道,甚至可能會聽錯,3分39的一段樂曲壓縮後的體積是3414kb,體積雖然不大但是聲音不能讓人滿意,存在比較大的缺陷。

  192kbps碼率的壓縮效果比起128來說可是要好多了,首先聲音紮實,至少沒有那種空洞感,高頻失真也小了很多,聲音緊湊,雜音小,乾淨,達到了相對比較理想的聽音效果,只是由於壓縮還是比較厲害,細節的表現仍舊不是很好,樂器尤其是管樂器的質感還是很硬,不真實,缺乏樂感,壓縮後的尺寸是5123kb,我覺得這個壓縮比例在128~~256m容量的mp3播放器上使用比較好,既可以滿足基本的聽感,也在尺寸上合適,128m大約能存儲95分鐘的音樂,256m則翻倍為190分鐘的音樂。

  256kbps的壓縮率比起192自然是在音質上更上了一個台階,就拿曲目剛開始的10秒鐘說,大提琴部的低頻明顯顆粒感就小了很多,聲音更加順滑自然,質感和紋理也更加清楚一些,細節方面多了不少,氣氛的渲染比較突出,後面的曲子進行中的聲部輪換也表現力起來許多,大信號小信號的清晰度也提升一些,聲音更加細緻耐聽,但是與此同時,文件的體積也一下子增加到了6831kb,這對於256m的mp3播放器來說還是可以承受的,計算一下不難知道,按照256的碼率可以存放約135分鐘的音樂,一般來說也是夠用了,128m就有點少了,只能支持一個小時多一點,所以推薦128m的使用192碼率。

  320kbps是lame能夠提供的最大碼率了,最終的生成文件是8592kb,大概就是8.4M,對比wav文件的37M來說,壓縮比基本為4.5:1,但是生成的mp3文件聽起來已經失真非常小了,對比其他碼率320的自然優勢明顯,音色,細節等等都非常細膩,基本是達到了原樣複製了cd的聲音素質,特別在帶有mp3播放功能的cd播放器上上聽起來,基本沒有什麼區別,不過我使用了比較高檔的耳塞,解析力比較高,再加上我對音樂和器材的經驗和能力,對比wav文件還是聽出了許多不同,首先;壓縮過的mp3聽起來有點縮水的感覺,整體比較干,沒有wav文件聽起來鮮活充滿動感,末端細節、泛音和空間感上,分離度上也不及wav文件來的素質高,不過在音色上已經算是相當接近了,只是表現力上面差一些,數碼味道比較濃重。所以如果您使用的是ipod等這類微型硬盤式的隨身聽播放器,那我還是推薦您使用320kbps的壓縮比率,這樣可以得到相對最好的聆聽感覺,當然直接聽wav是最好的啦~~無壓縮,沒損失,可惜現在還沒什麼隨身聽支持ape這種無損壓縮,不然又可以多種選擇了。

  上面給大家說得都是固定碼率的壓縮比,在lame裡這叫做CBR(即不可變碼率),其實lame最大的特點就是它給用戶提供了可變碼率VBR的壓縮方式,這種方式在一些停頓,簡單的信號處會自動降低碼率減少文件尺寸,是一種非常好的編碼方式,但是如何選擇VBR最低和最高的碼率範圍才能得到最恰當的文件和音質呢?這又是一個需要實驗來解決的問題,同樣的考慮到128kbps為基礎值,所以我們選擇了96kbps到160kbps為一個範圍進行了壓縮,壓縮後的文件大小是3801kb,比128kbps的CBR只是多了387kb,但是聲音絕對是提高了一個大層次,首先高頻的失真至少小了一半以上,雖然細節處的雜音還不少,但是第一聽感就比128kbps強太多了,壓縮後的平均碼率是147kbps,也是非常節省空間的。隨後又實驗了96kbps到192kbps、96kbps到224kbps、96kbps到256kbps、96kbps到320kbps,發現他們和最大值的CBR壓縮音質很近似,即96kbps到192kbps的vbr聲音近似cbr的192kbps,但是在尺寸上前者是4481kb而後者是5123kb,所以作為一個多追求高音質又節省空間的折中方法,vbr還真是很管用。當然另一方面,因為碼率變來變去,所以穩定性自然要比cbr的略微差一點。

  第四,模式參數上,有stereo、J-stereo、Forced-stereo和mono,對比測試得出標準的stereo效果最好,雖然壓縮出的文件尺寸最大,但是斟酌較小的文件尺寸差異和聲音素質差別及聽感,還是覺得stereo比較理想。

  第五,壓縮方式,軟件裡有vbr-old、vbr-new、及其它兩種,但是只有前面兩種好用,對比新舊兩種vbr編碼方式,發現如果從音質上說,還是老的比較細膩,但是老編碼壓縮速度很慢,差不多是新編碼方式的5、6倍,一首曲子製作差不多3、4分鐘,非常不好用,而且文件體積也大出10%左右,所以推薦使用vbr-new給大家,比較方便好用。
--------------------------------------------------------------------------------

  mp3可不是什麼憑空製造出來的詞彙,而是一個技術術語的縮寫,即MPEG-1 AudioLayer-3的縮寫拼法,這是什麼意思呢?我來給大家解讀一下:MPEG-1 AudioLayer-3就是mpeg1類型國際標準技術協議中的音頻部分第三層協議,它說明的是一種音頻格式,是不是看起來很複雜?不要緊我們一點一點來說,首先mpeg——這個詞是Moving Picture Exp-erts Group的縮寫, 就是動態影像壓縮處理小組的意思。這個小組相當厲害,專門研究開發動態靜態視頻(包含音頻)方面的幾乎所有國際技術標準,我們看的從電視到電影,從vcd到dvd都應用他們的研究成果,mp3正是他們的mpeg1協議中的一部分,音頻部分在第三層,所以稱作mp3,據我所知mp3的誕生是mpeg小組的工作人員在非有意識的情況下發現的,它是作為一種cd音軌的抓取方式被產生出來的,在當時的試驗中最多算個附屬產物,可就是這個小小的附屬產物卻演化出了我們現今最最流行的音樂格式,那麼是為什麼呢?我們一起去看個究竟。

  首先是體積小:根據不同的壓縮比率可以得到大小不等的文件尺寸,但是比起原始的wav格式,體積那是要小了太多了,文件體積小,存儲空間就小,用來播放的硬件設備體積、造價等方面就會顯著下降,所以就有了良好的市場,在加上到處都有mp3文件的下載,比起cd播放器用戶還要不停購買軟件來,自然又是節約了一筆。再次:隨心所欲,小體積的播放器可以輕鬆的隨身攜帶,我愛怎麼用就怎麼用,而且因為播放器電路部分相對功耗低,所以單電池工作時間也長,省去了很多更換電池的煩惱,還有就是用家可以隨意的把自己喜歡的曲子放在一起聽,而不必受制於音像出版商的成型軟件,自由度非常大,這讓我想起了周傑倫給動感地帶作廣告的一句廣告語「我的地盤,我作主!」真cool~~~!!
說了這麼一堆相關的話一定讓大家等急了,下來讓我們深入主體,為大家徹底的剖析一下mp3的方方面面。

  一、 基礎知識:

  數字壓縮音頻與mp3技術:

  要說mp3我得先說一下數字壓縮音頻,恩,數字壓縮音頻顧名思義就是壓縮的數字音頻了,可是什麼是數字音頻?什麼是壓縮呢???下面是一些較專業的解釋,有興趣的朋友可要仔細看囉~!

  在計算機的數字世界中,聲音都是以數字編碼的方式儲存的,不同於傳統生活中的模擬音頻,因為計算機只能記錄0和1的數字,所以必須對模擬音頻進行量化取樣,根據奈魁斯特(NYQUIST)采樣定理,用兩倍於一個正弦波的頻繁率進行采樣就能完全真實地還原該波形,因此一個數碼錄音波的采樣頻率直接關係到它的最高還原頻率指標。例如,用44.1KHZ的采樣頻率進行采樣,則可還原最高為22.05KHZ的頻率-----這個值略高於人耳的聽覺極限,所以a/d轉換通常都使用44.1KHZ 以上的采樣頻率,但是聲波資料的文件大小因取樣頻率(一般以Hz為單位)和取樣的比率(一般以bits為單位)而有所不同,取樣頻率越高所需要的儲存空間也越大,取樣相同的比率越高所需要的儲存空間也越大,這就造成了在實際操作中的困難,從而壓縮技術的出現就變成了必然。

  數字壓縮就是指對已經進行完成采樣的原始數字音頻文件進行「減肥」,利用一些有效的算法和方式,將文件中的冗余信息取出,這樣可以減少體積,方便使用,具體的操作過成太過複雜和專業(連我這個學計算數學的都看著費勁),所以就不一一給大家解釋了,只在這裡簡要說明一下壓縮中要牽扯的MP3壓縮編碼技術:MP3壓縮編碼使用了5種重要的技術:最小聽覺門限判定(Minimal Audition Threshold)、掩蔽效應(Masking Effect)、位儲存槽(Reservoir of Bytes)、聯合立體聲(JointStereo)和霍夫曼編碼(Huffman Code)。依靠這些技術科計算機的計算,我們就能夠大大的降低數字音頻的文件尺寸,將其壓縮後產生的新的音頻格式就是我們熟悉的mp3。

  二、 壓縮原理:

  不論什麼技術它都要有自己的道理,音頻技術更是如此,因為它直接關係到我們的聽覺,壓縮過的mp3為什麼聽起來還是很接近cd的聲音呢??這裡面和人的生理構造有莫大的關係。實驗表明,人類能聽到的聲音頻率範圍(音頻)是20Hz~20kHz,但人耳對整個音頻頻段聲音的反應不是平直的,2~5kHz是人耳最靈敏的頻段。依其特性將整個音頻頻段分成多個臨界頻帶,因為人類聽覺系統是依據頻率來分辨聲音能量的,任何頻率的細小聲音都會因掩蔽效應而被臨界頻帶內音量較高的聲音所覆蓋。MP3對其不作量化處理,從而去掉那些人類聽覺系統所無法察覺的聲音,達到壓縮的目的。可見,MP3是一種有損的音頻壓縮編碼。所以說無論多麼高碼率的mp3它都是有損壓縮,聲音的品質是比cd下降了的,但是下降的多少才能被接受,這就因人而異了。

  三、 壓縮後的音質:

  這是大家最最關心的話題吧,壓縮後的聲音能達到一個什麼樣的標準呢?這裡先給大家上個圖表,來看看mpeg的標準中的參考值。

  可以看出,由於壓縮比率不同,得到的聲音文件的質量也在逐步提高,128kbps基本就達到了cd音質,是這樣的麼???我得回答是:當然不是,這只是一個官方的參考數據表格,在實際的使用中,128這樣的碼率是根本不能表現出cd的聲音質量的,雖然mp3的壓縮過程中使用的軟件算法不同會有些差異,但是壓縮比率是限制其表現的最根本之處。
--------------------------------------------------------------------------------

市面上不僅僅是只有lame這一種壓縮軟件的,也不是只有mp3一種音頻壓縮格式的,其他公司也先後開發過不少好用的壓縮格式,只是因為各種各樣的原因沒有像mp3這樣推廣開來,但是作為壓縮音頻家族的一員,我在這裡也給大家介紹一下,可以讓大家多瞭解一些東西。

  1、 APE:

  APE格式:Monkey""s Audio(www.monkeysaudio.com),簡單的說ape是一種音頻的無損壓縮格式,大小只有wav文件的一半,但是音質沒有絲毫降低。能夠在最大程度上還原CD的音質,當然這也取決於抓軌的質量 。如果抓軌的質量好,ape的音質就會和CD差不多這是mp3等有損壓縮無法達到的,當然無損的代價就是體積的增大,1CD從200mb到400不等所以如果有足夠的帶寬的保證,ape給網友交流CD帶來了更多的方便,解決了許多古典音樂愛好者傳送高音質CD的需求。一張80分鐘的音樂CD大小大約700M,這麼大尺寸的傳輸,顯然是非常不方便的,這時用Monkey""s Audio—能把WAV文件壓縮成一半大小(甚至更小)的APE文檔,並且在理想狀態下,當你把APE解壓成WAV,音質沒有絲毫損失。

  優點:壓縮率高;音質無損;裝載插件後,可以用Winamp直接播放,音質比任何參數的Mp3或Mp3 Pro更好。

  缺點:壓縮及解壓時間過長。

  2、 MP3 Pro

  為了減低失真程度,MP3 Pro這種新MP3格式出現了。它將整個音頻頻段分離成中低頻和高頻兩個信道,由傳統MP3編碼器負責中低頻部分,而另一個採用SBR技術的(Spectral Band Replication/頻段複製)的譯碼器則負責高頻部分,最後兩者在MP3 Pro播放軟件中同時播放,從而得到顯著超過相同Bitrate的MP3之音質。不但高頻細節豐富,顫抖的現象亦已不易覺察,與原始WAV文件非常接近。

  MP3 Pro採用的SBR技術,並非直接將音樂中的高頻分離出來並編碼那麼簡單,而是根據對原來編碼器所傳輸的低頻訊號進行分析,從而重新構建出高頻訊號。

  3、Real Audio

  Real Audio,擴展名RA:這種格式真可謂是網絡的靈魂,強大的壓縮量和極小的失真使其在眾多格式中脫穎而出。和MP3相同,它也是為了解決網絡傳輸帶寬資源而設計的,因此主要目標是壓縮比和容錯性,其次才是音質。所以我們一般在網上遇到的新音樂試聽都是使用這中格式的。

  3、 WMA

  WMA就是Windows Media Audio編碼後的文件格式,由微軟開發,WMA針對的不是單機市場,是網絡!競爭對手就是網絡媒體市場中著名的Real Networks。微軟聲稱,在只有64kbps的碼率情況下,WMA可以達到接近CD的音質。和以往的編碼不同,WMA支持防複製功能,她支持通過Windows Media Rights Manager 加入保護,可以限制播放時間和播放次數甚至於播放的機器等等。WMA支持流技術,即一邊讀一邊播放,因此WMA可以很輕鬆的實現在線廣播,由於是微軟的傑作,因此,微軟在Windows中加入了對WMA的支持,WMA有著優秀的技術特徵,在微軟的大力推廣下,這種格式被越來越多的人所接受。比起ra來說,版權恐怕是所用用戶最討厭它的地方了。

  4、 ACC:

  AAC(高級音頻編碼技術,Advanced Audio Coding)是杜比實驗室為音樂社區提供的技術。AAC號稱「最大能容納48通道的音軌,采樣率達96 KHz,並且在320Kbps的數據速率下能為5.1聲道音樂節目提供相當於ITU-R廣播的品質」。和MP3比起來,它的音質比較好,也能夠節省大約30%的儲存空間與帶寬。它是遵循MPEG-2的規格所開發的技術。松下的mp3產品都採用了這種編碼方式,當然也兼容mp3格式,我自己使用時發現aac是非常好用的音頻格式,128kbps的aac足以和224kbps的mp3抗衡,空間卻小了差不多一半,但是在空間上和結構上aac和mp3編碼出來後的風格不太一樣,喜歡與否屬於仁者見仁智者見智的事情。

  5、 ATRAC 3/ATRAC 3 plus:

  ATRAC3(AdaptiveTransformAcousticCoding3)由日本索尼公司開發,是MD所採用的ATRAC的升級版,其壓縮率(約為ATRAC的2倍)和音質均與MP3相當。壓縮原理包括同時掩蔽、時效掩蔽和等響度曲線等,與MP3大致相同。ATRAC3的版權保護功能採用的是OpenMG。目前,對應ATRAC3的便攜式播放機主要是索尼公司自己的產品。不過,該公司已於2000年2月與富士通、日立、NEC、Rohm、三洋和TI等半導體製造商簽署了製造並銷售ATRAC3用LSI的專利許可協議。在mdlp壓縮中錄製cd和mp3相比,ATRAC3還是有一定的聲音優勢的,但是版權問題使得使用不是很方便,ATRAC 3 plus由於算法先進,在音質上得到了更一步的提高,但是只在sony的產品上有比較廣泛的應用,這個讓人比較鬱悶。

  6、 VQF:

  所謂VQF,是指TwinVQ(Transform-domain Weighted INterleave Vector Quantization),它是日本NTT(Nippon Telegraph and Telephone)集團屬下的NTT Human Interface Laboratories開發的一種音頻壓縮技術。該技術受到著名的YAMAHA公司的支持。VQF是其文件的擴展名。它和MP3的實現方法相似,都是通過採用有失真的算法來將聲音進行壓縮,不過它與MP3的壓縮技術相比卻有著本質上的不同:VQF的目的是對音樂而不是聲音進行壓縮,因此,VQF所採用的是一種稱為「矢量化編碼(Vector Quantization)」的壓縮技術。該技術先將音頻數據矢量化,然後對音頻波形中相類似的波形部分統一與平滑化,並強化突出人耳敏感的部分,最後對處理後的矢量數據標量化再進行壓縮而成。我自己使用中感覺在低碼率情況下,還是vqf好用很多,比同等音質的mp3體積小30%左右,但是高比特率就不太好了,所以也少有人使用它。






arrow
arrow
    全站熱搜

    nathanlee 發表在 痞客邦 留言(0) 人氣()