數字音頻

在數字音頻錄音機上顯示音頻級別(變焦H4N)

數字音頻是代表聲音記錄或轉換為數字形式。在數字音頻中聲波音頻信號通常編碼為數值樣品以連續的序列。例如,在CD音頻,採集樣品44,100每秒時間,每個都有16位樣品深度。數字音頻也是整個技術的名稱聲音錄音和繁殖使用以數字形式編碼的音頻信號。在1970年代和1980年代的數字音頻技術取得了重大進步之後,它逐漸替換模擬音頻技術在許多領域音頻工程創紀錄的生產電信在1990年代和2000年代

在數字音頻系統中模擬電信號代表聲音是用模數轉換器(ADC)進入數字信號,通常使用脈衝代碼調製(PCM)。然後可以使用該數字信號記錄,編輯,修改和復制電腦,音頻播放機和其他數字工具。當聲音工程師希望收聽耳機或揚聲器上的錄音(或消費者希望收聽數字聲音文件時)時,數字到分析轉換器(DAC)執行反向過程,將數字信號轉換回模擬信號,然後通過音頻功率放大器最終喇叭.

數字音頻系統可能包括壓縮貯存加工, 和傳播成分。轉換為數字格式,可以方便地操作,存儲,傳輸和檢索音頻信號。與模擬音頻不同,其中製作錄音的副本導致發電損失信號質量的退化,數字音頻允許製作無限數量的副本,而不會降解信號質量。

概述

紅色的聲波以數字方式表示為藍色(之後採樣和4位量化)。

數字音頻技術用於錄製,操縱,批量生產和聲音分佈,包括錄音歌曲,樂器作品,播客,聲音效果和其他聲音。現代的在線音樂發行取決於數字記錄和數據壓縮。音樂作為數據文件而不是物理對象的可用性大大降低了分銷成本,並使共享副本更容易。[1]在數字音頻之前,音樂行業通過出售物理副本的形式來分發和出售音樂記錄盒式磁帶。使用數字審計和在線分銷系統,例如iTunes,公司將數字聲音文件出售給消費者通過Internet收到的消費者。流行的流媒體服務,例如SpotifyYouTube,提供對數字文件的臨時訪問,現在是音樂消費的最常見形式[2]

模擬音頻系統通過使用A將聲音的物理波形轉換為這些波形的電氣表示傳感器, 比如一個麥克風。然後將聲音存儲在模擬介質上,例如磁帶,或通過模擬介質(例如電話線或者收音機。該過程被逆轉以繁殖:電氣音頻信號為放大然後通過A轉換回物理波形喇叭。模擬音頻在整個存儲,轉換,重複和放大過程中保留其基本波樣特性。

模擬音頻信號由於電子電路和相關設備的先天特性,因此容易受到噪聲和失真的影響。障礙數字系統除非它們如此之大,從而導致符號被誤解為另一個符號或乾擾符號序列,否則不要導致錯誤。因此,通常可以擁有一個完全沒有錯誤的數字音頻系統,其中在轉換為數字格式和轉換回模擬之間沒有噪聲或失真。

數字音頻信號可以編碼以糾正信號的存儲或傳輸中可能發生的任何錯誤。這種技術,稱為頻道編碼,對於播放或記錄的數字系統以保持位準確性至關重要。八到四個調製是用於音頻的通道代碼壓縮碟片(光盤)。

轉換過程

Analog to Digital to Analog conversion
聲音的生命週期通過ADC,數字處理,DAC,最後是聲音。

如果音頻信號是模擬的,則數字音頻系統以ADC開頭,該ADC將模擬信號轉換為數字信號。[注1]ADC在指定的採樣率並以已知的位分辨率轉換。CD音頻,例如,採樣率為44.1千赫(每秒44,100個樣本),有16位解析度每個立體聲渠道。尚未發生的模擬信號樂隊有限必須通過抗氧化過濾器轉換之前,以防止混疊失真這是由音頻信號引起的,頻率高於Nyquist頻率(一半的採樣率)。

數字音頻信號可以存儲或傳輸。數字音頻可以存儲在CD上數字音頻播放器, 一個硬盤, 一個USB閃存盤,或任何其他數字數據存儲設備。數字信號可能會通過數字信號處理,可能是過濾或有效果應用。樣品速率轉換包含提升採樣下採樣可用於更改在處理前用不同的採樣率編碼為常見抽樣率的信號。音頻數據壓縮技術,例如mp3高級音頻編碼Ogg Vorbis, 或者Flac,通常用來減少文件大小。數字音頻可以延續數字音頻接口AES3或者麥迪。數字音頻可以使用網絡使用以太網上的音頻IP上的音頻或其他流媒體標準和系統。

對於播放,必須將數字音頻轉換回帶有DAC的模擬信號。根據Nyquist -Shannon採樣定理在一些實用和理論限制的情況下,可以從數字信號准確地重建原始模擬信號的帶限製版本。

歷史

編碼

脈衝代碼調製(PCM)是由英國科學家發明的亞歷克·里夫斯(Alec Reeves)1937年。[3]1950年C. Chapin Cutler貝爾實驗室提出專利差分脈衝代碼調製(DPCM),[4]一個數據壓縮算法。自適應DPCM(ADPCM)由P. Cummiskey介紹,尼基爾·賈恩特(Nikil S. Jayant)詹姆斯·弗拉納根(James L. Flanagan)1973年在貝爾實驗室。[5][6]

感知編碼首先用於語音編碼壓縮,帶線性預測編碼(LPC)。[7]LPC的初始概念可以追溯到Fumitada Itakura(名古屋大學)和Shuzo Saito(日本電報和電話)1966年。[8]在1970年代,Bishnu S. AtalManfred R. Schroeder在貝爾實驗室開發了一種名為LPC的形式自適應預測編碼(APC),一種利用人耳的掩蔽特性的感知編碼算法,隨後在1980年代初期與代碼激發的線性預測(CELP)算法。[7]

離散的餘弦變換(DCT)編碼,一個有損壓縮最初提出的方法納西爾·艾哈邁德(Nasir Ahmed)1972年[9][10]提供了修改的離散餘弦變換(MDCT),由J. P. Princen,A。W。Johnson和A. B. Bradley於1987年開發。[11]MDCT是大多數的基礎音頻編碼標準, 如杜比數碼(AC-3),[12]mp3(mpeg第三層),[13][7]高級音頻編碼(AAC),,Windows媒體音頻(WMA),以及Vorbis(OGG)。[12]

記錄

PCM用於電信申請在其首次用於商業廣播和錄製之前。商業數字錄音在日本開創了NHK日本哥倫比亞和他們Denon品牌,1960年代。第一批商業數字錄音於1971年發行。[14]

英國廣播公司1960年代,還開始嘗試數字音頻。到1970年代初期,它已經開發了2通道錄音機,並於1972年部署了一個數字音頻傳輸系統,該系統將其廣播中心與遠程發射器聯繫起來。[14]

第一個16位PCM錄製美國是由托馬斯·斯托克姆聖達菲歌劇1976年,聲音流錄音機。改進的Soundstream系統版本用於通過TELARC1978年3m數字的MultiTrack Recorder當時的開發是基於BBC技術。在這台機器上錄製的第一張全數字專輯是Ry Cooder'bop直到你掉下來1979年。英國唱片公司decca1978年開始開發自己的2軌數字錄音機,並於1979年發行了第一張歐洲數字唱片。[14]

由索尼/研究員製作的流行的專業數字多軌錄音機(短跑)和三菱(prodigi)在1980年代初期,主要唱片公司獲得了數字錄音的認可。這些格式的機器也有自己內置的運輸捲軸到卷磁帶中的1/4“,1/2”或1英寸的寬度,使用多軌固定膠帶頭將音頻數據記錄到磁帶上。PCM適配器允許在常規NTC或PAL上進行立體數字音頻錄製錄像機.

1982年介紹CD與消費者普及的數字音頻。[14]

adat在1990年代初就可以使用,該錄音帶允許八軌44.1或48 kHz錄製在S-VHS盒式錄音帶上,並且DTR使用HI8磁帶執行了類似的功能。

諸如Protigi和Dash之類的格式被稱為SDAT(stationary頭digital一個udiotAPE)格式,與基於PCM適應器的系統和DAT等格式相反,該格式稱為rdat(r凝結頭digital一個udiotAPE)格式,由於其螺旋掃描記錄過程。

dat盒式紙盒,prodigi和儀表板機器還容納了強制性的44.1 kHz採樣率,但在所有機器上也容納了48 kHz,最終還具有96 kHz的採樣率。他們克服了使典型的模擬記錄器無法滿足帶寬(頻率範圍)數字記錄的問題的問題軌道。

與模擬系統不同,現代數字音頻工作站音頻接口與計算機一次可以有效運行的Manny不同採樣率一樣多的頻道。這使得多核記錄對於大型項目而言,混合更加容易,否則模擬齒輪將很難。

電話

PCM的快速發展和廣泛採用數字電話啟用了金屬 - 氧化物 - 血症導體(MOS)切換電容器(SC)在1970年代初開發的電路技術。[15]這導致了1970年代後期的PCM編解碼器芯片的開發。[15][16]矽柵CMOS(互補MOS)PCM編解碼器芯片,由大衛·霍奇斯(David A. Hodges)和W.C. 1980年黑色[15]此後,一直是數字電話的行業標準。[15][16]到1990年代,電信網絡如那個公共交換電話網絡(PSTN)主要是數字化vlsi(非常大規模集成)CMOS PCM編解碼器,廣泛使用電子開關係統為了電話交換,用戶端調製解調器以及一系列數字傳輸諸如集成服務數字網絡(ISDN),無繩電話手機.[16]

技術

索尼數字音頻磁帶錄音機PCM-7030

數字音頻用於廣播音頻。標準技術包括數字音頻廣播(輕拍),數字廣播Mondiale(DRM),高清廣播頻段內通道(IBOC)。

錄製應用中的數字音頻存儲在音頻特定技術中,包括CD,數字音頻磁帶(dat),數字緊湊型盒子(DCC)和小型盤。數字音頻可以存儲在標準中音頻文件格式並存儲在一個硬盤記錄器藍光或者DVD-Audio。文件可能會在智能手機,計算機或MP3播放器。數字音頻分辨率以樣品深度。大多數數字音頻格式使用16位,24位和32位的樣品深度。數字音頻分辨率以樣品深度。大多數數字音頻格式使用16位,24位和32位的樣品深度。

接口

FOCUSRITE USB接口

數字特定特定的接口包括:

幾個接口經過設計,用於將數字視頻和音頻攜帶在一起,包括HDMIDisplayPort。一些接口提供Midi支持和xlrtr模擬端口。

為了個人計算機USBIEEE 1394有提供實時數字音頻的規定。 USB界面由於其尺寸較小和易用性,在獨立音頻工程師和生產商中越來越流行。在專業的建築或安裝應用中,許多以太網上的音頻存在協議和接口。在廣播,更一般的IP上的音頻網絡技術受到青睞。在電話中IP的語音用作語音通信的數字音頻的網絡接口。

也可以看看

筆記

  1. ^一些音頻信號,例如由數字合成完全源於數字域,在這種情況下,不會發生類似於數字轉換。

參考

  1. ^詹森(Jansens),耶爾(Jelle); Stijn Vandale;湯姆·范德·貝肯(Tom Vander Beken)(2009)。 “在數字時代的音樂行業?倖存的音樂盜版”。歐洲犯罪,刑法和刑事司法雜誌.77(96):77–96。doi10.1163/157181709x429105.HDL1854/lu-608677.
  2. ^Liikkanen,Lassi A。; Åman,皮爾卡(2016年5月)。“洗牌服務:與數字音樂互動的當前趨勢”.與計算機交互.28(3):352–371。doi10.1093/iwc/iwv004.ISSN0953-5438.
  3. ^天才無法識別,BBC,2011-03-27,檢索2011-03-30
  4. ^美國專利2605361,C。Chapin Cutler,“通信信號的差異量化”,於1952-07-29發布
  5. ^P. Cummiskey,Nikil S. Jayant和J. L. Flanagan,“語音差分編碼中的自適應量化”,貝爾系統。技術。 J.,卷。 52,第1105-1118頁,1973年9月
  6. ^坎米斯基,p。尼基爾·賈恩特(Jayant); Flanagan,J。L.(1973)。 “語音差異PCM編碼中的自適應量化”。貝爾系統技術雜誌.52(7):1105–1118。doi10.1002/j.1538-7305.1973.tb02007.x.ISSN0005-8580.
  7. ^一個bcSchroeder,Manfred R.(2014)。“貝爾實驗室”.聲學,信息和傳播:紀念紀念卷,以紀念Manfred R. Schroeder。施普林格。 p。 388。ISBN9783319056609.
  8. ^Gray,Robert M.(2010)。“數據包網絡上的實時數字演講歷史:線性預測編碼和互聯網協議的第二部分”(PDF).成立。趨勢信號過程.3(4):203–303。doi10.1561/2000000036.ISSN1932-8346.
  9. ^艾哈邁德,納西爾(1991年1月)。“我如何提出離散的餘弦變換”.數字信號處理.1(1):4-5。doi10.1016/1051-2004(91)90086-Z.
  10. ^納西爾·艾哈邁德(Nasir Ahmed); T. Natarajan; Kamisetty Ramamohan Rao(1974年1月)。“離散的餘弦變換”(PDF).計算機上的IEEE交易.C-23(1):90–93。doi10.1109/T-C.1974.223784.
  11. ^J. P. Princen,A。W。Johnson Und A. B. Bradley:使用過濾器庫設計基於時域別名取消的子帶/變換編碼,IEEE PROC。 intl。聲學,語音和信號處理會議(ICASSP),2161–2164,1987。
  12. ^一個bLuo,FA-LONG(2008)。移動多媒體廣播標準:技術和實踐.施普林格科學與商業媒體。 p。 590。ISBN9780387782638.
  13. ^約翰·蓋克特(Guckert)(2012年春季)。“在MP3音頻壓縮中使用FFT和MDCT”(PDF).猶他大學。檢索7月14日2019.
  14. ^一個bcd好,托馬斯(2008)。 Barry R. Ashpole(編輯)。“商業數字記錄的曙光”(PDF).ARSC期刊。檢索2010-05-02.
  15. ^一個bcdAllstot,David J.(2016)。“切換電容器過濾器”(PDF)。在佛朗哥的馬洛貝蒂;戴維斯(Anthony C.)(編輯)。電路和系統的簡短歷史:從綠色,移動,普遍網絡到大數據計算.IEEE電路和系統社會。 pp。105–110。ISBN9788793609860.
  16. ^一個bc弗洛伊德,邁克爾·D。希爾曼(Hillman),加思(Garth D.)(2018年10月8日)[1st Pub。 2000]。“脈衝代碼調製編解碼器”.通信手冊(第二版)。CRC出版社。 pp。26–1,26–2,26–3。ISBN9781420041163.

進一步閱讀

  • Borwick,John,編輯,1994年:錄音練習(牛津:牛津大學出版社)
  • Bosi,Marina和Goldberg,Richard E.,2003年:數字音頻編碼和標準簡介(施普林格)
  • Ifeachor,Emmanuel C.和Jervis,Barrie W.,2002年:數字信號處理:一種實用方法(英格蘭哈洛:皮爾遜教育有限公司)
  • Rabiner,Lawrence R.和Gold,Bernard,1975年:數字信號處理的理論和應用(新澤西州恩格爾伍德懸崖:Prentice-Hall,Inc。)
  • 沃特金森,約翰,1994年:數字音頻的藝術(牛津:焦點出版社)

外部鏈接