發(fā)布時(shí)間:2022-11-25 15:21:37
序論:好文章的創(chuàng)作是一個(gè)不斷探索和完善的過(guò)程,我們?yōu)槟扑]一篇數(shù)字視頻壓縮技術(shù)研究范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來(lái)更深刻的閱讀感受。
0引言
現(xiàn)如今,視頻技術(shù)在我國(guó)應(yīng)用的范圍非常廣泛。無(wú)論是教育、醫(yī)療還是市政等方面都有視頻技術(shù)應(yīng)用的身影。 但是以上所有視頻技術(shù)的應(yīng)用都需要通過(guò)數(shù)字視頻壓縮技術(shù)來(lái)實(shí)現(xiàn)。 視頻本身傳輸所需的數(shù)據(jù)量較大,倘若不利用數(shù)字視頻壓縮技術(shù),那么就無(wú)法切實(shí)地傳播相關(guān)數(shù)據(jù)。
1相關(guān)概念界定
1. 1數(shù)字視頻以及應(yīng)用
隨著我國(guó)計(jì)算機(jī)技術(shù)以及信息技術(shù)的高速發(fā)展,數(shù)字化技術(shù)與各個(gè)領(lǐng)域的融合為人們的生活提供了便利。 以多媒體為例,無(wú)論是圖像還是文字,通過(guò)數(shù)字化處理能夠更好地便于人們進(jìn)行存儲(chǔ)、共享以及利用。數(shù)字視頻有以下特點(diǎn):(1)數(shù)字視頻方便存儲(chǔ)。 管理人員只需在計(jì)算機(jī)平臺(tái)上輸入關(guān)鍵詞就可按照內(nèi)容搜索出數(shù)字化視頻。 (2) 數(shù)字化視頻具有良好的交互性。交互性是指?jìng)鹘y(tǒng)的電視只能支持使用者快速搜索或改變播放速度。 而數(shù)字化視頻能夠調(diào)整清晰度,人們可以選擇多個(gè)視角觀看[1]。
1. 2數(shù)字視頻壓縮的必要性
視頻壓縮是指技術(shù)人員結(jié)合實(shí)際需求,通過(guò)多樣化的壓縮技術(shù)去除數(shù)字視頻中的冗余信息,從而使得視頻資源能夠快速、便捷地進(jìn)行傳輸,方便人們觀看。數(shù)字視頻壓縮前,每一個(gè)視頻都具有巨大的數(shù)據(jù)量。倘若這一階段的視頻需要進(jìn)行存儲(chǔ)和傳播,通常需要較長(zhǎng)的時(shí)間,并且還會(huì)為系統(tǒng)帶來(lái)一定的負(fù)擔(dān)。 在實(shí)際傳輸過(guò)程中,要想保障較高的數(shù)據(jù)傳輸率,就不得不通過(guò)降低視頻的質(zhì)量來(lái)實(shí)現(xiàn),例如顏色、采樣格式或空間分辨率等。 因此,數(shù)字視頻壓縮對(duì)于人們?nèi)粘I钜约跋嚓P(guān)工作具有重要意義[2]。從數(shù)字視頻冗余信息結(jié)構(gòu)角度來(lái)看,數(shù)字視頻冗余信息主要分為 4 種:首先是時(shí)間上的冗余信息,其次是空間上的冗余信息,再次是統(tǒng)計(jì)上的冗余信息,最后是感知上的冗余信息。 以時(shí)間上的冗余信息為例,數(shù)字視頻中相鄰的幀之間具有很強(qiáng)的關(guān)聯(lián)性,而這種關(guān)聯(lián)性就是時(shí)間上的冗余。 信息空間上的冗余信息是指在數(shù)字視頻的同一幀中,相鄰像素之間具有很強(qiáng)的關(guān)聯(lián)性,這種關(guān)聯(lián)性就是空間上的冗余信息。 統(tǒng)計(jì)上的冗余信息是指數(shù)字視頻冗余信息,將要編碼的符號(hào)分布概率不均勻。 而感知上的冗余信息是指數(shù)字視頻冗余 信 息 無(wú) 法 被 正 在 觀 看 視 頻 的 人 們 用 肉 眼 所 察覺(jué)到[3]。視頻經(jīng)過(guò)壓縮處理之后,其傳輸存儲(chǔ)速率會(huì)遠(yuǎn)遠(yuǎn)比視頻壓縮之前便捷許多。 在多數(shù)情況下,經(jīng)過(guò)壓縮處理后的圖像質(zhì)量并不會(huì)降低太多,通常肉眼無(wú)法感受到視頻質(zhì)量的降低。 因?yàn)樵趯?shí)際生活中,人們的眼睛只能辨別大概將近 1 024 種顏色,而世界上有數(shù)十億種顏色,人們?cè)谟^影過(guò)程中,即便一種顏色與另一種顏色相接近,而這兩種顏色是獨(dú)立的顏色,技術(shù)人員沒(méi)必要將每一種顏色都保留下來(lái)。 人們?cè)谟^看視頻過(guò)程中,肉眼通常只會(huì)觀察到一部分東西,而另一部分東西對(duì)于人們來(lái)說(shuō)是可有可無(wú)的,所以壓縮視頻的過(guò)程就是將那一部分東西去掉[4]。如何能夠分辨數(shù)字視頻壓縮技術(shù)的好壞,主要可以從算法的復(fù)雜度以及壓縮后視頻圖像質(zhì)量角度來(lái)看。 以運(yùn)算復(fù)雜度為例,高性能的編碼器能夠保障視頻壓縮過(guò)程中運(yùn)算復(fù)雜度更低,也使得整個(gè)視頻壓縮效率越來(lái)越快。 以壓縮品質(zhì)角度來(lái)看,數(shù)字視頻壓縮后,技術(shù)人員必須考慮壓縮后的視頻與壓縮前視頻比特率和失真程度之間的差距。 一般來(lái)講,壓縮后的比特率和失真程度要比壓縮前的比特率與失真程度之間的差距越小越好,這樣才能夠保障數(shù)字視頻壓縮后依舊能以高質(zhì)量的方式呈現(xiàn)給技術(shù)人員。 從實(shí)際角度來(lái)看,編碼器運(yùn)算復(fù)雜度與壓縮品質(zhì)之間也存在一定的聯(lián)系。 例如,技術(shù)人員如若將視頻信息的應(yīng)用方式以存儲(chǔ)為主,那么就需要選擇壓縮品質(zhì)較高的編碼方案,如果是該視頻信息主要用于視頻通話等領(lǐng)域,那么就需要選擇運(yùn)算復(fù)雜度較低的壓縮編碼方案。 人們是用肉眼觀察視頻的,因此數(shù)字視頻壓縮處理后,它的失真標(biāo)準(zhǔn)應(yīng)由人類的視覺(jué)感知來(lái)衡量。 例如結(jié)構(gòu)相似性指標(biāo)等,人們可以利用這些指標(biāo)來(lái)觀察數(shù)字視頻壓縮后的影像品質(zhì)是如何的[5]。
1. 3視頻壓縮編碼原理
數(shù)字電視是我國(guó)電視技術(shù)發(fā)展的新里程碑,數(shù)字電視和移動(dòng)通信網(wǎng)絡(luò)以及下一代因特網(wǎng)是我國(guó)未來(lái)發(fā)展的主要方向之一。 數(shù)字電視就是將傳統(tǒng)的模擬電視信號(hào)轉(zhuǎn)變?yōu)槎M(jìn)制數(shù)字信號(hào),再通過(guò)相關(guān)傳輸、存儲(chǔ)等方式讓計(jì)算機(jī)技術(shù)進(jìn)行處理。 相比于模擬視頻信號(hào),數(shù)字信號(hào)無(wú)論是性能還是質(zhì)量都要比模擬視頻信號(hào)具有一定的優(yōu)勢(shì)。 數(shù)字視頻信號(hào)的傳輸速率要高于模擬視頻信號(hào)。 從實(shí)際傳輸角度來(lái)看,數(shù)字電視需要在信道中逐幀地傳輸數(shù)字視頻,但是這一過(guò)程需要的碼率非常巨大。 因此,必須通過(guò)視頻壓縮編碼技術(shù)才能夠提高傳輸效果。 視頻壓縮編碼技術(shù)的原理有兩個(gè),首先是通過(guò)相關(guān)技術(shù)去掉信息編碼的冗余度,其次是結(jié)合人眼的視覺(jué)特性實(shí)現(xiàn)圖像壓縮這一功能。 結(jié)合當(dāng)前視頻編碼不同標(biāo)準(zhǔn)的數(shù)據(jù)來(lái)看。 在不同的應(yīng)用下,視頻可以編碼成幾十千位和幾十兆位。 為了更好地實(shí)現(xiàn)網(wǎng)絡(luò)傳輸,數(shù)字視頻壓縮技術(shù)能夠符合各種視頻的標(biāo)準(zhǔn),這樣人們能夠更加便捷地獲取或共享各類視頻數(shù)據(jù)。 當(dāng)今社會(huì),人們之所以能夠用 4G 或 5G 網(wǎng)絡(luò)通過(guò)手機(jī)觀看各種視頻,或利用電視機(jī)上網(wǎng)觀看、瀏覽視頻,是因?yàn)閿?shù)字視頻壓縮技術(shù)能夠?qū)崿F(xiàn)各個(gè)類型的視頻在各種設(shè)備之間的傳輸。 從實(shí)際角度來(lái)看,不光是視頻,文本、圖片、聲音等都是視頻內(nèi)在的元素,他們的壓縮處理方式不相同。 視頻是最難進(jìn)行壓縮處理的,如何能夠高效壓縮并快速處理,是數(shù)字視頻壓縮領(lǐng)域重要的發(fā)展方向[6]。
1. 4改進(jìn)視頻處理算法的重要性
MPEG-2 標(biāo)準(zhǔn)的提出使得視頻存儲(chǔ)方式發(fā)生了變革,通過(guò)這種標(biāo)準(zhǔn)能夠?qū)崿F(xiàn)長(zhǎng)視頻的存儲(chǔ),大多數(shù)節(jié)目都采取這種編碼方式來(lái)交換。 從實(shí)際情況來(lái)看,要想科學(xué)合理地壓縮視頻,首先需要考慮以下幾個(gè)問(wèn)題:一是運(yùn)算量的問(wèn)題,二是視頻處理后視頻質(zhì)量的問(wèn)題,三是處理效果的問(wèn)題,四是存儲(chǔ)器容量的問(wèn)題。 以運(yùn)算量問(wèn)題為例,傳統(tǒng)的處理方式都是先將壓縮視頻進(jìn)行解碼,隨后根據(jù)像素的方法進(jìn)行處理,最后將圖像通過(guò)重新編碼的方式壓縮成視頻。這一方式雖然較為正規(guī),但運(yùn)算量較大,因?yàn)檫@一過(guò)程需要編碼與解碼。 編碼與解碼在處理視頻過(guò)程中通常需要消耗大量的計(jì)算量。 傳統(tǒng)的處理方式是先將壓縮視頻進(jìn)行解碼,隨后根據(jù)像素的方法進(jìn)行處理,將圖像通過(guò)重新編碼的方式壓縮成視頻。 處理效果是當(dāng)今數(shù)字視頻壓縮過(guò)程需要重點(diǎn)考慮的問(wèn)題。 雖然我國(guó)現(xiàn)在壓縮視頻使用較廣,但是視頻壓縮后視頻本身應(yīng)保障不會(huì)發(fā)生較為明顯的變化。 這一過(guò)程依舊會(huì)導(dǎo)致視頻壓縮過(guò)程中需要處理的數(shù)據(jù)量過(guò)大,而技術(shù)人員利用壓縮域的方法能夠顯著減輕自己的重量。利用視頻壓縮技術(shù)后,較大容量的視頻可在普通的空間中進(jìn)行存儲(chǔ),但是倘若該視頻需要進(jìn)行恢復(fù),那么當(dāng)前存儲(chǔ)空間就不具備相關(guān)約束需求。 基于此,工作人員需要尋找既能夠滿足復(fù)雜數(shù)字處理技巧任務(wù),又能夠提升視頻質(zhì)量、存儲(chǔ)容量等數(shù)字視頻壓縮技術(shù)。此外,先進(jìn)的視頻處理技術(shù)能夠在我國(guó)教育、醫(yī)療以及企業(yè)培訓(xùn)等方面開(kāi)展。 以遠(yuǎn)程教育為例,遠(yuǎn)程教育、電子圖書(shū)館都能夠?qū)崿F(xiàn)完美地切合數(shù)字視頻壓縮技術(shù)。因此,通過(guò)落實(shí)數(shù)字視頻壓縮技術(shù),能夠有助于操作人員搜 尋、 整 合 多 媒 體 數(shù) 據(jù) 庫(kù) 資 源 以 及 進(jìn) 行 圖 像分析[7]。
1. 5非線性編輯系統(tǒng)概述
非線性編輯系統(tǒng)是數(shù)字視頻后期制作系統(tǒng),它結(jié)合了數(shù)字視頻后期制作設(shè)備,能夠?qū)崿F(xiàn)多媒體計(jì)算機(jī)的各種基本功能,還能夠保障數(shù)字視頻具備高畫質(zhì)的性能。 非線性編輯系統(tǒng)具備傳統(tǒng)線性電視編輯系統(tǒng)的功能,并且在他們?cè)谢A(chǔ)之上進(jìn)行了創(chuàng)新。 因此非線性編輯系統(tǒng)能夠?yàn)閿?shù)字視頻領(lǐng)域帶來(lái)巨大的變革。相比于傳統(tǒng)編輯技術(shù),非線性編輯技術(shù)提高了編輯效率。 非線性編輯技術(shù)在實(shí)際應(yīng)用過(guò)程中,技術(shù)人員能夠結(jié)合相關(guān)要求通過(guò)多元化的方式剪切和編輯視頻內(nèi)容,同時(shí)還能夠?qū)崿F(xiàn)多元化的數(shù)字特效處理功能。 這種技術(shù)使得工作人員在處理數(shù)字視頻過(guò)程中,不再以傳統(tǒng)的方式開(kāi)展作業(yè),而是結(jié)合自身思維認(rèn)知?jiǎng)?chuàng)作數(shù)字視頻,有利于我國(guó)電視后期制作領(lǐng)域的發(fā)展[8]。從非線性編輯系統(tǒng)結(jié)構(gòu)來(lái)看,非線性編輯系統(tǒng)主要包括多媒體素材接口單元、中央處理單元、信號(hào)輸出接口單元以及信號(hào)輸入接口單元。 當(dāng)音視頻傳輸?shù)椒蔷€性編輯系統(tǒng)中,首先該視頻進(jìn)入的是非線性編輯系統(tǒng)的信號(hào)輸入單元,隨后信號(hào)輸入單元就會(huì)將音視頻傳輸?shù)蕉嗝襟w素材接口單元,通過(guò)中央處理單元進(jìn)行一系列操作后。 再由多媒體素材接口單元將音視頻傳輸至信號(hào)輸出接口單元,以此來(lái)完成整個(gè)音視頻輸入、輸出過(guò)程。
2數(shù)字視頻壓縮技術(shù)
2. 1數(shù)字視頻壓縮技術(shù)分析
視頻數(shù)字壓縮就是將數(shù)字視頻按照某種規(guī)律進(jìn)行壓縮,遵循的標(biāo)準(zhǔn)主要有 MPEG-2 等。 從實(shí)際應(yīng)用角度來(lái)看,對(duì)于非公開(kāi)的壓縮技術(shù),他們一般存在標(biāo)準(zhǔn)不全面的現(xiàn)象,而眾多壓縮標(biāo)準(zhǔn)也使得不同廠家之間無(wú)法用同一種壓縮技術(shù)設(shè)備進(jìn)行互聯(lián)。 采取不同視頻壓縮技術(shù)的設(shè)備要想實(shí)現(xiàn)互聯(lián)具有相當(dāng)?shù)碾y度。 當(dāng)前,我國(guó)電視廣播領(lǐng)域以及視頻監(jiān)控領(lǐng)域通常采取 MPEG-2 視頻壓縮技術(shù)。 不同種類的視頻壓縮技術(shù)在處理圖像質(zhì)量、帶寬以及算法復(fù)雜度等領(lǐng)域有不同的特征。 以MPEG-2 為例,MPEG-2 在圖像質(zhì)量、復(fù)雜度以及帶寬3 個(gè)指標(biāo)中,位于中等水平,如圖 1 所示。圖像質(zhì)量即模擬視頻圖像的還原度。 圖像質(zhì)量越高,說(shuō)明利用該數(shù)字視頻壓縮技術(shù),能使得壓縮后的視頻更接近初始視頻的畫質(zhì)。 帶寬是指利用該數(shù)字視頻壓縮技術(shù)處理視頻時(shí)需要占有的網(wǎng)絡(luò)帶寬。 同樣,這需要計(jì)算機(jī)硬件性能達(dá)到相應(yīng)的要求。 不同實(shí)際情況以及不同的行業(yè),對(duì)數(shù)字視頻壓縮技術(shù)有不同的需求例如某行業(yè)更注重圖像質(zhì)量,而對(duì)于延時(shí)等性能則沒(méi)有過(guò)高的要求。 我國(guó)監(jiān)控行業(yè)對(duì)于延時(shí)具有較高的要求,相比于圖像,視頻需要更低的延時(shí)。
2. 2MPEG-2 數(shù)字視頻格式
以國(guó)際最廣泛應(yīng)用的數(shù)字視頻格式為例,MPEG-2標(biāo)準(zhǔn)的兼容性最強(qiáng),并且能夠被多個(gè)領(lǐng)域采用,無(wú)論是從技術(shù)上還是生命力的角度來(lái)看,MPEG-2 已經(jīng)逐漸取代其他數(shù)字視頻格式,當(dāng)前存在一種先進(jìn)的視頻格式。 這種視頻格式能夠?qū)崿F(xiàn)圖像質(zhì)量較高的情況下達(dá)到最大壓縮比,但是這種視頻格式并沒(méi)有與之對(duì)應(yīng)的芯片,所以 MPEG-2 數(shù)字視頻格式比其他數(shù)字視頻格式更為成熟,具有較強(qiáng)的兼容性。
2. 3圖像的調(diào)用
以某地鐵監(jiān)控中心為例,該監(jiān)控中心的監(jiān)控設(shè)備采用的是二次編解碼方式,但是從實(shí)際運(yùn)轉(zhuǎn)角度來(lái)看,該城市監(jiān)控中心能看到的圖像只是存在于監(jiān)控中心正在監(jiān)控的圖像,也就是說(shuō),技術(shù)人員不能通過(guò)操作實(shí)現(xiàn)任意車站的監(jiān)控觀看。 當(dāng)前,大部分采用的視頻編解碼延時(shí)范圍主要在 300 ms 以內(nèi),但是利用二次編碼的方式能夠使得編解碼延時(shí)降低至 100 ms 以內(nèi),使得該城市的監(jiān)控中心延時(shí)范圍為 400 ms 以內(nèi)。
3結(jié)語(yǔ)
綜上所述,隨著人們對(duì)視頻的需求越來(lái)越大,科學(xué)合理的數(shù)字視頻壓縮技術(shù)能夠有效實(shí)現(xiàn)視頻資源的傳輸與共享,能夠極大豐富人們的視野。 數(shù)字視頻壓縮技術(shù)是新型的科技領(lǐng)域,能夠?yàn)槲覈?guó)社會(huì)發(fā)展提供一定的動(dòng)力。
作者:王治 單位:江蘇省泰州廣播電視臺(tái)