視訊電話

维基百科,自由的百科全书
跳转至: 导航搜索
TANDBERG E20 ISDN影像電話

(一)視訊是什麼?

『視訊』究竟是什麼?有人說它有聲音、有人說它是會動的影像。視訊正是由這兩個要素所構成。平常從電影、電視或是錄影機中所播放出來的內容都是視訊,它早已融入每個人的生活之中。舉凡看電襯、電影、唱卡拉 0K,這些都是視訊資料所提供的功能。除了娛樂功能之外,金融機構錄影監視、太空船在人空拍攝所傳回的各項天文資訊等等,亦是屬於視訊之應用。

為什麼要將視訊數位化應用到電腦中呢?就科學上的應用而言,電腦強大的運算與處理能力,能夠協助視訊資料的分析與處理,完成人眼不易達成的工作,就生活、教育等方面,則可以運用電腦製作、管理視訊資料,使視訊資料的應用發揮更大的優點與功能。本次講義以視訊數位化之原理開始介紹,其中以視訊的動態影像部份為生。

(二)視訊的基本原理

現在介紹視訊的產生原理,然後說明電腦如何以數位化的方式處理視訊,同時也簡單的介紹視訊壓縮的原理,最後則分析視訊影片的結構。

(1)、視訊原理

小時候大家一定玩過一個遊戲,那就是在課本每頁的角落畫上連續圖案,之後再用手指快速翻動書頁,就可以看到所畫的圖案動了起來。這是利用人眼睛視覺暫留的特性,快速撥放連續的靜態影像,造成畫面本身在動的錯覺。

這個現象,正是視訊播放的基本原理。例如:電影影片在拍攝時,便是將畫面記錄成連續的方格底片,在放映時再快速的播放這些影片,達成動態的效果。因此,視訊畫面播放可以視為前後關連之靜態圖像快速替換。就電視而言,則是將視訊中一段段畫面轉為電子訊號,以很快的速度連續顯示在螢幕上。為了讓動態之效果自然,每秒中所顯示的畫面個數必須夠多,否則會有停頓不連續的感覺。以電視畫面之呈現來說,它是以映像管中的電子束撞擊螢幕上的材質,以產生光亮及顏色。由於電子束一次只能撞擊在一個點上,因此實際上一次只有一個點被畫上顏色 (一個點包含了紅、藍、綠三原色,所以稱為 RGB 三槍投影)。還好電子束移動的速度夠快,能夠在短暫的時間內就將螢幕上的每一個點都撞擊過一遍,而讓人感到整個畫面是同時呈現。電子束有順序的將螢幕上的每個點撞擊稱為 『掃瞄』。

電子束掃描的方向是以水平的方向進行,因此每一條水平線稱為「水平掃瞄線」,螢幕的畫面便由依條條的水平掃瞄線所構成。在掃瞄時將水平掃瞄線分為奇數線與偶數線兩組,依序分組掃瞄,這稱為「交叉掃瞄」,其作用在使畫面看起來更為平順。畫面中的掃瞄線愈多,所顯現的影像就愈清晰細緻。一秒鐘所能播放的畫面數則影響到所播放出來的畫面效果是否平順。目前常用的電視影像標準有國際電視標準協會(NTSC)規格(525條掃瞄線、每秒鐘播放30個畫面)、歐洲 PAL規格以及SECAM 等。

至於視訊資料的來源是如何產生呢?透過攝影機以一定的頻率,將鏡頭捕捉的畫面依序儲存到膠卷或是磁帶中,之後便可以經過適當的裝置將內容播放出來。傳統的視訊資料編輯是透過底片之剪輯和暗房技術產生特殊的效果,只有專業人員才能處理,功能亦有限。視訊資料在數位化之後,不但所能產生的效果更加豐富,同時只要使用適合之軟體,一般人亦能輕易學習視訊資料之處理與製作。

視訊除了畫面內容外,尚包含聲音。聲音經常伴隨著畫面同步播放,達到一致的效果。例如 : 錄影帶即是將視訊畫面和聲音平行存放於磁帶中,磁頭可以同時讀取播放視訊與音訊,達到同步的作用,沒有聲音的視訊其效果將失色不少。

(2)、數位化視訊

由以上介紹得知,視訊畫面是由一組二維的連續影像所構成。它和圖像資料的最大差異,就在於視訊資料除了是一組連續影像外,尚包含了畫面間的順序關係。視訊品質的好壞在於視訊的解晰度 (也就是掃瞄線的多寡)及畫面播放的速率。視訊數位化乃是將這些連續畫面以數位圖像之方式依序將每個畫面儲存。

將視訊資料數位化後,所存的內容、資訊必須包含原來的視訊內容與規格。因此數位化視訊的描述與其內容,主要包括以下幾部份:

1、畫面的大小:畫面長、寬所佔的點數。

2、畫面影像的深度:記錄畫面上的一個點所需佔用的記憶體空間,和圖像的表示方法一樣,可有24位元全彩、8位元256色以及其他的表示方式等等。一般常見的格式為256色的格式。

3.畫面的播放率:每秒鐘要播放多少個畫面。

4.視訊內容:每個畫面的賣際視訊內容。

以畫面大小為 320 X 2O0、256色(8位元)、每秒25個畫面的播放率計算,這樣規格的視訊資料,若長度是100分鐘的影片需要的儲存空間計算如下 :

320 X 2O0 X 8 / 8 = 6400O Bytes 約 64 KB(一個畫面所需的大小)

64 X 25 X 6O x lO0 約9600000 KB

約 960O MB ( l00分鐘所需的儲存容量 )

這個數字司說大得令人驚訝! 一般電腦儲存設備很難儲存如此大量之資料。再就播放的角度來看,由於每秒要播放25個畫面,將25個畫面的內容從電腦的儲存體讀取出來播放需要25 X 64 KB,也就是每秒中電腦必須能夠讀取約1.6 MB的資料才能趕得上播放的速度。目前部份的電腦儲存媒體無法滿足這項需求。因此,要解決這個問題一定要設法減少視訊的資料量。

減少視訊資料量的方式可以從兩方面來看 : 第一,降低視訊的品質。也就是以改變播放率與畫面的大小完成。畫面所含的像素數目愈少則晝面會顯得愈粗糙 ; 而每秒播放的畫面數愈少則畫面連續的感覺就會被破壞。例如 : 早期的光碟機資料傳輸率只有 15O KB/秒左右,因此若以每秒播放10個畫面的速度計算,每個畫面則只能有l5 K的資料量,也就是約 15O XlO0 的 256 色畫面品質。即使是以四倍速光碟而言,每秒600 KB 的傳輸率也僅能提供每秒播放 10 個 300 X 200 的 256 色畫面而已。第二方法是運用資料壓縮的方法減少視訊的資料量。這個方法不但可以減少儲存空間,也可以減少撥放時每秒鐘要讀取的資料量。由於視訊資料量也像圖像資料,允許壓縮過後的視訊在還原時可以有某種程度的「失真」(也就是「略損壓縮」),因此圖像之壓縮方法便可以應用在視訊之壓縮上,加上視訊畫面本身所具有的畫面連續性,使得壓縮的倍率可以遠超過圖像的壓縮率。

由於解壓縮程序需要大量的運算,所以壓縮過後的視訊在讀取播放時,通常硬體解壓縮卡做及時解壓縮。也可以用 Xing , vmpeg 等軟體工具來播放壓縮過後的視訊資料,但速度可能較慢。

(3)、壓縮與解壓縮

即時的(ReaI-time)影像成為數位化後,儲存與秀出使成為一個難題。如果以 24 bits的色彩品質來組成一個像框(frame),則大約需要lMB的電腦儲存空間 ; 如此類推,一秒鐘如呈現30個像框才足以成為全動 ( fuIl motion ) 即時的影像,則會產生3OMB的資料量,那麼目前 1200 MB的硬碟也只不過可以裝下 40秒鐘的影像而已。除了儲存之資料量外,演出之時所需的費料傳輸也是另一個問題。因為一秒內要將3O MB的資料傳送到電腦螢幕上不是現在的麥金塔及 PC 所能做到的,它們目前只不過大約每秒13 MB的傳輸量而已。若從硬碟傳出則每秒只不過 1MB ,而由 CD-ROM 傳出大概每秒只有 600K-1.2M遠遠落後於全動影像之要求。是故,將這些資料加以壓縮 (compression)與解壓縮 ( decomprcssion )處理使成為一項非常重要的課題了。

在各種圖片、影像壓縮技術當中,較為流行的有:JPEG、MPEG、Px64 及DVI等技術。

1、JPEG

JPEG 是Joint Photographic Experts Group 之縮寫。 它是一種靜態影像的壓縮標準,採用離散餘弦轉碼 (Discretc Cosine Transform;DCT)的運算法來進行壓縮。將影像切割成8 X 8二維的像素方塊 (block),再將這方塊依適當的量化處理,這樣可以獲得10:I到80:1 的壓縮比。

2.MPEG

MPEG 是 Moving Picture Experts Group 之縮寫,為一種動態影像的壓縮標準。它的方法是先利用動態預測(Motion Estimation)及差分編碼方式去除相鄰兩張影像之相關性,因為對於動態影像而言,除了正在移動的物體附近,其餘的像素幾乎是不變的,因此可以利用相鄰兩張甚至多張來預測像素可能移動的方向與亮度值,在記錄其差值。將這些差值利用轉碼或分類是編碼將高低頻分離,然後用一般量化或向量量化的方式捨去一些畫質而提高壓縮倍率,最後再經過一個可變長度的無失真型壓縮而得到最少位元數的結果,這種結果可以得到 50:1至 100:1 的壓縮比。

3、PX64

PX64 是國際電話電報咨詢委員會(International Consultative for Telephone and Telegraph:CCITT)設立的一種標準。它適用於視訊會議(video-Teleconference)之全動作視訊處理,如視訊會議當中所需的及時影像應用(Real-time Video)。它也是以離散餘弦轉碼(DCT)的方式來編碼,然後量化,將像素方塊編碼為位元串列,然後透過動態預測執行搜尋與比較,以形成一個代表在這個方塊和先前一個方塊不同之pixeI block。這種方式可以達到 l00:1 到 2000:1的壓縮比。

4、DVI

DVI是數位影橡穿插 ( Digital Video Interactive ; DVI ) 的縮寫,它是一套影像處理器及其相關的軟體。這個處理器稱為i75O PP/DP(pixel processor and display processor),是一種高速的電腦晶片,它使個人電腦能夠壓縮、解壓縮及顯示影像。電腦廠商可將這個處理器裝設在外加的板面上或直接裝在主機板上,形成可以處理多媒體的工作台(platform )。最特殊的地方是其壓縮資料之方式,包括:影像、靜止照片、及音響的壓縮方法。DVI是以壓縮後的影像、照片、音響置於一個叫做「媒體選擇陣列」當中。既然是壓縮的媒體檔案,則所需的儲存空間自然就減少了許多。如以一般的方式每一秒鐘的影像約須 22 MB的記憶空間,但經壓縮後可以減少至15O KB的記憶空間,其間相差大約在 80:1 至 160:1 的壓縮比。以DVI的壓縮技術可以產生兩種不同的影像檔案,一種稱為『 Rca1 time Video ( RTV ) 』,另一種稱為『Production-Leve Video (PLV)』。 RTV 所需的空間較PLV大,而在播放時,影像的品質RTV也較PLV低。 RTV的檔案可以由VCR或錄影機直接輸入電腦以ActionMedia 75O Capture Board 來抓取與播放,它的影像是由類比(analog ) 轉成數位( digital),再壓縮成每個像框在 7-1O KB 的大小,存於硬碟或CD- ROM當中。而PLV則是以一個叫壓縮引擎 (Compress Engine) 來進行類比轉成數位,並同時以delta encoding的壓縮運算法來儲存各像框之間不同之部份,將相同重複的部份剔除。通常第一個傢框是完全存起來的,稱之為『參照像框(reference frame)』,然後將第二個以後各個像框不同之部份存起來,當不同部份太多時,則另產生一個新的參照像框,如此類推下去,各像框相同部份去除只存其不同之處。這樣的運算法進行壓縮動態的影像,平均每個像框為5 KB。如果每秒以30像框呈現,15O KB的資料就可以很順暢、清晰的將影像呈現出來。

(4)、視訊內容結構

視訊是由連續畫面所組成,根據內容所表現出的含意與拍攝技術,我們可將一部視訊影片的結構分析如下 :

1、畫面:視訊資料的最小基本單位為單一『畫面(frame)』,內容即是一張圖像。

2.鏡景:在拍攝時,同一鏡頭所連續拍攝的一段連續畫面則稱為『鏡景 (shot)』。由於是同一個鏡頭所拍攝,同一『鏡景』內的畫面其內容非常相近。跟據運鏡的技巧可分為:鏡頭平移(panning)、拉近 (zoom-in)、拉遠(zoom-out) ……等各種動做。

3,場景:同一背景與前景所拍攝的各個鏡景則可稱為同一個『場景(sccne)』,相同場景的蹟景,其出現在影片中的順序不一定會連續,許多情形視訊剪輯耆會採用場景交錯的手法表達影片所要傳遞的訊息。

4.主題:由場景與鏡景所組合的一段具有一定目的與意義的影片片段則稱為『主題(episode)』,一個主題用以描述一段情節,所有的劇情情節即構成一部完整的影片。

了解視訊內容之結構後,則在視訊資料的編輯與製作上,除了應用電腦軟體所提供的各式功能與效果外,也能夠有意義的組織各片段影片的邏輯順序與含意表達。

(三)視訊資料的儲存格式

上面談到了視訊的基本原理與其數位化的形態,在本段將探討數位視訊的儲存與常見的幾種檔案格式。由於視訊資料龐大,因此在儲存上都會先進行壓縮,以下先就視訊壓縮的技術作一簡單的介紹。

(1)視訊壓縮

視訊資料以圖像的方式一張一張的儲存,會佔太大的儲存空間,並且也無法快速地播放,因此視訊壓縮勢在必行。在上面提到:圖像資料壓縮的方法可分為 『無損壓縮』與『略損壓縮』兩種。由於無損壓縮在資料解壓還原後,仍然和原始資料一樣,壓縮比例無法達到很高,因此不適合視訊的壓縮。而略損壓縮方面,能提供較好的壓縮比例,雖然影像可能會有某種程度的失真,但相對於人的眼睛敏感度而言,並沒有太大影響。例如 :圖像的壓縮,若要使畫面在還原後人的眼睛仍然不易看出其畫面品質的變化,其壓縮比例約在 20-30倍之間。而視訊資料要求更高的壓縮比例,因此針對視訊必需有更進一步的壓縮技術才行。

視訊資料是由一個個連續畫面所構成。每個畫面雖然如同一張圖像,但其和圖像資料的不同點,在於畫面與畫面之間有時間上的連續關係。連續的兩個畫面其內容往往相差無幾,因此在儲存上,只需要記錄其中的不同點就行了,這個特性可用來設計更好的壓縮技術。

MPEG 是目前較受歡迎的一種壓縮格式。它以圖像資料常用的『不連續餘弦轉換 ( Discrete Cosine Transform)』 壓縮技術再配合視訊畫面前後參照的方法達到了高壓縮比例,同時也保有良好的畫面品質。MPEG 已經成為視訊壓縮的一種標準格式,市面上也可以輕易的發現MPEG 規格的解壓縮/視訊播放卡。MPEG 也包含了視訊中聲音的壓縮功能,因此我們在播放時,可以同時表現出視訊的影像和聲音。視訊壓縮技術使得視訊儲存與播放不需要龐大的資料量。我們以50倍壓縮比例計算下列視訊規格 :畫面長寬= 640 X 480,256色,每秒播放25個畫面,l00分鐘之影片,所需的資料儲存量為(640 X 480 X 8/8 X

25 X 6O XlO0 ) / 50 約為 9OO MB (相當於不到兩片容量為 65O MB 之光碟片) 。每秒所需之資料讀取量為(640 X 480 X 25 )/ 50 約為 15O KB之資料量,若再考慮解壓縮所需要的時間,以二倍速 (每秒30OKB )的光碟機讀取速度,便可以勝任高品質之視訊播放。目前video CD (VCD)已逐漸普及,透過視訊壓縮卡與播放程式,可以在電腦上直接欣賞影片,由於光碟片容易保存、穩定性高,將來勢必取代傳統之磁帶。

(2)、視訊資料儲存格式

視訊資料的儲存格式主要有以下幾種 :

I、MPEG :國際標準機構 (ISO )所發展,根據不同的應用,它也制定了數

種規格。例: MPEGl、MPEG 2 及MPEG 3 等等。(.mpg)

2、QuickTime : Apple 公司的麥金塔電腦之視訊檔案格式。(.mov)

3、AVI:MicroSoft Windows 的視訊檔案格式 。(.avi)

4、DVI: Intel公司的視訊檔案格式。

不同格式的視訊資料可以透過相關的視訊應用軟體來讀取、播放或是編輯,目前也有一些軟體可以提供不同檔案格式之間的資料轉換。

(四)數位視訊的製作與撥放

一般使用者並無法自行製作大型視訊節目,因此大多數的數位視訊是由現有的類比視訊資料擷取而來,加以編輯、儲存為數位視訊的檔案格式。以下就其來源、製作與播放作一概略性的介紹。

(1)視訊資料來源

視訊資料的取得,大多必須先透過相關的設備讀取類比的視訊訊號,例如 : 電視、放影機、及攝影器材等。這些設備的輸出訊號通常為類比資料格式,因此,當電腦要透過這些設備來讀入視訊資料時,必須透過影像捕捉設備或視訊介面卡來達成。這些介面裝置的主要功能為將類比視訊轉換為數位視訊資料,並存到電腦的儲存裝置中。這類裝置包括有 :

1.影像卡 : 可以讓電腦直接接收類比視訊訊號,播放在螢幕上。

2.靜態捕捉器 : 這類捕捉器一次只能擷取一個畫面。因此,只能把所擷取到的影像轉存為數位圖像格式。

3.動態捕捉器 : 動態捕捉器的價格昂貴,能夠擷取連續的動態畫面,因此能夠方便的將類比棉訊資料轉換為數位視訊資料,其格式則根據所使用的軟硬體裝置而有所不同。

4.數位攝影機 : 捕捉器之功能是將已存在之類比視訊資料轉換為數位格式,通常用來抓取錄影機或電視訊號,再轉換為數位視訊。數位攝影機則具有攝影的功能,並將攝入的畫面直接以數位格式儲存。

在利用以上裝置將視訊資料擷取到電腦時,必須先設定訊號的來源,相關的參數有 : 色調、訊號接端、所採用的視訊規格標準、及是否為 VCR 裝置等。

設定好訊號來源後,接著必須設定接收後要轉為什麼樣的數位視訊格式,考慮的參數則有:

1.畫面大小: 即『設定畫面的長寬像素數目』。

2.畫面播放率 : 每秒含有多少個畫面。

3.聲音選項 : 設定是否把聲音部份也同時擷取。

4.視訊長度 : 設定所要捕捉的視訊時間。

5.儲存裝置 : 設定捕捉到的視訊將儲存到記憶體或是磁碟中。

(2)、視訊製作

視訊的製作,主要可以分為幾個步驟 :

1.取得所需要的視訊來源 : 視訊來源包括 : 畫面與聲音。除了以前面所介紹的方法之外,也可以使用已經存在的數位視訊資料檔。聾音部份除了視訊本身所含的部份,亦可另外錄製或取得已存在的聲音檔。

2.單一片段的編輯設定 : 對於每個單一片段的視訊來源,可以先對其編輯。有關視訊畫面的編輯部份,基本的功能為畫面大小、播放率以及畫面像素的深度等參數的變更、畫面的剪裁及安插額外畫面以調整播放率等。

3.特效處理 : 利用電腦視訊編輯軟體,可以對視訊內容進行特效處理,如 : 加上文字、畫面翻轉、旋轉、鏡射、模糊化……等功能。

4.合成與同步設定 : 最後則將所有編輯好的視訊片段加以合成剪接。首先可以把晝面部份的每一片段,根據所設計的順序加以安排,片段畫面可以根據鐘頭或場景的變化,予以切割重新安排次序。然後,畫面銜接的部份可以加上淡入、淡出或其他的特殊效果,有些功能較強的編輯軟體,甚至可以將畫面任意放大縮小或改變顯示的位置,以產生子母畫面或多重畫面的效果。在聲音部份,必須設定與畫面之間的同步,也就是說,每一段聲音的開始播放位置與播放的長瘦或結束位置,必須給予適當的安排。一般的編輯軟體都可以提供一個以上的聲音軌作為視訊的音效。一個好的視訊媒體製作,不只包括以上從電腦資訊的原理與使用的角度所介紹的過程,事先的內容設計、資料的搜集以及腳本的撰寫亦十分重要。

(3)、視訊播放-「媒體播放程式」簡介

數位視訊的製作,由於需要昂貴的軟硬體設備來配合,因此較不普遍,但是有關播放部份在Windows 98 內附有一個「媒體播放程式」工具,執行這程式可以按一下「開始」按鈕,「程式集」、「附屬應用程式」選「多媒體」便可找到「媒體播放程式」。

使用 『媒體執行程式』 軟體,必須有相關的驅動程式加以配合才能播放。驅動程式的設定,可以執行「控制台」中的「多媒體」圖示安裝、設定參數或是刪除。安裝設定好相關的視訊播放驅動程式後, 『媒體播放程式』 就可以播放視訊媒體了。实时视訊图象的一种电话