星期二, 4月 24, 2007

MultiMedia

1.CBIR系統中 shape 與 color 的使用目的為何?
CBIR:
CBIR是Content-Based Image Retrieval的縮寫,簡單地說,就是在影像資料庫中找出跟使用者給定的範例相似的影像。
Shape: segmentation or edge detection
分割或是圖片邊緣偵測
Color: independent of image size and orientation; often involve color histogram
圖片獨立的大小以及方向常常包含圖片的直方圖

2.zigzag的目的與方式為何?(??????)
方法:利用z型來作一維編碼
目的:Zig-Zag的主要目的是將量化後的63個二維高頻交流係數轉變程序列式的一維係數,這個序列的數完全是照頻率由低至高所排列的.而Zig-Zag完成此動作後會產生63個值得一維序列,然後再繼續編碼這63個值.

3.量化表的設計有何特殊之處?(????????)
量化表係依據人類視覺特性設計(Human Visual System, HVS)

4.Run-length Encoding能否達到理想壓縮比之關鍵為何?
變動長度編碼以「資料的重複次數」加上「原始資料內容」來編碼,故將每段重複的資料以二個位元組來表示。
由於變動長度編碼法對於資料的內容相當敏感,隨著影像複雜度的不同,其壓縮率也會大幅的變動,因此使用RLE的圖形格式經常不能保持一定的壓縮水準,有時遇到重複性低的影像資料,處理過的影像體積經常會不減反增。
利用zigzag編碼讓量化出來一串零做rle來達到壓縮目的

5.DCT除了選取部份係數即可不錯的代表原訊號外,與傅利葉轉換相比有其他哪些特殊之處?
他的計算為real-valued的運算,並且有較好的收斂倍率,減少正弦曲線的發生次數。比起傅利葉轉換會產生較多的sin曲線來得好。

6.Huffman編碼之答案可不可能有很多組?
答案有可能會有很多組,因為Huffman編碼會先找出每個字串出現的機率,例如01,011出現的機率,然後將他們命名,越常出現的字串就用越短的字來對應。用此方式,將原圖改為這些英文字的組合。
而命名的順序,依照每個Huffman編碼命名的不同,結果也會不同。並且字串出現的機率是有可能會相同的,此時編碼之答案就更依賴命名的方式(如依字母排序)了。

7.語音相關的應用中考一個例子
聲音辨識

8.傅利葉轉換結果與原影像的亮度有無關係?
計算每個像素與它的相鄰像素之間的亮度值的變化關係,將物體的邊界位置突顯出來
物體成像和自身發光強度的關係,就是傅立葉關係。

9.Morphing中 人臉之嘴與眼睛的辨識是為了什麼?
因為在Morphing中,要找到feature points,才能方便之後圖形的變換運算。然而直接從一張人臉要找出feature points,從其他地方來找實在是很困難並且不明確。而人臉上最明顯不同的地方就在於嘴巴以及眼睛,因此先將嘴與眼睛定出來之後,在去分析其他feature points就來的簡單、並且明確許多。

沒有留言: