問題

我已經實現了一個名為離散餘弦變換的影象/影片轉換技術.這個技術用於MPEG影片編碼.我的演算法基於以下URL中提出的想法:

http://vsr.informatik.tu-chemnitz.de/~jan/MPEG/HTML/mpeg_tech.html

現在我可以轉換黑白影象的8x8部分,例如:

0140  0124  0124  0132  0130  0139  0102  0088  
0140  0123  0126  0132  0134  0134  0088  0117  
0143  0126  0126  0133  0134  0138  0081  0082  
0148  0126  0128  0136  0137  0134  0079  0130  
0147  0128  0126  0137  0138  0145  0132  0144  
0147  0131  0123  0138  0137  0140  0145  0137  
0142  0135  0122  0137  0140  0138  0143  0112  
0140  0138  0125  0137  0140  0140  0148  0143 

轉換塊看起來像這樣:

1041  0039  -023  0044  0027  0000  0021  -019  
-050  0044  -029  0000  0009  -014  0032  -010  
0000  0000  0000  0000  -018  0010  -017  0000  
0014  -019  0010  0000  0000  0016  -012  0000  
0010  -010  0000  0000  0000  0000  0000  0000  
-016  0021  -014  0010  0000  0000  0000  0000  
0000  0000  0000  0000  0000  0000  0000  0000  
0000  0000  -010  0013  -014  0010  0000  0000  

現在,我需要知道如何利用這個轉換?我想檢測表示良好匹配的同一個影象(或另一個影象)中的其他8x8塊.

此外,這個轉換給我什麼?為什麼儲存在轉換影象右上方的資訊重要?

  最佳答案

DCT的結果是將原始源轉換為頻率域.左上角儲存“幅度”的“基”頻率和頻率沿水平軸和垂直軸增加. DCT的結果通常是在較常見的較低頻率(左上象限)和較高頻率的較少條目上集合放大幅度.正如所提到的那樣,通常只是將這些較高的頻率排除在外,因為它們通常構成了源的非常小的部分.但是,這會導致資訊的丟失.完成壓縮通常是在DCT源上使用較少壓縮的壓縮.這是因為這些壓縮零幾乎都沒有出現.

使用 DCT 來找到類似區域的一個可能的優點是,您可以對低頻值(左上角)進行第一次透過匹配。

希望這有助於

  相同標籤的其他問題

videocompressiondct