问题

我已经实现了一个名为离散余弦变换的图像/视频转换技术.这个技术用于MPEG视频编码.我的算法基于以下URL中提出的想法:

http://vsr.informatik.tu-chemnitz.de/~jan/MPEG/HTML/mpeg_tech.html

现在我可以转换黑白图像的8x8部分,例如:

0140  0124  0124  0132  0130  0139  0102  0088  
0140  0123  0126  0132  0134  0134  0088  0117  
0143  0126  0126  0133  0134  0138  0081  0082  
0148  0126  0128  0136  0137  0134  0079  0130  
0147  0128  0126  0137  0138  0145  0132  0144  
0147  0131  0123  0138  0137  0140  0145  0137  
0142  0135  0122  0137  0140  0138  0143  0112  
0140  0138  0125  0137  0140  0140  0148  0143 

转换块看起来像这样:

1041  0039  -023  0044  0027  0000  0021  -019  
-050  0044  -029  0000  0009  -014  0032  -010  
0000  0000  0000  0000  -018  0010  -017  0000  
0014  -019  0010  0000  0000  0016  -012  0000  
0010  -010  0000  0000  0000  0000  0000  0000  
-016  0021  -014  0010  0000  0000  0000  0000  
0000  0000  0000  0000  0000  0000  0000  0000  
0000  0000  -010  0013  -014  0010  0000  0000  

现在,我需要知道如何利用这个转换?我想检测表示良好匹配的同一个图像(或另一个图像)中的其他8x8块.

此外,这个转换给我什么?为什么存储在转换图像右上方的信息重要?

  最佳答案

DCT的结果是将原始源转换为频率域.左上角存储“幅度”的“基”频率和频率沿水平轴和垂直轴增加. DCT的结果通常是在较常见的较低频率(左上象限)和较高频率的较少条目上集合放大幅度.正如所提到的那样,通常只是将这些较高的频率排除在外,因为它们通常构成了源的非常小的部分.但是,这会导致信息的丢失.完成压缩通常是在DCT源上使用较少压缩的压缩.这是因为这些压缩零几乎都没有出现.

使用 DCT 来找到类似区域的一个可能的优点是,您可以对低频值(左上角)进行第一次通过匹配。

希望这有助于

  相同标签的其他问题

videocompressiondct