英语原文共 11 页
IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 27, NO. 5, MAY 2017, 1066-1076
基于近似离散切比赫夫变换的低复杂度图像与视频编码
Paulo A.M.Oliveira,Renato J.Cintra,IEEE高级成员,F_Bio M.Bayer,Sunera Kulasekera和Arjuna Madanayake,IEEE成员
摘要
线性变换的使用与数据去相关应用有很大的相关性,如图像和视频压缩。在这个意义上,离散切比赫夫变换(DTT)具有有用的编码和去相关特性。DTT变换核不依赖于输入数据,快速算法可用于实时应用。然而,DTT的快速算法在文献中具有较高的计算复杂度。本文介绍了一种新的DTT的低复杂度近似。快速算法所提出的转换是不乘法的,并且需要减少了加法和位移位操作的次数。在流行标准中的图像和视频压缩仿真结果表明,所提出的变换具有良好的性能。FPGA的资源消耗减少了43.1%。在可配置逻辑块和ASIC位置和路径实现中,与精确DTT的二维版本相比,面积-时间图减少了57.7%。
索引项-近似变换,离散切比赫夫变换,快速算法,图像和视频编码
1 引言
离散变量正交多项式是几个超几何差分方程的解[1]。这类正交多项式的经典应用包括泛函分析[2]和图[3]。此外,这种多项式被用于计算力矩函数[4],这在很大程度上被用于
2015年6月26日收到的原稿;2015年9月16日和2015年11月12日修订;2015年12月19日接受。出版日期:2016年1月6日;现行版本日期:2017年5月3日。这项工作部分得到了巴西机构的支持,如Conselho Nacional de Desenvolvimento Encio e tecnol_gico、Funda_o do Amparo a ci_ncia e tecnologia和Funda_o de Amparo_pesquisa do Estado Rio Grande do Sul,部分得到了美国俄亥俄州阿克伦市阿克伦大学的支持。这篇论文由协会推荐。编者T.-S.Chang。 P.A.M.Oliveira与信号处理小组,巴西Recife 50670-901,Pernambuco联邦大学Estat_stica系,以及德国Erlangen–Nuremberg大学多媒体通信和信号处理系(邮箱:oliveirapaulo@globo.com)。 R.J.Cintra与信号处理小组、巴西累西腓50 670-901 Pernambuco联邦大学Deestat_stica系、计算机科学与自动化研究所Quipe Cairn以及法国Rennes 35000 Rennes大学Mes al_atoires研究所合作。以及法国里昂国家科学应用研究院信息实验室图像与系统信息中心(邮箱:rjdsc@ieee.org)。F.M.Bayer与巴西圣玛丽亚联邦大学圣玛丽亚分校(Universidade Federal de Santa Maria,Santa Maria 97105-900)的Estamito de Estat_stica和Laborat_rio de Ci_ncias Espaciais de Santa Maria(Lacesm)(电子邮件:bayer@ufsm.br)。 S.Kulasekera和A.Madanayake现就职于美国俄亥俄州阿克伦市阿克伦大学电气与计算机工程系,邮编:44325(邮箱:arjuna@uakron.edu)。 本文中一个或多个图形的颜色版本可在http://ieeexplore.ieee.org上在线获取。 数字对象标识符10.1109/tcsvt.2016.2515378 |
图像处理[5]–[7]。例如,由离散切比赫夫多项式导出的离散切比赫夫矩[8]形成一组正交矩函数。这些函数不是基于连续函数的离散近似;它们在离散域上自然是正交的。
切比赫夫矩被用于量化图像块伪影[9]、图像识别[10]–[12]、盲完整性验证[13]和图像压缩[14]–[18]。在数据压缩环境下,采用二维离散切比赫夫变换(DTT)计算二维(2D)矩。事实上,在[16]、[20]和[21]中报告的平均位长度方面,8点DTT与离散余弦变换(DCT)[19]相比,可以获得更好的性能。此外,与最先进的基于DCT的嵌入式编码器相比,在[18]中提出的基于8点DTT的嵌入式编码器显示出更好的图像质量和更短的编码/解码时间。8点DTT还被用于盲法鉴证,作为确定受过滤和压缩的医疗图像完整性的工具[13]。
然而,由于DTT具有大量的加法和浮点乘法,因此它具有很高的算术复杂度。在软件和硬件中,这种乘法比加法或定点乘法更需要计算结构。因此,DTT更高的计算复杂度排除了其在低功耗系统[22]、[23]和/或实时处理(如视频流[24]、[25])中的应用。因此,快速的DTT算法可以提高其计算效率。一个全面的文献搜索只揭示了两个快速算法的4点DTT[14],[26]和一个8点DTT[15]。尽管与直接DTT算法相比,这些快速算法具有较低的算术复杂度,但它们仍然具有较高的算术复杂度,需要大量的加法和移位操作。
在一个类似的场景中,基于DCT的变换的计算已经在几种流行的编码方案中得到应用,如jpeg[27]、mpeg-2[28]、h.261[29]、h.263[30]、h.264[31]、高效视频编码[32]、[33]和vp9[34]——从矩阵近似理论中获益[35]–[41]。在这种情况下,不精确地计算离散变换,而是执行近似的、低成本的计算。近似值的设计允许类似的光谱和编码特性,以及较低的算术复杂度。通常,近似值是无乘法的,只需要加法和移位操作就可以进行计算。在[42]中,提出了8点DTT的无乘近似。据我们所知,这是文献中唯一的DTT近似。
本文的目的是为8点DTT引入一个有效的低复杂度近似值,该近似值能够超越[42]。为了得到无重近似DTT矩阵,结合编码增益和变换效率等不同的编码指标,提出了一个多准则优化问题。此外,还提出了一种快速有效计算所寻求近似值的算法。对于编码性能评估,我们提出了两个计算实验:
1)jpeg图像压缩模拟;
2)一个视频编码实验,将寻求的近似值嵌入H.264/AVC标准中。
本文展开如下。第二节回顾了DTT的数学背景。第三节介绍了DTT的参数化,推导了一系列DTT近似,并建立了一个优化问题来识别最优近似。在第四节中,我们从编码性能、与精确变换的接近度和计算成本等方面评估得到的近似值。此外,还介绍了一种快速的近似DTT算法。第五节展示了图像和视频压缩模拟的结果。第六节显示了硬件资源消耗与准确的DTT的比较,包括FPGA和ASIC实现。讨论和最后评论见第七节。
2 离散切比赫夫变换
A.离散切比赫夫多项式
离散切比赫夫多项式是一组离散变量正交多项式[43]。第k阶离散切比赫夫多项式由以下闭式表达式[14]给出:
tk [n] = (1 minus; N)k · 3F2(minus;k, minus;n, 1 k; 1, 1 minus; N; 1)
其中 n = 0, 1,..., N minus; 1, 3F2(a1, a2, a3; b1, b2;z) =
是概括了超几何函数和(a)k = a(a 1)···(a k minus; 1)
是后代的阶乘。切比赫夫多项式可根据以下递归[14]得到:
对于t0[n]=1和t1[n]=2nminus;N 1。实际上,集合{tk[n]},k=0,1···N-1是单位重量的正交基础。因此,离散切比赫夫多项式满足以下数学关系:
当和
是kronecker delta函数,如果和否则。
B.二维离散切比赫夫变换
设为Ntimes;N像素大小的离散图像的强度分布。f[m,n]的2d DTT,用M[p,q]表示,p,q=0,1,..., n-1,由[8]、[14]给出。
当 是正交化离散Tchebihef多项式
而且
注意,(1)中描述的转换内核是可分离的。
因此,以下关系成立:
假设
因此,F的变换域系数可以通过以下矩阵运算来计算:
(2)
式中,t是由下式给出的n点一维DTT矩阵
由(2)引起的矩阵运算表示二维DTT。由于核分离特性,二维DTT可以通过将一维DTT依次应用于F行,然后应用于生成的中间矩阵的列来计算。原始强度分布f可通过反程序 .
上述最后一个等式源于dtt正交性:,因此,相同的结构可以用于正向变换,也可以用于反向变换。
对于n=4和n=8,我们在图像和视频编码的上下文中有一些特殊的情况。因此,4点和8点DTT矩阵分别由
和
当
和
我们观察到,t4和t8是由整数矩阵和需要浮点表示的对角矩阵的乘积写成的。
3 DTT近似和编码优化
在本节中,我们旨在提出一个极低复杂度的DTT近似。我们的方法包括生成一类参数近似矩阵,然后根据编码性能确定最优类成员。
A.相关工作
据我们所知,文献中仅提出了DTT近似值[42]。这种近似是通过整数函数的参数化和转换矩阵列的规范化得到的。[42]中的派生近似提供了良好的编码能力,但它缺乏正交性或近正交性。因此,正变换和逆变换是截然不同的,具有不平衡的计算复杂性。
B.参数低复杂度矩阵
在[35]、[36]、[38]和[44]中,DCT近似值为根据以下操作提出:
其中int(·)是一个整数函数,是一个真实的比例因子,c是精确的DCT矩阵。通常的整数函数包括下限、上限、信号和舍入函数[38]。在本文中,这些函数在应用于矩阵参数时按元素进行操作。
对于所提出的DTT近似,也寻求类似的方法。但是,与DCT相比,DTT矩阵(基向量)具有广泛变化的动态范围。因此,整数函数可能会过度惩罚动态范围较小的行。为了补偿这种现象,我们将t4和t8的行按照左乘进行标准化
和
所寻求的近似值要求具有极低的复杂性。确保此属性的一种方法是采用一个整数函数,其c上域是一组低复杂度整数。在DCT文献中,常见的集合是。请注意,这些集合中的元素在硬件上实现非常简单,这意味着只有加法和位移位操作的无乘法设计[45]。
采用p2,我们得到了一个合适的整数函数,它由圆:
其中圆是在matlab[46]、octave[47]和python[48]编程语言中实现的舍入函数。根据[38]中所述的方法,我们得到以下矩阵的参数类:
c.DTT近似
给定的低复杂度矩阵可用于通过[36]–[38]中所述的正交化或准正交化来近似DTT矩阵。因此,Tn的近似值,称为,可通过(4)如果是对角矩阵,那么ediag返回一个对角矩阵及其参数的对角项,并且radic;是矩阵元素的平方根运算符[38]。如果
成立,则是一个正交矩阵[49]。否则,它可能是一个近正交矩阵[38]。当的对角度偏差较小时,近似称为准正交。设A为一个平方实矩阵。对角线偏差由[50]给出。
是矩阵的Frobenius范数[49]。在图像压缩中,对角线值低于0.1056的偏差表示准正交性[35],[38]。
D.优化问题
现在,我们的目标是在t族中确定提供最佳近似值的矩阵。我们采用两个指标作为优值来指导最佳选择:1)统一编码增益cg[51]、[52]和2)转换效率[53]。这些指标是相关的,因为它们量化了消除信号冗余以及数据压缩和去相关的转换能力[53]。因此,根据[54]中的方法,我们提出
以下是多标准优化问题:
式中,是根据(3)得出最优低复杂度矩阵t的缩放参数。
上述优化问题在分析上不易处理。因此,我们采用穷尽数值搜索来获得。对于n=4和n=8,我们分别在区间中找到了最优性。因此,上述间隔中的任何值都会影响相同的近似值。出于操作原因,我们选择2。因此,得到的低复杂度矩阵如下所示
和
关联最优逼近用表示,并可根据(4)计算。因此,我们得到
和
4 评价与计算复杂性
A.讨论
得到的矩阵满足(5),因此是正交的。实际上,所提出的矩阵与[44]中引入的H.264编码的4点整数转换相同。因此,它也是一个最佳的近似DTT。因为4点DCT近似矩阵由Malvar等人[44]在视频编码的背景下进行了深入的分析[31],这些结果也适用于T。因此,接下来我们将重点讨论拟议的8点近似T。lt;/
以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。