基于近似离散切比赫夫变换的低复杂度图像与视频编码外文翻译资料

 2021-11-29 10:11

英语原文共 11 页

IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, VOL. 27, NO. 5, MAY 2017, 1066-1076

基于近似离散切比赫夫变换的低复杂度图像与视频编码

Paulo A.M.Oliveira,Renato J.Cintra,IEEE高级成员,F_Bio M.Bayer,Sunera Kulasekera和Arjuna Madanayake,IEEE成员

摘要

线性变换的使用与数据去相关应用有很大的相关性,如图像和视频压缩。在这个意义上,离散切比赫夫变换(DTT)具有有用的编码和去相关特性。DTT变换核不依赖于输入数据,快速算法可用于实时应用。然而,DTT的快速算法在文献中具有较高的计算复杂度。本文介绍了一种新的DTT的低复杂度近似。快速算法所提出的转换是不乘法的,并且需要减少了加法和位移位操作的次数。在流行标准中的图像和视频压缩仿真结果表明,所提出的变换具有良好的性能。FPGA的资源消耗减少了43.1%。在可配置逻辑块和ASIC位置和路径实现中,与精确DTT的二维版本相比,面积-时间图减少了57.7%。

索引项-近似变换,离散切比赫夫变换,快速算法,图像和视频编码

1 引言

离散变量正交多项式是几个超几何差分方程的解[1]。这类正交多项式的经典应用包括泛函分析[2]和图[3]。此外,这种多项式被用于计算力矩函数[4],这在很大程度上被用于

2015年6月26日收到的原稿;2015年9月16日和2015年11月12日修订;2015年12月19日接受。出版日期:2016年1月6日;现行版本日期:2017年5月3日。这项工作部分得到了巴西机构的支持,如Conselho Nacional de Desenvolvimento Encio e tecnol_gico、Funda_o do Amparo a ci_ncia e tecnologia和Funda_o de Amparo_pesquisa do Estado Rio Grande do Sul,部分得到了美国俄亥俄州阿克伦市阿克伦大学的支持。这篇论文由协会推荐。编者T.-S.Chang。

P.A.M.Oliveira与信号处理小组,巴西Recife 50670-901,Pernambuco联邦大学Estat_stica系,以及德国Erlangen–Nuremberg大学多媒体通信和信号处理系(邮箱:oliveirapaulo@globo.com)。

R.J.Cintra与信号处理小组、巴西累西腓50 670-901 Pernambuco联邦大学Deestat_stica系、计算机科学与自动化研究所Quipe Cairn以及法国Rennes 35000 Rennes大学Mes al_atoires研究所合作。以及法国里昂国家科学应用研究院信息实验室图像与系统信息中心(邮箱:rjdsc@ieee.org)。F.M.Bayer与巴西圣玛丽亚联邦大学圣玛丽亚分校(Universidade Federal de Santa Maria,Santa Maria 97105-900)的Estamito de Estat_stica和Laborat_rio de Ci_ncias Espaciais de Santa Maria(Lacesm)(电子邮件:bayer@ufsm.br)。

S.Kulasekera和A.Madanayake现就职于美国俄亥俄州阿克伦市阿克伦大学电气与计算机工程系,邮编:44325(邮箱:arjuna@uakron.edu)。

本文中一个或多个图形的颜色版本可在http://ieeexplore.ieee.org上在线获取。

数字对象标识符10.1109/tcsvt.2016.2515378

图像处理[5]–[7]。例如,由离散切比赫夫多项式导出的离散切比赫夫矩[8]形成一组正交矩函数。这些函数不是基于连续函数的离散近似;它们在离散域上自然是正交的。

切比赫夫矩被用于量化图像块伪影[9]、图像识别[10]–[12]、盲完整性验证[13]和图像压缩[14]–[18]。在数据压缩环境下,采用二维离散切比赫夫变换(DTT)计算二维(2D)矩。事实上,在[16]、[20]和[21]中报告的平均位长度方面,8点DTT与离散余弦变换(DCT)[19]相比,可以获得更好的性能。此外,与最先进的基于DCT的嵌入式编码器相比,在[18]中提出的基于8点DTT的嵌入式编码器显示出更好的图像质量和更短的编码/解码时间。8点DTT还被用于盲法鉴证,作为确定受过滤和压缩的医疗图像完整性的工具[13]。

然而,由于DTT具有大量的加法和浮点乘法,因此它具有很高的算术复杂度。在软件和硬件中,这种乘法比加法或定点乘法更需要计算结构。因此,DTT更高的计算复杂度排除了其在低功耗系统[22]、[23]和/或实时处理(如视频流[24]、[25])中的应用。因此,快速的DTT算法可以提高其计算效率。一个全面的文献搜索只揭示了两个快速算法的4点DTT[14],[26]和一个8点DTT[15]。尽管与直接DTT算法相比,这些快速算法具有较低的算术复杂度,但它们仍然具有较高的算术复杂度,需要大量的加法和移位操作。

在一个类似的场景中,基于DCT的变换的计算已经在几种流行的编码方案中得到应用,如jpeg[27]、mpeg-2[28]、h.261[29]、h.263[30]、h.264[31]、高效视频编码[32]、[33]和vp9[34]——从矩阵近似理论中获益[35]–[41]。在这种情况下,不精确地计算离散变换,而是执行近似的、低成本的计算。近似值的设计允许类似的光谱和编码特性,以及较低的算术复杂度。通常,近似值是无乘法的,只需要加法和移位操作就可以进行计算。在[42]中,提出了8点DTT的无乘近似。据我们所知,这是文献中唯一的DTT近似。

本文的目的是为8点DTT引入一个有效的低复杂度近似值,该近似值能够超越[42]。为了得到无重近似DTT矩阵,结合编码增益和变换效率等不同的编码指标,提出了一个多准则优化问题。此外,还提出了一种快速有效计算所寻求近似值的算法。对于编码性能评估,我们提出了两个计算实验:

1)jpeg图像压缩模拟;

2)一个视频编码实验,将寻求的近似值嵌入H.264/AVC标准中。

本文展开如下。第二节回顾了DTT的数学背景。第三节介绍了DTT的参数化,推导了一系列DTT近似,并建立了一个优化问题来识别最优近似。在第四节中,我们从编码性能、与精确变换的接近度和计算成本等方面评估得到的近似值。此外,还介绍了一种快速的近似DTT算法。第五节展示了图像和视频压缩模拟的结果。第六节显示了硬件资源消耗与准确的DTT的比较,包括FPGA和ASIC实现。讨论和最后评论见第七节。

2 离散切比赫夫变换

A.离散切比赫夫多项式

离散切比赫夫多项式是一组离散变量正交多项式[43]。第k阶离散切比赫夫多项式由以下闭式表达式[14]给出:

tk [n] = (1 minus; N)k · 3F2(minus;k, minus;n, 1 k; 1, 1 minus; N; 1)

其中 n = 0, 1,..., N minus; 1, 3F2(a1, a2, a3; b1, b2;z) =

是概括了超几何函数和(a)k = a(a 1)···(a k minus; 1)

是后代的阶乘。切比赫夫多项式可根据以下递归[14]得到:

对于t0[n]=1和t1[n]=2nminus;N 1。实际上,集合{tk[n]},k=0,1···N-1是单位重量的正交基础。因此,离散切比赫夫多项式满足以下数学关系:

当和

是kronecker delta函数,如果和否则。

B.二维离散切比赫夫变换

设为Ntimes;N像素大小的离散图像的强度分布。f[m,n]的2d DTT,用M[p,q]表示,p,q=0,1,..., n-1,由[8]、[14]给出。

当 是正交化离散Tchebihef多项式

而且

注意,(1)中描述的转换内核是可分离的。

因此,以下关系成立:

假设

因此,F的变换域系数可以通过以下矩阵运算来计算:

(2)

式中,t是由下式给出的n点一维DTT矩阵

由(2)引起的矩阵运算表示二维DTT。由于核分离特性,二维DTT可以通过将一维DTT依次应用于F行,然后应用于生成的中间矩阵的列来计算。原始强度分布f可通过反程序 .

上述最后一个等式源于dtt正交性:,因此,相同的结构可以用于正向变换,也可以用于反向变换。

对于n=4和n=8,我们在图像和视频编码的上下文中有一些特殊的情况。因此,4点和8点DTT矩阵分别由

我们观察到,t4和t8是由整数矩阵和需要浮点表示的对角矩阵的乘积写成的。

3 DTT近似和编码优化

在本节中,我们旨在提出一个极低复杂度的DTT近似。我们的方法包括生成一类参数近似矩阵,然后根据编码性能确定最优类成员。

A.相关工作

据我们所知,文献中仅提出了DTT近似值[42]。这种近似是通过整数函数的参数化和转换矩阵列的规范化得到的。[42]中的派生近似提供了良好的编码能力,但它缺乏正交性或近正交性。因此,正变换和逆变换是截然不同的,具有不平衡的计算复杂性。

B.参数低复杂度矩阵

在[35]、[36]、[38]和[44]中,DCT近似值为根据以下操作提出:

其中int(·)是一个整数函数,是一个真实的比例因子,c是精确的DCT矩阵。通常的整数函数包括下限、上限、信号和舍入函数[38]。在本文中,这些函数在应用于矩阵参数时按元素进行操作。

对于所提出的DTT近似,也寻求类似的方法。但是,与DCT相比,DTT矩阵(基向量)具有广泛变化的动态范围。因此,整数函数可能会过度惩罚动态范围较小的行。为了补偿这种现象,我们将t4和t8的行按照左乘进行标准化

所寻求的近似值要求具有极低的复杂性。确保此属性的一种方法是采用一个整数函数,其c上域是一组低复杂度整数。在DCT文献中,常见的集合是。请注意,这些集合中的元素在硬件上实现非常简单,这意味着只有加法和位移位操作的无乘法设计[45]。

采用p2,我们得到了一个合适的整数函数,它由圆:

其中圆是在matlab[46]、octave[47]和python[48]编程语言中实现的舍入函数。根据[38]中所述的方法,我们得到以下矩阵的参数类:

c.DTT近似

给定的低复杂度矩阵可用于通过[36]–[38]中所述的正交化或准正交化来近似DTT矩阵。因此,Tn的近似值,称为,可通过(4)如果是对角矩阵,那么ediag返回一个对角矩阵及其参数的对角项,并且radic;是矩阵元素的平方根运算符[38]。如果

成立,则是一个正交矩阵[49]。否则,它可能是一个近正交矩阵[38]。当的对角度偏差较小时,近似称为准正交。设A为一个平方实矩阵。对角线偏差由[50]给出。

是矩阵的Frobenius范数[49]。在图像压缩中,对角线值低于0.1056的偏差表示准正交性[35],[38]。

D.优化问题

现在,我们的目标是在t族中确定提供最佳近似值的矩阵。我们采用两个指标作为优值来指导最佳选择:1)统一编码增益cg[51]、[52]和2)转换效率[53]。这些指标是相关的,因为它们量化了消除信号冗余以及数据压缩和去相关的转换能力[53]。因此,根据[54]中的方法,我们提出

以下是多标准优化问题:

式中,是根据(3)得出最优低复杂度矩阵t的缩放参数。

上述优化问题在分析上不易处理。因此,我们采用穷尽数值搜索来获得。对于n=4和n=8,我们分别在区间中找到了最优性。因此,上述间隔中的任何值都会影响相同的近似值。出于操作原因,我们选择2。因此,得到的低复杂度矩阵如下所示

关联最优逼近用表示,并可根据(4)计算。因此,我们得到

4 评价与计算复杂性

A.讨论

得到的矩阵满足(5),因此是正交的。实际上,所提出的矩阵与[44]中引入的H.264编码的4点整数转换相同。因此,它也是一个最佳的近似DTT。因为4点DCT近似矩阵由Malvar等人[44]在视频编码的背景下进行了深入的分析[31],这些结果也适用于T。因此,接下来我们将重点讨论拟议的8点近似T。lt;/

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。