英语原文共 6 页，剩余内容已隐藏，支付完成后下载完整资料

一种新的使用HTML5的异构网络IP视频传输系统

Andreacute;s Loacute;pez-Herreros , Alejandro Canovas , Jose M. Jimeacute;nez , Jaime Lloret4

Instituto de Investigacioacute;n para la Gestioacute;n Integrada de Zonas Costeras

Universidad Politeacute;cnica de Valencia, Spain

摘要：目前，互联网视频广播面临的主要问题之一是可用带宽的限制。媒体元素包含大量的多路复用数据，其编码对于通过HTML5中的新应用程序编程接口（API）或通过第三方插件顺利发布而言是必需的。互联网提供了与多种格式和视频编解码器的广泛兼容性，但它的发行主要集中在三个主要部分：MPEG-4，Ogg和WEBM。在这篇文章中，我们根据比特率和编码时间研究视频的不同编码。这项研究将使我们能够了解这三种视频格式中每一种的特点。然后，我们使用这些信息来设计一种能够在服务器中运行的算法，以便根据所研究的特征发送适当的视频类型。

关键字：视频传输，视频编解码，网络算法

1.引言

数字视频和音频流通过互联网传输是视听趋势的一部分[1]，但是它有占用带宽大以及端到端服务质量不足的缺点[2]。客户的带宽限制了用户可以接收的数据信息量和视频信息量[3]，因此使用视频压缩算法来降低视频流的比特率并实现最低视频尺寸是当务之急。评价这种优劣的测量通过压缩比来表示。在视听数字化过程中，压缩是必须要进行的，因为大量高质量视频流难以处理。标准电视的压缩算法有几项研究[4]，如BT.601建议书和高清电视[5]，更何况现在有多种用于连接互联网的设备[6]。

有很多的人参与了HTML浏览器中HTML规范和实现的开发。从2005年最先打算在HTML5中加入lt;videogt;元素到所有主流浏览器达成一致增加Internet资源管理器，花了9年的时间。HTML5中的lt;videogt;标签成为第一个在浏览器中实现多媒体支持的本地元素，并且不需要如Quick Time, Microsoft Windows Media或Flash等第三方插件[7]。长期以来一直存在一个争论，就是它被发现所需要的所谓的编解码器基础是HTML5的一种标准编码格式，它应该适用于所有浏览器。尽管任何编解码器都可以封装在容器中，但它只能包含在具有自定义映射的特定容器中[8]。这是多媒体压缩和HTML5标准之间的主要联系，后者通过API（视频，画布，SVG）为浏览器渲染引擎中的编解码器的视频排放和所需的支持提供了便利。

HTML5的优势在于浏览器必须在其渲染引擎中包含音频/视频播放器引擎。因此，如果浏览器支持编解码器，则是因为它是通过“书店”实现的，并且不需要外部插件。在HTML5之前，用户必须安装编解码器包才能在Internet和本地播放器中播放视频。HTML5通过使用语义语言简化了执行视频流的代码，扩展了API的可能性，并与JavaScript轻松集成。与第三方插件的主要区别包括：减少网页加载时间，增加与更多浏览器的兼容性，包括更多选项（更多动态页面，代码更少），并允许离线使用网站。在这项工作中，我们展示研究和分析HTML5中包含的视频压缩编解码器的特性。我们在这项研究中包含了几个参数，如浏览器的类型，帧速率，比特率，编码时间和视频的最终质量。它让我们设计一种基于接收参数的算法，决定哪种编解码器适用于该情况，并且由于编码时间低于播放时间，因此应在最终用户端无需缓冲器的情况下执行转码[9]。本文的其余部分安排如下。在第2节中显示了相关的工作。第3部分介绍了HTML5中包含的主要编解码器。用于执行测量和我们的分析的测试台和软件如第4节所示。第5节介绍用于设计我们的算法的实验过程。在第5节中，我们解释了所提出的算法。算法运行时的实验结果如第7节所示。第8节提供了我们的结论和未来的工作。

2.相关工作

在本节中，我们将回顾一些不同编解码器使得这些作者决定用其中一种来给他们的例子提供最佳性能的研究工作。

Lloret等人在[10]中提出了一项关于实施不同的视频监控编解码器的研究，以实现这类服务的图像压缩。该作品展示了使用编解码器DivX，XviD和H.264压缩视频时获得的结果。由于具有不同的亮度，该视频会在在一天中的不同时间被捕获到。像这项工作一样，我们的研究集中在一些编解码器上，但有不同的目的。 [10]中介绍的工作的目的是视频监控，而我们的研究主要集中在它在HTML5中的使用。

在[11]中，Koenen描述了基于ISO/IEC的MPEG-4标准，并展示了它的特征和规则。另外，它对这种编解码器进行压缩的可能性进行了比较。我们的工作还将它与Ogg和WebM进行比较。

在[12]中，作者证明了选择编解码器在不同环境下工作的重要性。由于地点（环境）的特点，他们在不同的环境中执行多种类型的录制，其中不同的颜色占优势。他们使用编解码器MPEG-4，Xvid，DivX，H.264进行测量，以研究它们在最终尺寸和质量方面的差异。与我们的工作室不同的是，它没有考虑可连接的设备来请求视频。该工作中分析的编解码器与我们的工作不同。他们专注于DivX和Xvid，而我们专注于HTML5中包含的编解码器。

E. Ohwovoriole和Y. Andreopoulos在[13]中比较了HTML5（MPEG-4 AVC H.264和WebM VP8）以及HEVC TMuC中包含的两种主要编解码器。本文提供当前最先进的视频压缩方面的事务，纯粹着重于量化或比特率约束下的码率失真性能，而忽视系统复杂性，延迟和其他领域特定因素。而且，它们提供了MPEG-4和WebM之间的比较结果。在我们的论文中，我们将这项工作扩展到Ogg，并且我们还提出了一个新算法来考虑它们。

Lambert等人[14]解释当视频将通过网络传输并将其与其他编解码器进行比较时，MPEG-4编解码器H. 264 AVC的主要操作是视频编码的强有力选择。

在[15]中，作者进行了类似于Koenen在[11]中提出的研究，但是他们自己的Ogg Theora规范。他们的部署与编纂的特点不同。

在[16]中，作者解释了互联网内视频的未来，通过其标签lt;视频gt;，了解HTML5对于视频传输的重要性。它分为三个主要部分，涉及网络视频的背景，视频传输技术和未来。它还讨论了HTML5的API lt;视频gt;在视频传输方面的可能性，但它不像我们的论文那样专注于编码。

Larbier等人[17]介绍了有关AVC / H.264编码的工作。他们使用10位颜色深度，不同的网页编解码器和4：2：2的色度子采样来基于这种类型的压缩来建模广播，并在人眼周边区域丢失信息。所呈现的结果是从ATEME当前实时高清编码器获得即时即时产品的按位或精确和深度软件模型。为了说明在各种应用中所取得的成果，我们对各种比特率进行了比较。本文非常有趣，因为它深入研究了编码方面的颜色深度或色度二次采样。这可能是我们研究的延伸，但我们更关注QoS参数，如最终尺寸（用于带宽目的），编码时间，帧速率或最终质量。这项工作只研究单一的编码技术，AVC / H.264，而在我们的工作中，我们包括MPEG-4，Ogg和WebM。而且，我们改变了参数的类型。

这套新的开发对于RTSP视频流的不同产品可能非常有用。它们都可以用于视频会议或电子学习服务，因为它们是实时服务。虽然有很多作品提供自适应流媒体系统[18]来改善最终用户的QoE，但我们的目的是开发一个系统，该系统考虑用户信息，在视频交付之前将视频转码为合适的编解码器。

3.HTML5中主要编解码器

为了提供互操作性，所有浏览器应该与相同的编解码器兼容。问题是没有人满足浏览器开发人员所要求的要求（每个单位或分销商的许可自由，与开源模式兼容，使用质量以及免除最重要公司专利的额外风险）。

下面，我们描述为本文选择的HTML5使用的三种主要编解码器（mp4，Ogg，WebM）。他们之所以被选中，是因为他们支持构建语义网站的元素和属性，与浏览器，平台或操作系统的兼容性更强，编码算法也更复杂，并且在质量，时间和规模之间取得更大的平衡。现在我们将解释他们的特征以及他们对我们研究的可用性。

A. Ogg（Theora）

它由Xiph.org开发。 Ogg容器格式可以将视频，音频，字幕和元数据的多个独立发射与视频编解码器（Theora）进行复用，从而带来损失[15]。自2007年以来，它已被纳入到大量的软件库中。但是，有些仍然不包括它。 Ogg算法框架的编码从一个名为Ogg Page的标题开始，具有媒体文件的信息和元数据（版本，标题类型，位置，序列号和页面帧序列号或段映射）。然后它使用段，它们是一组创建数据路径的数据包[8]。

B. Mp4（H.264）

它由运动图像专家组（MPEG）和视频编码专家组（VCEG）开发。 MP4视频编解码器也被称为H.264 / MPEG-4 AVC（高级视频编码），它是视频录制，编码和分配最常用的编解码器之一[9] [10]。它是一个面向块的运动补偿视频压缩标准。它通常用于有损压缩。它被创建为能够以比以前的标准更低的比特率提供良好的视频质量。

C. WebM（VP8）

它是由Google于2010年开发的，目的是为了克服诺基亚，微软和苹果对Ogg Theora所带来的问题。它基于开放源代码，并采用Matroska的视频编解码器VP8，最近更新为VP9，采用容器格式。开发人员正在寻找比以前版本压缩50％，但保持相同的视频质量。 VP8具有与H.264相同的视频质量，但空间大大减少，因此它是编解码器基础的重要候选者。

此编解码器审查提供了主要浏览器使用的主要编解码器的全貌。 Mozilla和Opera对Mp4表示不感兴趣，因为H.264的年费对他们和用户来说都是过分的，另外还因为它打破了开放源代码的网络概念。两者都在他们的浏览器中实现了WebM和Ogg Theora。 Apple的Safari和微软的Internet Explorer仅适用于MP4。谷歌浏览器与三者兼容。

还有其他编解码器，如Dirac，Xvid或ProRes。然而，Mp4，Ogg和WebM是在制定互联网标准时选出来的，因为它是视频编码领域的主要公司使用的。此外，它们支持具有FFmpeg或X264库的不同压缩平台，同时在编码时间，质量和尺寸之间具有良好的平衡。

图1 用户请求视频时系统过程的概述

4.测试台的描述

为了开始测量，我们拍摄了一个没有任何压缩类型的原始视频。然后，我们使用不同的编解码器和比特率对其进行压缩，并测量压缩文件的大小和压缩时间。这些数据让我们分析并得出关于使用的编解码器的结论。

图像序列取自具有以下规格的Blackmagic Cinema相机：拍摄分辨率：1920x1080 ProRes和DNxHD，有效传感器尺寸15.81mm x 8.88mm，动态范围13档，存储类型可拆卸2.5“SSD，SDI视频输出1x10位HD-SDI 4：2：2，可选择电影或视频动态范围。当SDI叠加关闭时，记录设置为25p或29.97p时，SDI输出格式分别为1080i50和1080i59.94。

用于数据处理，测量和编码的计算机是一台配有QuadCore AMD Phenom，2000 MHz处理器的HP Pavilion dv6笔记本电脑。 ACPI体系结构基于X64的PC（移动）AMD M785，带有2GB DDR3-1333 DDR3 SDRAM和缓存L1（512 Kb）L2（2048 Kb）的AMD K10。使用的操作系统是带有DirectX 11.0的Microsoft Windowsreg;7 SP2。此外它还拥有ATI Mobility Radeon HD 5650 1024MB图形卡，AHCI 1.0串行ATA，网络Atheros AR9285 802.11b / g Wifi适配器和Realtek RTL 8168D / 8111D PCI-E千兆以太网。用于文件编码的软件是VLC媒体播放器2.1.3 RinceWind。我们放弃了Sorenson Squeeze Premium 9.0.2.81，因为它仍然不支持Ogg编码。用于执行我们的测试的视频具有下面的特征：

视频文件大小：597 MB
持续时间：6s 298ms
比特率：795 Mbps
色彩空间：YUV
帧大小：1920像素（宽）x 1080p像素（高）
方面：16：9
帧率：NTSC 29,976
色度子采样：4：2：2
压缩损失：较少的模式。

在图1中示出了由多个用户请求多媒体资源的过程。所有用户将对服务器执行http请求，以便查看视频内容，服务器将根据用户的浏览器提供适当的视频。 HTML5通过浏览器实现书店（x264，libtheora和ffvpx），方便播放服务器发送的视频。我们将在下一节详细介绍系统。

为了实时转码每一秒的视频，它必须在不到一秒（或最多一秒）内进行编码。当文件被转码时，原始文件（源）被编码到另一个编解码器，该编解码器可以具有相同或更低的比特率，但具有相同的持续时间，色度子采样和帧速率。我们的目的是设计一种算法，考虑到能够实时流式传输视频所需的特性。这些是最终用户所需的参数：

最终用户的比特率。它可能低于源文件。
最终用户的帧速率。它取决于地理区域：对于逐行倒相（PAL）和高清（SECAM），它是25fps（帧每秒），而对于全国电视制式委员
全文共14319字，剩余内容已隐藏，支付完成后下载完整资料

资料编号：[14652]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可： Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版

注册

找回密码

一种新的使用HTML5的异构网络IP视频传输系统外文翻译资料

1.引言

2.相关工作

3.HTML5中主要编解码器

A. Ogg（Theora）

B. Mp4（H.264）

C. WebM（VP8）

4.测试台的描述

您可能感兴趣的文章

登录

注册

找回密码

1.引言

2.相关工作

3.HTML5中主要编解码器

A. Ogg（Theora）

B. Mp4（H.264）

C. WebM（VP8）

4.测试台的描述

您可能感兴趣的文章