对现场可编程门阵列(FPGA)原型机的特定用途集成电路(ASIC)电源和温度监控系统的仿真外文翻译资料

 2022-04-11 08:04

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


对现场可编程门阵列(FPGA)原型机的特定用途集成电路(ASIC)电源和温度监控系统的仿真

伊丽莎白格洛克,陈清清,乌尔夫施利希特曼,多丽丝兰西德尔施密特

摘要

系统运行期间可以使用硬件监控信息来提高系统的使用寿命和可靠性。这种监测信息包括功率,温度和处理器的老化状态。它们为系统提供有关当前硬件运行状况的相关信息。这些信息在资源感知计算概念中尤为重要,这些概念引入了自组织行为来处理大型MPSoC(多处理器片上系统):对于资源感知计算,资源根据当前需求进行分配。要找到合适的资源应用程序对并实现系统目标(如优化利用率),必须在资源分配期间考虑当前的硬件状态。

为了在设计阶段评估和优化资源分配策略,在ASIC实施之前通常需要FPGA原型设计。 ASIC实现和FPGA原型之间的功耗,温度和老化的演变是不同的。 FPGA原型应对基于目标ASIC设计的传感器数据作出反应,而不是FPGA的硬件状态。

本文介绍了用于基于FPGA的原型的仿真ASIC温度和功率监测系统(eTPMon)的设计。功率监控器的仿真方法是以指令级能量模型为基础的。为了模拟温度监视器,使用了热钢筋混凝土模型。

eTPMon可以为MPSoC原型提供有效负载分配所需的硬件状态信息(核心的功耗和温度),实现资源感知型计算目标。基于eTPMon数据,针对两片式资源感知型MPSoC系统评估了不同的操作策略和控制目标。由eTPMon提供的值来提取有关处理器老化的信息,这些信息可用于延长系统寿命。

关键词:电力监控,温度监控,ASIC监控仿真,在线监控系统

  1. 简介

由于功耗是通过摩尔定律预测来提高集成密度的限制因素,降低功耗的研究越来越广泛。随着MPSoCs(片上多处理器系统)变得越来越复杂,并且包括动态电源管理技术以及动态资源管理技术,对于设计时间(评估电源管理和资源分配策略)和运行时间(观察所有内核应用程序的功耗/能量消耗),电源监控的需求变得更加重要。

现代CMOS技术中的高功率密度影响芯片温度,这也取决于芯片及其封装的热导率。由于随着功率的增加,封装的散热能力与其成本之间存在非线性关系,所以不能提供价格合理的处理器封装,覆盖最坏情况的热点热场景。高温会降低电路速度并导致退化。温度以及电路老化取决于设备的工作负载。因此,如果工作负载在不同的电路模块中以非均匀的方式分布,则处理器通常会出现局部热点热点。这个问题在MPSoC中更为关键:非均匀温度分布不仅发生在单个核心内,而且也发生在不同核心之间。核心温度不仅取决于其自身的功率密度,还取决于相邻核心的活动和功率密度。因此,即使是相同类型的内核,其行为可能会有很大不同。

总的来说,这会影响芯片的寿命和可靠性。因为像负偏置温度不稳定性(NBTI)和热载流子注入(HCI)(这会增加MOSFET的阈值电压VT)等老化效应更强适用于高温。在现代技术中,NBTI被认为是器件可靠性降低和寿命受限的主要原因。电路老化对工作负载的依赖性导致器件老化程度不同。此外,并非所有电路在运行过程中都经历过最坏情况下的压力状态。最先进的设计采用基于最坏情况的安全余量(防护条带)来处理可靠性问题,通常不考虑设备退化的恢复效应。如果最坏情况很少发生,或者使用保守的安全余量,这可能导致功率和面积的大量浪费,以及不必要的性能下降。如[8]所述,退化机制的影响可以通过使用监测老化状态的测试结构来评估整个生命周期,也可以用来预测可能出现的性能故障,并对操作参数进行调整,例如通过增加可提高电路速度的耐压电压VDD。因此,可以减少过度约束的保护带,使设计在面积和功率系数方面更有效率。

需要对功耗和温度进行监控,以考虑核心本地和核心硬件状态。核心局部硬件状态由电源数据给出。温度数据提供核心的硬件状态,因为核心的温度受邻近核心活动的影响。此外,温度数据包含了过去使用的核心信息,因为热量演化要慢得多,考虑到以前的活动,而不是核心能量的演变。对老化影响的额外监测包含了更多关于过去使用年龄的信息,因为设备可靠性退化受过去操作的更长时间的影响。老化监视器可以不定期地运行以检测可能危及正确计算的老化。此外,如[8]中的老化监视器的实现将提供关于由监视器提取的电路级定时属性的附加信息,收集并传送到更高的系统层以确定剩余时间余量并诊断可靠性降低。

我们工作的目标是建立一个可用于MPSoC的FPGA原型设计的实时电源和温度监测系统。它必须在运行期间持续向系统提供当前的功率和温度值,而不会使系统过载。 由于MPSoC设计及其资源感知任务分配策略在最终ASIC实施之前需要进行评估和优化,因此FPGA原型中的仿真监控系统应该为目标ASIC实现提供数据特性,而不是原型设计平台。我们为ASIC功率和温度监测器开发了一种建模方法。这些用于仿真FPGA原型平台上ASIC监视器的行为。我们的主要成果是模拟电源和温度监测系统(eTPMon),具有以下特点:

  • 它提供实时ASIC实现特征化的功率和温度监测数据。
  • 它能够在赛灵思Virtex-6 FPGA平台上以高达80 MHz的速度提供周期精确的功率数据,并对基于LEON3的MPSoC计算架构进行原型设计。 该方法也可以很容易地适用于其他类型的处理器和技术。
  • 它提供了精确的温度值:当将该监测系统的最高温度与离线模拟进行比较时,所提出的监测系统的值与模拟结果的偏差最大为0.8°C。
  • eTPMon提供的温度和功率值可用于提取有关内核老化的重要信息。
  • 提出的监测系统针对示例性侵入式计算系统的不同使用场景进行详细仿真测试。

本文的其余部分组织如下:首先,给出了有关MPSoC架构中的监控和我们的样本架构(第1.1节)的详细信息。之后,我们解释了模拟ASIC监控系统(第1.2节)和相关最新工作(第1.3节)行为的。功率和温度监测器的仿真方法分别在第2节和第3节中介绍。第4节介绍并讨论了考虑瞬态温度变化的仿真温度监测器的扩展。我们在赛灵思Virtex-6 FPGA上实现eTPMon的结果将在第5节中介绍。在第6节中显示了整个计算系统中eTPMon的用法,用于不同的使用场景和控制目标。此外,本节讨论eTPMon用于建模老化效果。第7部分总结了本文,并展示了我们未来工作的展望。

    1. 资源感知计算中的监控

集成电路在不同部件之间(由制造期间的波动导致),随时间推移(由操作条件的波动或退化效应引起)以及空间上(例如,热点)而显着变化。 因此,不同内核的处理负载可能会有很大差异。对于导致内核处理能力与其降级漏洞之间存在显着差异的MPSoC系统。这会导致系统中的处理器,即使是相同类型的处理器的行为也会非常不同。这也可能在系统生命周期中改变。

对于具有例如大约80%的实际使用百分比的大型MPSoC系统,资源分配通常具有某种程度的自由度。通过有关当前物理硬件属性的信息,可以从当前可用的处理器中选择最适合正在运行的应用程序的最佳处理器。

处理大型MPSoC中的变化和不完善的一种方式是引入资源感知计算概念,如侵入式计算,它根据自组织方式的时间需求调整正在运行的应用程序的已分配资源数量(如内核)。通过在运行期间监控温度和功率,可以通过负载平衡来控制和限制它们,以避免热点,提高寿命和可靠性,并找到最适合的应用处理器对。 运行时资源意识对于具有不同处理能力的处理器而言变得尤为重要。

入侵计算体系结构的基本思想是在系统中引入自适应和资源感知编程:程序能够动态地指定它们在执行过程中所需的资源需求。这些要求可能会改变,因此可以请求新的资源,并且不再需要的资源可以提供给其他应用程序。

监视和使用监视器数据可以在资源感知计算系统中轻松完成,如[9]中介绍的入侵计算系统:入侵式架构具有不同类型的多个区块,如计算区块或内存区块。计算切片可能包含不同种类或数量的处理器。图1显示了这种计算图块的一个例子。为了在系统内分配监控数据,需要在应用程序,运行时支持系统(RTSS)和底层硬件之间建立一个闭环。在微创架构硬件扩展的入侵计算系统中,文献[10]中提出的动态多核i-let控制器(CiC)接管了硬件数据管理单元(DMU)的任务。资源分配是在入侵RTSS(iRTSS)和CiC之间密切合作完成的:iRTSS观察系统并代表应用程序处理分块资源分配,抽取监视信息,即监视不同类型的组合数据(例如,温度,老化状态和处理器负载)。 CiC通过处理分块本地监控数据,提供抽象监控信息和处理分块本地资源分配来协助iRTSS。将资源分配分割为本地(CiC)和全局(iRTSS)决策有助于减少系统内通信通道上监测数据的通信。

图1.具有处理器,数据管理单元(DMU),监视器和存储器的样板。显示应用程序,运行时支持系统(RTSS)和底层硬件之间的闭环。每个瓦片具有一个处理瓦片本地资源分配的DMU,考虑本地监视器数据。

    1. FPGA原型

设计阶段验证和设计参数调整通常需要FPGA原型设计。为了测试侵入式计算系统,在系统实施ASIC之前,实施了基于FPGA的原型。但是,通常模拟电路的监视器模块(如电源和温度监视器)不能直接在FPGA中实现,因为模拟电路无法用预制FPGA资源实现。

即使它们可以在FPGA中实现,与在设想的ASIC实现中获得的数据(设计优化应该基于来自ASIC的监视器数据)相比,在FPGA上的直接测量在功率和温度方面将显示出非常不同的行为。尽管如此,考虑到监控数据的资源分配程序必须通过ASIC监控系统的数据特性进行验证和测试。因此,开发了FPGA平台上ASIC监控系统的数据特性仿真,以有效评估系统在资源分配方面的行为和性能。在稍后的ASIC实现中,这些仿真监控系统将被模拟电路所取代。仿真监测系统满足监测数据的需求,以便用基于FPGA的原型评估资源分配策略。使用仿真监视器的另一个优点是不需要特别考虑FPGA原型的布局和布局:温度的演变主要取决于处理器块的选择位置。

    1. 相关工作

一般来说,功率建模和估算长期以来一直是设计阶段探索的重要课题。用于处理器FPGA原型设计的实时功率监视器仿真不仅需要功率建模和估计技术,而且还需要与实际功率监视器一样快,其运行速度与主处理器相同。参考文献[1] 建议附加硬件来模拟使用EDA工具进行RTL功耗估算的工作流程,与仿真相比,EDA工具可以提供10倍到500倍的加速。但是,由于其复杂性,这可能仍然比最终处理器原型慢得多。尽管如此,一些关于处理器功耗建模的相关工作有可能适用于我们的目的。参考文献[11] 讨论了一种基于FPGA的仿真方法,使用处理器组件的事件计数器来实现快速的早期功率勘探。参考文献[12] 讨论了一种基于指令的能量估计方法,用于基于指令集的模拟进行离线能量估计。这两种功耗模型都有可能用于实时功率监视器仿真,因为大多数表征和计算可以事先完成,并且在运行时只需要非常有限的计算。在本文中,基于指令的能量模型用于实时功率监视器仿真,因为与基于事件的模型相比,运行时需要更少的计算操作。

热建模离线完成,可以使用[13]中的详细模拟器或[14]中的虚拟平台。运行时的热探测依赖于[15]中的现有温度传感器或[16]中在主机上运行的热建模工具。尽管如此,这些解决方案可能比处理器原型慢得多。处理离线详细模拟的一些相关工作可适用于实时温度监测器仿真。参考文献[13] 讨论了用于模拟处理器温度的热RC建模方法。一些工作涉及这个计算非常密集的模型的改进版本(就计算成本而言),如英寸。但是,对于我们的仿真目的,执行离线模拟获得模型数据所花费的时间并不重要:在我们的案例中,离线模拟的小时数可以接受。对建模方法进行了深入的研究,并与有限元模拟器和测试芯片结果显示出良好的一致性。 在本文中,使用热RC模型来模拟实时温度监视器的行为。

据我们所知,这种实时功率和温度监测器,模拟ASIC监测系统的特性,用于单个或多个处理器系统的FPGA原型设计,尚未见文献报道。

  1. 功率监视器的仿真

本节介绍了本研究中使用的符合SPARC V8标准的LEON3处理器内核的FPGA原型的在线功率监测实时仿真方法。该方法基于存储在指令能量查找表(LUT)中的指令级能量模型,该模型包含LEON3内核的各种指令的平均能耗值。在运行时,对于每个进入的新指令,从LUT查找对应的能量值,然后在预定时间段积累。在每个时间段结束时,整个时期的累计能量值除以时间,从而产生该时期的功率值。在由多个处理器内核组成的完整MPSoC中,每个内核包含一个此类仿真电源监视器。由这些仿真功率监视器产生的功率值将被第3节中介绍的仿真温度监视器用来估计每个处理器内核的温度值。然后,功率和温度值将由监控数据管理和资源管理模块读取,以基于其控制的资源的当前状态(包括例如功率,温度,处理器核心负载和老化状态)来进行重新源分配决定。

图2. eTPMon对于四核的贴图的实现:只需要一个温度监视器和四个电源监视器(每个核心一个)

为了建立仿真功率监视器的指令能量LUT,每个指令的能量消耗值需要事先和离线地表征。对于表征,每种类型的指令都是在随机生成操作数的单个处理器内核的RTL仿真中连续执行多次。然后使用基于包含信号切换活动信息的值变化转储(VCD)文件(波形)的Cadence RTL编译器进行功耗分析。[12,18]也讨论了类似的方法。由于我们的方法使用大量随机生成的操作数来表征每条指令的平均能量消耗,所以未涵盖指令间效应(例如,添加指令的操作数的不同值可能导致不同的能量消耗)。 在极端情况下,指令间效应可能会导致高达25%的能量估计错误。但是,考虑到指令间的影响需要分析更多的信号,并大大增加了仿真的复杂性,这大大减缓了运行时监视数据的传送,并且实时仿真是不可能的。此外,这些极端情况在大多数应用中仅以低概率

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[467170],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。