利用时钟裕度技术早期故障预测
时间:2023-09-25 22:56来源: 作者: 点击: 次计算机领域的超频技术已存在多年,其目的就是有意识地让系统超越工作极限,实现最大性能,但这通常会减少设备的使用寿命且难以保证系统的稳定性。许多系统设计人员都认为超频技术除了影响系统稳定性之外一文不值,但实际它也有一些潜在的好处:可以为我们确定实际系统总时序预算(TTB)裕度以及估算产品现场使用寿命提供有益信息。超频技术正在发展为一种称为“时钟裕度”的新技术,该技术可确保系统稳定运行。此外,本文还将探讨如何利用可编程时钟源来实现,确保在临界条件下的真正系统稳定性。
很多读者对上世纪80年代和90年代初期的PC平台可能记忆犹新,这种平台都带有一个所谓加速模式(turbo mode)按键。我喜欢按下加速模式按键,并观察显示数字的变化。可这些数字到底意味着什么呢?按下这个按键,首先是自我感觉良好,认为自己正在体验一种极限计算性能,可谓物超所值,毕竟当年的一部台式机价值2500美元。我也很清楚,要是觉得加速模式下性能不稳定,那么总可以返回正常模式,以确保整个系统的稳定性。坦率地说,实际上我从未在正常模式下工作过,相信其他人也一样。当然,加速模式是一柄双刃剑,人们一直批评它会造成系统崩溃,而且还会担心一旦风扇失灵,就会把CPU烧坏报废掉。
实际上,过去的加速模式就是我们今天所说的超频技术。其实基本概念并没变,都是要接近或超越系统的计算速度极限,将系统推到稳定与不稳定的边缘。想到超频技术时,总是自然而然地想到PC。除了超频技术带来的问题之外,能不能通过超频技术(即以超频为工具)找到系统的弱点呢?能不能通过一种结构化的“试验设计”,让逻辑中最薄弱的一环自动暴露出来呢?能不能通过超频技术来准确判断系统稳定与不稳定的确切临界点呢?我们的分析还会不会提供一些隐性的有价值信息,有助于推测系统老化影响带来的早期故障问题?如果认为超频的好处是让系统达到稳定工作的极限,那么降频又会怎么样呢?通常认为超频主要就是修改设置时间,而降频就是修改保存时间。要讨论超频或降频,就需要给系统“标称”响应定义一个参考基准。系统设计人员应当根据系统组件数据表提供的有关制造规范建立一个标称响应的标准。
总时序预算
首先介绍一些涵盖关于超频概念的新术语。总时序预算(TTB)与超频系统的稳定性条件密切相关。总时序预算是指系统能够实现的性能。根据这个定义,我们可以明确理性条件下系统的边界时序性能限定。总时序预算是指系统的整体边界性能极限条件下的,既包括超频和降频时的体验效果。我们往往要通过实践分析来获得总时序预算参数,数据表中的内容不能提供这种最大和最小容限规范。根据定义,数据表提供的是系统“标称”的时钟速度(位于最大和最小指标之间),是构成整体系统的设备选择的内在特性。在分析系统总时序预算的时候,会发现标称数值与总时序预算数值之间存在一定的性能差或者频率差。系统电压与温度都会影响总时序预算,为了获得一致性的结果,必须考虑这些影响因素。
始终裕度
时钟裕度(clock margining)也是一个有趣的术语。其含义包含的不仅仅是超频的概念。时钟裕度的概念是指我们通过全面的回归测试、根据总时序预算数据来探索并得出系统的稳定性参数。通过时钟裕度,让小部分软件超频运行,能全面了解系统的工作性能极限。可在产品寿命周期中隔一定时期就进行一次时钟裕度检测,了解实际性能与标称性能的差别,从而了解产品性能变化的趋势。这种趋势有助于估计系统什么时候会达到寿命终点。系统制造后不久,会进行一次参照时钟裕度性能差检测,这通常可建立起一个极限性能基准。随着产品的老化,在实际的测试中首次极限性能与标称的差距最大,以后每次检测都会发现差距在缩小。