9

失效物理五十年

Author mosch    Category 可靠性技术     Tags

自从美国空军的Rome研究中心1962年组织一些列的失效物理(PoF)研讨会正式提出已经发展50年了。创立这个可靠性方法的驱动力始于美国军方20世纪40-50年代的电子产品可靠性系统发生的问题。然而在19世纪后期,也就是1870年A. Wohler总结了铁轨的疲劳试验结果后最终得出循环载荷相比最大载荷对产品寿命的影响更加重要,这帮助我们解决了机械产品的失效原因。在那之后的20世纪上半叶,很多的可靠性工作都和材料的疲劳和断裂相关(疲劳失效是第一次时间大战的主要问题)。例如Basquin在1910基于Wohler的疲劳试验数据提出应力和寿命(也被称为S-N曲线)的对数-对数关系;Griffith在1921提出了脆性材料的强度破坏理论;Miner在1945把Palmgren1924年提出的线性破坏的假设,在实际经验的基础上来进行金属的疲劳寿命计算。Epstein在1948发表了材料破坏寿命的统计学评估理论。

在第二次世界大战初期,据统计仓库中50%的空军电子设备无法满足军方的使用要求。1950年美国的国防部启动了一个为了解决电子产品可靠性的小组,这个小组的重点工作在于开发更好的元器件来提高元器件可靠性,建立元器件的定量可靠性要求,收集现场的失效数据来判断具体的失效原因。而由美国国防部在1952年8月份设立的电子设备可靠性顾问组织经常被认为是现代可靠性工程的开始。AGREE委员会建议对由于低可靠性而导致的较高的使用成本可以通过开展可靠性应力试验来控制,例如应用高低温、振动和其它的环境应力来了解失效的原因并最终进行修正。他们还建议结合置信度水平开展可靠性鉴定试验来预计设备的寿命。AGREE建议的可靠性技术被美国国防所采纳,随后也被美国的航空航天局(NASA)和众多其它提供高科技设备的单位所采纳。在这之后的20世纪50年代由几个技术论坛开始专注于不同的可靠性领域。其中一个在1955年开始的电子连接论坛强调了可靠性物理,它在后续的几年中通过持续的努力成为连接器可靠性物理的主要技术论坛。

从20世纪50年代到60年代早期,可靠性基于疲劳和断裂开展了很多工作。例如在1957年G.R. Irwin提出了Griffith理论来证明了材料的断裂是由于塑性变形导致。在1955年至1963年间Waloddi Weibull发表了多篇论文讨论疲劳和蠕变的模型,同时还介绍了疲劳和蠕变数据的分析方法。当Weibull作为美国空军材料实验室的顾问时,他于在1961年出版了一本关于材料疲劳试验的书。另外一个重要的事件是基于Irwin的应力强度因子的疲劳断裂的增长率预计方法。

在机械寿命模型(主要是疲劳和断裂的评估)和AGREE的推荐这样的大环境下,RADC在1961年提出失效物理项目来解决军用设备随着复杂度增加而导致的更高的失效。在1962年,贝尔实验室的研究员发表了一篇“高应力加速半导体器件失效”的论文,这篇论文用电子的理论阐述了Arrhenius模型,此模型可以用来对温度应力导致的半导体器件失效进行非常简便的评估。不久后,RADC和伊利诺伊州立技术学院(现在的伊利诺伊州立技术研究院)的Armour研究中心在1962年9月于芝加哥组办了第一届的电子产品失效物理研讨会。RADC和几个其它组织在这次研讨会为失效物理未来的研究和发展活动打下了坚实的基础。后续出现了众多的论文和理念来介绍、阐述和解释失效物理的观念和方法。

在第一届失效物理研讨会早期的一份失效物理论文Vaccaro(1962)提出失效物理必须研究材料基本的物理和化学特性(例如失效机理)和可靠性之间的关系。这个方法是基于消除所发生的失效必须解决其发生的根本原因的理念,也就是说如果我们需要完成这一工作就必须明白所发生失效的机理。Davis(1962)介绍了需要了解零部件功能失效的时间、环境应力和工作应力来明确产品可能发生的失效机理。他还建立了数学模型来表示这些失效率机理的关系以便来满足零部件的可靠性要求。很多企业和大学都实际参与并开展失效机理的研究工作。他们包括Raytheon、Syracuse大学和Motorola。尽管失效物理是零部件设计和可靠性提高的关键,但是当时引入失效物理所存在的一个关键问题是人力和设施成本的增加(Ryerson, 1962)。在第一次失效物理研讨会上失效物理关键参数的方法都得到了明确,例如失效模式、失效机理和失效原因(Earles and Eddins, 1962)。

由于1962年第一届失效物理研讨会的成功举办,直到1966年又持续举办了四届失效物理研讨会,期间众多的论文介绍了失效物理的概念。例如,Tamburrino(1963)提出了可靠性物理项目的要求,例如材料、检测技术和失效机理。零部件供应商的失效物理知识的要求进一步明确,如果现有零部件的生产流程或者工艺的任何改变可能会成为引入新的失效机理的关键因素,则必须和可靠性工程师进行紧密合作。Bretts, et al.(1963)通过物理退化模型来评估失效失效时间来给出了电阻的加速试验结果。这时失效物理已经被作为加速试验和评估计划的基本步骤之一。

在第三届失效物理研讨会上Ingram(1964)从统计的角度介绍了产品性能参数和失效机理。他建议“对产品所有适用的环境应力条件的性能和强度参数通过多维的分布函数进行建模。通过综合这些分布函数可以对产品进行定量可靠性评估”。Beau(1964)介绍了人为因素管理评估的失效物理方法。他提出三种会导致失效的原因:设计的固有可靠性、工程生产制程的可靠性退化和由于人造成的可靠性退化。基于Beau的理论,工厂的操作人员由于错误的操作或者较低的工艺水平都会在设备可靠性中引入人为因素。Workman(1964)和德州仪器先后介绍了失效分析的案例来说明如何通过失效分析所获得的信息来开展可靠性测试设计、流程控制和产品设计。

Shiomi(1965)提出了广义累计退化模型来针对不同应力条件下的零部件寿命进行评估。Partridge, et al.(1965)认为半导体供应商必须对他们自己的产品基于工程评估的可靠性水平来开展筛选。同时他们在上面的基础上又提出并不能够仅仅通过供应商的验证试验来决定供应商所能够提供高质量产品的能力,产品生产制造中的筛选、老化、组装、测试、存储、工作应力或者其它零部件失效所导致的失效都不应该被忽视。Church和Roberts(1965)发表了零部件失效的不同原因的文章,其失效可能由生产、组装、测试或者存储中的意外导致,也有可能是工作应力或者其它零部件的失效导致。

Thomas(1966)使用多维分析的基本理论来开展数学模型的一般性检查,例如Eyring模型。他指出信号噪音和多维变异可以用来描述数学模型、物理定律和统计分布。Schenk(1966)发表了两份民用半导体二极管失效机理的表单,并且对功能的差异、应力和测量误差做了深入研究。另外还有多份论文讨论了基于失效物理的非破坏性筛选和检查方法,这些方法最终成为了产品故障诊断与健康管理的理论基础。例如,Gill和Workman(1966)发布了基于更高应力试验发现的失效和失效分析结果的可靠性筛选流程(包括破坏性试验和非破坏性检查)。Potter和Sawyer(1966)发表了一种非破坏性的光学扫描技术来研究不同的半导体产品状态并确定产品异常的原因来提高产品的可靠性。

IEEE从1967开始赞助可靠性物料研讨会(IRPS)来供大家分享众多领域的失效物理相关研究成果。
例如,Ryerson(1967)发表了半导体二极管关于失效机理、零部件强度、应用应力和产品失效率之间数学模型。Payne(1967)发表了钛酸钡介质电容失效机理的失效物理研究。Frankel和Kinsolving(1970)讨论了零部件极限环境的可靠性试验需求,首先通过对现场条件的仿真再在实验室开发加速应用条件。Hollingshead(1970)介绍了通过编辑和处理必要的数据来优化不同系统应用下的零部件可靠性和质量水平的选择。其中可能比较的性能参数有维修成本、存储时间和失效的成本等。Schwuttke(1970)展示了半导体晶圆的不良率可以通过对晶圆的冷却来解决,这种方法对于温度梯度同样有效。

IEEE的可靠性物理研讨会在20世纪的70到80年代持续推广失效物理知识。电子零部件的多个数学模型和失效机理被公开发表,例如电容、半导体、电阻和内部互连。金属化、金属效应和焊接主导了可靠性物理研讨会的主要演讲和论文。例如,Black(1974)发表了电子迁移时间和失效之间的预计模型;et al.(1975)介绍了快速温度循环是三极管金属化失效的关键应力之一;Crook(1979)发表了基于工作应力和环境应力的半导体电迁移、时间相关介电层击穿模型;Lloyd(1983)发表了多层结构对电子迁移的影响的初步分析;Hieber和Pape发表了蠕变断裂计算方法来计算所施加机械应力和温度条件下的断裂时间;Chen, et al.(1985)发表了基于二极管击穿失效物理的薄膜删极二极管和隧穿二极管的击穿定量模型。Christou, et al.(1985)发表了高电子迁移率晶体管的可靠性研究结果;Conrad, et al.(1988)发表了一种方法来跟踪和预计早期寿命的失效机理。另外我们也看到在这段时间失效物理技术和实际使用有很大的降低,从20世纪90年代开始失效物理研讨会又持续发表了很多失效物理相关的出版物直到现在。

在20世纪80年代后期到90年的早期,在IEEE可靠性物理研讨会之外出现了多个失效物理相关研究的出版物。例如,Pecht, et al.(1990)提倡使用采用失效物理的方法来进行可靠性评估而不是传统的可靠性预计方法。Dasgupta和Pecht(1991)发表了一系列的论文来讨论材料的失效机理和破坏模型。Engel(1993)发表了机械磨损模式和机理的失效模型。 Cushing, et al.(1993)(美国国防材料系统分析项目)比较了以经验为基础的传统可靠性预计方法(例如MIL-HDBK-217)和失效物理可靠性预计方法,他们发现MIL-HDBK-217存在多个局限,而这些问题都可以采用失效物理方法来解决。

尽管失效物理的研究多发表于二十世纪90年的和二十一世纪,但是从二十世纪90年代开始概率开始得到更多的重视。例如,Hu, et al.(1991)发表了微电子引线焊接的热疲劳可靠性预计的统计方法。Mendel(1996)正式提出概率失效物理作为一门学科,其主要是基于失效物理来建立失效概率模型,他同时介绍了一个具体的可靠性设计的概率失效物理应用案例。不久,Modarres, et al.(1999)同样强调了失效预计的概率问题是因为失效模型和相关参数的不确定性,随着工作应力、环境应力和使用条件的变化,导致失效的应力也会发生变化。在二十一世纪早期出现了多个概率失效物理的出版物。例如,Haggag, et al.(2000)发表了基于典型失效的活化能分布的高性能芯片可靠性保障方法。Hall和Strutt(2003)发表了基于零部件参数和模型不确定性的零部件可靠性概率失效物理模型。Azarkhail和Modarres(2007)发表了采用贝叶斯框架的基于失效物理的可靠性模型。Matik和Sruk(2009)强调了需要对失效物理引入概率来解决生产过程中的变异对失效的影响。Chatterjee和Modarres发表了一种概率失效物理方法来开展基于失效物理、环境条件不确定性、结构尺寸、材料特性、失效物理模型和模型参数的高级核电站蒸汽机管路断裂评估。

另外一个失效物理的重要里程碑是可靠性信息分析中心(RIAC)于2008年出版微电子系统失效物理手册(Salemi et al., 2008)一书。 这是第一本通过综合考虑不同的失效机理,基于失效物理微电子系统可靠性评估和验证方法的书籍。另外一个重要的活动是由RAIC支持现在仍然可以访问的网络开发项目(失效物理模型网站-WARP)。WARP的目的是为了手机屏分析重要的失效物理模型的参数来提供一个研究人员和工程师可以访问的集中的数据库,其中包括电子、电气和机械零部件。

在我们庆祝失效物理50周年时,我们必须特别感谢RADC单位,其中包括他的主席和创立者Joseph J. Naresky,在他的领导和Joseph Vaccaro的协助下第一届失效物理研讨会被命名为“电子产品失效物理”并于1962年举办。我想特别强调的是,很多早期的观点在失效物理研讨会中被提出依然对我们现在理解电子产品的失效有着巨大的影响并提供了产品寿命关键参数的评估模型。正如我们在1962年的失效物理研讨会上锁看到的,失效物理方法包含了多个学科,其中有可靠性工程、物理、金属学和数理统计。20世纪60年代的失效物理研讨会为非破坏性测试方法和提高了有限试验数据下的零部件可靠性评估提供了失效物理方法。即使失效物理分析非常复杂且成本很高,但是失效物理提供了最好的零部件、结构和系统可靠性的量化。作为一个高可靠性产品开发的方法,现在失效物理已经在很多国家和地区(例如日本、新加坡和台湾)的民用产品(例如微软)被大家所接受。让我们为过去50年所大侠的坚实的失效物理基础而致敬!

欢迎关注我的微信公众号

现在大家几乎都有微信,也越来越多的利用手机获取信息,为了让大家方便的获取我的博客内容更新,申请了微信公众号来进行博客内容的推送。欢迎大家关注我的微信公众号并进行互动。

微信公众号:mosch-reliability

weixin

欢迎联系我:

如果大家希望就可靠性或者其它方面进行交流,欢迎大家发邮件给我,我的邮箱是: m @ mosch . cn 。

链接表

功能