电子设备基于PDCA循环的可靠性设计*

2014-03-29 16:13生建友翟助群
电讯技术 2014年1期
关键词:元器件可靠性故障

生建友,翟助群

(1.总参第六十三研究所,南京210007;2.海军装备研究院,北京100073)

1 引言

电子设备的可靠性设计是一项非常复杂的任务,从时间节点来说,有论证、方案、样机研制和设计定型等阶段,从内容上说,有策划、设计、验证、确认等活动,从涉及到的部门来说,有主管部门、研发部门、质管部门、采购部门、保障部门等,从涉及的人员来说,有产品设计师、可靠性师、工艺师、标准化师以及质控、采购等保障人员。如何全方位地采取措施进行设备的可靠性设计?仁者见仁,智者见智,有的从设计角度进行研究,有的从管理角度进行分析,有的从使用维护角度进行探讨,缺乏统一认识和对策。随着全面质量管理的贯彻实施,以“过程”为基础的“过程方法”逐渐被人们熟悉并广泛运用。PDCA循环这一“过程方法”作为科学的工作程序为有序开展可靠性设计工作提供了有效途径。它强调高效与合理的过程控制,强调在循环过程中不断自我发现、自我调节、自我完善,通过对过程的控制而实现预期的目标。本文结合PDCA循环的这一特点,就如何运用PDCA循环模式进行电子设备的可靠性设计展开讨论。

2 PDCA循环概述

所谓“过程方法”就是系统地识别和管理组织所应用的过程,特别是这些过程之间的相互作用[1]。PDCA循环是由美国质量管理专家戴明博士首先提出来的,由计划(Plan)、执行(Do)、检查(Check)和处理(Action)的4个英文首字母所组成,又称戴明环。其含义是工作之前要进行策划,做好顶层设计,以满足顾客要求,提高质量,取得最大经济效益,然后将策划的输出(计划)付诸实施,进行具体的分析计算和工程设计,再对计划的执行情况和实施效果进行检查,通过具体的过程调试、测试、试验、评审等活动,及时发现实施过程中问题,最后对检查的结果进行总结、处理,巩固成绩,纠正错误,防止再度出现同样问题。它不仅是一种质量管理方法,也是一套科学的、合乎认识论的通用办事程序[2]。以下就基于PDCA循环的管理、控制模式,从可靠性策划、实施、检查和处置等4个方面详细讨论电子设备的可靠性设计问题。

3 可靠性策划

PDCA循环强调策划在先,从源头抓起。可靠性策划是确保可靠性设计达到预期目标、满足顾客要求的基础,是开展可靠性工作的依据,其主要任务是明确目标,制定计划,并确定具体的执行措施。为确保策划结果的科学性、准确性、实用性、可行性,应做好以下工作:

(1)进行大量调研,与顾客充分沟通,弄清楚设备的用途、特点、技战术指标与功能要求、使用环境等,根据相似设备的研制信息以及设备的研制经费、复杂程度等确定设备的可靠性定性、定量要求;

(2)根据设备特点和复杂程度以及单位的实际情况,建立可靠性工作组织,明确可靠性组织的职责、负责人和组成人员,明确各成员的分工和职责;

(3)按照GJB450A的相关要求,明确可靠性工作项目,结合设备研制的阶段划分,制定可靠性工作计划,确定各阶段的工作内容和完成时间;

(4)按照有关国军标要求和设备研制的实际情况,制定可靠性设计原则;

(5)根据设计原则、人员分工、设备特点等确定具体的可靠性实施措施,按照质量管理的有关要求,明确各阶段可靠性工作的检查内容和准则。可靠性策划的结果就是形成可靠性保证大纲、元器件大纲、可靠性工作计划和工作项目等顶层设计文件。

4 可靠性实施

实施是PDCA循环的关键环节。可靠性实施就是按照可靠性保证大纲、可靠性工作计划的要求进行可靠性分析计算、可靠性方案设计、可靠性图样和工程设计等活动,是实现设备可靠性指标的关键阶段。

4.1 可靠性分析计算

可靠性分析计算是进行可靠性工程设计的基础,是检验设备可靠性水平是否达到指标要求的重要手段。

4.1.1 可靠性分析

可靠性分析是利用归纳、演绎的方法对可能发生的故障进行研究,分析故障的原因、后果和影响及危害程度,确定薄弱环节,为设备的整体设计提供改进建议[2]。常用的分析方法有:故障模式、影响及危害度分析(Failure Mode Effects and Criticality Analysis,FMECA),故障树分析(Failure Tree Analysis,FTA),潜在通路分析(Sneak Circuit Analysis,SCA),电路容差分析和可靠性关键件与重要件分析等。

FMECA在FMEA(Failure Mode and Effects A-nalysis)定性分析的基础上对故障模式的危害程度进行量化,它由“下”往“上”进行,分析时应列出每一个零部件、元器件、模块可能产生的故障模式,针对各种故障模式及其影响,找出故障原因,提出补救或预防措施。FMECA是一项重要的基础性工作,根据FMECA分析结果,可以确定所有灾难性和严重性的故障事件,因此,FMECA也是进行维修性、保障性、测试性和安全性设计的一项重要内容,是可靠性关键件与重要件分析的依据。FTA由“上”往“下”进行,其分析流程是:选择顶事件→建造故障树→定性分析和识别故障模式→定量计算事件发生的概率→确定薄弱环节→采取必要的改进措施。SCA假定所有电路单元都正常工作的情况下,分析那些能引起功能异常或抑制正常功能的潜在电路,对于解决电路单元的设计缺陷十分重要。电路容差分析通过对电路单元及其组成器件在规定的使用温度范围内其参数偏差对电路模块和整机性能的影响分析,提出相应的改进措施,在研制经费、周期等允许的情况下尽量增加设计的容差和参数漂移的范围。可靠性关键件与重要件分析从设备的功能、性能要求出发,找出危及人员、设备安全和使设备不能完成主要任务的单元和器件,并制定相应的质量控制措施,从采购、设计、验证等环节采取综合保证措施。

4.1.2 可靠性计算

可靠性计算主要包括可靠性建模、可靠性分配和可靠性预计。建模是进行可靠性分析、分配、预计和评价的基础。建模时,应认真分析、研究设备的任务定义、寿命周期以及工作原理图,确保影响设备可靠性的每一个元件都不遗漏,包括导线和电连接器等,确保模型中所有组成部分的故障率都是相互独立的,最终确保可靠性分配、预计值的科学性、准确性。具体的分配和预计方法参见相关文献。在方案阶段,通过计算合理地确定设备各组成单元的可靠性指标,对关键和重要单元要投入较多的精力和经费,减少设计的盲目性;进行方案比较,综合考虑设备的性能、功能和研制经费、周期等因素选择最佳方案。在样机研制阶段,通过计算可以发现影响设备可靠性的主要因素,找出薄弱环节,以采取相应措施来降低失效率,为可靠性增长试验、验证试验等提供依据。

元器件是组成电子设备的最小单元,由于其数量、品种众多,它们对整个设备的性能和可靠性影响极大。样机研制阶段,设备所用元器件的应力情况比较清晰,应采用元器件应力分析法对所有器件和组成单元以及整机进行可靠性预计,以检验设计的合理性以及与规定要求的符合性。实践证明,采用元器件应力分析法进行可靠性预计,虽然工作量大,但能比较准确地估计出设备的可靠性水平。

4.2 可靠性方案设计

可靠性设计方案涉及需要采用的标准、技术、元器件、材料、加工与组装工艺等众多内容,通过评审的设计方案,决定了设备的可靠性水平。

制定可靠性设计方案时,应根据设备的总体技术方案、组成结构、使用环境、装备数量等综合考虑,可靠性设计方案如何拟制和详细内容参见文献[3]。不同种类的设备其可靠性设计方案也不同,但其设计思想应是一致的。

(1)简化设计

从源头上抓起,在确保设备满足性能指标的前提下,尽量简化设备的电路和结构,使每个部件都成为最简设计,最大限度地减少材料、元器件、零部件的种类、数量。

(2)模块化设计

合理划分设备的组成模块和单元,尽可能多地选用通用模块,电路设计尽可能采用标准化单元电路或成熟电路。

(3)一体化设计

将可靠性设计与维修性、保障性、测试性、环境适应性、安全性、电磁兼容性设计等结合在一起,采取综合措施。它们看起来是相互独立的,其实是相互影响的。维修性好则维修时间就短,设备的正常工作时间就长,可靠性必然好;测试性好则故障检测时间和故障检测率就高,故障的排除时间就短;环境是影响设备作战性能的主要因素,环境适应性好则设备承受环境应力的能力就强,就会少发生故障;保障性好则设备就能长期保持可用状态,即使发生故障,由于维修规范、保障到位,维护保养后也能迅速重新投入战斗;安全性好则设备发生事故的概率就低;电磁兼容性不好则设备受电磁干扰后不能正常工作甚至工作瘫痪的概率就大,可见它们都直接影响到设备的可靠性。

4.3 可靠性工程设计

可靠性工程设计主要包括整机的可靠性一体化设计、元器件的控制和设计。

4.3.1 元器件的质量控制与设计

资料表明,在电子设备现场使用的故障原因中,元器件失效约占50%,其中元器件的选择或使用不当又占了30% ~50%[4]。因此,设备研制中应对元器件的选型、采购、验收等进行规范和管理,对电路中使用的元器件进行降额和容差设计。

(1)质量控制

按照《元器件可靠性保证大纲》要求明确元器件的型号、规格和质量等级,并在合格供方采购,同时,应考虑器件未来的淘汰问题,明确替代方案;按照《元器件检验规定》要求做好元器件的入所检验工作;根据《元器件老炼筛选规范》要求做好元器件的筛选工作,剔除由于制造缺陷引起早期失效的元器件,确保装机元器件的可靠性;元器件装机前严格按照《元器件存放规定》要求对存放环境的湿度、温度、静电等加以控制。

(2)降额设计

依据《电子元器件降额设计准则》要求降低元器件使用时的应力条件,进行降额使用,使元器件的工作电压、温度特性、电特性参数等在减额负荷下工作,从而降低元器件在各种应力条件下的失效率。应注意的是元器件的降额范围要合理,且增加设备的重量、体积、成本不多。

(3)容差与漂移设计

电子元器件由于制造、老化原因、使用时的应力以及电路的输入匹配等因素,会引起电路性能参数偏差、漂移,而使设备产生故障。因此,在进行电路设计时,应充分考虑到元器件的参数公差及参数随环境变化而漂移的结果,即使元器件发生较大的性能漂移但仍然能满足工程的要求,使设备处于良好的工作状态。

4.3.2 整机可靠性一体化设计

以可靠性为主的多学科一体化设计是近年来应用比较广的新的设计技术[5]。将可靠性设计与维修性、保障性、测试性、环境适应性、安全性(简称六性)与电磁兼容性设计、结构设计等进行综合考虑,利用CAD(Computer Aided Design)系统建立整机模型,从中提取整机的结构组成、性能和设计指标等信息,进行力学、传热学、电磁学等仿真和评估,建立可靠性模型,形成可靠性综合优化设计。然后以此模型为基础,进行潜在故障和事故分析以及维修保障仿真分析,再根据分析、评估结果找出设计上的薄弱环节,有针对性地采取措施,如简化结构,增加设计裕度,减小传热热阻,减振缓冲,屏蔽和滤波,优化布局,减少电磁发射功率,增加故障检测装置和测试点,采取防差错、防静电措施等,提高设备“六性”水平和电磁兼容性能力。

4.4 图样设计

图样设计是方案和工程设计的具体化,经过批准的设计图纸决定了所用材料、元器件的型号、规格,决定了需要用的制造和装配工艺,后续的检验、试验都是为了实现设计的图纸和技术要求。图样设计若存在缺陷将严重影响设备的制造和使用,影响设备的固有质量和可靠性水平。为此,图样设计时应重视以下几点:一是严格按照设计方案选择材料和器件;二是图纸符合有关机械和电路制图的标准,避免由于图纸设计不规范而加工出错;三是设计尺寸和图形符号准确,尺寸公差合理;四是技术和工艺要求明确;五是总装配图应清楚表达各组成件的位置、数量和装配关系,接线图和线缆连接图上各组成件的相对位置和标注的项目代号、端子号、导线号等正确、完整;六是严格执行图纸的审核、会签制度,确保图纸的正确性。

5 可靠性检查

检查是PDCA循环的重要一环,采用评审、验证和确认等检查活动来发现问题。设备研制过程中与可靠性有关的检查工作主要有:可靠性保证大纲、可靠性工作计划、可靠性设计方案等的评审活动,可靠性关键技术的比较、仿真、验算以及设备的过程调试和试验等验证活动,产品试用和可靠性鉴定试验等确认活动。评审是检查的主要工作之一,应按照可靠性工作计划的安排,在研制的各个阶段邀请相关专家对可靠性工作进行评审,可靠性评审的具体内容参见文献[6-7]。试验是最直接、有效的验证方法,也是装备研制过程中使用最多的,包括功能试验、性能试验、烤机(负荷)试验、应力筛选试验、环境试验、电磁兼容性试验、可靠性试验以及系统联试等,通过对试验数据和原始记录进行整理、分析和处理,找出故障原因并采取改进措施,促使设备可靠性切实得到提高。设备研制完成后应进行可靠性鉴定,确认设备的可靠性状态。评审的目的是识别可能存在的任何导致设备可靠性设计结果不能满足研制要求的问题,并提出解决办法;验证的目的是提出客观证据,证明可靠性设计过程中某项活动结果的正确性;确认的目的是确定设备的可靠性水平是否满足用户要求。设备研制过程中,应按照研制节点和可靠性工作计划实时地做好可靠性检查工作,通过检查为可靠性处置提供数据和证据。

6 可靠性处置

处置是PDCA循环的升华过程,没有处置就没有提高。可靠性检查的结果是可靠性处置的依据,对检查中出现的问题,详细分析原因,制定相应的纠正措施并及时处理;对成功的经验加以肯定并固化,形成标准或规章制度。对设备研制过程中出现的故障严格按照质量管理要求实施闭环和归零,即故障定位准确、机理清楚、故障复现、措施有效、举一反三。建立元器件信息库和故障报告、分析与纠正措施系统(Failure Report Analysis and Corrective Action System,FRACAS)是进行可靠性处置的重要内容。

6.1 建立元器件信息库

装备承制单位应加强元器件信息的管理,收集所用的元器件信息,建立全面、准确、及时的信息库,包括元器件的型号、质量等级、生产厂家,元器件入所检验数据,器件筛选及失效分析数据,元器件在调试、试验和试用、使用中的失效信息等。元器件信息库应作为单位的公共信息平台,并对收集到的元器件信息尤其是失效信息进行分析,为电路硬件设计、元器件应力分析等提供依据,这项工作很多单位做得都不是很好。

6.2 建立故障报告、分析与纠正措施系统

可靠性设计过程中,应重视过程控制,建立故障报告、分析与纠正措施系统。故障报告、分析和纠正措施系统应包括:FRACAS的组织和工作程序;故障信息;采取的措施办法,尤其是对关键件、重要件出现的故障提出的纠正措施。FRACAS既能及时发现设计上的薄弱环节,改善设备性能,又能对设备未来的使用有预防作用,也能积累经验,为类似产品的设计和故障模式及影响分析提供更准确、完整的信息,做到举一反三,防止同样故障在其他型号出现。为确保FRACAS的真实性、连续性和完整性,对设备寿命周期内的所有故障信息均应详细记录下来,包括故障地点、故障时间、故障现象、故障部位等。随着时间的推移,FRACAS能真实反映出设备的可靠性趋势,是单位宝贵的经验知识库、案例库,是提升整体设计和设备可靠性水平,避免故障重现的好教材。建立FRACAS设备研制过程中进行可靠性分析与评价的基础,是设备《可靠性分析评价报告》的重要内容。

7 结束语

将PDCA循环应用于电子设备的可靠性设计,通过科学策划、全面实施、完善设计、强化检查、及时处置等措施,来识别设计存在的缺陷和不足,防止故障的产生,并提出必要的改进措施,控制故障发生的概率,纠正已经发生的故障,确保影响可靠性的每一个过程都能得到有效控制与管理,不断提高电子设备的可靠性水平。以上只是作者将质量管理中的“过程方法”——PDCA循环应用于电子设备可靠性设计的一些个人看法与设计体会,如何将PDCA循环与性能、可靠性设计有机融合在一起,同步提高设备的性能、可靠性及质量水平,是产品设计师和可靠性师需要进一步探讨并实践的课题。

[1]GJB 9001B-2009,质量管理体系要求[S].GJB 9001B-2009,Quality Management Systems Requirements[S].(in Chinese)

[2]苏秦.质量管理与可靠性[M].北京:机械工业出版社,2008.SU Qin.Quality Management and Reliability[M].Beijing:China Machine Press,2008.(in Chinese)

[3]生建友.军用电子设备研制过程中的可靠性工作[J].舰船科学技术,2011,33(1):122-126.SHENG Jian-you.Reliability Work among Developing Military Electronic Equipment[J].Ship Science and Technology,2011,33(1):122-126.(in Chinese)

[4]赵洪杰,于慧.军用电子设备研制中元器件的质量与可靠性管理[J].微电子技术,2002,30(2):47-49.ZHAO Hong-jie,YU Hui.Quality and Reliability Management of Components for Military Electronic Equipment Development[J].Microelectronic Technology,2002,30(2):47-49.(in Chinese)

[5]胡云.机载电子设备可靠性与结构一体化设计方法[J].电讯技术,2012,52(9):1532-1536.HU Yun.Reliability and Structure Integrated Design Method for Airborne Avionics[J].Telecommunication Engineering,2012,52(9):1532-1536.(in Chinese)

[6]GJB 450A-2004,装备可靠性工作通用要求[S].GJB450A-2004,General Requirements of Reliability Work for Materiel[S].(in Chinese)

[7]生建友.军用电子设备的可靠性管理[J].电讯技术,2012,52(1):96-101.SHENG Jian-you.Reliability Management for Military E-lectronic Equipment[J].Telecommunication Engineering,2012,52(1):96-101.(in Chinese)

猜你喜欢
元器件可靠性故障
元器件国产化推进工作实践探索
故障一点通
可靠性管理体系创建与实践
合理使用及正确测试以提升DC/DC变换器可靠性
装备元器件采购质量管理与控制探讨
基于DSP+FPGA的元器件焊接垂直度识别方法
5G通信中数据传输的可靠性分析
奔驰R320车ABS、ESP故障灯异常点亮
炭黑气力输送装置主要元器件的选择
故障一点通