高级统计方法(Advanced Statistical Methods) 比基本的统计方法更复杂的统计过程分析及控制技术,包括更高级的控制图技术、回归分析、试验设计、先进的解决问题的技术等。 计数型数据(Attributes Data) 可以用来记录和分析的定性数据,例如:要求的标签出现,所有要求的紧固件安装,经费报告中不出现错误等特性量即为计数型数据的例子。其他的例子如一些本来就可测量(即可以作为计量型数据处理)只是其结果用简单的“是/否”的形式来记录,例如:用通过/不通过量规来检验一根轴的直径的可接受性,或一张图样上任何设计更改的出现。计数型数据通常以不合格品或不合格的形式收集,它们通过p、np、c和u控制图来分析(参见计量型数据)。 均值(Average)(参见平均值Mean) 数值的总和被其个数(样本容量)除,在被平均的值的符号上加一横线表示。例如,在一个子组内的x值的平均值记为X,X(X两横)为子组平均值的平均值,X(X上加一波浪线)为子组中位数的平均值。R为子组极差的平均值。 认知(AwarenesS) 个人对质量和生产率相互关系的理解,把注意力引导到管理义务的要求和达到持续改进的统计思想上。 基本的统计方法(Basic Statistical Methods) 通过使用基本的解决问题的技术和统计过程控制来应用变差理论,包括控制图的绘制和解释(适用于计量型数据和计数型数据)和能力分析。 二项分布(Binomial Distribution) 应用于合格和不合格的计数型数据的离散型概率分布。是p和np控制图的基础。 因果图(Cause-Effect Diagram) 一种用于解决单个或成组问题的简单工具,它对各种过程要素采用图形描述来分析过程可能的变差源。也被称作鱼刺图(以其形状命名)或石川图(以其发明者命名)。 中心线(Central Line) 控制图上的一条线,代表所给数据平均值。 特性(Characteristic) 一个过程或其输出的明显特性,可按这个特性收集计量型或计数型数据。 普通原因(Common Cause) 造成变差的一个原因,它影响被研究过程输出的所有单值;在控制图分析中,它表现为随机过程变差的一部分。 连续的(Consecutive) 连续生产的产品单元,是选择子组样本的基础。 质量和生产率持续改进(Continual Improvement in Quality and Productivity) 一种可操作的宗旨,它充分利用公司内的人才,用不断提高效率的方式来为顾客生产质量不断提高的产品,从而归还受益者投资。这是一个动态的战略,使公司提高现在及未来市场条件中的能力。与任何静态的战略不同,它认为2(显然地或隐含地)一些特殊的不合格中不可避免的。 控制(Control) 用来表示一个过程特性的图象,图上标有根据那个特性收集到的一些统计数据,如一条中心线,一条或两条控制限。它能减少I尖错误和II类错误的净经济损失。它有两个基本的用途:一是用来判定一个过程是否一直受统计控制;二是用来帮助过程保持受控状态。 控制图(Control Limit) 控制图上的一条线(或几条线),作为制定一个过程是否稳定的基础。如有超出了控制极限变差存在,则证明过程受特殊因素的影响。控制限是通过过程数据计算出来的,不要与工程的技术规范相混淆。 累计和(CUSUM) 一种先进的统计方法,它利用当前的和最近的过程数据来检验过程均值中不大的变化或变异性,CUSUM代表偏离目标值的变差的“累积和”,它把当前和最近的数据看得同等重要。 探测(找出)(Detection) 一种被动(事后)型的策略,它企图在产品生产出来后发生不能接受的输出,并将其与好的输出分开(参见预防)。 分布(Distrbution) 描述具有稳定系统变差的输出的一种方式,其中单个值是不可预测的,但一组单值就可形成一种图形,并可用位置、分布宽度和形状这些术语来描述。位置一般用均值来表示,或者用中位数表示。分布宽度用样本的标准差或样本极差表示,形状包括许多特性,比如对称性及峰度,但经常使用常见分布的名称来概括,如:正态分布,二项分布,或泊松分布。 单值(Individual) 一个单个的产品或一个特性的一次测量,通常用符号X表示。 位置(Location) 分布中心趋势典型值的一般概念。 平均值(Mean) 一组测量值的均值。 中位数(Median) 将一组测量值从小到大排列后,中间的值即为中位数。如果数据库的个数为偶数,一般将中间两个数的平均值作为中位数。子组中位数是构成简单的有关过程位置的控制图的基础。中位数加波浪号(~)的符号表示;如X就是一分组的中位数。] 移动极差(Moving Range) 两个或多个连续样本值中最大值与最小值之差,这种差是按这样方式计算的:每当得到一个额外的数据点时,就在样本中加上这个新的点,同时删除其中时间上“最老的”点,然后计算与这点有关的极差,因此每个极差的计算至少与前一个极差的计算共用一个点的值。一般说来,移动极差用于单值控制图,并且通常用两点(连续的点)来计算移动极差。 不合格品(Nonconformity) 一个具体出现的不符合规范要求或其他检验标准的情况,有时称为缺陷。一个不合格品中能有多处不合格。(例如:一扇门也许有几处凹痕和缝,对化油器进行功能检验可发现一些潜在的不合格。分析产品不合格的系统,用c和u控制图。 正态分布(Normal Distribution) 一种用于计量型数据的、连续的、对称的钟形频率分布,它是计量型数据用控制图的基础。当一组测量数据服从正态分布时,有大约68.26%的测量值落在平均值处正负一个标准差的区间内,大约95.44%的测量值将落在平均值处于正负两个标准差的区间内;大约99.73%的值将落在平均值处正负三个标准偏差的区间内。这些百分数是控制界限或控制图分析的基础(因为即使整个输出的全部数据不服从正态分布,但其子组平均值趋向于正态分布),而且是许多过程能力确定的基础(因为许多工业过程的输出服从正态分布。) 可操作的定义(Operational Definition) 清楚地交流质量期望和性能信息的方式;它由以下三部分组成:(1)适用于某一个物体或一个组标准,(2)对这一个体或组进行一种试验;(3)一个决定:是或不是--这一个体或组是否符合上述要求。 排列图(Pareto Chart) 一种用于解决问题的简单工具,按照对成本或总变差的影响程序对各种潜在的有问题的区域变差源进行排序。一般情况下,大多数的成本(或变差)是由于少量原因造成的,所以解决问题的精力最好是优先集中在少量关键的原因上,而暂忽视多数不重要的原因。 泊松分布(Poisson Distribution) 应用于不合格数的计数型数据概率分布,是c和u控制图的基础。 预防(Prevention) 是一个主动(事前)型的策略,通过直接分析和改善过程本身来改进质量和生产率。预防是与持续改进的宗旨是一致的(参见检验)。 解决问题(Problim-Solving) 从症状分析到产生的原因(特殊的或普通的)再到改进性能措施的过程。可用的基本技术有:排列图,因果图及统计过程控制技术。 过程(Process) 能产生输出--一种给定的产品或服务的人、设备、材料、方法和环境的组合。过程可涉及到我们业务的合格各个方面,管理过程的一个有力工具即为统计过程控制。 过程均值(Process Average) 一个特定过程特性的测量值分布的位置即为过程平均值,通常用X来表示。 过程能力(Process Capability) 一个稳定过程的固有变差(6σR/d2)的总范围。 --对于计量型数据(Variables Data Case) (1) 过程固有能力定义为6σR/d2; (2) 符合规范的过程能力(即输出符合规范的百分数%)可以通过考虑过程中心及分布宽度(如CPK)等指数和一些假设来估算。然而,也有估算这个值更精确的方法。 --对于计数型数据(Attributes Data Case) 过程能力通常用不合格的平均比例或比率表示。例如,从控制图上来说,过程能力被定义为p,c或u,这里直接指的是不符合规范的产品的平均比例或比率(或用符合规范的比例1-p表示)。 过程控制(Process Control) 参见统计过程控制。 过程性能(Process Performance) 一具过程总变差的总范围6σR/d2。 过程分布宽度(Process Spread) 一个过程特性单值的分布变化程度。通常用过程平均值加减几倍的标准差来表示(例如:X±3σ)。 二次方程式(Qadratic) 属于二次幂的数学关系式,二次方程式最普通的例子即为抛物线。 随机性(Randomess) 单值是不可预测的状态,尽管它可能符合某种分布规律。 随机抽样(Ramdom Sampling) 使得所考虑的几个个体的所有组合被抽作样本的机会是相同的机样过程。 极差(Range) 一个子组、样本或总体中最大与最小值之差。 合理子组(Rational Subgroup) 按下列方式组成的子组:给予最大机会使得每个子组中测量相同,并且给予最大机会使得子组之间彼此不同。这种分组方法提出了一种确定一个过程的变差是否来自一个恒定系统的偶然原因的要求。 链(Run) 控制图上一系列连续上升或下降,或中中心线之上或之下的点。它是分析是否存在造成变差的特殊原因的依据。 链图(Run Chart) 一种代表过程特性的简单图形,上面描有一些从过程中收集到的统计数据(通常是单值)和一条中心线(通常是测量值的中位数),可用来进行链分析。(参见控制图) 样本(Smaple) 应用于过程控制时,它是子组的同义词,这个用法的目的完全不同对于一大群人或项目等的估计。 形状(Shape) 数值分布形成的总体图形的一般概念。 σ(Singmaσ) 用于代表标准差的希腊字母。 特殊原因(Special Cause) 一种间断性的,不可预计的,不稳定的变差根源。有时被称为原因,存在它的信号是:存在超过控制子的点或存在控制限之内的链或其它非随机性的图形。 规范(Specification) 判定一特定的特性是否可接受的工程技术要求。规范不能与控制限混淆,理想情况规范直接与顾客(内部的或外部的)的要求或期望紧密相连,或者兼容。 分布宽度(Spread) 和个分布中从最小值到最大值之间的间距(参见过程分布宽度)。 稳定性(Stability) 不存在变差的特殊原因;处于统计控制的状态。 稳定过程(Stable Process) 处于统计控制状态的过程。 标准差(Standard Deviation) 过程输出的分布宽度或从过程中统计抽样值(例如:子组均值)的分布宽度的量度,用希腊字母σ或字母s(用于样本标准差)表示。 统计值(Statistic) 由样本数据计算得到的值(例如:子组均值或极差),用来推断产生输出的过程,而这个样本也是来自这个输出。 统计控制(Statistical Control) 描述一个过程的状态,这个过程中所有的特殊原因变差都已排除,并且仅存在普通原因。即:观察到的变差可归咎于恒定系统的偶然原因;在控制图上表现为不存在超出控制限的点或在控制限范围内不存在非随机性图形。 统计过程控制(Statistical Process Control) 使用诸如控制图等统计技术来分析过程或其输出以便采取适当的措施达到并保持统计控制状态从而提高过程能力。 子组(Subgroup) 用来分析过程性能的一个或多个事件或测量。通常选用合理分组使得每个子组内的变差尽量小(代表普通原因的变差),同时使得各子组间过程性能的变化(即特殊原因变差)不一样。合理子组一般由连续的零件组成,尽管有时采用随机抽样。 I 类错误(Type Erroy) 拒绝一个真实的假设;例如:采取了一个适用于特殊原因的措施而实际上的过程还没有发生变化;过度控制。 II 类错误(Type Error) 定量的数据,可用测量值来分析。例如:用毫米表示的轴承颈直径,用牛顿表示关门的力,用百分数表示电解液的浓度,用牛顿.米表示紧固件的力矩,X-R图,X-s中位数,单值和移动极差控制图都用于计量型数据(参见计数型数据)。 变差(Variation) 过程的单个输出之间不可避免的差别;变差的原因可分成两类:普通原因和特殊原因。 --固有变差(Inherent Variation) 仅由普通原因造成的过程变差,由6σR/d2来估计: --总变差(Total Variation) 由于普通和特殊两个原因造成的变差,用σs估计。 区域分析(Zone Analysis) 这是对休哈特(Shewhart)控制图详细分析的一种方法,它将X图上均值到控制上限的区域分成三等分,并将平均值到控制下限的区域也分成三等分。这些等分的区域有时被称为“σ”区域(这里的σ为平均分布标准差,而不是单值)。只要数据服从正态分布(即受控)则期望一定比例落在每个区域内的概率是一定的。例如,落在均值相邻区域的概率是0.3413,落在下一个区域的概率为0.136,落在最近一个区域的概率是0.02135,落在上、下控制限之外区域的概率各是0.00135。那么可以根据与这些区域相关的数据点来检验数据中是否有些不自然的趋势。极差图的概率取决于样本的容量,计数型数据控制图的概率是以二项分布或泊松分布为基础的。由这个系统得到的经验方法可用作过程微小变化的早期警告系统,而这种微小变化可能不会反映为超出控制线的点。读者若想获得更多的信息可参考Western Electric“统计质量控制手册”第25~31,180~183页(附录H,参考文献7)。 本手册所使用的符号: A2--计算均值控制限时R的乘数,见附录E的表。 A2--计算中位数控制限时R的乘数,见附录E的表。 A3--计算均值控制限时s的乘数,见附录E的表。 B3、B4--分别为计算样本标准差上下控制限时s的乘数,见附录有的表。 C--样本中的不合格数,c图的介绍见第III间第3节。 c--样本容量恒定为n时,样本的平均不合格数 C4--估计过程标准差时s的除数,见附录E表。 CP--稳定过程能力指数通常定义为 。 CPK--稳定过程的能力指数,通常定义为CPU或CPL中的最小值。 CPL--能力指数下限,通常定义为 。 CPU--能力指数下限,通常定义为 。 CR--稳定过程的能力比值,通常定义为 。 d2--估计过程标准差时R的除数,见附录E表。 D3、D4--分别为计算极差的上下控制限时R的乘数,见附录E的表。 E2--用来计算单位控制限时R的乘数,见附录E的表。 k--用来计算控制限时子组的个数。 LCL--下控制限。LCLX,LCLR,LCLP等分别是均值、极差、不合格品率等的下控制限。 LSL--工程规范的下限。 MR--主要用于单值图一系列点的移动极差。 n--一个子组内的单值的个数;子组的样本容量。 n--平均子组样本容量。 np--在一个容量为n的样本中不合格品的数量,np图的介绍见第III章第2节。 np--样本容量恒定为n时,不合格品数的平均数。 p--一个样本中的不合格品率,p图的介绍如见第III章第1节。 p--一系列样本中的平均不合格品率。 PP--性能指数,通常定义为 。 PR--性能比率,通常定义为 。 PPK--性能指数,通常定义为 或 的最小值。 PZ--输出超过利益点的比例,这种利益点诸如特定的规范限值,与过程均值之差为z个标准差单位。 R--子组的极差(最大值减去最小值);R图的介绍见第III章。 R--一系列容量相等子组的平均极差。 R--一系列容量相等子组的平均的均值。 R--一系列容量相等子组的平均极差的中位数极差。 s--子组的样本标准差,s图的介绍见第II章第2节。 s--过程的样本标准差,s的介绍见第II章经5节。 s--一系列子组的平均样本标准差,如有必要可以按样本容量加权。 SL--单边工程规范极限。 u--一个样本中每单元不合格数,这个样本可能含有一个以上单位,u图的介绍见第III章第4节。 u--样本中单位不合格数的平均值,样本的容量不必相等。 UCL--上控制限,UCLX、UCLR、UCLP等分别是均值、极差、不合格品率等的上控制限。 USL--工程规范的上限。 X--一个单值,是其它子组统计值的基础,单值图的讨论见第II章第4节。 X--一个子组数值的平均数,X图的讨论见第II章第1节。 X--子组均值的均值(如有必要可按样本容量加权);测得的过程均值。注:在本手册中,X有作单值图的过程均值(第II章第4节)尽管它仅代表一个水平的平均(单值点),以便避免与通常便服了组均值的X相混淆。 X--一个子组的数值的中位数;中位数图的讨论见第II章第3节。 X--子组中位数的均值,估计的过程中位数。 Z--从过程均值到一个利益值(例如工程规范)的标准差单位个数。当用于能力评审时,ZUSL就是与上规范限的距离,是的与与下规范限的距离,而Zmin是与最近的规范限的距离。 σ--一个过程特性单值分布的标准差。 σ--过程特性标准差的估计值。 σX、σR、σP,等--基于样本过程输出的一个统计值标准差,例如,子组均值分布的标准差(为σ√n),子组极差分布的标准差,不合格品率分布的标准差等。 σS--用位于该组平均值附近的一组单值的样本标准差来估计的过程标准差。 6σR/d2--用从过程中得到的子组样本的平均极差来估计稳定过程的标准差,通常在控制图内容中讨论,式中d2为附录E表中的系数。 |