实验大数据误差分析报告和大数据处理
说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。
第二章 实验数据误差分析和数据处理 第一节 实验数据的误差分析 由于实验方法和实验设备的不完善,周围环境的影响,以与人的观察力,测量程序等限制,实验观测值和真值之间,总是存在一定的差异.人们常用绝对误差、相对误差或有效数字来说明一个近似值的准确程度.为了评定实验数据的准确性或误差,认清误差的来源与其影响,需要对实验的误差进展分析和讨论.由此可以判定哪些因素是影响实验准确度的主要方面,从而在以后实验中,进一步改良实验方案,缩小实验观测值和真值之间的差值,提高实验的准确性. 一、误差的根本概念 测量是人类认识事物本质所不可缺少的手段.通过测量和实验能使人们对事物获得定量的概念和发现事物的规律性.科学上很多新的发现和突破都是以实验测量为根底的.测量就是用实验的方法,将被测物理量与所选用作为标准的同类量进展比拟,从而确定它的大小. 真值是待测物理量客观存在确实定值,也称理论值或定义值.通常真值是无法测得的.假如在实验中,测量的次数无限多时,根据误差的分布定律,正负误差的出现几率相等.再经过细致地消除系统误差,将测量值加以平均,可以获得非常接近于真值的数值.但是实际上实验测量的次数总是有限的.用有限测量值求得的平均值只能是近似真值,常用的平均值有如下几种: <1> 算术平均值 算术平均值是最常见的一种平均值. 设x1、x2、……、xn为各次测量值,n代表测量次数,如此算术平均值为 nxix1x2xn xi1<2-1> nn<2> 几何平均值 几何平均值是将一组n个测量值连乘并开n次方求得的平均值.即 x几nx1x2xn<2-2> 〔3〕均方根平均值 nxxx <2-3> i1nn<4> 对数平均值 在化学反响、热量和质量传递中,其分布曲线多具有对数的特性,在这种情况下表征平均值常用对数平均值. 设两个量x1、x2,其对数平均值 x1x2xx2 <2-4> x对1xlnx1lnx2ln1x2x均应指出,变量的对数平均值总小于算术平均值.当x1/x2≤2时,可以用算术平均值代替对数平均值. 当x1/x2=2,x对=1.443,x1.50,<x对-x>/x对=4.2%, 即x1/x2≤2,引起的误差不超过%. . 21222nx2i以上介绍各平均值的目的是要从一组测定值中找出最接近真值的那个值.在化工实验和科学研究中,数据的分布较多属于正态分布,所以通常采用算术平均值. 根据误差的性质和产生的原因,一般分为三类: 〔1〕系统误差 系统误差是指在测量和实验中未觉察或未确认的因素所引起的误差,而这些因素影响结果永远朝一个方向偏移,其大小与符号在同一组实验测定中完全一样,当实验条件一经确定,系统误差就获得一个客观上的恒定值. 当改变实验条件时,就能发现系统误差的变化规律. 系统误差产生的原因:测量仪器不良,如刻度不准,仪表零点未校正或标准表本身存在偏差等;周围环境的改变,如温度、压力、湿度等偏离校准值;实验人员的习惯和偏向,如读数偏高或偏低等引起的误差.针对仪器的缺点、外界条件变化影响的大小、个人的偏向,待分别加以校正后,系统误差是可以去除的. 〔2〕偶然误差 在已消除系统误差的一切量值的观测中,所测数据仍在末一位或末两位数字上有差异,而且它们的绝对值和符号的变化,时而大时而小,时正时负,没有确定的规律,这类误差称为偶然误差或随机误差.偶然误差产生的原因不明,因而无法控制和补偿.但是,倘假如对某一量值作足够屡次的等精度测量后,就会发现偶然误差完全服从统计规律,误差的大小或正负的出现完全由概率决定.因此,随着测量次数的增加,随机误差的算术平均值趋近于零,所以屡次测量结果的算数平均值将更接近于真值. 〔3〕过失误差 过失误差是一种显然与事实不符的误差,它往往是由于实验人员粗心大意、过度疲劳和操作不正确等原因引起的.此类误差无规如此可寻,只要加强责任感、多方警惕、细心操作,过失误差是可以防止的. 3、精细度、准确度和准确度 反映测量结果与真实值接近程度的量,称为精度〔亦称准确度〕.它与误差大小相对应,测量的精度越高,其测量误差就越小."精度〞应包括精细度和准确度两层含义. 〔1〕精细度:测量中所测得数值重现性的程度,称为精细度.它反映偶然误差的影响程度,精细度高就表示偶然误差小. 〔2〕准确度 测量值与真值的偏移程度,称为准确度.它反映系统误差的影响精度,准确度高就表示系统误差小. 〔3〕准确度〔精度〕 它反映测量中所有系统误差和偶然误差综合的影响程度. 在一组测量中,精细度高的准确度不一定高,准确度高的精细度也不一定高,但准确度高,如此精细度和准确度都高. 为了说明精细度与准确度的区别,可用下述打靶子例子来说明.如图2-1所示. 图2-1中表示精细度和准确度都很好,如此准确度高;图2-1表示精细度很好,但准确度却不高;图2-1表示精细度与准确度都不好.在实际测量中没有像靶心那样明确的真值,而是设法去测定这个未知的真值. 学生在实验过程中,往往满足于实验数据的重现性,而忽略了数据测量值的准确程度.绝对真值是不可知的,人们只能订出一些国际标准作为测量仪表准确性的参考标准.随着人类认识运动的推移和开展,可以逐步逼近绝对真值. 〔a〕 〔b〕 〔c〕 图 2-1 精细度和准确度的关系 . 4、误差的表示方法 利用任何量具或仪器进展测量时,总存在误差,测量结果总不可能准确地等于被测量的真值,而只是它的近似值.测量的质量上下以测量准确度作指标,根据测量误差的大小来估计测量的准确度.测量结果的误差愈小,如此认为测量就愈准确. 〔1〕绝对误差 测量值X和真值A0之差为绝对误差,通常称为误差.记为: DXA0<2-5> 由于真值A0一般无法求得,因而上式只有理论意义.常用高一级标准仪器的示值作为实际值A以代替真值A0.由于高一级标准仪器存在较小的误差,因而A不等于A0,但总比X更接近于A0.X与A之差称为仪器的示值绝对误差.记为 dXA<2-6> 与d相反的数称为修正值,记为 CdAX<2-7> 通过检定,可以由高一级标准仪器给出被检仪器的修正值C.利用修正值便可以求出该仪器的实际值A.即 AXC<2-8> 〔2〕相对误差 衡量某一测量值的准确程度,一般用相对误差来表示.示值绝对误差d与被测量的实际值A的百分比值称为实际相对误差.记为 Ad100% <2-9> Ad100% <2-10> X以仪器的示值X代替实际值A的相对误差称为示值相对误差.记为 X一般来说,除了某些理论分析外,用示值相对误差较为适宜. 〔3〕引用误差 为了计算和划分仪表准确度等级,提出引用误差概念.其定义为仪表示值的绝对误差与量程X围之比. A示值绝对误差d100%100% <2-11> 量程范围Xnd--示值绝对误差; Xn-- 标尺上限值-标尺下限值. 〔4〕算术平均误差 算术平均误差是各个测量点的误差的平均值. dii1,2,,n<2-12> 平nn—测量次数; di—为第 i次测量的误差. 〔5〕标准误差 标准误差亦称为均方根误差.其定义为 dn2i<2-13> 上式使用于无限测量的场合.实际测量工作中,测量次数是有限的,如此改用下式 . 本文来源:https://www.wddqw.com/doc/7df61516ba0d6c85ec3a87c24028915f814d845e.html