图3-18中数据是某监测点6—10月的多环芳烃数据,下面按前述所讲的数据审核步骤进行审核。(一)数据的完整性判断每月16种多环芳烃数据的完整性。根据每月有效样本量应大于5个的要求,6、8、9、10月的数据量均大于5条,但是7月的数据...[继续阅读]
海量资源,尽在掌握
图3-18中数据是某监测点6—10月的多环芳烃数据,下面按前述所讲的数据审核步骤进行审核。(一)数据的完整性判断每月16种多环芳烃数据的完整性。根据每月有效样本量应大于5个的要求,6、8、9、10月的数据量均大于5条,但是7月的数据...[继续阅读]
图3-19中数据是某监测点1—3月的多环芳烃数据,按前述所讲步骤对数据进行审核:(一)数据的完整性判断每月16种多环芳烃数据的完整性。根据每月有效样本量应大于5个的要求,1、2、3月的数据量均大于5条,符合数据完整性要求。(二)数...[继续阅读]
[1] 万学红,卢雪峰.诊断学[M].北京:人民卫生出版社,2013:7—54.[2] 中华人民共和国国家质量监督检验检疫总局,中国国家标准化标准化管理委员会. GB/T4883—2008,数据的统计处理和解释—正态样本离群值的判断和处理[S].北京:中国标准出版...[继续阅读]
由于监测数据的多样化来源,数据质量常常参差不齐,给数据分析带来许多困难,进而影响到监测结论的准确性和卫生政策制定的科学性。数据清洗的目的在于查找出异常、重复和逻辑错误等问题数据,并进行修正,以便为后续的统计分析...[继续阅读]
(一)数据清洗的相关概念和方法数据清洗(data cleanning)是发现并尽量纠正数据错误、以减少数据对研究结果影响的过程[1]。它是数据分析前的一个重要步骤,一方面能提高数据质量,另一方面能增强数据的可利用性,是正确得出统计结果...[继续阅读]
(一)空气污染和健康数据中存在的问题及清洗工具的选择近年来,空气污染对健康的影响越来越受到国内外的高度关注,大量流行病学研究已经证明空气污染与许多健康效应有直接或者间接的相关性[13],从轻微的呼吸系统症状到心肺疾...[继续阅读]
气象监测数据包含以下监测指标:气压(平均气压、最高气压、最低气压)、温度(平均温度、最高温度、最低温度)、相对湿度(平均相对湿度、最大相对湿度、最小相对湿度)、降水量、日平均风速、日照时数、能见度、霾日。每个指标...[继续阅读]
气象数据可按图4-1中流程进行清洗:原始数据备份保存后,首先可利用趋势图和计数汇总表观察数据整体分布,大致了解异常值、重复值和缺失值出现情况,其次根据上述清洗规则,进行异常值、重复值和缺失值的定位查找,异常值和重复...[继续阅读]
本节主要介绍基于Excel的气象数据清洗方法,因此清洗过程的各个步骤将主要依靠Excel编写函数的功能及其自身所带如插入图表、条件格式等功能来实现。在进行清洗之前,需将原始数据录入Excel工作簿,工作簿第一行为表头,填写各监测...[继续阅读]
以下各步骤操作都是基于气象监测数据清洗工具包及其配套的测试数据来进行的,并配有相应的案例,读者可通过阅读以下内容同时结合光盘学习气象监测数据清洗工具包的使用方法,气象监测数据EXCEL工具包见光盘“数据清洗工具包”...[继续阅读]