- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
药品数据统计分析与应用
药品数据统计分析与应用
一、导言
1、我们面临大数据时代的挑战
数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素,人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。——麦肯锡
大数据时代已经降临,在商业、经济及其它领域中,决策将日益基于数据和分析而作出,项并非基于经验和直觉。——《纽约时报》
2、数据是实施GMP管理的支持
数据是一各观测值,是实验、测量、观察、调查等活动中以数量的形式给出的结果。数据分析是企业有目的地收集数据、分析数据,使之成为信息的过程,这一过程是在产品的整个生命周期的支持过程;是实施GMP管理的支持,是建立并实施高质量的药品质量体系的支持过程。
3、数据统计分析——质量管理体系的支持过程
(1)数据是信息的载体;
(2)数据统计是数据转为信息的加工过程,统计技术是企业质量体系中的一个重要要素,分析数据,控制过程中的异常,坚持不懈地持续改进,提高产品质量,提升企业的核心竞争力。
4、数据是企业的无形资产
掌握现状
工序调节
工序管理
检查和评价
分析和改进
二、数据分析的有关基础知识
1、数据分析的类型
描述性数据分析:是对一组数据的各种特征的分析,以便描述测量样本的各种特征及其所代表的总体的特征;
推断性数据分析:也叫探索性数据分析,是为了形成值得假设的检验而对数据进行分析的一种方法;
验证性数据分析:是对社会调查数据进行的一各统计分析。通过因子间的关系是否符合研究者所设计的理论;
2、定量数据的分类
计数值数据:不能连续取值的数据;
计量值数据:可以连续取值的数据;
差别:当数值是百分率时,取决于给出数值的数学式分子,分子为计量值,则求得的百分率是计量值;如分子为计数值,求得的百分率虽不是整数提也属于计数植。
3、值得注意的概念
总体:指所要研究的对象的全体;
个体:指组成总体的每一个基本单位;
样本:从总体中随机抽出的一部分样品,样本中所包含榈数目称为样本大小,又叫样本量,常用n表示;
4、数据的特征值
位置特征值:子样平均值
了样中位数量
差异特征量:极差
标准差
相对标准差
[实例1]对气相层析的实验人员进行技术考核,进样10次,每次0.5ul,得色谱峰高(mm)为:
142.1 147.0 146.2 145.2 143.8 146.2 147.3 150.3 149.9 151.8
=146.98 s=3.00 RSD=2.04%
结论:有经验的色谱工作人员很容易将RSD控制在1%以内,可认为该实验人员的技术还不够稳定,操作不够熟练。
5、数据分析的基础
制药生产现场的数据是分析的基础,生产工序的稳定是收集可靠数据的前提,抓住生产现场的六大因素是生产的关键。
6、数据分析的形式
算一算:特征数
看一看:动力变化
比一比:统计值
找一找:相关因素
7、数据分析的前处理(筛选)
数值的修约(GB/T8170-2008)
四舍六入五考虑,五后非零则进一,五后全零看五前,五前偶舍奇进一,不论数字多少位,都要一次修约成。
修约的位数:试验运算中,应比规定的有效数字多保留一位数,后根据有效数字的修约进舍至规定有效位。标准差一般按二位有效即可,最多保留小数点后二位。
数据筛选的方法
按美国E·J鲍尔推荐的方法进行处理。步骤如下:
计算这群检测值的平均值;
计算极差R;
计算可疑值Xi与平均值之差的绝对值,再用极差R除,得出ti与规定附表的临界值比较,若ti比表上的t值大,则应弃去此可疑值。
附表如下:抛弃无效测量的临界伸值
n 3 4 5 6 7 8 9 10 11 12 13 14 15 20 t 1.53 1.05 0.86 0.76 0.69 0.64 0.60 0.58 0.56 0.54 0.52 0.51 0.50 0.46 注:用分式计算t,如计算值超过表上的值时,则所调查的值是无效的,此概率约为0.95。,
[实例2]某分析者对一样品检测,得:93.3% 93.3% 93.4% 93.4% 93.3% 94.0%,问:第六个结果有效吗?
第1步:计算方法六个结果的平均值:=93.45%
第2步:计算极差R=94.0=93.9=0.7
第3步:计算可疑值与增均值之差的绝对值再用极差除:=(91.0-93.45)/0.7=0.79
第4步:与临界值t=0.76( n=6)比较
ti=0.79 t=0.76,说明94.0%是一个离群数据,应舍弃。
G—检验法(格鲁布斯法)
步骤:
算出包括可疑值在内的平均值;
计算可疑值与平均值之差;
算出包括可疑值在内的标准偏差;
用标准偏差除
文档评论(0)