- 1、本文档共46页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
葡萄酒的評价与分析
葡萄酒的评价
摘 要
本文分析了葡萄酒质量与酿酒葡萄、葡萄酒的理化指标之间的联系,建立相应的数学模型,对各因素之间的关系作了深入研究。
对于问题1,首先将所给的两组评酒员对红、白葡萄酒的评价结果进行了预处理,然后分别对每一组的所有评酒员对红、白葡萄酒各个样品的总评分取均值,得到两组红、白葡萄酒的综合评价得分。利用数据统计假设检验知识,建立T检验模型,得到两组评酒员对红、白葡萄酒的评价无显著性差异。令外,再将每一个评酒员对所有红、白葡萄酒的总评分取均值,得到两组每一个评酒员对红、白葡萄酒的综合评价得分,然后运用方差分析的方法对两组评价结果的可信度进行论证。经过比较得出,第二组的评分结果比较可信。
对于问题2,对二级指标的舍去和对某些理化指标多次测量的数值取平均值后得到二次数据,将二次数据进行标准化处理后作主成分分析,将主成分分析得到的主要影响因子结合问题1中第二组评酒员对每个样品的综合得分进行聚类分析,据此作出相应的分级,即:红葡萄酒酿酒葡萄可分为三个等级,白葡萄酒酿酒葡萄可分为四个等级。
对于问题3,为了更好的分析酿酒葡萄与葡萄酒的理化指标之间的联系,首先将附件2中的酿酒葡萄和葡萄酒的相对应的理化指标挑选出来并进行了分析,然后运用MATLAB软件计算出葡萄酒和酿酒葡萄相对应物质的理化指标的相关系数,同时作出红、白葡萄的理化指标的走势图。利用灰色关联分析的方法,将求出的理化指标的相关系数和理化指标图相结合来分析说明葡萄酒和酿酒葡萄理化指标之间的联系,进而建立葡萄酒和酿酒葡萄对应的理化指标之间的线性方程。
对于问题4,运用SPSS软件进行多元回归分析,给出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量的关系。运用回代检验的方法,将葡萄酒质量与所得非标准化预测值作差值,对结果进行分析发现,可以用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。
关键词:T检验 方差分析 主成分分析 聚类分析 多元回归分析
1.问题的重述
1.1背景:
随着经济的发展,葡萄酒已进入人们的日常生活,葡萄酒的质量一般是通过有资质的评酒员进行品评,每个评酒员在对葡萄酒品尝后进行分类指标打分,然后得到其总分,以此确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。
1.2问题:
(1)分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
(2)根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。
(3)分析酿酒葡萄与葡萄酒的理化指标之间的联系。
(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
2.问题的分析
2.1问题1的分析
附件1中包含两组品酒员评价红葡萄酒与白葡萄酒的数据,要分析两组评酒员的评价结果有无显著性差异,需要比较两组品酒员对红葡萄酒的评价结果及对白葡萄酒的评价结果。由于数据表中未给出品酒员对每个酒种的具体评价结果,可以得到每个品酒员对某一酒种的各项指标相加得到总分,再将全组品酒员对此酒种的总分进行平均,分别得到27种红葡萄酒的综合得分,再用同样的方法得到另一组评酒员对27组红葡萄酒的综合得分。同步处理白葡萄酒的相关数据。以此通过均值运用T检验来检测两组品酒员评价结果是否有无显著性差异,运用方差分析来确定那一组结果更可信。
2.2问题2的分析
由于同一样品的葡萄酒的一种理化指标有多个,一级理化指标包含多个数据,因此可以将同一理化指标有多个数据的进行均值处理,将二级理化指标舍去,简单处理后得到二次数据,以后的步骤均在二次数据的基础上进行。要通过酿酒葡萄的理化指标和葡萄酒的质量对葡萄进行分级,由于分类情况未知,所以选择聚类分析来分类。运用聚类分析可将含量相近的葡萄归为一类。由于原始数据量较大,且多个变量之间具有一定的相关性,对数据结构不能做出明确分类,所以需要对数据进行降维处理。主成分分析法是以最少的信息丢失将众多原有变量浓缩成少数几个因子来实现酿酒葡萄的理化指标数据的简单化。并且原始数据指标变量的量纲不同,为了使这些数据能够放在一起加以比较,需要对原始数据标准化处理,以便于主成分分析。
2.3问题3的分析
要分析酿酒葡萄与葡萄酒的理化指标之间的关系,需要将酿酒葡萄与葡萄酒相对应的理化指标放在一起比较。运用相关系数反映酿酒葡萄和葡萄酒的理化指标之间的关联程度。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。再选出相关系数矩阵中相关系数大
文档评论(0)