- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
葡萄酒评价方法介绍
第二问:
根据两个变量进行分级:首先我们用第一问两种葡萄酒进行分级(原因为酿酒葡萄的好坏与葡萄酒的质量直接相关,所以我们要选取好的葡萄进行酿酒)。
因为葡萄酒的好坏与工艺还有葡萄的好坏有关,这里我们要研究与葡萄的关系所以首先我们要消除工艺的影响。
消除某一个因素的影响我们用的是?????(。为了消除工艺的影响我们选取指标分为80 以上的样品酒来研究葡萄酒与葡萄之间的关系。)
然后我们用spearman进行检验,得到葡萄酒的质量与那些葡萄的生理指标有相关性关系。这样可以剔除不关紧要的指标。如果最后选取的指标还是比较多我们可以采用主成分分析进行降维。最后还要对其进行检验???,如果检验结果与实际不相符,我们再用支持向量回归进行分析。
Spearman选取指标:用18种好的红葡萄酒和23种好白葡萄酒,通过和指标之间进行spearman检验,选出重要指标。
Spearman相关系数是描述两种变量之间是否存在着相关或者相反关系的一种指标。这种指标可以得到一个值介于-1x1之间。
具体介绍:
斯皮尔曼(Spearman) 相关系数是描述两组变量之间是否存在着相同或相反趋同性的一种指标,由于该检验不需要假定服从正态分布,仅需要确定变量在每个点(时期)上的等级即可获得,因此具有较好的性质。在两组数据都没有重复观测值的情况下,斯皮尔曼等级相关系数的公式为:????????????
其中,??????? ,x 和y 分别是两个变量按大小(或优劣等)排位的等级(称为秩),n 是样本的容量。与Pearson 相关系数类似,Spearman 等级相关系数的取值区间为?1 ≤ ≤ 1 s r 。s r 为正值时,存在正的等级相关, s r 取负值时,存在负的等级相关; s r =1,表明两个变量的等级完全相同,存在完全正相关; s r =-1,表明两个变量的等级完全相反,存在完全的负相关。
通过spearman检验我们得到葡萄酒质量与葡萄的理化生理指标之间是一种非线性关系,可以求出非线性关系的方法有,神经网络和支持向量机。这里我们比较两种方法:因而考虑用神经网络、支持向量机等方
法。这两种方法十分相似,都是学习型的机制,且算法也大致相同,但是不同的
是SVM 使用的是数学方法和优化技术,而且该方法得到的是全局最优点,解决
了在神经网络方法中无法避免的局部极值问题,基于此我们选择使用SVM 支持
向量机。
支持向量回归机
支持向量机(Support V ector Machine)是十七年代由apnik 及其合作者提出的一种新的数据挖掘中很有前景的方法。目前,它已广泛地应用于统计分析以及回归分析中,能够非常成功地处理回归问题和模式识别等诸多问题,并可推广于预测和综合评价等领域。它能够非常成功地处理其特点在于它具有压缩整个训练集信息的功能,它通过训练得到较少的几个支撑向量来代表整个训练集的信息。训练SVM 的本质就是解决一个二次规划问题,则算法最终将转化成为一个二次型寻优问题,并得到全局最优点。同时,它将实际问题通过非线性变换转化到高维的特征空间(Feature Space),在高维空间中构造线性判别函数来实现原空间中的非线性判别函数。
第三问:
结构方程进行的确定关系式,确定了关系式之后要对模型进行拟合和模型的评价。
文档评论(0)