2012数学建模确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分

2012数学建模
确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评.每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量.酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量.附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据.请尝试建立数学模型讨论下列问题：
1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?
2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级.
3.分析酿酒葡萄与葡萄酒的理化指标之间的联系.
4．分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?
只求思路!

yujiaolong 1年前已收到1个回答举报

zhanggminxie 幼苗

共回答了26个问题采纳率：88.5% 举报

第一问
先对数据标号,标号方式参考如下：
红葡萄酒澄清度色调香气纯正度香气浓度香气质量口感纯正度口感浓度持久性口感质量平衡/整体评价

白葡萄酒澄清度色调香气纯正度香气浓度香气质量口感纯正度口感浓度持久性口感质量平衡/整体评价

还可以更细得标号,用表示第组第位品酒师对第种红葡萄酒第项指标的评分,用表示第组第位品酒师对第种白葡萄酒第项指标的评分,比如第1组第0位品酒师对第21种红葡萄酒第7项指标（口感浓度）的评分就是,第2组第5位品酒师对第8种白葡萄酒第2项指标（色调）的评分就是.
若是评价“哪一组结果更可信”的话,应该考虑一下系统误差和偶然误差,系统误差小的结果比系统误差大的结果可信,偶然误差小（数据比较集中）的结果比偶然误差大的结果可信.
比如说,第号红酒澄清度的实际分值（带有主观性,不过根据大数定理,无穷多个品酒师的评分的数学期望就是实际分值）为4分,那么同样是对第号红酒澄清度的打分,第一组打了7个4分,2个5分和1个3分,第二组打了6个4分,1个5分和3个3分,那么第一组的评分的数学期望就是4.1分,第二组的评分的数学期望就是3.8分,第二组的系统误差更大,第一组更可信；再比如说,第一组打了5个4分,3个5分和2个3分,第二组打了7个4分,2个5分和1个3分,那么两组的评分的数学期望都是4.1分,不过第一组的数据比较分散,偶然误差比较大,第二组更可信.
不同的品酒师的个人感受不可能完全一样,评分标准掌握尺度也有差异,因此难免有主观误差（系统误差的一类）,不过如果品酒师是随机分配到两组的话,多数情况下可以认为不同的人的系统误差相互抵消（下文说不能相互抵消的话怎么办）,因此重点考虑偶然误差.
可以通过统计学中的理论（需要用到分布）得出同样的置信水平（可以设）下每一个统计量（同一组人对同一种酒同一项指标的评分）的置信区间,然后求出置信区间跨度（置信上限与置信下限的查,设为和,与和对应,比如就是第二组的品酒师对第七种红葡萄酒口感浓度的评分的置信区间跨度）,跨度小的偶然误差小.
可以求出同一组品酒师评价同样的指标的置信区间跨度的平均值（但目前不知道应不应该分红葡萄酒和白葡萄酒）,即、,然后比较和的大小,以及和的大小,小者偶然误差小,更可靠,这样就可以得出两组品酒师对同一个品种（一共两个品种）的酒的同一项指标（一共十个指标）的评分哪个更可靠了.
如果计算不方便的话,可以不算置信区间跨度,而算标准差,这样和就是第组品酒师对第种酒第项指标的评分的标准差了,而平均标准差越小的数据越可靠.
当然,系统误差也可能存在,如果两组品酒师对同一个品牌的酒的同一项指标的平均打分（即和,或和）差距比较大,说明其中一组存在较大的系统误差,或者两组都存在较大的系统误差,此时怎么办?有两种办法,一种是在比较和的时候删去这个品牌的酒的该指标数据,另一种是比较分析哪种更有可能有系统误差（但如何分析还没想好）.
此外,品酒师水平参差不齐,评价尺度也不一样,不过对于主观打分评判来说,都宽松和都严格是公平的,但宽严尺度不一（不一定是“黑哨”）就有问题了,比如三种酒的“客观”评分应该是70、80、90,这样给它们分别打75、85、95分和分别打65、75、85分对它们来说是公平的,但都打80分就不公平了.
因此,需要检验一下品酒师的水平.我的方法（计算量肯定非常大,请选择性使用）是,把同一个人对同一项指标的打分以品牌为单位一一列出来（、……、、……）,然后求出二十个人对各个品牌这项指标打的分数的平均值,也一一列出来,再求二者的相关系数,如果相关系数太小,说明这位品酒师对这项指标的打分存在不公平的情况,数据有问题（但我没想好如何删数据）.
至于显著差异,不好意思,我没带书,不记得怎么求显著差异了.
第二问
第一问已经求出哪组品酒师对同一个品种的酒的同一项指标（红葡萄酒指标0、红葡萄酒指标1、红葡萄酒指标2……白葡萄酒指标9、白葡萄酒指标0、白葡萄酒指标1、白葡萄酒指标2……白葡萄酒指标9）的评分更可靠了,这样可以得到一个相对客观的打分（个人建议,如果两组数据存在显著差异的话,用更可靠的那组；如果不存在显著差异的话,用两组平均值）,把同一个品牌的酒的十项指标得分累加起来,就是酒的总分.
分级的时候,总分越高的酒对应的葡萄的等级越高.
但我不知道“根据酿酒葡萄的理化指标对这些酿酒葡萄进行分级”是怎么回事,希望专业人士帮帮忙.
第三问
首先,附件2的数据该求平均值的一律求出来平均值.
对葡萄的各类理化指标分别编号、……,对葡萄酒的各类理化指标分别编号、……,然后进行拟合数据
令
……
则对于每一个,都有28组数据可以用来拟合,从而得到葡萄酒理化指标与葡萄理化指标的关系.
拟合的工作交给计算机进行,至于,拟合成什么性质的曲线,可以查参考资料,也可以交给软件智能解决.
别忘了进行显著性检验!
注意,这么算的话计算量非常大,计算之前先从化学角度分析一下葡萄酒的某项理化指标跟葡萄的某项理化指标有没有可能显著相关,没有可能的话直接排除.
第四问
还是拟合,只不过这次酒的评分是因变量,葡萄的理化参数、葡萄酒的理化参数都是自变量.
根据我的经验,应该是同一个理化指标在一定范围内与得分正相关（不一定是线性相关）,但达到“峰值”之后就负相关了.
这里还存在一个问题：可能有的理化指标对有利于提高葡萄酒指标甲（色调、香气浓度等）的得分,却不利于提高指标乙（色调、香气浓度等）的得分,因此需要分指标讨论；但这样一来计算量将难以估量.
我目前能想到的就是这些了,我的思路需要的计算量非常大（虽然是计算机处理）,希望高人能简化一下.

1年前

可能相似的问题

你能帮帮他们吗

精彩回答