- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘习题课6.3数据仓库与数据挖掘习题课6.3
习题五 5给定两个对象,分别表示为(22,1,42,10),(20,0,36,8): (a)计算两个对象之间的欧几里得距离 (b)计算两个对象之间的曼哈顿距离 (c)计算两个对象之间的明考斯基距离,p=3 * * * * * * * * computer.dqpi.edu.cn 习题一 假定用于分析的数据包含属性age.数据元组age值(以递增序)是:13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70. (a) 使用min-max规范化将age值35变换到[0.0,1.0]区间。 (b) 使用z-score规范化变换age值35,其中age的标准差为12.94岁。 (c) 使用小数定标规范化变换age值35。 (d) 对于给定的数据,你愿意使用哪种方法?陈述你的理由。 解答一 (a) 使用min-max规范化将age值35变换到[0.0,1.0]区间。 ∵ minA=13,maxA=70,new_minA=0.0,new_maxA=1.0,而v=35, (b) 使用z-score规范化变换age值35,其中age的标准差为12.94岁。 解答一(续) (c) 使用小数定标规范化变换age值35。 由于最大的绝对值为70,所以j=2。 (d) 对于给定的数据,你愿意使用哪种方法?陈述你的理由。 答:更倾向于选择小数定标规范化。因为小数定标规范化会保持数据的分布,这种变换更直观并容易解释 习题二 2.14 假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215。使用如下每种方法将其划分成三个箱。 (a) 等频(等深)划分。 (b) 等宽划分。 解答二 (a) 等频(等深)划分。 (b) 等宽划分。 每个区间的宽度是:(215-5)/3=70 bin1 5,10,11,13 bin1 15,35,50,55 bin1 72,91,204,215 bin1 5,10,11,13,15,35,50,55,72 bin1 91 bin1 204,215 习题三 3假定BigUniversity的数据仓库包含如下4个维:student(student_name, area_id, major, status, university),course(course_name, department),semester(semester, year)和instructor(dept, rank);2个度量:count和avg_grade。在最低概念层,度量avg_grade存放学生的实际课程成绩。在较高概念层,avg_grade存放给定组合的平均成绩。 (a)为该数据仓库画出雪花形模式图。 (b)由基本方体[student, course, semester, instructor]开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 (c)如果每维有5层(包括all),如“studentmajorstatusuniversityall”,该立方体包含多少方体? 解答三 解答三 b)由基本方体[student, course, semester, instructor]开始,为列出BigUniversity每个学生的CS课程的平均成绩,应当使用哪些特殊的OLAP操作。 这些特殊的联机分析处理(OLAP)操作有: 沿课程(course)维从course_id“上卷”到department。 沿学生(student)维从student_id“上卷”到university。 取department=“CS”和university=“Big University”,沿课程(course)维和学生(student)维切块。 沿学生(student)维从university下钻到student_name。 c)如果每维有5层(包括all),如“studentmajorstatusuniversityall”,该立方体包含多少方体? 这个立方体将包含54=625个方体。 习题四 4 假定数据仓库包含4个维: date(day, month, quarter, year), spectator(spectator_name, status, phone, address), location(location_name, phone#, street, city, province, country)和game(game_nam
文档评论(0)