网站大量收购独家精品文档,联系QQ:2885784924

2025年大数据分析师职业技能测试卷:数据仓库设计与实施试题.docx

2025年大数据分析师职业技能测试卷:数据仓库设计与实施试题.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

2025年大数据分析师职业技能测试卷:数据仓库设计与实施试题

考试时间:______分钟总分:______分姓名:______

一、关系型数据库设计

要求:请根据以下业务场景,设计一个关系型数据库模型,并说明每个表的结构和字段。

1.业务场景:某在线图书销售平台,包含用户、图书、订单、评论等实体。

(1)用户表(User)

字段:

-UserID(用户ID,主键,自增)

-Username(用户名,唯一)

-Password(密码)

-Email(邮箱)

-PhoneNumber(手机号)

-RegisterDate(注册日期)

(2)图书表(Book)

字段:

-BookID(图书ID,主键,自增)

-BookName(书名)

-Author(作者)

-CategoryID(分类ID,外键)

-Price(价格)

-Stock(库存)

-PublishDate(出版日期)

(3)分类表(Category)

字段:

-CategoryID(分类ID,主键,自增)

-CategoryName(分类名称)

(4)订单表(Order)

字段:

-OrderID(订单ID,主键,自增)

-UserID(用户ID,外键)

-OrderDate(订单日期)

-TotalAmount(订单总额)

(5)评论表(Comment)

字段:

-CommentID(评论ID,主键,自增)

-UserID(用户ID,外键)

-BookID(图书ID,外键)

-CommentContent(评论内容)

-CommentDate(评论日期)

2.请根据上述表结构,编写SQL语句实现以下功能:

(1)查询所有图书的平均价格。

(2)查询所有图书的分类名称和对应图书数量。

(3)查询订单ID为1001的订单详情。

(4)查询用户名为Tom的用户所购买的图书名称和作者。

二、数据仓库设计

要求:请根据以下业务场景,设计一个数据仓库模型,并说明每个表的结构和字段。

1.业务场景:某在线教育平台,包含课程、教师、学生、成绩等实体。

(1)课程表(Course)

字段:

-CourseID(课程ID,主键,自增)

-CourseName(课程名称)

-TeacherID(教师ID,外键)

-CourseDescription(课程描述)

-CourseDuration(课程时长)

(2)教师表(Teacher)

字段:

-TeacherID(教师ID,主键,自增)

-TeacherName(教师姓名)

-TeacherTitle(教师职称)

-DepartmentID(部门ID,外键)

(3)学生表(Student)

字段:

-StudentID(学生ID,主键,自增)

-StudentName(学生姓名)

-ClassID(班级ID,外键)

-EnrollmentDate(入学日期)

(4)班级表(Class)

字段:

-ClassID(班级ID,主键,自增)

-ClassName(班级名称)

-DepartmentID(部门ID,外键)

(5)成绩表(Grade)

字段:

-GradeID(成绩ID,主键,自增)

-StudentID(学生ID,外键)

-CourseID(课程ID,外键)

-Score(分数)

2.请根据上述表结构,编写SQL语句实现以下功能:

(1)查询所有课程的平均时长。

(2)查询所有教师所在的部门名称和教师数量。

(3)查询所有学生的班级名称和入学日期。

(4)查询某学生(假设StudentID为1001)在某课程(假设CourseID为1001)的分数。

四、数据仓库ETL过程设计

要求:请设计一个数据仓库ETL过程,包括数据抽取、转换和加载(ETL)的步骤,并说明每个步骤的具体操作。

1.数据抽取

(1)从源系统(如数据库、日志文件等)中抽取用户表、图书表、订单表、评论表的数据。

(2)从源系统抽取课程表、教师表、学生表、成绩表的数据。

2.数据转换

(1)清洗数据,去除重复、错误或不完整的数据。

(2)转换数据格式,如日期格式、货币格式等。

(3)计算数据,如计算订单总额、图书分类数量等。

(4)数据合并,将相关数据表合并为一个数据集。

3.数据加载

(1)将清洗和转换后的数据加载到数据仓库的对应表中。

(2)根据业务需求,创建数据仓库的汇总表和维度表。

(3)将数据加载到汇总表和维度表中。

五、数据仓库查询优化

要求:请针对以下查询场景,提出数据仓库查询优化的策略。

1.查询场景:查询所有图书的平均价格,并按分类名称排序。

优化策略:

(1)在图书表上创建价格索引。

(2)在分类表上创建分类名称索引。

(3)使

您可能关注的文档

文档评论(0)

wangfeifei + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档