全媒体大数据分析师考前冲刺题(五)

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:7

试卷答案:没有

试卷介绍: 我们为想考全媒体大数据分析师证的学员准备了全媒体大数据分析师考前冲刺题,让你能在模拟考试中获得进步。

开始答题

试卷预览

  • 1. 数据仓库一般都是存在层次架构的,比如可以分为ODS、DW、DM层,不同粒度的表,不同作用的表,一般会分布在不同的层级中,如下相关信息表存放在ODS层的有?

    A从源系统同步至数仓的粒度相同的一张登录日志表

    B日期为天粒度的登录统计表

    C从人的角度统计的登录情况表

    D日期为月粒度的登录统计表

  • 2. 机器学习常见的特征处理方法不含?

    A数据预处理

    B特征选择

    C降维

    D特征监控

  • 3. 大数据常用的数据处理方法可分为实时处理和离线处理,下列数据处理方法描述错误的是?

    A实时处理的方式适用于及时反馈的场景,主要关注数据处理的实时性,如天猫双十一的成交额;

    B离线处理的方式适用于事后分析的场景,主要关注关注数据处理的吞吐量,比如统计用户访问日志的pv和uv;

    C典型的离线处理平台有Hadoop,典型的实时处理平台有Storm;

    D实时处理适用于解决计算量小、计算时间快的问题;离线处理适用于解决计算量大、计算时间慢的问题

  • 4. 数据质量是数据仓库建设的重要环节,以下关于数据质量的描述错误的是?

    A数据质量管理的目的是收集和清理数据并确保数据的完整性,及时性和准确性;

    B数据质量问题产生的主要原因是数据孤岛的存在;

    C数据质量的提升不是一次就能完成的,它是一个长期的过程;

    D数据质量管理是通过计划、实施和控制活动,运用质量管理技术度量、评估、改进和保证数据的恰当使用。

  • 5. 策划留存类活动的目的是()

    A增加粉丝活跃度

    B增加用户黏性

    C提升转化率

    D以上都是

  • 6. 以下操作属于输入当前系统时间的是()

    ACtrl+Shift

    BShift+;

    CCtrl+;

    DCtrl+Shift+;

  • 7. 某新闻APP,希望向用户推荐其感兴趣的新闻增加用户的粘性。现收集了大量用户过去3个月的各类新闻浏览数据,需构建一个数据挖掘模型预测用户感兴趣的新闻。如下几模型构建方案,最合适的是哪个?

    A统计当前阅读量最大的新闻,将该类新闻推荐给用户。

    B统计用户最近阅读量最大的新闻类型,将此类型新闻推荐给用户。

    C使用Apriori关联分析算法分析用户阅读新闻类型,找到新闻类型的频繁项集,当用户阅读的新闻属于频繁项集,则向其推荐频繁项集其他类型新闻。

    D通过协同过滤算法,即当用户A阅读某个新闻时,统计阅读该新闻的其他用户还阅读了哪些其他新闻,将这些新闻推荐给用户A。

  • 8. 阿里云大数据计算服务MaxCompute中,有订单表和产品表,现需用订单表关联产品表获取产品信息,使用如下哪种方式性能最佳?

    A订单表 left outer join产品表

    B订单表 inner join 产品表

    C订单表 mapjoin 产品表

    D订单表full join 产品表

  • 9. 逻辑建模是数据建模中重要的一个环节,如下描述中,关于逻辑建模,描述正确的是?

    A逻辑建模的主要工作包括客户交流、理解需求、形成实体。

    B逻辑建模的产物是数据库具体表或者其他数据库对象。

    C逻辑建模属于建模三步骤中的第一个步骤。

    D逻辑建模是在数据库中创建具体的数据库对象。

  • 10. 在用户分群的常用模型中,RFM模型基于最近一次消费(R)、消费频率(F)、消费金额(M)来帮助预测客户再次购买的可能性。其基本思想是,如果客户最近经常花重金从你的公司购买产品,他未来还可能购买。以下场景中,()___最适合使用RFM模型。

    A某视频网站的VIP订阅分析

    B某直播网站的打赏分析

    C某婚庆公司的消费分析

    D某楼盘的购房分析

  • 11. 某电商公司,每天会产生大量客户浏览商品、购买商品等数据,其中购买商品订单数据在关系型数据库,浏览商品记录在日志文件中。现该公司需要通过这些数据,分析客户的购买偏好,通过数据挖掘预测客户购买意向,进行商品推荐。现使用阿里云的产品构建大数据平台实现上述需求,下面几个产品组合,哪个最适合?

    A分布式关系型数据库DRDS、一站式大数据开发平台DataWorks、分析型数据库ADB

    B大数据计算服务MaxCompute、一站式大数据开发平台DataWorks、机器学习PAI

    C表格存储TS、智能数据构建与管理Dataphin、BI报表平台Quick BI

    D大数据计算服务MaxCompute、一站式大数据开发平台DataWorks、DataV数据可视化

  • 12. 在完成图表后,想要在图表底部的网格中显示工作表中的图表数据,正确操作为()

    A单击'图表'工具栏中的'图表向导'按钮

    B选中图表,单击'图表'工具栏中的'图表向导'按钮

    C单击'图表'工具栏中的'数据表'按钮

    D选中图表,单击'图表'工具栏中的'数据表'按钮

  • 13. 使用分类汇总按"性别"分别求出男生和女生的各科平均成绩,应进行( )操作?()

    A单击'数据'菜单栏中的'分类汇总',按'性别'进行分类

    B单击'编辑'菜单栏中的'分类汇总',按'性别'进行分类

    C先单击'数据'菜单栏中的'排序和筛选',按'性别'进行排序,再点击'分类汇总'进行分类

    D先单击'编辑'菜单栏中的'排序和筛选',按'性别'进行排序,再点击'分类汇总'进行分类

  • 14. 在Excel中,可以通过( )向单元格输入数据?()

    A编辑栏

    B工具栏

    C状态栏

    D菜单栏

  • 15. 下列不属于教师数据素养三大构成要素的是()

    A 数据意识

    B 数据分析

    C 数据能力

    D 数据伦理道德

  • 16. 下列关于"以学生为中心"的人文主义教育观描述正确的是()

    A发挥学生的潜能,达到自我实现的目的

    B'以教师为中心'的教育基础

    C重视学习结果,促进自我评价强

    D调理论学习,忽视动手实践

  • 17. 以下关于无监督学习的说法错误的是?()

    A无监督学习主要应用于数据挖掘,模式识别,图像处理等。

    B无监督学习通过算法让机器自我减少误差。

    C无监督学习又称归纳性学习(clustering)。

    D无监督学习的方法分为两大类∶基于概率密度函数估计的直接方法、基于样本间相似性度量的简洁聚类方法

  • 18. 分层的课后作业内容不包括?()

    A进阶提升

    B巩固提高

    C夯实基础

    D课前预习

  • 19. 对于数据的可视化实现方法,下列描述错误的是()

    A常用的可视化实现方法分为静态可视化实现方法和交互式可视化实现方法

    B数据集以表格形式呈现便于读者了解数据的内部结构

    C常用的静态可视化形式包括散点图、柱形图、折线图、饼图、箱线图、直方图、雷达图

    D数据的静态可视化方法比数据的交互式可视化好

  • 20. 以下哪个变量表示样本数据的数值落在某一区间的概率__?()

    A峰度

    B置信水平

    C偏度

    D方差

  • 21. 以下那种引用方式属于绝对引用?()

    ASB2

    BSBS2

    CBS2

    DB2

  • 22. 使用描述统计分析工具的操作为____?()

    A点击'数据'选项卡中的'数据分析'按钮,在打开的'数据分析'对话框中选择'描述统计'

    B点击'帮助'选项卡中的'数据分析'按钮,在打开的'数据分析'对话框中选择'描述统计'

    C点击'引用'选项卡中的'数据分析'按钮,在打开的'数据分析'对话框中选择'描述统计'

    D点击'插入'选项卡中的'数据分析'按钮,在打开的'数据分析'对话框中选择'描述统计'

  • 23. 从格式塔原则的角度分析,下图可视化运用了哪些原则()

    A简洁性原则、接近性原则、连续性原则

    B闭合性原则、对称性原则、相似性原则

    C简洁性原则、接近性原则、相似性原则

    D主体/背景原则、接近性原则、相似性原则

  • 24. 下列关于大数据时代帮助学生实现个性化学习方法描述不正确的是()

    A确定学习目标,统一教学进度

    B挖掘学习兴趣,建立学生分组

    C分析学生数据,设定学习目标

    D应用信息技术,帮助学生交流

  • 25. 下列不属于系统思维常见的模型的是()

    A文字模型

    B数学模型

    C数据模型

    D程序模型

  • 26. 在整个可视化过程中,数据共有哪五种状态()

    A原始数据、准备数据、聚焦数据、几何数据、图像数据

    B原始数据、准备数据、噪音数据、图形数据、虚拟数据

    C原始数据、噪音数据、几何数据、图形数据、聚焦数据

    D原始数据、准备数据、噪音数据、聚焦数据、虚拟数据

  • 27. 对文本内容进行词频统计所做的可视化通常采用()

    A词云

    B雷达图

    C密度图

    D直方图

  • 28. 关于关系挖掘技术,以下描述不正确的是()

    A挖掘序列关系

    B从用户的访问序列中挖掘出相关的规则

    C挖掘共现关系

    D注重事务间的关系

  • 29. 知识图谱所描绘的对象不包括()

    A从事科学技术活动和作为知识载体的人

    B显性或编码化的知识

    C过程或方法

    D隐性的知识

  • 30. 以下哪个选项不是学习分析的特点()

    A理解和优化学习

    B以线下学习为基础

    C评估学业成就

    D预测未来表现

  • 31. 下面哪项不是ETL引擎常用的组件()

    A数据载入

    B字段映射

    C数据清洗

    D数据过滤

  • 32. 网络广告的精准投放,政府部门的一站式服务,城市的可持续发展,医疗数据分析,实时路况,智慧城市这一景象出现在数据发展历史的哪一阶段?()

    A孕育期

    B成熟期

    C应用期

    D萌芽期

  • 33. 关于微课,以下说法不正确的是?()

    A一节微课通常只讲解一个知识点或典型问题

    B该知识点要足够'微'

    C能够解决学习者的实际问题

    D一节微课可以包含几个知识点,只要讲解清楚就好

  • 34. 在翻转课堂教学中,不属于学生课前活动的是?()

    A制作学习任务单

    B明确学习目标

    C观看微课视频

    D做进阶练习

  • 35. 按照学习中使用推理的多少,机器学习所采用的策略大体上可分为哪几种?()

    A通过传授学习、类比学习和通过事例学习

    B通过传授学习、通过事例学习、机械学习

    C机械学习、通过传授学习、类比学习和通过事例学习

    D机械学习、通过传授学习、类比学习

  • 1. A店铺昨日的交易指数为70096,竞争对手B店铺的交易指数为85238,对此,下列说法错误的是()

    AB店铺的支付金额比A店铺高出15139元

    BB店铺的支付转化率比A店铺高

    CB店铺的访客数比A店铺高

    D两个店铺的指数差值不代表实际支付金额的差值,仅代表高低

  • 2. 行动指标可拆解为()

    A人群维度

    B渠道维度

    C业务流程

    D地理区域

  • 3. 在小视频分析模块,相关数据包括()

    A播放量

    B评论量

    C收藏量

    D转发量

    E平均进度

  • 4. 在“粉丝变化”模块中可以看到近一周内的()

    A净增粉丝数

    B新增粉丝数

    C减少粉丝数

    D原创微博数

  • 5. 在电子商务数据分析需求分析时,需要对需求进行哪些分析?()

    A真实性

    B可行性

    C价值性

    D快捷性

  • 6. 计算行业赫芬达尔指数,其关键步骤包括()。

    A获取竞争对手的市场份额

    B将竞争对手的市场份额平方值相乘

    C计算市场份额的平方值

    D将竞争对手的市场份额平方值相加

  • 7. 电子商务的各类应用是建立在()和()两大支柱上的。

    A政策法律

    B消费者

    C信息来源渠道

    D技术标准

  • 8. 下列哪些属于所属电商平台提供的数据工具?()

    A生意参谋

    B京东商智

    C多多参谋

    D店侦探

  • 9. 以下属于电子商务数据分析在企业中常见应用的是()。

    A对企业网站及对外营销推广的数据进行分析

    B对企业目标受众群体、实际交易客户群体、潜在客户群体等进行分析

    C对产品的点击量、订单量、成交量、客户反馈等数据进行分析

    D对企业所在行业及市场中的发展现状与趋势进行分析

  • 10. 属于用户运营的指标体系的是()。

    A收入

    B流失用户

    C登陆用户

    D新注册用户