题库分类下载APP 帮助中心

当前位置：首页 > 考试 > 职业技能 > 大数据工程技术人员 > 理论知识 >

大数据工程技术人员考试试题

大数据工程技术人员考试试题

考试总分：100分

考试类型：模拟试题

作答时间：90分钟

已答人数：377

试卷答案：没有

试卷介绍： 本站为大家精心整理了大数据工程技术人员考试试题，看看你的分数是多少吧。

开始答题

试卷预览

单选题 判断题 多选题

1. 下列论据中，体现“冷眼”看大数据的观点的是（）

A互联网金融打破了传统的观念和行为

B大数据医疗正在走进平民百姓

C数据资产型企业前景光明

D个人隐私泄露与信息安全担忧

2. HDFS中的block默认保存几个备份。

A3份

B2份

C1份

D不确定

3. 下面哪个进程负责MapReduce任务调度。

ANameNode

BJobtracker

CTaskTracker

DsecondaryNameNode

4. 关于OLAP和OLTP的说法，下列正确的是（）。

AOLAP事务量大，但事务内容比较简单且重复率高

BOLAP的最终数据来源与OLTP不一样

COLTP面对的是决策人员和高层管理人员

DOLTP以应用为核心，是应用驱动的

5. 哪一个属于非关系型数据库（）。

AMySQL

BOracle

CMongoDB

DMicrosoft Access

6. 制成大数据业务的基础是(　　)

A数据科学

B数据应用

C数据硬件

D数据人才

7. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(　　)

A一个Map函数就是对一部分原始数据进行指定的操作。

B一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

CMap与Map之间不是相互独立的。

DReducee与Reduce之间不是相互独立的。

8. 下列哪些操作可以设置一个监听器Watcher(　　)

AgetData

BgetChildren

Cexists

DsetData

9. 在数据生命周期管理实践中，（）是执行方法。

A数据存储和备份规范

B数据管理和维护

C数据价值发觉和利用

D数据应用开发和管理

10. （）反映数据的精细化程度，越细化的数据，价值越高。

A规模

B活性

C关联度

D颗粒度

11. 第一次信息化浪潮主要解决什么问题？

A信息传输

B信息处理

C信息爆炸

D信息转换

12. 下列哪一个不属于大数据产业的产业链环节？

A数据循环层

B数据源层

C数据分析层

D数据应用层

13. 下面哪一项不属于计算机集群中的节点？

A主节点(MasterNode)

B源节点（SourceNode）

C名称结点(NameNode)

D从节点（SlaveNode）

14. 下面对SecondaryNameNode第二名称节点的描述，哪个是错误的？

ASecondaryNameNode一般是并行运行在多台机器上

B它是用来保存名称节点中对HDFS元数据信息的备份，并减少名称节点重启的时间

CSecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件，并下载到本地的相应目录下

DSecondaryNameNode是HDFS架构中的一个组成部分

15. HBase中需要根据某些因素来确定一个单元格，这些因素可以视为一个“四维坐标”，下面哪个不属于“四维坐标”？

A行键

B关键字

C列族

D时间戳

16. 下面关于Region的说法，哪个是错误的？

A同一个Region不会被分拆到多个Region服务器

B为了加快访问速度，.META.表的全部Region都会被保存在内存中

C一个-ROOT-表可以有多个Region

D为了加速寻址，客户端会缓存位置信息，同时，需要解决缓存失效问题

17. 下列关于阿里云RDS的说法，哪个是错误的？

ARDS是阿里云提供的关系型数据库服务

BRDS由专业数据库管理团队维护

CRDS具有安全稳定、数据可靠、自动备份

DRDS实例，是用户购买RDS服务的基本单位，在实例中，用户只能创建一个数据库

18. 以下哪个不属于数据分析应用？

A基于规则的报警

B移动应用中的产品更新及实验评估分析

C消费者技术中的实时数据即席分析

D大规模图分析

19. 下列哪个不属于可视化工具？

AGoogle Chart API

BD3

CVisual.ly

DSpark

20. 下列哪个说法是错误的？

A无论是亚马逊还是Netflix，其推荐系统的基础都是ItemCF算法

BItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品

CItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度

D实现UserCF算法的关键步骤是计算物品与物品之间的相似度

1. 具备很强的报告撰写能力，可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来，能够清楚地论述分析结果及可能产生的影响，从而说服决策者信服并采纳其建议，是数据分析能力对大数据人才的基本要求。（）

A对

B错

2. 数据外部流通和对外开放不能通过数据直接交易的方式实现。

A对

B错

3. python中定义函数不用声明数据类型。

A对

B错

4. Hive使用length()函数可以求出输出的数量。

A对

B错

5. 删除Hive外部表时，表数据也会删除。

A对

B错

1. 以下哪些是数据仓库的特性：（）

A面向主题的（SubjectOriented）

B集成的（Integrated）

C相对稳定的（Non-Volatile）

D反映历史变化

2. Hive主要由哪三个模块组成：（）

A用户接口模块

B用户查询模块

C驱动模块

D元数据存储模块

3. Hadoop作为分布式计算技术的杰出代表，其主要特征包括：（）

A可靠性

B健壮性

C简单性

D高效性'

4. 当前，大数据产业发展的特点是（）

A规模较大

B规模较小

C增速很快

D增速缓慢

E多产业交叉融合

5. 下列关于Storm框架，描述正确的有？

Aworker:每个worker进程都属于一个特定的Topology

Bexecutor：executor是产生于worker进程内部的线程

Ctask:实际的数据处理由task完成

D在Topology的生命周期中，每个组件的task数目是不会发生变化的，而executor的数目却不一定

6. 下面哪个是Hadoop2.0的组件？

AResourceManager

BJobTracker

CTaskTracker

DNodeManager

7. 推荐系统的本质是建立用户与物品的联系，根据推荐算法的不同，推荐方法包括以下哪几类？

A专家推荐：人工推荐，由资深的专业人士来进行物品的筛选和推荐，需要较多的人力成本

B基于统计的推荐：基于统计信息的推荐（如热门推荐），易于实现，但对用户个性化偏好的描述能力较弱

C基于内容的推荐：通过机器学习的方法去描述内容的特征，并基于内容的特征来发现与之相似的内容

D混合推荐：结合多种推荐算法来提升推荐效果

8. 一个完整的推荐系统通常包括以下哪三个模块？

A用户建模模块

B数据采集模块

C推荐对象建模模块

D推荐算法模块

9. 关于基于用户的协同过滤，下列哪些说法是正确的？

A基于用户的协同过滤算法（简称UserCF算法）在1992年被提出，是推荐系统中最古老的算法

BUserCF算法符合人们对于“趣味相投”的认知

C实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度

DUserCF算法符合兴趣相似的用户往往有相同的物品喜好

10. 下列选项参数是Sqoop指令的是？(　　)

Aimport

Boutput

Cinput

Dexport

相关试卷

相关题库

手机浏览器扫码下载

关注
公众号

微信扫码关注

微信
小程序

微信扫码关注

微信扫码添加老师微信