考试总分:100分
考试类型:模拟试题
作答时间:90分钟
已答人数:394
试卷答案:有
试卷介绍: 本站为大家带来了大数据工程技术人员试题及答案(三)的模拟试卷,快来进行练习吧。
A定量思维
B相关思维
C因果思维
D实验思维
A价值密度低
B处理速度快
C数据类型繁多
D数据体量巨大
A将罪犯的定罪权放在数据手中,借以表达对数据和分析结果的崇尚,这实际上是一种滥用。
B随着数据量和种类的增多,大数据促进了数据内容的交叉检验,匿名化的数据不会威胁到任何人的隐私。
C采集个人数据的工具就隐藏在我们日常生活所必备的工具当中,比如网页和智能手机应用程序。
D预测与惩罚,不是因为所做,而是因为将做。
A更有效
B相当
C不具备可比性
D无效
A降低
B不变
C提高
D无关
A其本质是线性搜索
B可以进行二进制搜索
C需要扫描每个文件块并测试所有记录
D如果选择位于关键属性上,则可以停止查找记录
AGroup
BJoin
CPartition
DUnion
A行
B单元格
C时间戳
D列族
A实体
B实体间的关系
C以上两者
D以上都不是
ACREATE TABLE
BCREATE TRIGGER
CCREATE INDEX
DCREATE DATABASE
A动态可扩展
B高成本
C易用性
D大规模并行处理
A在Region分裂或合并后,负责重新调整Region的分布
B对发生故障失效的Region服务器上的Region进行迁移
C管理用户对表的增加、删除、修改、查询等操作
D不支持不同Region服务器之间的负载均衡
AHDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
BHDFS采用了主从(Master/Slave)结构模型
CHDFS采用了冗余数据存储,增强了数据可靠性
DHDFS采用块的概念,使得系统的设计变得更加复杂
A关联规则发现
B聚类
C分类
D自然语言处理
A一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合
B每个RDD可分成多个分区,每个分区就是一个数据集片段
CRDD是可以直接修改的
DRDD提供了一种高度受限的共享内存模型
A完全参与
B部分参与
C以上均有可能
D以上均不是
Aindex
Bdrop
Cerase
Dresources
AMapReduce
BTez
CStorm
DSpark
A英国
B韩国
C印度
D澳大利亚
A数据收集
B数据存储
C数据分析
D数据再利用
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
AHBase是建立在HDFS之上的可靠的、可扩展的分布式数据集库,是一个高可靠性、高性能、面向列(簇)、可伸缩的分布式存储系统
BZookeeper是一个针对大型分布式系统的可靠协调系统,主要提供配置服务、名字服务、分布式服务、组服务等功能
CHive是一个基于Hadoop的数据仓库平台,它提供了很多数据仓库中使用的工具和方法
DHadoopCommon是Hadoop一系列分布式文件系统通用的I/O组件和接口,包括序列化、JavaRPC和持久化数据结构等
A客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
BHDFS客户端是一个库,暴露了HDFS文件系统接口
C严格来说,客户端并不算是HDFS的一部分
D客户端可以支持打开、读取、写入等常见的操作
AFsImage
BDN8
CBlock
DEditLog
A应用层
B处理层
C感知层
D网络层
A分布式存储
B分布式应用
C分布式处理
D集中式存储
A事件驱动型应用
B数据分析应用
C数据流水线应用
D正反馈应用
AHDFS作为高可靠的底层存储,用来存储Hive的海量数据
BMapReduce对这些海量数据进行批处理,实现Hive的高性能计算
C当采用MapRedue作为Hive的执行引擎时,用HiveQL语句编写的处理逻辑,最终都要转化为MapReduce任务来运行
DHBase与Hive的功能是互补的,它实现了Hive不能提供的功能
A无法满足快速增长的海量数据存储需求
B无法有效处理不同类型的数据
C具有很强的扩展性
D计算和处理能力不足
A泊松相关系数
B余弦相似度
C调整余弦相似度
D调整正弦相似度
Ahadoop-env.sh
Bprofile
Ccore-site.xml
Difcfg-eth0