考试总分:100分
考试类型:模拟试题
作答时间:90分钟
已答人数:371
试卷答案:没有
试卷介绍: 本站精心整理了大数据工程技术人员考试题,快来看看你的分数是多少吧。
A微软公司
B惠普公司
C苹果公司
DIBM公司
A柱形图
B饼状图
C曲线图
D网络图
A第i个扇区
B第i个磁头
C第i个磁道
D第i个柱面
ASELECT
BINSERT
CUPDATE
DDELETE
A上卷
B下钻
C切块
D转轴
APMI
BHWI(HiveWebInterface)
CJDBC/ODBC
DThriftServer
AHive与Impala使用相同的元数据
BHive与Impala中对SQL的解释处理比较相似,都是通过词法分析生成执行计划
CHive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询
DHive在内存不足以存储所有数据时,会使用外存,而Impala也是如此
A/user/hive/warehouse
B/opt/hive/warehouse
C/opt/softwares/warehouse
D/modules/hive/warehouse
AZookeeper
BHBase
CHive
DSqoop
AHDFS
BHBase
CHIve
DKafka
A32MB
B64MB
C128MB
D256MB
A数据交易市场是大数据产业发展到一定程度的产物
B商业化的数据交易活动催生了多方参与的第三方数据交市场
C数据交易市场通过生产数据、研发和分析数据,为数据交易提供帮助
D数据交易市场是大数据资源化的必然产物
AGFS与HDFS相对应
BGFS与Zookeeper相对应
CMapReduce与Hadoop MapReduce相对应
DChubby与Zookeeper相对应
A维护了blockid到datanode本地文件的映射关系
B存储文件内容
C文件内存保存在磁盘中
D存储元数据
AHDFS
BMapReduce
CYARN
DNameNode和DataNode
AHadoopJob 对应 Storm Topology
BHadoopTaskTracker对应 Storm Supervisor
CHadoopJobTracker对应 Storm Spout
DHadoopReduce对应 Storm Bolt
A数据实时采集
B数据批量采集
C数据实时计算
D实时查询服务
A推荐系统是大数据在互联网领域的典型应用
B推荐系统是自动联系用户和物品的一种工具
C推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
D推荐系统分为基于物品的协同过滤和基于商家的协同过滤
AController服务器
BProxy服务器
C愚公系统
D阿斯隆服务器
AHive
BHBase
CHDFS
DHadoop
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A配置维护
B域名服务
C分布式同步
D负载均衡服务
AHBase采用表来组织数据,表由行和列组成,列划分为若干个列族
B每个HBase表都由若干行组成,每个行由行键(row key)来标识
C列族里的数据通过列限定符(或列)来定位
D每个单元格都保存着同一份数据的多个版本,这些版本采用时间戳进行索引
ANative Java API
BHBase Shell
CThrift Gateway
DREST Gateway
A数据的“大量化”
B数据的“快速化”
C数据的“多样化”
D数据的“价值密度比较低”
A关系数据库以完善的关系代数理论作为基础,有严格的标准
B关系数据库可扩展性较差,无法较好支持海量数据存储
CNoSQL可以支持超大规模数据存储
DNoSQL数据库缺乏数学理论基础,复杂查询性能不高
A性能好(高并发),灵活性高
B具备统一的查询语法
C文档数据库支持文档间的事务
D复杂性低,数据结构灵活
A推荐系统可以创造全新的商业和经济模式,帮助实现长尾商品的销售
B“长尾”概念于2004年提出,用来描述以亚马逊为代表的电子商务网站的商业和经济模式
C可以通过发掘长尾商品并推荐给感兴趣的用户来提高销售额
D热门推荐的主要缺陷在于推荐的范围有限,所推荐的内容在一定时期内也相对固定。无法实现长尾商品的推荐
A观测、跟踪数据
B分析数据
C辅助理解数据
D增强数据吸引力
A选择集群中的多台机器执行图计算任务,每台机器上运行用户程序的一个副本
BMaster把一个图分成多个分区,并把分区分配到多个Worker
CMaster会把用户输入划分成多个部分,通常是基于文件边界进行划分
DMaster向每个Worker发送指令,Worker收到指令后,开始运行一个超步
A运行速度快
B容易使用
C通用性
D运行模式单一