考试总分:100分
考试类型:模拟试题
作答时间:90分钟
已答人数:432
试卷答案:没有
试卷介绍: 大数据工程技术人员考试题目及答案已经上线了,需要的朋友快来刷题吧。
A探索性数据分析
B建模描述
C预测建模
D寻找模式和规则
A国家领导人
B大型企业
C行业专家和技术专家
D职业经理人
A反欺诈
B精准营销
C基金定投
D交易预警
A面向主题的
B集成的
C动态变化的
D反映历史变化的
A传统的机器学习和数据分析肛具
B第二代机器学习工具
C第二代机器学习工具
D未来机器学习工具
AUserCF算法推荐的是那些和目标用户有共同兴趣爱好的其他用户所喜欢的物品
BItemCF算法推荐的是那些和目标用户之前喜欢的物品类似的其他物品
CItemCF算法的推荐更偏向社会化,而UserCF算法的推荐更偏向于个性化
DItemCF算法倾向于推荐与用户已购买商品相似的商品,往往会出现多样性不足、推荐新颖度较低的问题
A任意应用程序
B任意可以在Windows
C可以串行处理的应用程序
D可以并行处理的应用程序
A数据可视化是指将大型数据集中的数据以图形图像形式表示
B利用数据分析和开发工具发现其中未知信息的处理过程
C数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元素表示
D将数据的各个属性值以一维数据的形式表示
AZookeeper文件记录了用户数据表的Region位置信息
B-ROOT-表记录了.META.表的Region位置信息
CMETA.表保存了HBase中所有用户数据表的Region位置信息
DZookeeper文件记录了-ROOT-表的位置信息
A为海量数据提供存储的HDFS和对数据进行计算的MapReduce
B提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务
CHadoop不仅可以运行在企业内部的集群中,也可以运行在云计算环境中
DHadoop被视为事实上的大数据处理标准
A成熟期
B萌芽期
C大规模应用期
D迷茫期
A在数据基础上倾向于全体数据而不是抽样数据
B在分析方法上更注重相关分析而不是因果分析
C在分析效果上更追求效率而不是绝对精确
D在数据规模上强调相对数据而不是绝对数据
A数据管理人员
B数据分析员
C研究科学家
D软件开发工程师
A数据重组是数据的重新生产和重新采集
B数据重组能够使数据焕发新的光芒
C数据重组实现的关键在于多源数据融合和数据集成
D数据重组有利于实现新颖的数据模式创新
A顶点的当前值
B消息队列
C标志位
D一个接收到的消息的迭代器
A全局计算
B局部计算
C通讯
D栅栏同步
A反欺诈
B异常检测
C基于规则的报警
D消费者技术中的实时数据即席分析
A图结构数据的处理
B基于历史数据的交互式查询
C复杂的批量数据处理
D基于历史数据的数据挖掘
A读写分离
B分库分表
C数据安全
D资源合并
AHDFS
BMapReduce
CHadoop
DHBase
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A对
B错
A大数据(BigData)又称为巨量资料或海量资料
B大数据是指所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为对企业经营决策具有较高参考价值的资讯
C“大数据”一词首次被提出是在2011年有关机构发布的研究报告——《大数据:创新、竞争和生产力的下一个新领域》之中
D“大数据”并不是突然产生的概念,它是IT技术发展的必然产物
A在数据存储方面,Hive一般依赖于分布式文件系统HDFS,而传统数据库则依赖于本地文件系统
B在索引方面,传统的关系数据库可以针对多个列构建复杂的索引,大幅度提升数据查询性能,而Hive不像传统的关系型数据库那样有键的概念,它只能提供有限的索引功能
C在分区方面,传统的数据库提供分区功能来改善大型表以及具有各种访问模式的表的可伸缩性、可管理性,以及提高数据库效率;Hive不支持分区功能
D在执行引擎方面,传统的关系数据库依赖自身的执行引擎,而Hive则依赖于MapReduce、Tez和Spark等执行引擎
A该顶点的当前值
B一个接收到的消息的迭代器
C一个出射边的迭代器
D标志位,用来标记顶点是否处于活跃状态
A大数据成为一种新的决策方式
B大数据应用促进信息技术与各行业的深度融合
C大数据开发推动新技术和新应用的不断涌现
D大数据对社会发展没有产生积极影响
A软件即服务(SaaS)
B平台即服务(PaaS)
C基础设施即服务(IaaS)
D数据采集即服务(DaaS)
A数据类型
B数据操作
C存储模式
D数据维护
AWeb2.0网站系统通常不要求严格的数据库事务
BWeb2.0网站系统基本上不用关系数据库来存储数据
CWeb2.0并不要求严格的读写实时性
DWeb2.0通常不包含大量复杂的SQL查询
A局部计算:每个参与的处理器都有自身的计算任务
B通讯:处理器群相互交换数据
C栅栏同步:当一个处理器遇到“路障”(或栅栏),会等到其他所有处理器完成它们的计算步骤
D基于现有的分布式计算平台进行图计算
A复杂的批量数据处理:通常时间跨度在数十分钟到数小时之间
B基于历史数据的交互式查询:通常时间跨度在数十秒到数分钟之间
C基于实时数据流的数据处理:通常时间跨度在数十秒到数分钟之间
D基于实时数据流的数据处理:通常时间跨度在数百毫秒到数秒之间
ACA:也就是强调一致性(C)和可用性(A),放弃分区容忍性(P)
BCP:也就是强调一致性(C)和分区容忍性(P),放弃可用性(A)
CAP:也就是强调可用性(A)和分区容忍性(P),放弃一致性(C)
DCAP:也就是同时兼顾可用性(A)、分区容忍性(P)和一致性(C),当时系统性能会下降很多