大数据工程技术人员考试试题

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:367

试卷答案:没有

试卷介绍: 本站为大家精心整理了大数据工程技术人员考试试题,看看你的分数是多少吧 。

开始答题

试卷预览

  • 1. 下列论据中,体现“冷眼”看大数据的观点的是()

    A互联网金融打破了传统的观念和行为

    B大数据医疗正在走进平民百姓

    C数据资产型企业前景光明

    D个人隐私泄露与信息安全担忧

  • 2. HDFS中的block默认保存几个备份。

    A3份

    B2份

    C1份

    D不确定

  • 3. 下面哪个进程负责MapReduce任务调度。

    ANameNode

    BJobtracker

    CTaskTracker

    DsecondaryNameNode

  • 4. 关于OLAP和OLTP的说法,下列正确的是()。

    AOLAP事务量大,但事务内容比较简单且重复率高

    BOLAP的最终数据来源与OLTP不一样

    COLTP面对的是决策人员和高层管理人员

    DOLTP以应用为核心,是应用驱动的

  • 5. 哪一个属于非关系型数据库()。

    AMySQL

    BOracle

    CMongoDB

    DMicrosoft Access

  • 6. 制成大数据业务的基础是(  )

    A数据科学

    B数据应用

    C数据硬件

    D数据人才

  • 7. 下面关于MapReduce模型中Map函数与Reduce函数的描述正确的是(  )

    A一个Map函数就是对一部分原始数据进行指定的操作。

    B一个Map操作就是对每个Reduce所产生的一部分中间结果进行合并操作。

    CMap与Map之间不是相互独立的。

    DReducee与Reduce之间不是相互独立的。

  • 8. 下列哪些操作可以设置一个监听器Watcher(  )

    AgetData

    BgetChildren

    Cexists

    DsetData

  • 9. 在数据生命周期管理实践中,(  )是执行方法。

    A数据存储和备份规范

    B数据管理和维护

    C数据价值发觉和利用

    D数据应用开发和管理

  • 10. ( )反映数据的精细化程度,越细化的数据,价值越高。

    A规模

    B活性

    C关联度

    D颗粒度

  • 11. 第一次信息化浪潮主要解决什么问题?

    A信息传输

    B信息处理

    C信息爆炸

    D信息转换

  • 12. 下列哪一个不属于大数据产业的产业链环节?

    A数据循环层

    B数据源层

    C数据分析层

    D数据应用层

  • 13. 下面哪一项不属于计算机集群中的节点?

    A主节点(MasterNode)

    B源节点(SourceNode)

    C名称结点(NameNode)

    D从节点(SlaveNode)

  • 14. 下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?

    ASecondaryNameNode一般是并行运行在多台机器上

    B它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间

    CSecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下

    DSecondaryNameNode是HDFS架构中的一个组成部分

  • 15. HBase中需要根据某些因素来确定一个单元格,这些因素可以视为一个“四维坐标”,下面哪个不属于“四维坐标”?

    A行键

    B关键字

    C列族

    D时间戳

  • 16. 下面关于Region的说法,哪个是错误的?

    A同一个Region不会被分拆到多个Region服务器

    B为了加快访问速度,.META.表的全部Region都会被保存在内存中

    C一个-ROOT-表可以有多个Region

    D为了加速寻址,客户端会缓存位置信息,同时,需要解决缓存失效问题

  • 17. 下列关于阿里云RDS的说法,哪个是错误的?

    ARDS是阿里云提供的关系型数据库服务

    BRDS由专业数据库管理团队维护

    CRDS具有安全稳定、数据可靠、自动备份

    DRDS实例,是用户购买RDS服务的基本单位,在实例中,用户只能创建一个数据库

  • 18. 以下哪个不属于数据分析应用?

    A基于规则的报警

    B移动应用中的产品更新及实验评估分析

    C消费者技术中的实时数据即席分析

    D大规模图分析

  • 19. 下列哪个不属于可视化工具?

    AGoogle Chart API

    BD3

    CVisual.ly

    DSpark

  • 20. 下列哪个说法是错误的?

    A无论是亚马逊还是Netflix,其推荐系统的基础都是ItemCF算法

    BItemCF算法是给目标用户推荐那些和他们之前喜欢的物品相似的物品

    CItemCF算法主要通过分析用户的行为记录来计算物品之间的相似度

    D实现UserCF算法的关键步骤是计算物品与物品之间的相似度

  • 1. 具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求

    A

    B

  • 2. 数据外部流通和对外开放不能通过数据直接交易的方式实现。

    A

    B

  • 3. python中定义函数不用声明数据类型。

    A

    B

  • 4. Hive使用length()函数可以求出输出的数量。

    A

    B

  • 5. 删除Hive外部表时,表数据也会删除。

    A

    B

  • 1. 以下哪些是数据仓库的特性:( )

    A面向主题的(SubjectOriented)

    B集成的(Integrated)

    C相对稳定的(Non-Volatile)

    D反映历史变化

  • 2. Hive主要由哪三个模块组成:( )

    A用户接口模块

    B用户查询模块

    C驱动模块

    D元数据存储模块

  • 3. Hadoop作为分布式计算技术的杰出代表,其主要特征包括:()

    A可靠性

    B健壮性

    C简单性

    D高效性'

  • 4. 当前,大数据产业发展的特点是( )

    A规模较大

    B规模较小

    C增速很快

    D增速缓慢

    E多产业交叉融合

  • 5. 下列关于Storm框架,描述正确的有?

    Aworker:每个worker进程都属于一个特定的Topology

    Bexecutor:executor是产生于worker进程内部的线程

    Ctask:实际的数据处理由task完成

    D在Topology的生命周期中,每个组件的task数目是不会发生变化的,而executor的数目却不一定

  • 6. 下面哪个是Hadoop2.0的组件?

    AResourceManager

    BJobTracker

    CTaskTracker

    DNodeManager

  • 7. 推荐系统的本质是建立用户与物品的联系,根据推荐算法的不同,推荐方法包括以下哪几类?

    A专家推荐:人工推荐,由资深的专业人士来进行物品的筛选和推荐,需要较多的人力成本

    B基于统计的推荐:基于统计信息的推荐(如热门推荐),易于实现,但对用户个性化偏好的描述能力较弱

    C基于内容的推荐:通过机器学习的方法去描述内容的特征,并基于内容的特征来发现与之相似的内容

    D混合推荐:结合多种推荐算法来提升推荐效果

  • 8. 一个完整的推荐系统通常包括以下哪三个模块?

    A用户建模模块

    B数据采集模块

    C推荐对象建模模块

    D推荐算法模块

  • 9. 关于基于用户的协同过滤,下列哪些说法是正确的?

    A基于用户的协同过滤算法(简称UserCF算法)在1992年被提出,是推荐系统中最古老的算法

    BUserCF算法符合人们对于“趣味相投”的认知

    C实现UserCF算法的关键步骤是计算用户与用户之间的兴趣相似度

    DUserCF算法符合兴趣相似的用户往往有相同的物品喜好

  • 10. 下列选项参数是Sqoop指令的是?(  )

    Aimport

    Boutput

    Cinput

    Dexport