题库分类下载APP 帮助中心

当前位置：首页 > 查试题 >

在大数据计算服务中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章每篇文章一行记录）,参考个字典文件（该文件会经常更新进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章（已经保存在表中了）,又需要输入字典（为经常变动的本地文件）,以下最合理的解决方案为？（）

单选题

在大数据计算服务中,使用MapReduce开发一个分词程序,即输入为保存在表中的多篇文章每篇文章一行记录）,参考个字典文件（该文件会经常更新进行分词。简而言之,在执行该程序的时候,既需要输入待分词的文章（已经保存在表中了）,又需要输入字典（为经常变动的本地文件）,以下最合理的解决方案为？（）

A. 将字典文件保存在本地,在MR中通过访问本地最新的字典文件实现

B. 将这个字典与源代码一起进行打包,直接执行即可

C. 将字典达成jar包,使用jar命令执行MR程序时,通过 resource参数指定该jar包

D. 每次都将字典文件作为资源上传到大数据计算服务上,然后MR中通过资源的方式来访

查看答案

该试题由用户451****78提供查看答案人数：34477 如遇到问题请 联系客服

相关试题

换一换

在开发大数据计算服务（MaxCompute原ODPS）的MapReduce时,可以使用JobClient类中的接口提交MapReduce作业。目前提交方式支持（）

A.非阻塞方式 B.远程提交 C.阻塞方式 D.本地提交

大数据计算服务（MaxCompuTe,原ODPS）允许用户在MapReduce中通过读取资源的方式使用表数据（）

大数据计算服务（MaxCompute,原ODPS）支持多种计算方式包括SQL、MapReduce、图计算（Graph）等我们最常使用的是SQL关于大数据计算服务sQL说法正确的是哪一项？（）

A.适合面向迭代的计算场景 B.适合事件（消息）驱动的计算场景 C.用户的学习成本低,不需要了解复杂的分布式计算概念,具备标准SQL使用经验的用户可以快速熟悉,使用 D.语法与Orcale, MySQL没有差别,用户可以将其他数据库中的SQL语句无缝迁移到大数据计算服务上来

大数据计算服务（MaxCompute,原ODPS）支持多种计算方式,包括SQL、MapReduce.图计算（Graph）等,我们最常使用的是SQL关于大数据计算服务SQL,说法正确的是哪项？（）

A.适台面向迭代的计算场景 B.适合事件（消息）驱动的计算场景 C.用户的学习成本低。不需要了解复杂的分布式计算概念,具备标准SQL使用经验的用户可以快速熟悉。使用 D.语法与 Oracle, MySQL没有差别。用户可以将其他数据库中的SQL语句无壁迁移到大数据计算服务上来

大数据计算服务（MaxCompute,原oDPS）的MapReduce编程模型通过Map/Reduce的协同操作,可以更加便捷、简易的处理分布式数据,以下关于大数据计算服务MapReduce的说法中,正确的是（）

A.Map和 Reduce前都需要对数据进行按顺序分片 B.进入 reduce前。数据必须进行合并操作（combiner）。然后按照key排序 C.Map Worker在输出数据时,需要为每一个输出数据指定一个Key D.Reducer的个数和 Mapper的个数必须一致

大数据计算服务的MapReduce的输入可以为空,也可以为视图（）

Bob使用java开发了一个大数据计算服务的MapReduce,用来对海量交易数据做时序分析,结果该MR性能较差,某些map存在明显的长尾效应,方法可以有效的消除长尾效应。什么方法可以有效的消除长尾效应（）

A.只关心处理的列,忽略其余的多余列 B.合理使用 combiner,适当的减少数据交互量 C.通过set命令或者 Jobconf修改MR参数,增大map/ reduce的内存 D.通过set命令或者 Jobconf修改MR参数,影响分片的大小和个数

大数据计算服务（MaxCompute原ODPS）的MapReduce提供了分布式的编程框架,以下哪类大数据计算服务可以作为MR的输入和输出（）

A.表 B.视图 C.资源 D.项目空间

大数据计算服务（MaxCompute原ODPS）的MapReduce的输入可以为空,也可以为视图（）

大数据计算服务（MaxCompute原ODPS）的MapReduce由多个步骤组成,以下哪个步骤是必须的（）

A.combine B.shuffle C.map D.reduce

热门试题

在使用大数据计算服务（MaxCompute,原ODPs）的MapReduce时,将输出结果写入到某张表中,采取的写入方式是（） 从优化角度来看大数据计算服务的MapReduce对于哪个节点处理哪个分片这个问题采用了策略（） 大数据计算服务的MapReduce中,归并函数是MapReduce计算框架的一种优化,即框架会在map端对相同key值的数据进行本地的合并操作。关于Combiner（归并）,以下说法正确的是？（） 使用大数据计算服务（MaxCompute,原ODPS）的客户端工具odpscmd时,如何进入一个已有的项目？（） 大数据计算服务MaxCompute原ODPS中支持在select中使用distinct使用distinct关键字可以仅仅列出不同的取值（） 一个阿里云账号只能加入一个大数据开发套件的组织（） 链式MapReduce计算中,对任意一个MapReduce作业,Map和Reduce阶段可以有无限个Mapper,但Reducer只能有一个 在DatalDE中使用数据同步任务将云数据库RDS（MySQL）加载到大数据计算服务时,为了提高单个数据同步任务的速度及效率,可以采取方式？（） 项目空间是大数据计算服务MaxCompute中的一个重要概念,一个用户可以创建多个项目空间,每个对像都属于某个项目空间（） 在大数据开发套件DatalDE中,需要为每个项目指定一个计算引擎,即该项目中的数据存储和处理将使用该指定的计算引擎。关于计算引擎的说法中最准确的是（） 大数据计算服务提供了大数据的存储和计算服务,非常适合应用于大数据分析的领域。以下说法中错误的是哪一项？（） 分析型数据库（AnalyticDB,原ADS）和大数据计算服务（MaxCompute,原MaxCompute）是阿里云针对大数据的两款产品,两者都提供面向海量数据的计算服务。以下哪几个场景更适合使用分析型数据库但是不适合使用大数据计算服务的？（） 在一个大数据计算服务的SQL语句中,可以读多张表中的数据,但是只能更新一张目标表中的数据（） 大数据计算服务（MaxCompute原ODPS）执行MapReduce时,每个MapWorker在读入各自的数据后,需要为每一条数据指定一个Key，这个Key的值决定了记录会被发送到那一个ReduceWorker。单个ReduceWorker有可能接收到多个Key值的记录,一个Key值对应的记录也有可能发送到多个ReduceWork（）某个阿里云账号下并未创建大数据计算服务（MaxCompute,原ODPS的projecT,该账号仍然可以通过被授权的方式,使用其他账号的大数据计算服务的资源,但该账号下不会产生大数据计算服务相关的费用（） 大数据计算服务的开发人员创建了日志表，并且导入了历史数据后发现表的一个字段命名拼写有错误，可以采用更正此问题成本最低（） 大数据计算服务（MaxCompute,原ODPS）是阿里巴巴自主研发的海量数据处理平台。主要服务于批量结构化数据的存储和计算。以下哪个场景不适合使用大数据计算服务实现？（） 大数据计算服务（MaxCompute原ODPS提供了超强的数据存储与计算能力,以下哪些场景可以只选择大数据计算服务就能实现？（） 在测试数据中使用生产交易的一个优点是（） 某公司使用大数据计算服务MaxCompute和一站式大数据开发平台DataWorks构建大数据平台，根据需求规划创建多个MaxCompute项目，其中有2个项目存储了公司重要数据，要求这两个 MaxCompute项目中的数据只能在这两个项目之间流动，不能流出到其他项目。以下哪个方案可以实现这个要求？

~~购买搜题卡~~ 会员须知 | 联系客服

免费查看答案购买搜题卡

关注公众号，回复验证码
享30次免费查看答案

微信扫码关注立即领取

恭喜获得奖励，快去免费查看答案吧~

去查看答案

全站题库适用，可用于E考试网网站及系列App

只用于搜题看答案，不支持试卷、题库练习，下载APP还可体验拍照搜题和语音搜索

支付方式

登录成功

首次登录已为您完成账号注册，
可在【个人中心】修改密码或在登录时选择忘记密码
账号登录默认密码：~~手机号后六位~~

手机浏览器扫码下载

关注
公众号

微信扫码关注

微信
小程序

微信扫码关注

微信扫码添加老师微信