题库分类下载APP 帮助中心

当前位置：首页 > 查试题 >

DataIDE的数据同步任务Task1,将数据从大数据计算服务MaxCompute,原ODPS）同步到云数据库RDS（MySQL）中,数据表中存在数据质量问题,加载的时候会有部分出错记录,Task1中已经配置了容错记录条数,为了保证正确记录能够保留,在数据加载与控制中,还需要对Task1配置（）

单选题

DataIDE的数据同步任务Task1,将数据从大数据计算服务MaxCompute,原ODPS）同步到云数据库RDS（MySQL）中,数据表中存在数据质量问题,加载的时候会有部分出错记录,Task1中已经配置了容错记录条数,为了保证正确记录能够保留,在数据加载与控制中,还需要对Task1配置（）

A. 数据过滤条件

B. 视为脏数据,保留原有数据（insert into

C. 作业速率上限

D. 源表切分主键

查看答案

该试题由用户174****42提供查看答案人数：40685 如遇到问题请 联系客服

相关试题

换一换

DataIDE的数据同步任务Task1,将数据从大数据计算服务MaxCompute,原ODPS）同步到云数据库RDS（MySQL）中,数据表中存在数据质量问题,加载的时候会有部分出错记录,Task1中已经配置了容错记录条数,为了保证正确记录能够保留,在数据加载与控制中,还需要对Task1配置（）

A.数据过滤条件 B.视为脏数据,保留原有数据（insert into C.作业速率上限 D.源表切分主键

数据工场DataWorks（原DataIDE）中,任务task1是按小时调度的周期性调度任务,任务配置为在00:00至23:59之间每1小时执行次,每次执行生成前一个小时的数据。任务task2是按天调度的周期性调度任务,每次执行都是处理task1最新生成的一整天的数据。为了保证task2每次运行前,task1最新的一整天的数据已经成功生成,task1和task2需要如何配置？（）

A.task1跨周期依赖选择自依赖,task2调度周期定时设置为零点整,task2依赖属性的上游任务配置为task1 B.task2调度周期定时设置为零点整,task2依赖瓜性的上游任务配置为task1 C.task2调度周期定时设置为23点59分,task2依赖属性的上游任务配置为task1 D.task2调度周期定时设置为零点整,task2跨周期依赖选择等待自定义任务的上一周期结束自定义任务是task1

DataIDE中,task1和task2都是按天调度的周期性调度任务,task1生成分区表table1,task2生成分区表table2,每天task2取table1最新分区的数据进行统计,而task1有部据来源是tabe2前一天分区的数据。Task1和task2的依赖关系需要如何配置？（）

A.只需要task1依赖属性的上游任务配置为task2 B.task1和task2都不需要配置依赖属性 C.task1跨周期依赖选择“等待自定义任务的上周期结束,才能继续运行”,自定义任务填写task2,task2依赖属性的上游任务配置为task1 D.只需要task2依赖属性的上游任务配置为task1

在使用数据工场DataWorks（原DataIDE进行数据同步时,会因为数据质量问题,导致部分记录无法从源表同步至目标表中去。数据同步任务Task1的目标表为云数据库RDS中的表,假设数据同步过程中只会因主键冲突产生错误记录。以下关于主键冲突配置中说法正确的是（）

A.当主键冲突配置为“替换原有数据（replace into）时,会使用新数据直接替换原有记录并计入脏数据记录 B.当主键冲突配置为视为脏数据,保留原有数据（insert into）”则后导入的数据被丢弃,并被视作脏数据 C.无需配置主键冲突处理规则,所有的主键冲突都不会被视为脏数据 D.无需配置主键冲突处理规则,所有的主键冲突都会被自动视为脏数据

使用大数据开发套件DataIDE可以开发配置数据同步任务以下说法正确的有（）

A.需要通过项目管理中的数据源配置添加数据源 B.可以使用系统提供的时间变量,包括S（current time）FAS run time C.可以抽取源表部分列建立字段间的对应关系不能加入常量或是变量 D.对源数据提取可参考whe过滤语句昨为增量同步的条件 E.可以设置清理规则写入前清理已有数据或是写入前保留已有数据

DatalDE中,项目空间prj1的SQL任务task1中,部分数据来源于项目空间prj2的任务task2生成的表table2,task1和task2都是按天调度的周期性调度任务,task1每次执行要使用table2同周期生成的数据,为了保证task1能正常执行,即每次运行时所需的table2数据已经生成,以下task1和task2配说法正确的是？（）

A.task1代码中表 tabke2的写法为 table2task1依赖属性的上游任务配置为prj2中的task2 B.task1代码中表 tabke2的写法为prj2 table2,task1依赖属性的.上游任务配置为prj2中的task2 C.task1代码中表 tabke2的写法为“prj2 table2,但是task1和task2不在同个项目无法配置成依赖关系 D.task1代码中表 tabke2的写法为 table2但是task1和task2不在同个项目无法配置成依赖关系

数据工场DataWorks（原DatalDE）中,任务task1是任务task2的上游任务,任务task2是任务task3的上游任务,3个任务都是按天调度的周期调度任务,2016年4月9日,task1运行失败。task2和task3未运行。经查发现task1代码语法有误导致失败。修复好task1的代码后,以下做法能保证3个任务正常重跑的有（）

A.对task1操作重跑并恢复调度 B.对task1操作重跑下游并恢复调度。选择task1.task2. task 3 C.对task1操作置为成功并恢复调度 D.对task2操作重跑并恢复调度

数据工场DataWorks（原Data|DE冲中,task1和task2都是按天调度的周期性调度任务。task1生成分区表table1,task2生成分区表tabe2,每天task2取tabe1最新分区的数据进行统计,而task1有部分数据来源是tabe2前一天分区的数据。task1和task2的依赖关系需要如何配置？（）

A.task1踣周期依赖选择等待白定义任务的上一周期结束。才能地续运行。自定义任务填写task2.task2依赖属性的上游任务配置为task1 B.只需要task2依赖属性的上游任务配i为task1 C.只需要task1依赖届性的上游任务配置为task2 D.task1和ask2都不需要配置依赖屈性

在DataIDE中配置数据同步任务将云数据库RDS（Mysql同步至大数据计算服务（MaxCompute,原ODPS）中,需要确认在云数据库RDS实例的P白名单中是否包含了DataIDE的IP段,如未包含,则需要添加（）

数据工场DataWorks（原DatalDE）中,task1和task2者是按天调度的周期性调度任务,task1设置定时时间为02:00,task2设置定时时间为00:00,task2依赖属性的上游任务配置为task1,每天task2何时可以运行？（）

A.只要task1执行成功,task2就可以开始运行 B.task1执行成功时,时间著已到2:00。则task2可以运行 C.task1在2:002后才执行成功,则ask2不再运行 D.task1执行成功时,时间没到200,则task2不再行

热门试题

数据工场DataWorks（原DataIDE）中,SQL任务task1是按天调度的周期性调度任务,每天执行一次,每次执行生成表table1的一个分区,分区ds值取前一天的日期（格式yyy/mm/d）,要使用调度系统提供的时间参数定义table1的分区,使得task1每次调度运行时自动替换时间值,task1应该（） 数据工场DataWorks（原DataIDE）中的数据同步任务支持实时的数据传输（） DataIDE中,任务task1是按天调度的周期任务,task1生成分区表tabe1该表每次执行生成的分区（分区名ds）取前一天日期的年月日（格式为yyymmdd）,要使用调度系统提供的时间参数定义table1的分区,使得task1每次调度运行时自动替换时间值,task1应该如何配置？（）数据工场DataWorks（原DataIDE）中,SQL任务task1是按月调度的周期性调度任务,生成分区表table1,每次运行生成一个分区,分区取值为上个月的最后一天日期的年月日（分区名ds,格式yyyymmdd）,要使用调度系统提供的时间参数定义table1的分区,使得task1每次调度运行时自动替换时间值,task1应该如何配置？（）数据工场DataWorks（原DatalDE）中,事实表A需要按天增量更新（配置成任务task1）,维度表B需要按周更新（配置成任务task2）,事实表A中的某个字段来自维度表B.关于task1和task2的说法正确的是（） 在DatalDE中使用数据同步任务将云数据库RDS（MySQL）加载到大数据计算服务时,为了提高单个数据同步任务的速度及效率,可以采取方式？（） DataIDE中,虚拟节点类型是空跑节点,即调度时直接返回成功状态不会真正执行。两个周期调度任务task1、task2之间没有依赖关系,业务上也没有共同上游任务,但是希望可以有一个共同的父人物进行统筹管理,那么可以创建一个虚拟节点作为task1和task2的上游任务（） 数据工场DataWorks（原DataIDE中数据同步任务可支持不同时间粒度的周期性的数据同步,目前不支持周期粒度为的同步（） DataIDE中,虚拟节点类型是空跑节点,即调度时直接返回成功状态不会真正执行。两个周期调度任务task1、task2之间没有依赖关系,业务上也没有共同上游任务,但是希望可以有一个共同的父任务进行统筹官理,那么可以创建一个虚拟节点作为task1和task2的上游任务（） DataIDE中,调度系统可以根据配置好的任务属性进行自动调度。属性中包含的生效日期是指任务在有效期内可以进行调度运行,任务task1的生效日期为2016-01-01至2016-06-30,以下关于任务task1的说法中正确的有（） DataIde中的数据同步支持离线批量数据同步模式,离线数据同步是指数据周期性、成批量地从源端系统传输到目标端系统关于数据同步同期说法正确的是（） 在DataIDE中,某数据同步任务执行成功,但是发现目标表数据为空。以下说法去正确的是（） 在数据工场DataWorks（原DataIDE）数据同步任务中,对于所有的数据源均可以选择源表中的整型列作为切分键,提高该数据同步的效率（） 数据工场DataWorks（原DatalDE）中,SQL任务task1是按小时调度的周期性调度任务,任务配置为每1小时执行次,每次执行生成的分区表table1的分区值取前一个小时的年月日时,格式为yyyymmddhh24要使用调度系统提供的时间参数定义分区,使得task1每次调度运行时自动替换时间值task1应该如何配置？（） 在数据工场DataWorks（原DataIDE中的数据同步任务的字段配置中,可以将自定义变量的值写入到目标表中去（） 使用大数据开发套件DataIDE进行数据开发时,可以创建不同的任务。如果某任务内需要多节点配合并包含表示依赖关系的连线则该任务的类型是（） 在DatalDE中使用数据同步任务将云数据库RDS数据导入大数据计算服务（MaxCompute原ODPS）时,将Maxcompute侧数据清理规则配置为导入前保留已有数据可以有效避免测试引入脏数据带来的主键冲突问题（） DataIDE中,调度任务每次运行前都先将任务实例化,即生成一个实例,调度运行时实际上在执行相应的实例。可以通过运维中心的任务运维管理暂停任务自动调度的实例。如果按天调度的同期性任务task1的2016年4月9日自动调度的实例操作暂停,以下关于task1的说法中正确的是（）在数据工场DataWorks（原DataIDE）中,当从云数据库RDS（MySQL）加载到大数据计算服务（MaxCompute原ODPS）中时,可配置切分键进行数据分片,切分键的数据类型为（） 在DataIDE中,当从云数据库RDS（MySQL抽取数据时,可配置切分键进行数据分片,提高数据同步效率,以下关于切分键的说法中正确的有（）

~~购买搜题卡~~ 会员须知 | 联系客服

免费查看答案购买搜题卡

关注公众号，回复验证码
享30次免费查看答案

微信扫码关注立即领取

恭喜获得奖励，快去免费查看答案吧~

去查看答案

全站题库适用，可用于E考试网网站及系列App

只用于搜题看答案，不支持试卷、题库练习，下载APP还可体验拍照搜题和语音搜索

支付方式

登录成功

首次登录已为您完成账号注册，
可在【个人中心】修改密码或在登录时选择忘记密码
账号登录默认密码：~~手机号后六位~~

手机浏览器扫码下载

关注
公众号

微信扫码关注

微信
小程序

微信扫码关注

微信扫码添加老师微信