全媒体大数据分析师考前冲刺题(三)

考试总分:100分

考试类型:模拟试题

作答时间:90分钟

已答人数:5

试卷答案:没有

试卷介绍: 我们为想考全媒体大数据分析师证的学员准备了全媒体大数据分析师考前冲刺题,让你能在模拟考试中获得进步。

开始答题

试卷预览

  • 1. 某公司使用大数据计算服务MaxCompute和一站式大数据开发平台DataWorks构建大数据平台,根据需求规划创建多个MaxCompute项目,其中有2个项目存储了公司重要数据,要求这两个 MaxCompute项目中的数据只能在这两个项目之间流动,不能流出到其他项目。以下哪个方案可以实现这个要求?

    A使用基于标签的权限控制机制实现

    B开启项目空间数据保护机制,同时设置两个项目为互信项目

    C使用跨项目空间的资源分享机制(package),在两个项目之间分享数据权限

    D使用policy授权机制,制定数据只能在两个项目之间流动的权限策略

  • 2. 某成衣厂过去一年共生产了10万件大衣,分为A/B/C三款。质检部门采用抽样调查的方法,从中随机抽取出1000件进行检验, 其中A款700件中5件不合格,B款150件中2件不合格,C款150件中3件不合格。根据数理统计中的概念,下列选项中哪个是正确的?

    AA款可以被称为总体单位

    BB款的150件成衣是抽样总体

    CC款的150件成衣是10万件成衣的观测值

    D过去一年生产的10万件产品是这次调查的统计总体

  • 3. 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型,如下描述中,不属于星星模型的特点的是?

    Ajoin复杂度低

    B查询逻辑简单

    C可读性高

    D数据冗余度小

  • 4. 数据分析报告的结构包括标题页、目录、前言、正文、结论与建议和附录几个部分,一般情况下,分析背景,分析目的,分析思路的说明描述是在哪一个部分里面体现?

    A前言

    B正文

    C结论与建议

    D附录

  • 5. 数据仓库某个库表中的一个cust_id字段表明是一个客户,但发现这个表里存在多个一样的cust_id值,这种情况违反了哪种数据质量管理要求?

    A一致性

    B关联性

    C完整性

    D唯一性

  • 6. 以下SQL语句中,获取平均值的是 ?

    Aselect MAX(price) from A;

    Bselect MIN(price) from A;

    Cselect AVG(price) from A;

    Dselect SUM(price) from A;

  • 7. 执行SQL语句select A+B from user;下列执行结果描述正确的是?

    A如果A为NULL,返回B

    B如果B为NULL,返回A

    C如果A或B为NULL,返回NULL

    D不论A或B是否为NULL,都返回A + B的结果

  • 8. 下列对大数据的理解,错误的是?

    A数据是资产,大数据的意义在于掌握庞大的数据信息

    B数据价值需要挖掘,大数据的意义在于对数据进行专业化处理

    C大数据通过提高数据的“加工能力”实现数据的“增值”

    D大数据无法用单台的计算机进行处理,一般采用分布式处理

  • 9. 阿里云MaxCompute可提供海量数据的存储和计算服务,已经在阿里巴巴集团内部得到大规模应用,下列不属于其应用场景的是?

    A大型互联网企业的数据仓库和BI分析

    B网站的日志分析

    C电子商务网站的日常交易

    D用户特征和兴趣挖掘

  • 10. 关系数据库(如MySQL),已知表t_order为订单表,有字段prod_id(产品种类id),user_id(购买用户id),order_time(订单时间)等字段。现统计每种产品购买数量最多的前10个用户找出来,如下哪个语句是正确的?

    Aselect prod_id, user_id, count(*) as cnt from t_order group by prod_id,user_id having cnt <=10

    Bselect * from ( select prod_id, user_id, cnt, row_number() over (partition by prod_id order by cnt desc) as rn from (select prod_id, user_id, count(*) as cnt from t_order group by prod_id,user_id) a ) b where rn <=10

    Cselect * from ( select prod_id, user_id, cnt, row_number() over (partition by user_id order by cnt ) as rn from (select prod_id, user_id, count(*) as cnt from t_order group by prod_id,user_id) a ) b where rn <=10

    Dselect * from ( select prod_id, user_id, cnt, row_number() over (partition by user_id order by cnt desc) as rn from (select prod_id, user_id, count(*) as cnt from t_order group by prod_id,user_id) a ) b where rn <=10

  • 11. 在关系数据库(如MySQL)中,有表t_test,包含字段id。关于如下两条SQL语句描述正确的是? 1) select * from t_test where id in (1,2,3); 2) select * from t_test where id = 1 or id = 2 or id =3;

    A语句1的性能优于语句2

    B语句2的性能优于语句1

    C语句1与语句2性能无差别

    D语句1与语句2性能优劣不确定

  • 12. 以下对表的操作,哪个是通过alter table语句来完成的?

    A修改表名

    B删除表

    C创建索引

    D清除数据

  • 13. 某商家希望根据顾客历史的消费数据和顾客本身的一些属性,来预测每个顾客是否会购买一个新产品,在这种情况下,可以采用如下哪些算法?

    A一元线性回归

    B逻辑回归

    CK均值

    DDBSCAN

  • 14. 曝光对应的付费模式是()

    ACPA

    BCPC

    CCTR

    DCP

  • 15. 以下说法错误的是()

    A网络爬虫是一种按照一定的规则,被动地抓取互联网数据的程序或脚本,也称网络蜘蛛或网络机器人

    BETL 引擎一般以组件化的方式实现转换,常用的组件有字段映射、数据清洗、数据过滤、数据验证、数据合并、数据拆分、数据替换、数据加解密、数据计算等.这些组件可以任意组合。

    C深度优先策略的基本方法是按照深度由低到高的顺序,依次访问下一级网页链接,直到不能再深入为止。

    D聚焦爬虫爬行策略实现的关键是评价页面内容和链接的重要性

  • 16. 一个机器学习系统包含哪几个部分?()

    A知识库、学习部分和执行部分

    B环境、知识库、学习部分

    C环境、知识库、执行部分

    D环境、知识库、学习部分和执行部分

  • 17. 微课在翻转课堂中的作用不包括?()

    A导学作用

    B助学作用

    C强化作用

    D调节作用

  • 18. 以下不属于在线教育中的微课在实践三种类型的是?()

    A以摄录编为主的电视模式

    B以录屏为主的软件模式

    C以手写+录制为主的模式

    D糅合各种技术的富媒体模式

  • 19. 下列不属于教育大数据三个层次的是()

    A教育大数据是指全体样本全学习过程的数据,这个层次特指教育教学的过程。

    B教育大数据是指教育大数据系统,这个层次特指校本大数据平台,也指区域和国家建立的大数据系统。

    C教育大数据是指共建共享思想,这个层次特指教育大数据带来的价值,特别是实现多类型、多维度、多业务数据融通的意义。

    D教育大数据是利用新兴资源的新教学策略,这个层次特指教育教学过程的新思维和新视角。

  • 20. 下列关于人工智能教育的应用场景描述不正确的是()

    A智能学习支持,实现学习过程中的交流、整合、重构、协作、探究和分享。

    B智能教育评价,对学习者学习过程中的知识、身体、心理状态进行诊断和反馈。

    C智能教师助理,替代教师日常工作中重复的、单调的工作,缓解教师所有工作的压力。

    D教育智能管理与服务,管理者与人工智能协同,形成人机协同的决策模式。

  • 21. 下列不属于教育大数据特征的是()

    A全学习的过程(过程长)

    B多类型的数据(类型多)

    C跨业务的价值(跨业务)

    D细粒度的稀疏(粒度大)

  • 22. ___分析工具用于生成数据源区域中数据的单变量统计分析报表,提供有关数据趋中性和易变性的信息?()

    A数据分析

    B描述统计

    C分类汇总

    D折线图

  • 23. DBMS指的是()

    A数据库管理系统

    B智能录播系统

    C数据库

    D数据库系统

  • 24. 大数据的生命周期,就是数据产生后,经过这三个基本步骤,最终完成挖掘数据价值的过程。()

    A搜索、采取、分析

    B采集、储存、应用

    C采集、存取、应用

    D采集、存取、分析

  • 25. 教育教学管理数据的典型应用不包括?()

    A课程设置

    B教师绩效评价

    C家长参与子女学习的程度

    D毕业生追踪

  • 26. 微信公众号的运营人员除了做好日常的编辑、发布工作,还要()

    A策划线下活动

    B积极和粉丝沟通

    C保持对数据的敏感度

    D以上说法都对

  • 27. 是指在统计时间周期里,产生过内容分享行为的用户占内容阅读点击人数的比重,即内容分享率=内容分享人数/内容点击人数()

    A内容分享率

    B内容平均分享量

    C内容最高分享量

    D内容分享人数

  • 28. 由原始分推导出来的相对的位量数为()

    A标准分数

    B百分位

    C原始参数

    D均值

  • 29. 在Excel中,以"姓名"为关键字排序时,系统默认按照( )排序?()

    A拼音字母

    B偏旁部首

    C区位码

    D笔画

  • 30. 对于数据的可视化实现方法,下列描述错误的是()

    A常用的可视化实现方法分为静态可视化实现方法和交互式可视化实现方法

    B数据的静态可视化方法比数据的交互式可视化好

    C常用的静态可视化形式包括散点图、柱形图、折线图、饼图、箱线图、直方图、雷达图

    D数据集以表格形式呈现便于读者了解数据的内部结构

  • 31. 以下不属于视错觉的是()

    A旁佐错觉

    B彭罗斯三角形

    C马赫带

    D记忆错觉

  • 32. 在绘制折线图时,下列做法错误的是()

    A两终点与横轴相交

    B折线图下所围成的面积与直方图面积相等

    C折线图表示的频数分布与直方图一致

    D将各矩形竖边中点用直线连接起来即可

  • 33. 采用无监督学习的分类方法,能把任意维的输入信号变换到一维或二维的离散网格上,并保持一定的拓扑有序性的结构是?()

    A自组织映射图谱

    B社会网络分析图谱

    C多维尺度图谱

    D三维构型图谱

  • 34. 大数据的核心特征不包括?()

    A数据新增速度加快

    B数据来源多样化

    C数据价值密度高

    D数据量巨大

  • 35. 在数据分析过程中,如果分析数据量过于庞大,以下哪个处理办法比较好()

    A把数据排序后显示

    B把没有用的数据去掉

    C用excel表格传输

    D用图片显示数据

  • 1. 产品结构分析是产品盈利能力分析的内容之一,关于产品结构,下列说法正确的是()。

    A合理的产品结构应当是定位明确的

    B合理的产品结构应当是比例适当

    C合理的产品结构应当是相互关联并相互促进的

    D合理的产品结构是店铺运营进入良性发展的基础

  • 2. 下列属于数据造假的行为有()

    A刷单

    B刷分

    C刷好评

    D搬运原创内容

  • 3. 内容运营分析的作用包括()。

    A比较多渠道投放、多种内容的推送效果

    B分析竞品优势

    C找到问题所在,及时调整优化内容

    D能反馈内容运营效果,提供决策参考

  • 4. 每份报表必须包括三个关键组成要素,下列是其组成要素的有()。

    A报表指标

    B分析维度

    C报表版式

    D报表主题

  • 5. 数据检查是数据采集后至关重要的一步,以下属于数据检查内容的是()。

    A完整性检查

    B规范性检查

    C保密性检查

    D准确性检查

  • 6. 电子商务的特点包括()。

    A虛拟性

    B跨越时空性

    C低成本

    D高效性

  • 7. 电子商务数据采集与处理方案中通常需要包含()?

    A项目背景

    B分析目标

    C数据来源渠道

    D数据指标

  • 8. 电子商务数据化运营的价值不包括()。

    A完全了解用户

    B科学的数据预测

    C完全控制未来

    D完善数据化管理

  • 9. GRAI复盘法包括哪些方面()

    A回顾目标

    B结果描述

    C过程分析

    D经验总结

  • 10. 与内容发布量相关的指标包括()

    A内容更新总量

    B内容发布量趋势

    C内容发布频率

    D内容生产用户量