2021年7月16日 gebilaowang

Spark大数据处理(对外经济贸易大学)中国大学MOOC答案2024完整版WYC

对应课程:点击查看
起止时间:2020-02-24到2020-08-31
更新状态:已完结

第1章大数据技术概述第1章大数据技术概述单元测验

1、大数据计算模式有以下四种，对电子商务网站购物平台数据的实时分析处理过程属于哪一种?

A:批处理计算
B:流计算
C:图计算
D:查询分析计算
答案: 流计算

2、大数据技术及其代表性的软件种类很多，不同的技术有其不同应用场景，都对应着不同的大数据计算模式，请问软件产品Pregel主要应用于以下哪种计算模式？

A:批处理计算
B:流计算
C:图计算
D:查询分析计算
答案: 图计算

3、经过多年的发展，Hadoop生态系统不断完善和成熟，目前已经包含多个子项目，其中YARN的主要功能是?

A:分布式并行编程模型
B:数据仓库工具
C:负责集群资源调度管理的组件
D:分布式海量日志采集、聚合和传输系统
答案: 负责集群资源调度管理的组件

4、 Hadoop生态系统中用于构建数据仓库并允许用户输入SQL语句进行查询的功能组件是?

A:Spark
B:Pregel
C:Flume
D:Hive
答案: Hive

5、 MapReduce的一个基本设计思想是?

A:计算向数据靠拢
B:数据向计算靠拢
C:提高数据的串行计算速度
D:提高数据的冗余度
答案: 计算向数据靠拢

6、 Hadoop的生态系统组件之一Sqoop的功能是?

A:提供高可靠性、高可用、分布式的海量日志采集
B:用来存储非结构化和半结构化的松散数据
C:负责集群资源调度管理的组件
D:用来在Hadoop和关系数据库之间的交换数据，改进数据的互操作性
答案: 用来在Hadoop和关系数据库之间的交换数据，改进数据的互操作性

7、以下哪一项不是Hadoop的缺点？

A:计算表达能力有限
B:数据文件被分布存储到多台机器上
C:计算延迟高
D:磁盘I/O开销大
答案: 数据文件被分布存储到多台机器上

8、网络中很多数据是以图的形式呈现的，比如社交网络、交通事故，现场证据采集等，为了解决大型图的分布式计算问题，最适合采用以下哪种计算框架：

A:Spark Core
B:Dremel
C:Pregel
D:Storm
答案: Pregel

9、用户在使用HDFS时，仍然可以像普通文件系统那样用文件名去访问文件，以下哪个选项是正确的访问方式？

A:把文件名发送给名称节点，根据文件名直接在名称节点上获取数据
B:把文件名发送给数据节点，根据文件名直接在数据节点上获取数据
C:把文件名发送给名称节点，根据文件名在名称节点上找到数据块的实际存储信息，客户端再到数据节点上获取数据
D:以上说法都不对
答案: 把文件名发送给名称节点，根据文件名在名称节点上找到数据块的实际存储信息，客户端再到数据节点上获取数据

10、大数据处理的基本流程有以下哪四个步骤？

A:数据采集
B:存储管理
C:处理分析
D:结果呈现
E:数据安全和隐私保护
答案: 数据采集;
存储管理;
处理分析;
结果呈现

11、目前学术界和业界比较认可的关于大数据的四个特点是?

A:数据量大
B:数据类型多
C:处理速度快
D:数据可重复使用
E:价值密度低
答案: 数据量大;
数据类型多;
处理速度快;
价值密度低

12、 Hadoop两大核心组成部分是什么？

A:分布式文件系统HDFS
B:分布式协作服务Zookeeper
C:资源调度管理框架YARN
D:分布式计算框架MapReduce
答案: 分布式文件系统HDFS;
分布式计算框架MapReduce

13、与Hadoop相比，Spark主要有以下哪些优点？

A:提供多种数据集操作类型而不仅限于MapReduce
B:数据集中式计算更加高效
C:提供了内存计算，带来了更高的迭代运算效率
D:基于DAG的任务调度执行机制
答案: 提供多种数据集操作类型而不仅限于MapReduce;
提供了内存计算，带来了更高的迭代运算效率;
基于DAG的任务调度执行机制

14、 YARN是负责集群资源调度管理的组件。不同的计算框架统一运行在YARN框架之上，具有哪些优点：

A:计算资源按需伸缩
B:不同负载应用混搭，集群利用率高
C:共享底层存储，避免数据跨集群迁移
D:大大降低了运维成本
答案: 计算资源按需伸缩;
不同负载应用混搭，集群利用率高;
共享底层存储，避免数据跨集群迁移;
大大降低了运维成本

15、关于Hadoop生态系统中HBase与其它部分的关系，以下说法正确的有：

A:HBase利用MapReduce来处理HBase中的海量数据，实现高性能计算
B:利用Zookeeper作为协同服务，实现稳定服务和失败恢复
C:使用HDFS作为高可靠的底层存储，利用廉价集群提供海量数据存储能力
D:利用Pig和Hive为HBase提供了高层语言支持
E:使用Sqoop为HBase提供了高效便捷的RDBMS数据导入功能
答案: HBase利用MapReduce来处理HBase中的海量数据，实现高性能计算;
利用Zookeeper作为协同服务，实现稳定服务和失败恢复;
使用HDFS作为高可靠的底层存储，利用廉价集群提供海量数据存储能力;
利用Pig和Hive为HBase提供了高层语言支持;
使用Sqoop为HBase提供了高效便捷的RDBMS数据导入功能

16、 Spark的设计遵循“一个软件栈满足不同应用场景”的理念，逐渐形成了一套完整的生态系统，可以支持以下哪些操作计算：

A:SQL即席查询（Spark SQL）
B:流式计算（Spark Streaming）
C:机器学习（MLlib）
D:图计算（GraphX）
答案: SQL即席查询（Spark SQL）;
流式计算（Spark Streaming）;
机器学习（MLlib）;
图计算（GraphX）

17、 Flink和Spark一样，都是基于内存的计算框架，都支持流计算，在流式处理方面，以下选项是Flink的主要特点的有：

A:Flink是一行一行地处理数据
B:Flink可以支持毫秒级的响应
C:Flink只能支持秒级的响应
D:Flink支持增量迭代，具有对迭代进行自动优化的功能
答案: Flink是一行一行地处理数据;
Flink可以支持毫秒级的响应;
Flink支持增量迭代，具有对迭代进行自动优化的功能

第2章 Scala语言基础第2章Scala语言基础单元测验

1、以下哪个选项不是Scala的数据类型？

A:A Byte，Short，Int，Unit
B:Integer，Void
C:Long，Char，String
D:Float，Double，Boolean
答案: Integer，Void

2、 Scala关于变量定义、赋值，错误的是？

A:val a = 3
B:val a:String = 3
C:var b:Int = 3 ; b = 6
D:var b = “Hello World!” ; b = “123”
答案: val a:String = 3

3、下面四个选项中，哪一个选项中a的取值与其他三个选项不同？

A:val a = 3
B:val a:Double = 1 + 2

注：此答案尚未制作完成，如需购买，可点击下方红字提交表单联系客服更新，更新后可直接在本网页购买答案

点击这里，联系客服更新

为了方便下次阅读，建议在浏览器添加书签收藏本网页

添加书签方法：

1.电脑按键盘的Ctrl键+D键即可收藏本网页

2.手机浏览器可以添加书签收藏本网页

获取更多MOOC答案，欢迎在浏览器访问我们的网站：http://mooc.mengmianren.com

注：请切换至英文输入法输入域名，如果没有成功进入网站，请输入完整域名：http://mooc.mengmianren.com/

我们的公众号

打开手机微信，扫一扫下方二维码，关注微信公众号：萌面人APP

本公众号可查看各种网课答案，还可免费查看大学教材答案

点击这里，可查看公众号功能介绍

一键领取淘宝，天猫，京东，拼多多无门槛优惠券，让您购物省省省，点击这里，了解详情

干饭人福利，饿了么红包每日领

点击这里，领取饿了么外卖红包

中国大学MOOC答案

，欢迎在浏览器访问我们的网站：http//mooc.mengmianren.com注：请切换至英文输入法输入域名，如果没有成功进入网站，请输入完整域名：http//mooc.mengmianren.com/我们的公众号打开手机微信，扫一扫下方二维码，关注微信公众号：萌面人资料铺本公众号提供各种网课 AAByte，Short，Int，UnitBInteger，VoidCLong，Char，StringDFloat，Double，Boolean Avala=BvalaDouble=+注：此 Avala=BvalaString=CvarbInt=;b=Dvarb=“HelloWorld!”;b=“”A分布式文件系统HDFSB分布式协作服务ZookeeperC资源调度管理框架YARND分布式计算框架MapReduce A批处理计算B流计算C图计算D查询分析计算 A把文件名发送给名称节点，根据文件名直接在名称节点上获取数据B把文件名发送给数据节点，根据文件名直接在数据节点上获取数据C把文件名发送给名称节点，根据文件名在名称节点上找到数据块的实际存储信息，客户端再到数据节点上获取数据D以上说法都不对 A提供多种数据集操作类型而不仅限于MapReduceB数据集中式计算更加高效C提供了内存计算，带来了更高的迭代运算效率D基于DAG的任务调度执行机制 A数据采集B存储管理C处理分析D结果呈现E数据安全和隐私保护 A计算表达能力有限B数据文件被分布存储到多台机器上C计算延迟高D磁盘I/O开销大 Flink和Spark一样，都是基于内存的计算框架，都支持流计算，在流式处理方面，以下选项是Flink的主要特点的有：AFlink是一行一行地处理数据BFlink可以支持毫秒级的响应CFlink只能支持秒级的响应DFlink支持增量迭代，具有对迭代进行自动优化的功能 Flink是一行一行地处理数据;Flink可以支持毫秒级的响应;Flink支持增量迭代，具有对迭代进行自动优化的功能第章Scala语言基础第章Scala语言基础单元测验 Hadoop两大核心组成部分是什么 Hadoop生态系统中用于构建数据仓库并允许用户输入SQL语句进行查询的功能组件是?ASparkBPregelCFlumeDHive Hadoop的生态系统组件之一Sqoop的功能是?A提供高可靠性 HBase利用MapReduce来处理HBase中的海量数据，实现高性能计算;利用Zookeeper作为协同服务，实现稳定服务和失败恢复;使用HDFS作为高可靠的底层存储，利用廉价集群提供海量数据存储能力;利用Pig和Hive为HBase提供了高层语言支持;使用Sqoop为HBase提供了高效便捷的RDBMS数据导入功能 Hive Integer，Void MapReduce的一个基本设计思想是?A计算向数据靠拢B数据向计算靠拢C提高数据的串行计算速度D提高数据的冗余度 Pregel Scala关于变量定义 Spark大数据处理(对外经济贸易大学)中国大学MOOC慕课答案 Spark大数据处理(对外经济贸易大学)中国大学MOOC答案 Spark大数据处理(对外经济贸易大学)中国大学MOOC答案2022完整版WYC Spark大数据处理(对外经济贸易大学)中国大学慕课答案 Spark的设计遵循“一个软件栈满足不同应用场景”的理念，逐渐形成了一套完整的生态系统，可以支持以下哪些操作计算：ASQL即席查询（SparkSQL）B流式计算（SparkStreaming）C机器学习（MLlib）D图计算（GraphX）SQL即席查询（SparkSQL）;流式计算（SparkStreaming）;机器学习（MLlib）;图计算（GraphX）valaString=YARN是负责集群资源调度管理的组件下面四个选项中，哪一个选项中a的取值与其他三个选项不同不同的计算框架统一运行在YARN框架之上，具有哪些优点：A计算资源按需伸缩B不同负载应用混搭，集群利用率高C共享底层存储，避免数据跨集群迁移D大大降低了运维成本与Hadoop相比，Spark主要有以下哪些优点中国大学MOOC慕课答案中国大学MOOC答案中国大学MOOC答案公众号免费中国大学MOOC答案在哪里查中国大学MOOC答案查询中国大学慕课答案交通事故，现场证据采集等，为了解决大型图的分布式计算问题，最适合采用以下哪种计算框架：ASparkCoreBDremelCPregelDStorm 以下哪一项不是Hadoop的缺点以下哪个选项不是Scala的数据类型以及大学学习资料淘宝天猫内部优惠券，一年帮你省下好几千，点击这里，了解详情关于Hadoop生态系统中HBase与其它部分的关系，以下说法正确的有：AHBase利用MapReduce来处理HBase中的海量数据，实现高性能计算B利用Zookeeper作为协同服务，实现稳定服务和失败恢复C使用HDFS作为高可靠的底层存储，利用廉价集群提供海量数据存储能力D利用Pig和Hive为HBase提供了高层语言支持E使用Sqoop为HBase提供了高效便捷的RDBMS数据导入功能分布式文件系统HDFS;分布式计算框架MapReduce 分布式的海量日志采集B用来存储非结构化和半结构化的松散数据C负责集群资源调度管理的组件D用来在Hadoop和关系数据库之间的交换数据，改进数据的互操作性图计算大数据处理的基本流程有以下哪四个步骤大数据技术及其代表性的软件种类很多，不同的技术有其不同应用场景，都对应着不同的大数据计算模式，请问软件产品Pregel主要应用于以下哪种计算模式大数据计算模式有以下四种，对电子商务网站购物平台数据的实时分析处理过程属于哪一种?A批处理计算B流计算C图计算D查询分析计算对应课程点击查看起止时间到更新状态已完结第章成衣的生产准备成衣的生产准备尚未制作完成，如需购买，可点击下方红字提交表单联系客服更新，更新后可直接在本网页购买把文件名发送给名称节点，根据文件名在名称节点上找到数据块的实际存储信息，客户端再到数据节点上获取数据提供多种数据集操作类型而不仅限于MapReduce;提供了内存计算，带来了更高的迭代运算效率;基于DAG的任务调度执行机制数据文件被分布存储到多台机器上数据采集;存储管理;处理分析;结果呈现数据量大;数据类型多;处理速度快;价值密度低流计算点击这里，联系客服更新为了方便下次阅读，建议在浏览器添加书签收藏本网页添加书签方法：.电脑按键盘的Ctrl键+D键即可收藏本网页.手机浏览器可以添加书签收藏本网页获取更多MOOC 用户在使用HDFS时，仍然可以像普通文件系统那样用文件名去访问文件，以下哪个选项是正确的访问方式用来在Hadoop和关系数据库之间的交换数据，改进数据的互操作性目前学术界和业界比较认可的关于大数据的四个特点是?A数据量大B数据类型多C处理速度快D数据可重复使用E价值密度低经过多年的发展，Hadoop生态系统不断完善和成熟，目前已经包含多个子项目，其中YARN的主要功能是?A分布式并行编程模型B数据仓库工具C负责集群资源调度管理的组件D分布式海量日志采集网络中很多数据是以图的形式呈现的，比如社交网络聚合和传输系统计算向数据靠拢计算资源按需伸缩;不同负载应用混搭，集群利用率高;共享底层存储，避免数据跨集群迁移;大大降低了运维成本负责集群资源调度管理的组件赋值，错误的是高可用

文章导航

Previous Post:汽车文化(华南农业大学)中国大学MOOC答案2024完整版WYC
Next Post:20春-图书信息检索-缪幽竹-3(苏州大学)中国大学MOOC答案2024完整版WYC

Search for:

分类目录

中国大学MOOC答案

中国大学MOOC答案V2

模板目录

超星尔雅学习通答案

渝ICP备17014860号-3

渝公网安备 50011202503319号

友情链接：萌面人资料铺萌面人资料铺常见问题解答萌面人网萌面人CC网萌面人PRO网形势与政策（2020年秋）尔雅答案友情站点

第1章 大数据技术概述 第1章大数据技术概述单元测验

第2章 Scala语言基础 第2章Scala语言基础单元测验

第1章大数据技术概述第1章大数据技术概述单元测验

第2章 Scala语言基础第2章Scala语言基础单元测验