大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC

对应课程:点击查看
起止时间:2020-02-20到2020-05-28
更新状态:已完结

第1章 Spark的设计与运行原理 (复习) 第3章 Spark的设计与运行原理单元测验

1、 以下哪个不是Spark的组件?

A:Spark Streaming
B:MLlib
C:GraphX
D:Flink
答案: Flink

2、 下面哪个不是 RDD 的特点 ?

A:可分区
B:可序列化
C:可修改
D:可持久化
答案: 可修改

3、 Task是Executor上的工作单元,运行于下面哪个组件上?

A:Driver Program
B:Spark Master
C:Worker Node
D:Cluster Manager
答案: Worker Node

4、 下面哪个操作肯定是宽依赖?

A:map
B:filter
C:reduceByKey
D:union
答案: reduceByKey

5、 以下是Spark的主要特点的有?

A:运行速度快
B:容易使用,简洁的API设计有助于用户轻松构建并行程序
C:通用性,Spark提供了完整而强大的技术栈
D:运行模式多样
答案: 运行速度快;
容易使用,简洁的API设计有助于用户轻松构建并行程序;
通用性,Spark提供了完整而强大的技术栈;
运行模式多样

6、 Spark的运行架构包括哪些?

A:集群资源管理器(Cluster Manager)
B:执行进程(Executor)
C:Worker Node
D:任务控制节点Driver Program
答案: 集群资源管理器(Cluster Manager);
执行进程(Executor);
Worker Node;
任务控制节点Driver Program

7、 关于RDD之间的依赖分为窄依赖和宽依赖,以下说法正确的是?

A:存在一个父RDD的一个分区对应一个子RDD的多个分区,则为宽依赖
B:存在一个父RDD的多个分区对应一个子RDD的一个分区,则为宽依赖
C:存在一个父RDD的一个分区只被一个子RDD的一个分区所使用,则为窄依赖
D:存在一个父RDD的一个分区被一个子RDD的多个分区所使用,则为窄依赖
答案: 存在一个父RDD的一个分区对应一个子RDD的多个分区,则为宽依赖;
存在一个父RDD的一个分区只被一个子RDD的一个分区所使用,则为窄依赖

8、 Spark可以采用几种不同的部署方式,以下正确的部署方式有?

A:Local
B:Standalone
C:Spark on Mesos
D:Spark on YARN
答案: Local;
Standalone;
Spark on Mesos;
Spark on YARN

9、 目前的大数据处理典型应用场景可分为哪几个类型?

A:复杂的批量数据处理
B:基于历史数据的交互式查询
C:大数据的分布式计算
D:基于实时数据流的数据处理
答案: 复杂的批量数据处理;
基于历史数据的交互式查询;
基于实时数据流的数据处理

10、 以下选项中哪些是Spark的优点?

A:具有高效的容错性
B:利用进程模型
C:可以将中间结果持久化到内存
D:表达能力有限
答案: 具有高效的容错性;
可以将中间结果持久化到内存

第2章 Spark环境搭建和使用方法 第4章Spark环境搭建和使用方法单元测验

1、 判断HDFS是否启动成功,可以通过哪个命令?

A:hdfs
B:spark
C:jps
D:start-dfs
答案: jps

2、 spark-shell在启动时, 采用local[*]时,它的含义是?

A:使用任意个线程来本地化运行Spark
B:使用与逻辑CPU个数相同数量的线程来本地化运行Spark
C:使用与逻辑CPU个数相同数量的进程来本地化运行Spark
D:使用单个线程来本地化运行Spark
答案: 使用与逻辑CPU个数相同数量的线程来本地化运行Spark

3、 下面描述正确的是:

A:Hadoop和Spark不能部署在同一个集群中
B:Hadoop只包含了存储组件,不包含计算组件
C:Spark是一个分布式计算框架,可以和Hadoop组合使用
D:Spark和Hadoop是竞争关系,二者不能组合使用
答案: Spark是一个分布式计算框架,可以和Hadoop组合使用

4、 Spark部署模式有哪几种?

A:Local模式(单机模式)
B:Standalone模式
C:YARN模式
D:Mesos模式
答案: Local模式(单机模式);
Standalone模式 ;
YARN模式;
Mesos模式

5、 关于Hadoop和Spark的相互关系,以下说法正确的是?

A:Hadoop和Spark可以相互协作
B:Hadoop负责数据的存储和管理
C:Spark负责数据的计算
D:Spark要操作Hadoop中的数据,需要先启动HDFS
答案: Hadoop和Spark可以相互协作;
Hadoop负责数据的存储和管理;
Spark负责数据的计算;
Spark要操作Hadoop中的数据,需要先启动HDFS

6、 HDFS若启动成功,系统会列出以下哪些进程?

A:NameNode
B:HDFS
C:DataNode
D:SecondaryNameNode
答案: NameNode;
DataNode;
SecondaryNameNode

7、 spark-shell在启动时,采用yarn-client模式时,以下说法正确的是?

A:当用户提交了作业之后,不能关掉Client
B:当用户提交了作业之后,就可以关掉Client
C:该模式适合运行交互类型的作业
D:该模式不适合运行交互类型的作业
答案: 当用户提交了作业之后,不能关掉Client;
该模式适合运行交互类型的作业

8、 spark-shell在启动时,采用yarn-cluster模式时,以下说法正确的是?

A:当用户提交了作业之后,不能关掉Client
B:当用户提交了作业之后,就可以关掉Client
C:该模式适合运行交互类型的作业
D:该模式不适合运行交互类型的作业
答案: 当用户提交了作业之后,就可以关掉Client;
该模式不适合运行交互类型的作业

9、 开发Spark独立应用程序的基本步骤通常有哪些?

A:安装编译打包工具,如sbt,Maven
B:编写Spark应用程序代码
C:编译打包
D:通过spark-submit运行程序
答案: 安装编译打包工具,如sbt,Maven;
编写Spark应用程序代码;
编译打包;
通过spark-submit运行程序

10、 集群上运行Spark应用程序的方法步骤有哪些?

       


注:此答案尚未制作完成,如需购买,可点击下方红字提交表单联系客服更新,更新后可直接在本网页购买答案

点击这里,联系客服更新


为了方便下次阅读,建议在浏览器添加书签收藏本网页

添加书签方法:

1.电脑按键盘的Ctrl键+D键即可收藏本网页

2.手机浏览器可以添加书签收藏本网页

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第1张

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第2张


获取更多MOOC答案,欢迎在浏览器访问我们的网站:http://mooc.mengmianren.com

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第3张

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第4张

注:请切换至英文输入法输入域名,如果没有成功进入网站,请输入完整域名:http://mooc.mengmianren.com/


我们的公众号

打开手机微信,扫一扫下方二维码,关注微信公众号:萌面人APP

本公众号可查看各种网课答案,还可免费查看大学教材答案

点击这里,可查看公众号功能介绍

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第5张


一键领取淘宝,天猫,京东,拼多多无门槛优惠券,让您购物省省省,点击这里,了解详情


干饭人福利,饿了么红包每日领 

大数据开发基础(魏永波)(河北地质大学)中国大学MOOC答案2024完整版WYC第6张

点击这里,领取饿了么外卖红包