对应课程:点击查看
起止时间:2020-02-20到2020-05-28
更新状态:已完结
第1章 Spark的设计与运行原理 (复习) 第3章 Spark的设计与运行原理单元测验
1、 以下哪个不是Spark的组件?
A:Spark Streaming
B:MLlib
C:GraphX
D:Flink
答案: Flink
2、 下面哪个不是 RDD 的特点 ?
A:可分区
B:可序列化
C:可修改
D:可持久化
答案: 可修改
3、 Task是Executor上的工作单元,运行于下面哪个组件上?
A:Driver Program
B:Spark Master
C:Worker Node
D:Cluster Manager
答案: Worker Node
4、 下面哪个操作肯定是宽依赖?
A:map
B:filter
C:reduceByKey
D:union
答案: reduceByKey
5、 以下是Spark的主要特点的有?
A:运行速度快
B:容易使用,简洁的API设计有助于用户轻松构建并行程序
C:通用性,Spark提供了完整而强大的技术栈
D:运行模式多样
答案: 运行速度快;
容易使用,简洁的API设计有助于用户轻松构建并行程序;
通用性,Spark提供了完整而强大的技术栈;
运行模式多样
6、 Spark的运行架构包括哪些?
A:集群资源管理器(Cluster Manager)
B:执行进程(Executor)
C:Worker Node
D:任务控制节点Driver Program
答案: 集群资源管理器(Cluster Manager);
执行进程(Executor);
Worker Node;
任务控制节点Driver Program
7、 关于RDD之间的依赖分为窄依赖和宽依赖,以下说法正确的是?
A:存在一个父RDD的一个分区对应一个子RDD的多个分区,则为宽依赖
B:存在一个父RDD的多个分区对应一个子RDD的一个分区,则为宽依赖
C:存在一个父RDD的一个分区只被一个子RDD的一个分区所使用,则为窄依赖
D:存在一个父RDD的一个分区被一个子RDD的多个分区所使用,则为窄依赖
答案: 存在一个父RDD的一个分区对应一个子RDD的多个分区,则为宽依赖;
存在一个父RDD的一个分区只被一个子RDD的一个分区所使用,则为窄依赖
8、 Spark可以采用几种不同的部署方式,以下正确的部署方式有?
A:Local
B:Standalone
C:Spark on Mesos
D:Spark on YARN
答案: Local;
Standalone;
Spark on Mesos;
Spark on YARN
9、 目前的大数据处理典型应用场景可分为哪几个类型?
A:复杂的批量数据处理
B:基于历史数据的交互式查询
C:大数据的分布式计算
D:基于实时数据流的数据处理
答案: 复杂的批量数据处理;
基于历史数据的交互式查询;
基于实时数据流的数据处理
10、 以下选项中哪些是Spark的优点?
A:具有高效的容错性
B:利用进程模型
C:可以将中间结果持久化到内存
D:表达能力有限
答案: 具有高效的容错性;
可以将中间结果持久化到内存
第2章 Spark环境搭建和使用方法 第4章Spark环境搭建和使用方法单元测验
1、 判断HDFS是否启动成功,可以通过哪个命令?
A:hdfs
B:spark
C:jps
D:start-dfs
答案: jps
2、 spark-shell在启动时, 采用local[*]时,它的含义是?
A:使用任意个线程来本地化运行Spark
B:使用与逻辑CPU个数相同数量的线程来本地化运行Spark
C:使用与逻辑CPU个数相同数量的进程来本地化运行Spark
D:使用单个线程来本地化运行Spark
答案: 使用与逻辑CPU个数相同数量的线程来本地化运行Spark
3、 下面描述正确的是:
A:Hadoop和Spark不能部署在同一个集群中
B:Hadoop只包含了存储组件,不包含计算组件
C:Spark是一个分布式计算框架,可以和Hadoop组合使用
D:Spark和Hadoop是竞争关系,二者不能组合使用
答案: Spark是一个分布式计算框架,可以和Hadoop组合使用
4、 Spark部署模式有哪几种?
A:Local模式(单机模式)
B:Standalone模式
C:YARN模式
D:Mesos模式
答案: Local模式(单机模式);
Standalone模式 ;
YARN模式;
Mesos模式
5、 关于Hadoop和Spark的相互关系,以下说法正确的是?
A:Hadoop和Spark可以相互协作
B:Hadoop负责数据的存储和管理
C:Spark负责数据的计算
D:Spark要操作Hadoop中的数据,需要先启动HDFS
答案: Hadoop和Spark可以相互协作;
Hadoop负责数据的存储和管理;
Spark负责数据的计算;
Spark要操作Hadoop中的数据,需要先启动HDFS
6、 HDFS若启动成功,系统会列出以下哪些进程?
A:NameNode
B:HDFS
C:DataNode
D:SecondaryNameNode
答案: NameNode;
DataNode;
SecondaryNameNode
7、 spark-shell在启动时,采用yarn-client模式时,以下说法正确的是?
A:当用户提交了作业之后,不能关掉Client
B:当用户提交了作业之后,就可以关掉Client
C:该模式适合运行交互类型的作业
D:该模式不适合运行交互类型的作业
答案: 当用户提交了作业之后,不能关掉Client;
该模式适合运行交互类型的作业
8、 spark-shell在启动时,采用yarn-cluster模式时,以下说法正确的是?
A:当用户提交了作业之后,不能关掉Client
B:当用户提交了作业之后,就可以关掉Client
C:该模式适合运行交互类型的作业
D:该模式不适合运行交互类型的作业
答案: 当用户提交了作业之后,就可以关掉Client;
该模式不适合运行交互类型的作业
9、 开发Spark独立应用程序的基本步骤通常有哪些?
A:安装编译打包工具,如sbt,Maven
B:编写Spark应用程序代码
C:编译打包
D:通过spark-submit运行程序
答案: 安装编译打包工具,如sbt,Maven;
编写Spark应用程序代码;
编译打包;
通过spark-submit运行程序
10、 集群上运行Spark应用程序的方法步骤有哪些?
为了方便下次阅读,建议在浏览器添加书签收藏本网页
添加书签方法:
1.电脑按键盘的Ctrl键+D键即可收藏本网页
2.手机浏览器可以添加书签收藏本网页
获取更多MOOC答案,欢迎在浏览器访问我们的网站:http://mooc.mengmianren.com
注:请切换至英文输入法输入域名,如果没有成功进入网站,请输入完整域名:http://mooc.mengmianren.com/
我们的公众号
打开手机微信,扫一扫下方二维码,关注微信公众号:萌面人APP
本公众号可查看各种网课答案,还可免费查看大学教材答案
点击这里,可查看公众号功能介绍
一键领取淘宝,天猫,京东,拼多多无门槛优惠券,让您购物省省省,点击这里,了解详情
干饭人福利,饿了么红包每日领