2021年7月16日 gebilaowang

探索数据的奥秘(南京大学)中国大学MOOC答案2024完整版WYC

对应课程:点击查看
起止时间:2021-02-22到2021-06-30
更新状态:每5天更新一次

第三讲数据搜集与准备 1-3单元测验

1、人类探索世界的第四科学范式是指

A:实验
B:理论
C:计算
D:数据科学
答案: 数据科学

2、以下关于大数据的特点描述，错误的是

A:大数据是指体量非常大的结构化数据
B:大数据具有种类繁多、速度快时效高的特点
C:大数据的价值密度相对较低
D:数据量大到常常需要并行计算处理
答案: 大数据是指体量非常大的结构化数据

3、以下关于数据科学的说法，你认为正确的是

A:数据科学其实就是统计学
B:数据科学就是机器学习
C:数据科学就是传统意义的“科学”，不必过多考虑工程应用
D:数据科学涉及多学科与工程应用的融合与交叉
答案: 数据科学涉及多学科与工程应用的融合与交叉

4、一个完整的数据科学项目，应起始于

A:问题的确定
B:数据搜集
C:建立高大上的模型
D:目标制定
答案: 问题的确定

5、关于模型的评价，以下说法中不正确的是：

A:模型采用什么样的评价指标和具体的模型类型密切相关
B:对于一个有效的数据科学模型，其评价指标需优于以往实现同类任务的模型所实现的指标
C:在不了解以往工作的情况下，分类模型优于50%的准确率指标（也就是随机分类准确率）即可
D:分类模型的性能评价常规采用混淆矩阵
答案: 在不了解以往工作的情况下，分类模型优于50%的准确率指标（也就是随机分类准确率）即可

6、又到了大学新生入学的时间。你作为学生会中的老干部，很荣幸领到了一项为新生匹配舍友的任务，每四个新生同住一间宿舍。有无穷活力的你，决定利用你所了解的数据科学来实现自动匹配，让个性、爱好相似的人成为舍友。请问，从数据科学的观点，这是一个什么问题？

A:分类
B:聚类
C:关联化
D:特征提取
答案: 聚类

7、一位葡萄酒经销商找到你，想了解到底酸度、剩余糖分、氯化物、酒精浓度、酸碱度等性质中究竟哪种性质最影响大众对葡萄酒的喜好程度。请问，从数据科学的观点，这是一个什么问题？

A:分类
B:关联化
C:特征提取
D:预测
答案: 关联化

8、以下哪些技术支撑了现今的数据时代？

A:传感技术
B:互联网与通信技术
C:存储技术
D:航天技术
答案: 传感技术;
互联网与通信技术;
存储技术

9、以下哪些是数据？

A:你听讲座时的录音文件
B:十字路口的监控视频
C:传感器采集到的你的生命体征信息
D:你在朋友圈里发布的动态
答案: 你听讲座时的录音文件;
十字路口的监控视频;
传感器采集到的你的生命体征信息;
你在朋友圈里发布的动态

10、以下说法正确的是：

A:问题和目标，都涉及两个层面：用户层面和数据科学层面。
B:用户层面我们面临的一般是一个现实世界中的具体问题。
C:用户层面的问题与目标涉及到最后项目的验收，因此一旦明确，也就指出了我们努力的方向和路径。
D:数据科学层面的问题与目标确定，其中的关键是现实问题的抽象化。
答案: 问题和目标，都涉及两个层面：用户层面和数据科学层面。;
用户层面我们面临的一般是一个现实世界中的具体问题。;
数据科学层面的问题与目标确定，其中的关键是现实问题的抽象化。

11、 “张大妈服用我们的产品治好了多年的老寒腿”，为什么不能作为产品有效的科学依据？

A:样本容量太小
B:存在抽样偏差
C:未考虑混杂因素
D:单个个体不能代表总体
答案: 样本容量太小;
存在抽样偏差;
未考虑混杂因素;
单个个体不能代表总体

12、一个数据科学项目，可能涉及的人员包括项目出资方、客户（或用户）、数据科学家、数据架构师和运营工程师，不同的角色有不同任务，大家各有其专业领域，各司其职即可，不要相互影响。

A:正确
B:错误
答案: 错误

13、现在的模型功能非常强大，所以拿到数据以后，可以直接建模，让模型自动化分析。

A:正确
B:错误
答案: 错误

14、明确数据科学层面的任务（问题和目标）之后，我们需要首先提出前提假设。

A:正确
B:错误
答案: 正确

15、根据前提假设，只要能设计出对应的数据构成，我们就可以进入数据收集。

A:正确
B:错误
答案: 错误

16、不同的假设很可能会涉及不同的数据，最终导致不同的研究内容。

A:正确
B:错误
答案: 正确

17、确定数据的构成，一般是指建立一张不可再分的二维表。表中一行代表一个样本，一列代表样本的一个特征或属性。

A:正确
B:错误
答案: 正确

18、传统统计学认为样本容量大于30就具备统计学意义了，所以大数据时代的数据，哪怕不是全部数据，也可以有效代表总体。

A:正确
B:错误
答案: 错误

19、抽样偏差（Sampling bias）是指从总体中非随机性抽样带来的系统性错误。

A:正确
B:错误
答案: 正确

20、产生“辛普森悖论”的主要原因是没有排除混杂因素的影响。

A:正确
B:错误
答案: 正确

21、所谓混杂因素，是指那些不是我们的考察对象，但却可能对结果造成影响的因素。

A:正确
B:错误
答案: 正确

22、在一个数据科学项目中，最核心的人员是（）
答案: 数据科学家

23、明确问题与目标，都包含两个层面：现实层面和（）层面
答案: 数据科学

24、样本真实反映总体的两个前提条件是：1.样本容量足够大；2.（）
答案: 无偏

25、样本真实反映总体的两个前提条件是：1.（）；2.无偏抽样
答案: (以下答案任选其一都对)样本容量足够大;
样本足够多;
样本够多

第四讲 Python简介 4单元测验

1、 Pandas.read_csv函数读取数据文件时，指定参数（）（也就是为其赋值）可以实现数据的流读取，即不将数据一次性加载，而是以连续流的方式加载。

A:chunksize
B:index
C:header
D:delimiter
答案: chunksize

注：此答案尚未制作完成，如需购买，可点击下方红字提交表单联系客服更新，更新后可直接在本网页购买答案

点击这里，联系客服更新

为了方便下次阅读，建议在浏览器添加书签收藏本网页

添加书签方法：

1.电脑按键盘的Ctrl键+D键即可收藏本网页

2.手机浏览器可以添加书签收藏本网页

获取更多MOOC答案，欢迎在浏览器访问我们的网站：http://mooc.mengmianren.com

注：请切换至英文输入法输入域名，如果没有成功进入网站，请输入完整域名：http://mooc.mengmianren.com/

我们的公众号

打开手机微信，扫一扫下方二维码，关注微信公众号：萌面人APP

本公众号可查看各种网课答案，还可免费查看大学教材答案

点击这里，可查看公众号功能介绍

一键领取淘宝，天猫，京东，拼多多无门槛优惠券，让您购物省省省，点击这里，了解详情

干饭人福利，饿了么红包每日领

点击这里，领取饿了么外卖红包

中国大学MOOC答案

，欢迎在浏览器访问我们的网站：http//mooc.mengmianren.com注：请切换至英文输入法输入域名，如果没有成功进入网站，请输入完整域名：http//mooc.mengmianren.com/我们的公众号打开手机微信，扫一扫下方二维码，关注微信公众号：萌面人资料铺本公众号提供各种网课 ;数据科学层面的问题与目标确定，其中的关键是现实问题的抽象化 ;用户层面我们面临的一般是一个现实世界中的具体问题 “张大妈服用我们的产品治好了多年的老寒腿”，为什么不能作为产品有效的科学依据 (以下 AchunksizeBindexCheaderDdelimiter A传感技术B互联网与通信技术C存储技术D航天技术 A你听讲座时的录音文件B十字路口的监控视频C传感器采集到的你的生命体征信息D你在朋友圈里发布的动态 A分类B关联化C特征提取D预测 A分类B聚类C关联化D特征提取 A样本容量太小B存在抽样偏差C未考虑混杂因素D单个个体不能代表总体 A正确B错误 B用户层面我们面临的一般是一个现实世界中的具体问题 chunksize注：此 C用户层面的问题与目标涉及到最后项目的验收，因此一旦明确，也就指出了我们努力的方向和路径 D数据科学层面的问题与目标确定，其中的关键是现实问题的抽象化 Pandas.read_csv函数读取数据文件时，指定参数（）（也就是为其赋值）可以实现数据的流读取，即不将数据一次性加载，而是以连续流的方式加载一个完整的数据科学项目，应起始于A问题的确定B数据搜集C建立高大上的模型D目标制定一个数据科学项目，可能涉及的人员包括项目出资方一位葡萄酒经销商找到你，想了解到底酸度不同的假设很可能会涉及不同的数据，最终导致不同的研究内容中国大学MOOC慕课答案中国大学MOOC答案中国大学MOOC答案公众号免费中国大学MOOC答案在哪里查中国大学MOOC答案查询中国大学慕课答案产生“辛普森悖论”的主要原因是没有排除混杂因素的影响人类探索世界的第四科学范式是指A实验B理论C计算D数据科学以下关于大数据的特点描述，错误的是A大数据是指体量非常大的结构化数据B大数据具有种类繁多以下关于数据科学的说法，你认为正确的是A数据科学其实就是统计学B数据科学就是机器学习C数据科学就是传统意义的“科学”，不必过多考虑工程应用D数据科学涉及多学科与工程应用的融合与交叉以下哪些技术支撑了现今的数据时代以下哪些是数据以下说法正确的是：A问题和目标，都涉及两个层面：用户层面和数据科学层面以及大学学习资料淘宝天猫内部优惠券，一年帮你省下好几千，点击这里，了解详情任选其一都对)样本容量足够大;样本足够多;样本够多第四讲Python简介单元测验传感技术;互联网与通信技术;存储技术传统统计学认为样本容量大于就具备统计学意义了，所以大数据时代的数据，哪怕不是全部数据，也可以有效代表总体你作为学生会中的老干部，很荣幸领到了一项为新生匹配舍友的任务，每四个新生同住一间宿舍你听讲座时的录音文件;十字路口的监控视频;传感器采集到的你的生命体征信息;你在朋友圈里发布的动态关于模型的评价，以下说法中不正确的是：A模型采用什么样的评价指标和具体的模型类型密切相关B对于一个有效的数据科学模型，其评价指标需优于以往实现同类任务的模型所实现的指标C在不了解以往工作的情况下，分类模型优于%的准确率指标（也就是随机分类准确率）即可D分类模型的性能评价常规采用混淆矩阵关联化剩余糖分又到了大学新生入学的时间在一个数据科学项目中，最核心的人员是（）在不了解以往工作的情况下，分类模型优于%的准确率指标（也就是随机分类准确率）即可大数据是指体量非常大的结构化数据客户（或用户）对应课程点击查看起止时间到更新状态每天更新一次质点的运动及其运动规律第一章习题尚未制作完成，如需购买，可点击下方红字提交表单联系客服更新，更新后可直接在本网页购买所谓混杂因素，是指那些不是我们的考察对象，但却可能对结果造成影响的因素抽样偏差（Samplingbias）是指从总体中非随机性抽样带来的系统性错误探索数据的奥秘(南京大学)中国大学MOOC慕课答案探索数据的奥秘(南京大学)中国大学MOOC答案探索数据的奥秘(南京大学)中国大学MOOC答案2022完整版WYC 探索数据的奥秘(南京大学)中国大学慕课答案数据架构师和运营工程师，不同的角色有不同任务，大家各有其专业领域，各司其职即可，不要相互影响数据科学数据科学家数据科学涉及多学科与工程应用的融合与交叉无偏明确数据科学层面的任务（问题和目标）之后，我们需要首先提出前提假设明确问题与目标，都包含两个层面：现实层面和（）层面有无穷活力的你，决定利用你所了解的数据科学来实现自动匹配，让个性样本容量太小;存在抽样偏差;未考虑混杂因素;单个个体不能代表总体样本真实反映总体的两个前提条件是：.（）；.无偏抽样样本真实反映总体的两个前提条件是：.样本容量足够大；.（）根据前提假设，只要能设计出对应的数据构成，我们就可以进入数据收集正确氯化物点击这里，联系客服更新为了方便下次阅读，建议在浏览器添加书签收藏本网页添加书签方法：.电脑按键盘的Ctrl键+D键即可收藏本网页.手机浏览器可以添加书签收藏本网页获取更多MOOC 爱好相似的人成为舍友现在的模型功能非常强大，所以拿到数据以后，可以直接建模，让模型自动化分析确定数据的构成，一般是指建立一张不可再分的二维表聚类表中一行代表一个样本，一列代表样本的一个特征或属性请问，从数据科学的观点，这是一个什么问题速度快时效高的特点C大数据的价值密度相对较低D数据量大到常常需要并行计算处理酒精浓度酸碱度等性质中究竟哪种性质最影响大众对葡萄酒的喜好程度错误问题和目标，都涉及两个层面：用户层面和数据科学层面问题的确定

文章导航

Previous Post:人体生理学(黑龙江大学)中国大学MOOC答案2024完整版WYC
Next Post:数字电子技术与项目训练(陕西国防工业职业技术学院)中国大学MOOC答案2024完整版WYC

第三讲 数据搜集与准备 1-3单元测验

第四讲 Python简介 4单元测验

第三讲数据搜集与准备 1-3单元测验