南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.数据归约(Data Reduction)主要有( )。
A.维度规约
B.样本规约
C.数据聚集
D.离散化概念分层
参考答案:ABCD
2.以下哪个方法可以创建RDD( )
A.parallelize
B.makeRDD
C.textFile
D.loadFile
参考答案:ABC
3.SparkContext类中makeRDD方法不可将单机数据创建为分布式RDD。( )
A.正确
B.错误
参考答案:B
4.RDD的( )操作通常用来划分单词
A.filter
B.union
C.flatmap
D.mapPartitions
参考答案:C
5.矩阵连乘问题的算法可由动态规划设计实现。( )
A.错误
B.正确
参考答案:B
6.快速排序算法的性能取决于划分的对称性。( )
A.错误
B.正确
参考答案:B
7.决策树是( )的常用算法
A.分类
B.聚类
C.降维
D.回归
参考答案:AD
8.Scala中使用( )方法来查看两个集合的交集元素
A.Set.concat
B.Set.&
C.Set.&&
D.Se ...
附件列表