全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
113 0
2025-06-06
南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.Mllib中线性会馆算法中的参数reParam表示( )
A.要运行的迭代次数
B.梯度下降的步长
C.是否给数据加干扰特征或者偏差特征
D.Lasso和ridge的正规化参数
参考答案:D
2.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。( )
T.对F.错参考答案:F
3.Spark创建DataFrame对象方式有( )
A.结构化数据文件
B.外部数据库
C.RDD
D.Hive中的表
参考答案:ABCD
4.以下哪个不是Scala的数据类型( )
A.Int
B.Short Int
C.Long
D.Any
参考答案:B
5.Hbase中Region服务器的系统会周期性地把MemStore缓存里的内容刷写到磁盘的StoreFile文件中,清空缓存,并在Hlog里面写入一个标记。( )
A.正确
B.错误
参考答案:A
6.关于Map端Shuffle过程中的合并与归并,说法正确的是( )。
A.两个键值对和,如果合并,会得到
B.合并不会改变最 ...
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群