经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
提问 悬赏 求职 新闻 读书 功能一区
›
学道会
【学习笔记】大规模数据处理学习03 ## Top K算法当数据规模变大会遇到哪些问 ...
楼主
a1032077316
575
1
收藏
2019-07-15
大规模数据处理学习03
## Top K算法当数据规模变大会遇到哪些问题
---
1.内存占用:
比如1000亿行的文件或者表,然后再把销量统计结果一行一行读进
后面的堆树/优先级队列里,肯定不可信,对于TB级的交易记录数
据,很难找到单台计算机容纳那么大的哈希表
2.磁盘I/O延时
一次磁盘读取大概需要10ms的时间
### 大规模分布式解决方案
需要把每一步从简单的函数算法,升级为计算集群的分布式算法
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
经管之家编辑部
2019-7-15 21:19:52
学习笔记奖!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
【学习笔记】大规模数据处理学习02: 1.对于复杂的处理架构,会使用多个Map和 ...
【学习笔记】大规模数据处理学习04:学会用服务等级协议SLA来评估你的系统 什 ...
【学习笔记】大规模数据处理08:发布订阅模式 1.在分布式架构里,架构中的各个 ...
【学习笔记】今天一定要把数据处理完 加油
【学习笔记】数据处理案例学习_连玉君老师_论文篇
【学习笔记】做完数据处理
【学习笔记】今天在做二八图发现图片呈现效果之前应该把数据处理完善,顺序很 ...
【学习笔记】复习一下,昨晚上讲的时间数据处理需要好好看一下。要看的东西不 ...
【学习笔记】今天完成模型,准确率较低,大家晚上讨论了两个小时,对数据处理 ...
【学习笔记】今日计划引言部分玩成,并进行数据处理,处理结果进行回归,还有 ...
栏目导航
学道会
比特币、区块链与元宇宙
经管文库(原现金交易版)
宏观经济学
休闲灌水
学术道德监督
热门文章
蔡定创教授、李云庆院长致联合国秘书长古特 ...
2022年北京冬奥会英语观后感【10篇】
瓦尔拉斯方程组及其求解历史
一般均衡证明中的关键人物与全 1 解的关联探 ...
2018届高考化学基础模块综合检测17
达富发投资关于华策影视行情数据操作分析与 ...
宏观经济深度报告:AI视角下的美国就业市场
达富发投资关于中国电影操作数据操作分析与 ...
深圳市生态环境质量指数测评分析报告2025
2026年全球食品与饮料趋势预测
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群