经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
提问 悬赏 求职 新闻 读书 功能一区
›
学道会
【学习笔记】大规模数据处理学习03 ## Top K算法当数据规模变大会遇到哪些问 ...
楼主
a1032077316
640
1
收藏
2019-07-15
大规模数据处理学习03
## Top K算法当数据规模变大会遇到哪些问题
---
1.内存占用:
比如1000亿行的文件或者表,然后再把销量统计结果一行一行读进
后面的堆树/优先级队列里,肯定不可信,对于TB级的交易记录数
据,很难找到单台计算机容纳那么大的哈希表
2.磁盘I/O延时
一次磁盘读取大概需要10ms的时间
### 大规模分布式解决方案
需要把每一步从简单的函数算法,升级为计算集群的分布式算法
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
经管之家编辑部
2019-7-15 21:19:52
学习笔记奖!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
【学习笔记】大规模数据处理学习02: 1.对于复杂的处理架构,会使用多个Map和 ...
【学习笔记】大规模数据处理学习04:学会用服务等级协议SLA来评估你的系统 什 ...
【学习笔记】大规模数据处理08:发布订阅模式 1.在分布式架构里,架构中的各个 ...
【学习笔记】今天一定要把数据处理完 加油
【学习笔记】数据处理案例学习_连玉君老师_论文篇
【学习笔记】做完数据处理
【学习笔记】今天在做二八图发现图片呈现效果之前应该把数据处理完善,顺序很 ...
【学习笔记】复习一下,昨晚上讲的时间数据处理需要好好看一下。要看的东西不 ...
【学习笔记】今天完成模型,准确率较低,大家晚上讨论了两个小时,对数据处理 ...
【学习笔记】今日计划引言部分玩成,并进行数据处理,处理结果进行回归,还有 ...
栏目导航
学道会
市场营销
求助成功区
真实世界经济学(含财经时事)
休闲灌水
世界经济与国际贸易
热门文章
CDA数据分析脱产就业班于2026年3月7日开班! ...
Measure Theory for Analysis and Probabil ...
现代数学基础19 偏微分方程 孔德兴
科研时间70%耗在“下载-复制-粘贴”?零代码 ...
精准匹配,菁英相伴--经管之家单身俱乐部, ...
CDA数据分析师:商业数据分析实践的核心执行 ...
我该如何记住你?智能体记忆系统的演化之路
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
Stata 19.0 Win 安装文件
Trading_Price_Action第一本书
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群