经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
python论坛
python dataframe如何处理上亿数量级表
楼主
静电单位
2200
3
收藏
2020-01-16
各位大神,我有一张9千万级的数据在HIVE SQL中做完了初步处理,现在需要到python中做加工,
但由于数据量太大了跑完cur.excute语句以后,一直自动崩溃,如何将HIVE SQL中的千万级数据放到python上呢?
跪谢!!!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
juliewong
2020-1-16 16:35:39
这么多数据,牛
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
juliewong
2020-1-16 16:36:12
我会python,没试过这么多数据
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
hgz2373294
2020-1-16 22:06:08
python应该可以直接写程序在HADOOP里执行,
SAS这方面也类似功能
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
python统计DataFrame前20%的和
python dataframe 全是NaN
【学习笔记】python数据学习打卡 几天才看完dataframe的部分
python的DataFrame 中根据两列条件判断生成第三列
python+dataframe 列名批量引用
python中Dataframe数据的显示(笔记)
Python中Dataframe数据的修改(笔记)
python中Dataframe数据的排序
Python中DataFrame的子查询(笔记)
python+dataframe + 时间索引
栏目导航
python论坛
经管高考
真实世界经济学(含财经时事)
计量经济学与统计软件
学道会
经管文库(原现金交易版)
热门文章
《那年2003:我双手插兜,搞钱不知什么叫对 ...
在概率与代码之间:Agent Skills 是 AI 的枷 ...
CDA数据分析脱产就业班于2026年3月7日开班! ...
参数估计:CDA数据分析师的核心推断工具,用 ...
通用指标与场景指标:CDA数据分析师的核心分 ...
GeoSaaS永久会员版
全国国土利用现状、耕地、园地、林地分布等 ...
癌症·真相:医生也在读(菠萝)
2024年合集 ESG评级数据大全(彭博 华证 Wi ...
脑机接口行业系列报告:Neuralink带来的启示 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群