全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
459 0
2023-02-09

分区存储

如果将用户标签开发成一张大的宽表,在这张宽表下放几十种类 型标签,那么每天该画像宽表的ETL作业将会花费很长时间,而且不便 于向这张宽表中新增标签类型。

要解决这种ETL花费时间较长的问题,可以从以下几个方面着手:

·将数据分区存储,分别执行作业;

·标签脚本性能调优;

·基于一些标签共同的数据来源开发中间表。


下面介绍一种用户标签分表、分区存储的解决方案。

根据标签指标体系的人口属性、行为属性、用户消费、风险控 制、社交属性等维度分别建立对应的标签表进行分表存储对应的标签 数据。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群