全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
831 3
2018-05-04
如下图所示是袁数据,ID代表客户id,addr和phe分别是地址和电话,只要地址或者电话一样,就说明两个客户id,是属于同一个客户。



结果见这个,id代表客户id,flag组名




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-5-5 15:06:44
一个思路 : 将数据看成是    地址和 电话 通过 ID 来连接 的 查并集数据。  然后就可以找到 group 1 有哪些 地址和电话。 group 2  有哪些 地址和电话。 再将 原始数据通过  地址或  电话 找到 group ID。

查并集[UnionFind] R code 好像没有。 我之前 用过 python的

参考 https://code.activestate.com/recipes/577225-union-find/
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-20 23:32:29
我思考了一阵,提出一个算法,先在r-bloggers上,暂时没有人指出思路错误,你可以先参考一下:
https://www.r-bloggers.com/do-clustering-by-dimensional-collapse/
我有空会在论坛里贴出中文版的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-5-21 07:03:10
interesting
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群