全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
11610 13
2019-12-24
悬赏 50 个论坛币 已解决
我想实现的数据处理过程是先让数据按疾病的大类排列好,再按药品的名称排列好,然后再按会员的id排列好,再然后是按日期排列好,最后算出日期间隔。我用gsort这个命令后面加4个变量,那日期这一列并没有按顺序排列好,详细的结果请看下面的例子;我用gsort命令后面只添加加id和order_time,虽然计算的日期间隔的结果没有负数,但这种算法不能排除同一个id在同一天购买了不同的药,所以结果好像也是会有问题的。我应该如何实现多变量的正确排序,求大神们指教!

---------------------- copy starting from the next line -----------------------
复制代码

------------------ copy up to and including the previous line ------------------




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-12-24 20:31:43
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-25 06:42:12
请说明你的变量的意义 (谁是谁?)!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-25 08:57:34
黃河泉 发表于 2019-12-25 06:42
请说明你的变量的意义 (谁是谁?)!
product_name是药品名称,account_id是会员id,order_time是订单日期。我在问题里描述的疾病大类的变量没有放到举例的数据里。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-25 09:21:11
我再详细描述一下我的数据结构。我拿的是某公司所有慢性病的用户购药的数据,大概有10几种慢性病,每种慢性病又有好多个不同的药品,我要计算的就是某个用户在一段时期内购买某种药品的复购天数的间隔。因为日期复购天数的计算只能局限在某个用户,所以必须先对慢性病进行排序,再对某类慢性病中的药品排序,再对购买该类药品的用户id排序,最后再对id当中的下单日期进行排序。我用了sort和gsort命令,都不能保证下单日期是按照先后顺序排列的,也就是我昨天问的问题
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-25 10:22:18
朗啊朗 发表于 2019-12-25 09:21
我再详细描述一下我的数据结构。我拿的是某公司所有慢性病的用户购药的数据,大概有10几种慢性病,每种慢性 ...
很遗憾地,看了半天,我无法了解你的问题 (虽然我相信这用 Stata 处理应该不难)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群