全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4399 3
2012-05-21
各位好!       我有一个变量,其变量值包含多个信息,每个变量值基本上是这样的组成:“厂商品牌口味包装规格”,但是变量值中的每个部分字数都是不固定的,现在想根据这一个变量的值建立新变量,区分出来品牌、口味、包装和规格,然后根据每个变量将观测分组,请问如何实现?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-5-21 11:23:29
可能不太清楚,我举例说明一下:
比如该变量中有一个值是:
康师傅千椒百味泡椒牛肉桶110g  ,我想把它拆成:康师傅、千椒百味、泡椒牛肉、桶、110g这几个变量;


像这样的变量值格式不完全一致,还有:
公仔炒面-特式香辣酱味四包装456g(希望结果是:公仔、炒面、特式香辣酱味、 、四包装456g)

康师傅面霸煮面上汤排骨拉面五入(希望结果是:康师傅、面霸煮面、上汤排骨拉面、、五入)等




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-21 11:27:49
这个还真不好弄,没啥规律啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-5-21 11:32:40
是啊,只是大概能分出来这几个部分,有的不能分成5个部分,可能只有4个或者3个,而且每个部分字符数不一样,数据集观测数大概4万条
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群