全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1601 1
2015-03-23
现在有客户的基本属性数据(性别、年龄、职业、职位、城市等)和交易数据(交易类型、交易金额),并且这些客户都是买了车的,有相关的车辆品牌、车型、车辆价格等信息。
现在希望用现有的数据给其他没有买车的客户都打上标签,预测他们会买什么车(品牌和车型)。
我是这样考虑的:
1、由于汽车的品牌和车型比较多,而且是分类变量,无法直接预测,所以我用汽车网站的数据,将所有的车型拆分成以下几个指标:价格、舒适性、性价比、空间、动力等,大概7-8个维度,每个车型在不同的维度上都有评分,评分在3-5分之间。
2、建立每个客户对每个评分指标的模型
3、各个指标的预测综合起来可以对应出一款车型。

不知道这样考虑对不对。而且有一个问题,每个维度上的评分都是3-5分之间,保留2位小数。这样的数据能用来做因变量吗?是否需要怎么处理一下呢?

另外,自变量应该如何处理呢?

问题有点复杂,求各位大神帮忙。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-26 22:48:57
原则上可以。但有些细节需要处理,如:
    (1)8个维度似乎太多,有些可以合并一下
     (2) 既然都是3~5分,似乎看成分类变量比较合适,如:价格-高、中、低;舒适性-好、中、差等,用logistic回归等来建模
   
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群