全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1108 3
2020-02-17
请教下各位大佬:背景:有200地级市的年度销量Y。自变量:N个二分类变量,M个多分类变量,L个离散变量。
需求:根据样本数据,对全国600地级市的年度销量进行预测。
问题:
1、请问选择什么预测模型比较合适?为什么?
2、我查阅了下,可能会用有序多分类Logistic回归模型,如何用这个模型,年度销量Y,如何处理?是要先对样本年度销量Y进行分组吗?如果分组,怎样分组?分多少个组呢?参考因素有哪些?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-2-17 15:37:55
自己先顶一个。
同步补充个问题3:自变量有二分类、多分类、离散型。是否需要处理
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-2-21 00:15:57
Y是连续变量,可先用OLS回归看看结果。X中的二分变量,直接放进去就可以。多分类变量应生成一组dummy,以一个作为参照,不然会存在完全共线性问题。离散变量指的什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-2-23 16:01:20
koropits 发表于 2020-2-21 00:15
Y是连续变量,可先用OLS回归看看结果。X中的二分变量,直接放进去就可以。多分类变量应生成一组dummy,以一 ...
1、离散变量一般是整数变量,不能无限分割。离散变量如产品销量,连续变量如年龄。
2、dummy是什么啊?
3、鉴于目前的业务现状,请大佬赐教,推荐什么预测模型比较合适啊。
目前我是新手,如果有解释不到位的地方,还望谅解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群