经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
聚类分析中变量问题
楼主
gerxyuan
2344
4
收藏
2014-11-15
悬赏
2
个论坛币
已解决
想用R做聚类分析,数据里有二元变量,序数变量,数值连续变量。看各种范例都是连续变量在做,我数据二元变量居多,可以用kmeans()做吗?或者需要数据预处理?谢谢!
最佳答案
suhui0723
查看完整内容
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的, 因为算相似性矩阵的时候不同的变量都要归一化, 我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
suhui0723
2014-11-15 12:16:06
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的,
因为算相似性矩阵的时候不同的变量都要归一化,
我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
李会超
2014-11-15 15:27:12
聚类分析都是针对连续变量,没有二元变量聚类的
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
gerxyuan
2014-11-15 16:35:38
我问过一个R博客的博主,他提示可以在连续变量基础上,加二值变量。
我搜出国外网站上类似问题,说Gower distance is a good metric for datasets with mixed variables.
有人知道怎么搞吗?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
calsunny
2014-11-16 04:43:58
See here on page 7:
http://www.statisticalinnovations.com/products/twostep.pdf
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助] 聚类分析
聚类分析结果的检验指标
K均值聚类分析
Kmeans 聚类分析的初始数据的选择
聚类分析时遇到的难题
手把手教你使用 R 进行聚类分析(K Means)
动态聚类分析
关于R需要聚类分析结果如何能最快捷加在数据表后
【学习笔记】Python 机器学习第二天打卡 今天学了聚类分析KMeans, 明天继续加 ...
一文总结聚类分析步骤!
栏目导航
R语言论坛
休闲灌水
经管文库(原现金交易版)
真实世界经济学(含财经时事)
经管高考
学道会
热门文章
CDA 数据分析师:线性回归实战指南 —— 从 ...
世界上最简单的会计书(高清pdf版)
AI应用新范式:从工具革命到“超级OS”的演 ...
同心动力携手山西金控,共筑金融企业“以人 ...
R语言实战 机器学习与数据分
蔡定创教授、李云庆院长致联合国秘书长古特 ...
2022年北京冬奥会英语观后感【10篇】
R语言预测实战
瓦尔拉斯方程组及其求解历史
一般均衡证明中的关键人物与全 1 解的关联探 ...
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群