经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
聚类分析中变量问题
楼主
gerxyuan
2388
4
收藏
2014-11-15
悬赏
2
个论坛币
已解决
想用R做聚类分析,数据里有二元变量,序数变量,数值连续变量。看各种范例都是连续变量在做,我数据二元变量居多,可以用kmeans()做吗?或者需要数据预处理?谢谢!
最佳答案
suhui0723
查看完整内容
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的, 因为算相似性矩阵的时候不同的变量都要归一化, 我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
suhui0723
2014-11-15 12:16:06
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的,
因为算相似性矩阵的时候不同的变量都要归一化,
我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
李会超
2014-11-15 15:27:12
聚类分析都是针对连续变量,没有二元变量聚类的
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
gerxyuan
2014-11-15 16:35:38
我问过一个R博客的博主,他提示可以在连续变量基础上,加二值变量。
我搜出国外网站上类似问题,说Gower distance is a good metric for datasets with mixed variables.
有人知道怎么搞吗?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
calsunny
2014-11-16 04:43:58
See here on page 7:
http://www.statisticalinnovations.com/products/twostep.pdf
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助] 聚类分析
聚类分析结果的检验指标
K均值聚类分析
Kmeans 聚类分析的初始数据的选择
聚类分析时遇到的难题
手把手教你使用 R 进行聚类分析(K Means)
动态聚类分析
关于R需要聚类分析结果如何能最快捷加在数据表后
【学习笔记】Python 机器学习第二天打卡 今天学了聚类分析KMeans, 明天继续加 ...
一文总结聚类分析步骤!
栏目导航
R语言论坛
休闲灌水
金融实务版
世界经济与国际贸易
宏观经济学
金融学(理论版)
热门文章
几何(第五卷)[法] M. 贝尔热
几何(第四卷)[法] M. 贝尔热
奇瑞QQ焕新归来
CDA数据分析脱产就业班于2026年3月7日开班! ...
表格结构数据的核心特征及具象实例解析
湖南统计年鉴2025(Excel版)
中外历史年代对照表
高效办公—Word零基础教程
2026太空算力发展研究报告
2026中信里昂风水指数
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
26年寒假天津站|Gemini论文写作&数据分析 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群