经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
数据分析与数据科学
›
R语言论坛
聚类分析中变量问题
楼主
gerxyuan
2389
4
收藏
2014-11-15
悬赏
2
个论坛币
已解决
想用R做聚类分析,数据里有二元变量,序数变量,数值连续变量。看各种范例都是连续变量在做,我数据二元变量居多,可以用kmeans()做吗?或者需要数据预处理?谢谢!
最佳答案
suhui0723
查看完整内容
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的, 因为算相似性矩阵的时候不同的变量都要归一化, 我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
suhui0723
2014-11-15 12:16:06
我以前做凝聚聚类的时候,二元数据也一起扔进去算相似性矩阵的,
因为算相似性矩阵的时候不同的变量都要归一化,
我不知道我这样做行不行
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
李会超
2014-11-15 15:27:12
聚类分析都是针对连续变量,没有二元变量聚类的
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
板凳
gerxyuan
2014-11-15 16:35:38
我问过一个R博客的博主,他提示可以在连续变量基础上,加二值变量。
我搜出国外网站上类似问题,说Gower distance is a good metric for datasets with mixed variables.
有人知道怎么搞吗?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
报纸
calsunny
2014-11-16 04:43:58
See here on page 7:
http://www.statisticalinnovations.com/products/twostep.pdf
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
[求助] 聚类分析
聚类分析结果的检验指标
K均值聚类分析
Kmeans 聚类分析的初始数据的选择
聚类分析时遇到的难题
手把手教你使用 R 进行聚类分析(K Means)
动态聚类分析
关于R需要聚类分析结果如何能最快捷加在数据表后
【学习笔记】Python 机器学习第二天打卡 今天学了聚类分析KMeans, 明天继续加 ...
一文总结聚类分析步骤!
栏目导航
R语言论坛
新手入门区
行业分析报告
求助成功区
经管高考
经管文库(原现金交易版)
热门文章
在概率与代码之间:Agent Skills 是 AI 的枷 ...
法兰西数学精品译丛09-概率与位势(第Ⅰ卷) ...
表格结构数据特征与CDA数据分析师:精准适配 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
问卷填写,每份50个论坛币
新宏观丨豆包,传统经济学与商学对全球性债 ...
硅光芯片代工爆发式增长,重构全球半导体产 ...
新宏观丨豆包,谁是传统经济学的最大反对派
失去的三十年:平成日本经济史(【日】野口 ...
中国力量席卷全球- 绿色赋能地产先行 掀起全 ...
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群