全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1018 4
2016-08-08
各位,想要进行相关分析以及分类聚类,但是属性是汉字,怎么数值化,向量化?求指教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-10 09:30:14
你数据内的汉字肯定是有一定的等级的,你将汉字按等级分别换成 0-n
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-10 11:52:44
Baby-Zhao 发表于 2016-8-10 09:30
你数据内的汉字肯定是有一定的等级的,你将汉字按等级分别换成 0-n
请问怎么讲等级?你是说因子型吗?我想过每个词给一个属于自己的编码,就像二进制码那样,使得每个字词具有唯一吗,但是不知道怎么实现
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-10 14:32:32
R语言实战里有个例子,作者把经药物作用后呈现的结果"poor","improved","excellent",分别用 1,2,3表示的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-10 15:02:33
Baby-Zhao 发表于 2016-8-10 14:32
R语言实战里有个例子,作者把经药物作用后呈现的结果"poor","improved","excellent",分别用 1,2,3表示的
谢谢!书上那是因子型,我的数据现在有很多,转为因子型量还是很大
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群