全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1303 1
2017-08-18
simhasher = worker("simhash", topn = 2)
simhasher <= text
simhasher = worker("keywords", topn = 2)
simhasher <= text
二者之间有何区别?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-8-21 18:31:54
> keys = worker("keywords", topn = 2)
> keys <= "江州市长江大桥参加了长江大桥的通车仪式"
   22.3853    8.69667
"长江大桥"     "江州"
> simhasher = worker("simhash",topn=2)
> simhasher <= "江州市长江大桥参加了长江大桥的通车仪式"
$simhash
[1] "12882166450308878002"

$keyword
   22.3853    8.69667
"长江大桥"     "江州"

从这个官方例子可以看出,他们都计算了keyword值,并且值相等,不过simhash又用了simhash算法计算了simhash值和海明距离,可以看帮助文档
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群