全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2622 5
2010-12-26
x: 202 * 263 202行,263列

num.compd<-nrow(x); # number of compounds
diss.all<-0
for( i in 1:num.compd)
   for (j in 1:num.compd)
      if (i!=j) {
        S1<-sum(x[i,]*x[j,])
        S2<-sum(x[i,]^2)
        S3<-sum(x[j,]^2)
        sim2<-S1/(S2+S3-S1)
        diss2<-1-sim2
        diss.all<-diss.all+diss2}
这个程序计算速度太慢了,各位兄弟帮忙各个向量化的程序替换我的,谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-12-27 16:07:18
初步改进意见:
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-27 16:57:59
此外楼主的程序有重复计算的问题,建议将实际的公式写出,而不是以程序代码形式
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-27 18:55:11
复制代码
可以尝试不用循环
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-28 16:28:33
3# shenbaiseshatan

my data.rar
大小:(132.41 KB)

 马上下载



这里是公式,还有数据,谢谢大家帮助,这个问题解决了,把X变成矩阵形式就快多了,数据框很慢。

x<-as.matrix(x)
xtx <- tcrossprod(x)
xtd <- diag(xtx)
xzz <- outer(xtd,xtd,'+')
zz  <- 1 - xtx/(xzz-xtx)
diss.all <- sum(zz)

这个很好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-28 16:30:01
谢谢 大家帮助啊,其实 我就是想求 Tanimoto coefficient.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群