全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4320 3
2019-01-04
我用R在某网站提取了2075相似个网页的内容,每个网页都包含三个主要的信息:作者,发布日期和内容。现在我想建立一个for循环把每个网页提取的这三样信息依次存入一个数据框或者表里,这个表应该有2075行和3列,该如何做呢?顺便说一下这三样信息全是文本。谢谢各位大佬。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-1-5 20:54:51
 试试下面的代码:

dat = data.frame(
  author = rep(NA, 2075),
  date = rep(NA, 2075),
  content = rep(NA, 2075)
)

for (i in 1:2075){
  dat$author[i] = author_content
  dat$date[i] = date_content
  dat$content[i] = content_content
}
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-7 20:54:08
caimiao0714 发表于 2019-1-5 20:54
 试试下面的代码:

dat = data.frame(
适用入我的案例后,出现了一个严重的问题,就是repleacement has length zero。在我改进后,在一个for循环内加入了很多个if else语句,就搞定了。多谢你的知道,非常有用。这个问题虽然很基本,但是网上基本没有这样的说明
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-7 23:29:34
aaasssdddwww 发表于 2019-1-7 20:54
适用入我的案例后,出现了一个严重的问题,就是repleacement has length zero。在我改进后,在一个for循环 ...
R的向量是从1开始的,不是像python一样从0开始
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群