全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
2199 0
2021-05-31

几十万+!两份twitter社交网络数据集!

1、数据来源:http://snap.stanford.edu/data/egonets-Twitter.html(Social circles:Twitter);http://snap.stanford.edu/data/higgs-twitter.html(Higgs Twitter Dataset)

2、时间跨度:twitter

3、区域范围:全国

4、指标说明:

(1)Social circles: Twitter

该数据集由Twitter的“圆圈”(或“列表”)组成。Twitter数据来自公共资源。数据集包括节点要素(轮廓),圆和自我网络。

  

Dataset statistics

  
  

Nodes

  

81306

  

Edges

  

1768149

  

Nodes in largest WCC

  

81306 (1.000)

  

Edges in largest WCC

  

1768149 (1.000)

  

Nodes in largest SCC

  

68413 (0.841)

  

Edges in largest SCC

  

1685163 (0.953)

  

Average clustering coefficient

  

0.5653

  

Number of triangles

  

13082506

  

Fraction of closed triangles

  

0.06415

  

Diameter (longest shortest path)

  

7

  

90-percentile effective diameter

  

4.5

Citation:

J.McAuley and J. Leskovec. Learning to Discover Social Circles in Ego Networks.NIPS, 2012.

(2) Higgs Twitter Dataset

希格斯(Higgs)数据集的建立是在2012年7月4日宣布发现具有希格斯玻色子玻色子特征的新粒子之前,之中和之后监视Twitter上的传播过程而建立的。和2012年7月7日。

此处提供的四个定向网络已从Twitter中的用户活动中提取为:


  • 转推(转推网络)
  • 回复(回复网络)现有推文
  • 提及(提及网络)其他用户
  • 参与上述活动的用户之间的朋友/追随者社交关系
  • 关于希格斯玻色子发现期间Twitter活动的信息

值得一提的是,用户ID已被匿名化,并且所有网络都使用相同的用户ID。这种选择允许将Higgs数据集用于有关大规模相互依存/互连的多路复用/多层网络的研究,其中一层负责社会结构,三层负责编码不同类型的用户动态。

此数据集最终更新于2015年3月31日更新。

地址:

推特
大小:(76 Bytes)

只需: RMB 49元  马上下载

附件:

012.png 011.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群