经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
经济学论坛 三区
›
宏观经济学
维基百科每小时页面视图时间序列数据
楼主
孙潇琦
322
2
收藏
2026-03-04
CnOpenData维基百科每小时页面视图时间序列数据收录了2024年1月整月期间,全球范围内被高频访问的维基百科页面的逐小时精确浏览量数据。该数据集以结构化时间序列的形式,
记录了不同语言版本(域名)下特定页面的标题及其在一天24小时中每个整点时刻的独立访问量
。该数据集为深入分析维基百科页面浏览行为、用户兴趣变化以及特定页面的访问趋势提供了强有力的数据支持。
数据独特性
高时间分辨率与完整月度覆盖
:本数据集提供每小时级别的页面浏览数据,且完整覆盖2024年1月整个自然月。这种细粒度的时间序列使得分析者能够追踪日内关注度变化、识别流量峰值的确切时间点(如特定新闻发布后的小时级反应),并进行精确的周期(如日周期、周周期)分析。相较于仅提供日度或月度聚合数据的公开数据集,本数据在时间维度上的分辨率具有显著优势,为微观行为研究和实时趋势捕捉提供了可能。
聚焦热门页面,数据价值密度高
:数据经过严格筛选,每日文件仅收录至少被浏览10次的页面,日均数据量高达500-600万条。这意味着每条记录都代表着当月受到显著公众关注的主题、人物或事件。对于研究特定时期的社会热点、流行文化趋势、重大新闻事件的全球传播与影响,本数据集提供了经过预筛选的高价值、高信噪比的分析对象,能有效提升研究效率与分析深度。
跨语言/地域维度的标准化结构
:数据通过 domain_code 字段清晰标识了页面的所属维基百科子项目。这种标准化的结构允许研究者便捷地进行跨语言、跨文化比较研究,例如分析同一国际事件在不同语言用户群体中关注度的时空差异,或探究特定文化主题在其主要语言社区内的活跃度。
该数据以其小时级的
高时间分辨率、对热门页面的聚焦、以及标准化
的跨语言结构,为学术界和产业界提供了一个独特而强大的分析工具。无论是用于揭示公众注意力的微观动态,还是服务于网络基础设施的智能优化,亦或是支撑前沿的跨文化数字研究,该数据集都能提供坚实、精细的数据基础,赋能用户从海量网络行为中挖掘出深刻的洞察与价值。
1.字段展示
2.样本展示
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
walker12345
2026-3-5 10:19:33
thanks for sharing
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
藤椅
512661101
2026-3-5 13:00:13
谢谢分享!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
求助:急需信息数据,特别是时间序列数据。
时间序列数据
50几个样本适合做时间序列数据的分析吗?
请教关于时间序列数据的
做房价回归至少要多少个数据呀,时间序列数据
宏观时间序列数据频率选择
如何批量合并多个具有相同变量的时间序列数据,悬赏5个币
stata的单位根、平稳性、协整性、格兰杰因果检验的do文档命令
时间序列数据离散化
分解时间序列数据以检查基金之间的一致性
栏目导航
宏观经济学
经管文库(原现金交易版)
市场行情分析
人工智能
经管高考
行业分析报告
热门文章
我雇了一只"学术龙虾"当助理,不发工资 ...
CDA数据分析师必备:数据仓库体系与ETL实操 ...
CDA 认证考试大纲 2025 重磅更新:一二级考 ...
1997-2025年樊纲指数市场化细分指数跨年可比 ...
第57次中国互联网络发展状况统计报告
2026年移动应用市场展望报告
好书共赏:这才是可看的心理学(11版)-经典 ...
技术革命与金融资本 泡沫与黄金时代的动力学 ...
本人写作的几章试读
芜湖这个超级工厂,加紧建设!
推荐文章
2026 科研 AI 工具天花板!Gemini /GPT/ De ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群