【主题词】程序语言-程序设计-数据采集
| 部分阅读
[url=]图书馆文献传递[/url]
|
【中图法分类号】TP312R
|
【内容提要】 本书共17章。第1章是概述, 阐述数据挖掘的意义与实际应用。第2-8章介绍网络和数据技术基础知识。内容涉及互联网上通信、交换、保存和显示信息的基础技术, 并讲解用于查询网络文档和数据集的基本技术 (XPath和正则表达式) 。第9-11章介绍网络抓取和文本挖掘的实用工具箱。第12-17章介绍实际案例分析, 涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖...
【参考文献格式】(德)西蒙·蒙策尔特(Simon Munzert)著. 基于R语言的自动数据收集 网络抓取和文本挖掘实用指南. 北京:机械工业出版社, 2016.03.