全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
6244 11
2013-07-09
整理数据时总会遇到一些坏数据,不想“垃圾进垃圾出”,就要面临着坏数据处理问题。
本书作者Q. Ethan McCallum联合19位同行给出他们工作中坏数据处理的经验。
目录:
Chapter 1 Setting the Pace: What Is Bad Data?
Chapter 2 Is It Just Me, or Does This Data Smell Funny?
Chapter 3 Data Intended for Human Consumption, Not Machine Consumption
Chapter 4 Bad Data Lurking in Plain Text
Chapter 5 (Re)Organizing the Web’s Data
Chapter 6 Detecting Liars and the Confused in Contradictory Online Reviews
Chapter 7 Will the Bad Data Please Stand Up?
Chapter 8 Blood, Sweat, and Urine
Chapter 9 When Data and Reality Don’t Match
Chapter 10 Subtle Sources of Bias and Error
Chapter 11 Don’t Let the Perfect Be the Enemy of the Good: Is Bad Data Really Bad?
Chapter 12 When Databases Attack: A Guide for When to Stick to Files
Chapter 13 Crouching Table, Hidden Network
Chapter 14 Myths of Cloud Computing
Chapter 15 The Dark Side of Data Science
Chapter 16 How to Feed and Care for Your Machine-Learning Experts
Chapter 17 Data Traceability
Chapter 18 Social Media: Erasable Ink?
Chapter 19 Data Quality Analysis Demystified: Knowing When Your Data Is Good Enough

--------------------------------------
这本书还不错,推荐给大家。
Bad Data Handbook(1st).pdf
大小:(4.43 MB)

只需: 1 个论坛币  马上下载


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-9 12:09:01
再免费送一本Paul E. Johnson的R的tips,当然他自己的网站上可以任意下载。
Rtips(Revival 2012).pdf
大小:(532.23 KB)

 马上下载


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-9 12:27:15
R书籍。
R in Action.pdf
大小:(14.93 MB)

 马上下载




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-9 21:49:35
正需要,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-10 12:03:23
虽然便宜,但还是要顶贴啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-7-14 23:14:00
不错不错,支持~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群