现在国际上普遍认为的数据科学第一社区Kaggle,成立于2010年,2017年3月被Google收购,记得之前看过一个对他们首席科学家的采访,其中介绍到这个平台成立的初衷是“用世界上最聪明的人解决世界上最棘手的问题,让任何组织和个人都可以受益于数据科学的进步”(大概是这个意思)。Kaggle创始于澳大利亚,而不是美帝实际上到从Kaggle成立到被Google收购的这7年,就可以看作是数据科学从萌发到走向成熟的过程,也让我们可以看到在国际范围内的头部人才和企业中(美帝还是很厉害的),数据科学平台+竞赛众包模式已经不止是炙手可热的趋势,而是一个能够形成确切价值闭环的商业模式,并在可见的未来极大拉低数据创新成本,赋能众多行业。那中国呢,普遍认为的第一社区是Heywhale和鲸,也就是原来的Kesci科赛,是2015年成立的,起步便已经比Kaggle晚了整整5年,加上Kaggle是面向全球用户,而Heywhale只是面对中国用户,有一个发展势能的区别,目前二者在用户规模、专业内容、数据资源、商业项目上仍有不小差距。不过可喜的是,Heywhale是在一票优秀人才忙于滴滴快的合并、58赶集合并、美团大众点评合并、携程去哪儿合并、世纪佳缘百合网合并……的2015年成立,中国在这一块的反应不算太慢。Heywhale是中国最大的数据科学社区及创新平台为什么要通过数据科学社区的对比来国际和国内的发展水平呢,一是因为只有一个垂直领域能够形成一个足够成熟的群落,这个领域才算是有了规模化发展的可能;二是一旦群落聚集成社区,就能够进入商业价值裂变的快速通道。尤其是数据科学,这是一个协同创新、开放式创新、跨领域创新频繁发生的领域,只有形成了成熟的社区,产业及之下的企业才都有规模化的用户进行创新的可能。