您如何识别实际的数据科学家?
真正的医生与假医生的区别是什么?没有医学学位的人可以免费治愈自己,家人和朋友,并且比官方医疗服务更好,并且不称自己为医生,那该怎么办?
同样,尽管我拥有丰富的统计背景(请参阅我的数据科学历程)— Phd,Cambridge PostDoc,众多顶级期刊,专利拥有者,前风险投资资助的数据科学主管和投资者,以及在企业界拥有20年数据科学经验在所有级别和所有行业中,我可以说我不同意可能的数据科学家发布的大多数答案。
您可以在没有统计的情况下进行数据科学,请阅读以下内容:没有统计的数据科学是可能的,甚至是可取的
如果您花费80%的时间来清理数据,则您不是数据科学家。数据科学与自动化这些无聊的任务有关。并自动化更多高级任务!您在书中学到的所有内容最终都将外包给机器人或自动化,无论是逻辑回归还是SVM。
如果您在40岁时连续五年从事数据科学工作的年收入至少未达到15万美元,那么也许您的“数据科学”活动并没有产生您认为他们能做的巨大价值。
如果您在某种程度上不相信自己的直觉或直觉,或者您知道自己的直觉是不可靠的(承认这一点真是太好了),或者您错过了数据科学的很大一部分。数据科学是一门科学,也是一门艺术。今天,许多自称数据科学家的人既不是科学家,也不是艺术家。
如果您的投资组合中没有成功案例,则可以证明自己(由CEO和建议作为后盾),帮助您从数据中节省或产生了100万美元的收入(包括查找正确的数据,向利益相关者提出正确的问题)首先要弄清楚问题,并在生产模式下部署POC),那么您不是数据科学家。没有初级数据科学家这样的人。
考虑一下:您是否准备好在股票市场上交易,冒着自己的钱冒险,并使用“数据科学”策略击败其他所有人?您将与非常复杂的数据科学家竞争。我做到了这一点,包括在房地产市场,包括每个人都受到挤压时,我都没有使用统计模型,线性或逻辑回归以任何方式取得成功。
可视化效果很棒。在30秒内交流的任何事物,就像别人在几个月内交流的事物一样,就像魔术。
在房地产行业中有这样的座右铭:位置,位置,位置。我在数据科学中的座右铭是:简单,简单,简单。或者:自动化,自动化,自动化。
如果您正在寻找理想的模型,就像有些人在不久前寻找哲学家的石头一样,那您就是在浪费时间(或试图在短期内保护您的工作),并在浪费首席执行官的钱。知道80/20规则:一周内设计一个简单的解决方案,就可以实现95%(我最多可以说110%),而在同一个项目上花费2年后,则可以达到。一直这样做,令人难以置信的是,遵循这条规则您可以完成多少工作,以及获得的回报-特别是在我的情况下,您没有老板,而您的所有收入/增加值取决于您的工作效率生成它。
没有丰富的经验和培训,就无法成功设计自动化数据科学。部署自动化数据科学就像冬天在没有氧气的情况下独自攀登珠穆朗玛峰一样(已经完成了!)如今,有人称呼数据科学为在没有任何登山经验的情况下攀登珠穆朗玛峰,并得到了100名夏尔巴人和向导的帮助。即使您正在睡觉。在数据科学方面,这要付出代价:负ROI,无法检测到假新闻等等。
1