我们在日常生活中每秒收集和分享的数据量很可能超过我们呼吸的次数;世界现在变得如此受数据驱动,以至于数据成为我们整个存在的核心部分。
周围有如此多的数据,我们很难生活和平衡一切。为此,有数据英雄可以简化数据并使我们的工作更轻松。但是,这些数据英雄是谁?数据科学家就是这样的
数据挖掘者,他们利用自己在数学、统计学和编程方面的强大技能,挖掘出大量杂乱的数据,然后对其进行清理、管理和组织。他们利用包括行业知识、背景理解和对现有假设的怀疑在内的分析能力来帮助企业挖掘复杂挑战的隐藏解决方案。
虽然听起来很酷,但成为一名数据科学家并非易事。一个人需要聪明和明确的技术技能,以及对细节的关注,才能成功地装饰大
数据分析师或数据科学家的帽子。随着企业产生千兆字节和 PB 级的数据,世界需要高度智能和高效的数据英雄来拯救企业免受复杂情况的影响。
但是没有人是完美的,错误会发生,尽管这实际上可能是一件好事。著名的爱尔兰小说家詹姆斯乔伊斯正确地引用了这句话,“错误是发现的门户。” 对于数据科学家来说,错误有助于他们变得更加敏锐并发现新的数据趋势,但这并不意味着大数据分析中的错误有时不会造成很大问题。尽管数据科学家很少犯严重的错误,但由于他们被精确聘用,该领域的一些新手可以犯错误,我们将在这里讨论。那么让我们看看数据分析师/科学家常犯的错误以及如何避免这些错误。
错误一:过度使用工具
当遇到业务问题时,一些数据科学家会直接跳入分析工具池,而不考虑问题到底是什么。有时,所有问题都需要从不同的角度观察,但在迅速解决问题的过程中,他们浪费时间在无数可用的工具上试验他们的所有专业知识和知识,而不是需要的工具。因此,避免此错误的第一步是首先定义目标,然后选择正确的工具以令人信服的方式呈现结果。
此外,避免一次学习多种工具,因为这总比什么都不掌握要好。选择一个并坚持下去,掌握然后移动到下一个。尽量不要爱上花哨的工具。记住“闪光的不是金子”,所以先进和昂贵的工具不一定会让事情变得更容易。根据业务的目标和需求选择工具,而不是根据它们的先进程度。“当 Google Analytics 等免费工具的一些高级功能可以为您提供您实际需要的答案时,无需在大型分析工具和专家团队上投入大量资金,”联合创始人 Mike Le 说。纽约数字机构 CB/I Digital 的创始人兼首席运营官。
错误2:不做探索者和展示者
数据可视化是数据科学的核心,轻视它是错误的。一些数据科学家跳过这个过程,直接进入模型构建阶段,这就是他们出错的地方。除非正确地理解数据,否则任何事情都不会顺利进行。
花一些时间探索和可视化,以正确的方式掌握数据集。之后事情会变得更容易。不要害怕发现。好奇、询问、研究、实践、学习,这将进一步明确对数据的理解。
错误三:忽视可能性
解决问题的可能性可能不止一种,坚持一个甚至可能成功机会很小的可能性也无济于事。永远记住,每个需要探索的问题都有不止一种可能性,这将有助于更好更快地做出决策。
错误四:随机解决问题
数据科学家需要始终以有组织和结构化的方式思考,以使事情落到正确的位置。没有结构化的方法来解决问题会让他们付出很多代价。通过实施结构化方法,数据科学家将以更合乎逻辑的方式分离问题。它将帮助他们计划他们的方法并为此做好准备。
有针对性的培训可以帮助构建思维定势,并使数据科学家准备好更成熟地处理问题。
错误五:害怕沟通和竞争
沟通与竞争;两者都必须参与大数据分析,否则增长是不可能的。摆脱害羞和恐惧,与他人讨论和分享发现。欢迎反馈和批评,并从中学习。作为一名数据科学家,与社区合作很重要。参与讨论和头脑风暴会议,协作并了解其他数据专家的想法和观点。贡献、竞争、获胜只是奖金,真正的回报是知识和经验。
沟通可以提升你的水平。如果无法很好地与他人沟通,发现和分析有什么用?不仅仅是客户,与团队和其他同事沟通,升级为高效的数据科学家。使用简单和通俗的语言,以便非技术人员也可以了解所讲的内容。打磨你的个性、演讲和沟通技巧。
最后一句话
新的数据科学家会犯一长串错误,上面列出的是一些常见的错误。当然,这是他们已经知道的事情,但是他们跳过或忘记了练习,后来发现自己陷入了复杂的境地,弄清楚出了什么问题。这些不是无法撤消或避免的巨大错误。如果在开始分析之前稍加注意,带有数据的日期将完美无缺,并像溪流一样顺畅流动。