危机出现的另一个征兆是数据保留时间不断缩水。一开始你想保留 13 个月的数据进行年度分析。但是由于空间限制,你开始减少保留数据的月份数。到最后,你的 Hadoop 系统因为没有足够多的数据而从 BID DATA 变成 SMALL DATA 系统。数据保留导致空间缩水是因为存储的扩展性遇到问题,这与前面的运算性能问题类似。当你的容量 Prediction Model 出现问题时,需要尽快调整。
危险信号四: Data scientist 被「饿死」
任务负荷过重的 Hadoop Computer cluster 会扼杀创新,因为 Data scientist 将没有足够的运算资源来开展大型任务,也没有足够的空间来存储中间结果。性能和容量规划通常会忽略或者低估 Data scientist 的需求,之前提到对生产环境任务的估计不足,会严重限制 Data scientist 的创新性工作。
危险信号五:Data scientist 开始查看 Stack Overflow
在 Hadoop 系统部署的早期,运行和营业团队与科学家紧密协作。运行和营业团队随时为 Data scientist 提供支持,但是当 Hadoop 系统成功上线后,系统的运行维护和扩展任务就会让运行和营业的团队疲于奔命,这时候 Data scientist 遇到 Hadoop 问题就只好自己解决,例如去 Stack Overflow 查看问题帖子。
危险信号六:Data Center 越来越热
Data Center 伺服器的电力都不是按伺服器的功率配置的,但是一个 Hadoop Computer cluster 运行任务的时候经常会连续开启数小时,会烧坏不匹配的供电线路,同样的问题也存在于制冷系统中。部署 Hadoop 系统时请确保 Data Center 能顶得住长时间全速运行的 Hadoop….。