我知道大数据开发一共几个流程,大概概括起来有:收集、清洗、数仓(建模)、OLAP、可视化这里边:收集一般的技术是:Kafka、Flume、高性能HTTP开发(可能)、Avro协议(可能)、Thrift协议(可能),取决于所在公司的技术栈。清洗:Spark、HiveSQL/SparkSQL、MapReduce(已经过时)存储:HDFS、Alluxio(分布式内存存储)、Redis(高速缓存)、mongoDB(文档型数据库)... 流式计算:Spark Streaming / Storm数仓建模:Hive、MongoDB、HBaseOLAP:MySQL(常用),PostgreSQL (GreenPlum) MyCAT(小众)数据可视化: echarts.js hicharts.js d3.js从上到下就是:数据要怎么存, 数据要怎么查...