习惯养成记之04

昨天是习惯养成记的第三天，全程纸质书阅读，感觉非常不错。

昨日阅读的部分主要是讲解环境搭建，以及如何编译配置，都是一些实战，所以我在这里就不再多说了，真正有需要的时候参照着去构建就好了。

主要的方式有：本地模式虚拟机集群样板机 Docker集群；

今天将会重点理解Spark的核心编程模型：RDD，这个是贯穿整个Spark 2.x 最最核心的部分，必须花时间学习和理解。

其实昨天还看了祝威廉写的博文《Spark 之殇》，文中的主要观点是：Spark团队太过于专注他们所谓的架构，忽略了对用户问题的解决。为了所谓的统一（DataFrame API）导致公司精力都放在了内核的重构上，这也直接让Spark在很多方面慢了一大拍。

Spark 不是为我等欢快的工作而努力，而是为了他们的技术追求和审美的强迫症而努力。或许这是技术人员难以逾越的坑吧。

我觉得不管怎么样，Spark还是有很多非常值得学习的，每个产品，每个技术都会在发展过程中出现或多或少的一些问题，但是这个不能掩盖它本身的价值。

###总结###

文章目录