作者简介

王家林

中国著名的Spark培训专家,Apache Spark Android技术中国区布道师,DT大数据梦工厂创始人和首席专家,Android软硬件整合专家。深入研究了Spark从0.5.0到2.1.0中共28个版本的Spark源码,目前致力于开发优化的Spark中国版本。尤其擅长Spark在生产环境下各种类型和场景故障的排除和解决,痴迷于Spark在生产环境下任意类型(例如Shuffle和各种内存问题及数据倾斜问题等)的深度性能优化。

夏阳

系统架构师,从事平台和应用软件研发工作多年,行业阅历丰富,对行业技术发展有独到见解和精准判断,曾就职于中创中间间件公司、蚁坊软件公司、认子行网络技术股份有限公司。对大数据处理、机器学习、图计算、文本处理等技术领域有丰富的实战经验和浓厚兴趣。