参考文献

[1] BORTHAKUR D.File System/Storage Management[EB/OL].[2019-10-19].http://hadoop.apache.org/ common/docs/r0.20.1/hdfs_design.pdf.

[2] 尧炜,马又良.浅析Hadoop 1.0与2.0设计原理[J].邮电设计技术,2014(7):37-42.

[3] 李港,刘玉程.Hadoop的两大核心技术HDFS和MapReduce[J].电子技术与软件工程,2018(7):180.

[4] JEFFREY D,SANJAY G,USENIX Association.MapReduce:Simplified Data Processing on Large Clusters[C].//Proceedings of the Sixth Symposium on Operating Systems Design and Implementation (OSDI’04).2004:137-149.

[5] 刘刚.Hadoop应用开发技术详解(大数据技术丛书)[M].北京:机械工业出版社,2014.

[6] 范东来.Hadoop海量数据处理[M].北京:人民邮电出版社,2015.

[7] 王鹏,李俊杰,谢志明,等.云计算和大数据技术:概念、应用与实战[M].北京:人民邮电出版社,2016.

[8] JUNQUEIRA F,REED B.ZooKeeper[M].北京:机械工业出版社,2016.

[9] 蒲志明.云平台中日志管理模块的研究与实现[D].电子科技大学,2017.

[10] 哈里.Flume:构建高可用、可扩展的海量日志采集系统[M].马延辉,等译.北京:电子工业出版社,2015.

[11] The Apache Software Foundation.Welcome to Apache Flume[EB/OL].[2020-12-1].http://flume.apache.org/.

[12] 王成光.分布式实时计算框架原理及实践案例[M].北京:电子工业出版社,2016.

[13] 耿嘉安.深入理解Spark:核心思想与源码分析[EB/OL].[2020-11-20].https://yq.aliyun.com/articles/ 107748.

[14] 丁维龙,赵卓峰,韩燕波.Storm:大数据流式计算及应用实践[M].北京:电子工业出版社,2015.

[15] 曹世宏.Storm技术原理[EB/OL].[2020-12-1].https://blog.csdn.net/qq_38265137/article/details/80547695.

[16] 快速入门Apache Flink[EB/OL].[2019-06-26].https://zhuanlan.zhihu.com/p/70866059.

[17] 大数据技术之路.Flink基本介绍及框架原理[EB/OL].[2019-08-05].https://zhuanlan.zhihu.com/ p/76761474.

[18] 周维.Hadoop 2.0-YARN核心技术实践[M].北京:清华大学出版社,2015.

[19] 冈纳拉森.Hadoop MapReduce v2参考手册[M].南京:东南大学出版社,2016.

[20] 加里.Hadoop基础教程[M].张治起,译.北京:人民邮电出版社,2014.