2.1.4 Hadoop特性

Hadoop具有海量数据的存储和海量数据的处理分析能力,其主要特性如下。

(1)高可靠性:在处理数据时,Hadoop往往会将多份数据备份分发至不同的机器进行保存,这样就避免了在处理数据时,机器宕机导致数据丢失的麻烦,保证了数据的安全性、可靠性。

(2)高扩展性:在处理数据时,如果当前集群的资源(如存储能力和运算能力)不足以完成数据处理和分析任务,则可通过快速扩充集群规模进行扩容和加强集群的运算能力。

(3)高效性:相比传统的单台机器处理数据,Hadoop效率是极高的。

(4)高容错性:Hadoop能自动保存数据的多个副本,当某个节点宕机时,它可以自动地将副本复制给其他机器,保证数据的完整性,并且可以将失败的任务重新分发。

(5)低成本:Hadoop集群可以将程序运行在廉价的机器上并发地进行处理,其成本低、效率高,是处理海量数据的最佳选择。