2.5 小结

本章介绍了分布式文件系统及HDFS,并重点介绍了HDFS的结构组成、运行原理,以及数据操作、数据完整性、压缩存储、序列化等诸多优点和特性。

通过学习本章的内容,读者应能够对HDFS分布式文件系统有一定的认识,掌握HDFS的内部运行机制,为下一章的操作打下基础。

当然,HDFS也有其自身的缺陷和不足,比如不适合存储大量的小文件、不适合大量的随机读文件操作等,有兴趣的读者不妨扩展一下。

本章最后详细介绍了Hadoop的安装配置,读者要熟练掌握并实际完成Hadoop集群配置,后续学习实践也将在本章安装的环境的基础上进行。