Hadoop- NameNode和Secondary NameNode元数据管理机制

博客大数据
19年8月17日
编辑

牛肉丸没牛肉

元数据的存储机制

A、内存中有一份完整的元数据(内存meta data)

B、磁盘有一个“准完整”的元数据镜像（fsimage）文件(在namenode的工作目录中)

C、用于衔接内存metadata和持久化元数据镜像fsimage之间的操作日志（edits文件）

NameNode和Secondary NameNode元数据管理机制

客户端每次对文件的操作，如果涉及到元数据的更新（读除外），比如说更改文件的名称，路径，移动，复制，上传，删除等，除了查之外，其他增删改都会有可能涉及到与元数据的更改。dfs不支持客户端更改文件内容，只能在文件后面追加。

注：当客户端对hdfs中的文件进行新增或者修改操作，操作记录首先被记入edits日志文件中，当客户端操作成功后，相应的元数据会更新到内存meta.data中。当日志里面累积的操作记录越来越多，与老的fsimage相差越来越大，这时候需要由Secondary NameNode定期把edits文件和老的fsimage做一个合并上传上NameNode替换掉老的fsimage，这时候NameNode上的fsimage文件和内存上的元数据永远保持在一个小的差距里面。NameNode工作时，它的元数据查询都是找内存的，不会去找fsimage，也不会去找edits。

XML处理器输出 fsimage 的 xml 文档，包含了 fsimage 中的所有信息，比如 inodeid 等。该处理器的输出支持XML工具的自动化处理和分析，由于XML语法格式的冗余，该处理器的输出也最大。实例如下：

[root@srv02 hadoop]# hdfs oiv -i fsimage 0000000000000000000116 -p XML -o fsimage.xml
[root@srv02 hadoop]# cat fsimage.xml

edits文件是操作记录文件，也可以查看个究竟：

hdfs oev -i edits edits_0000000000000013356-0000000000000013357 -o edits.xml

{{userData.name}}已认证

Hadoop- NameNode和Secondary NameNode元数据管理机制

元数据的存储机制

NameNode和Secondary NameNode元数据管理机制

Sqooop- 使用Sqoop进行数据的导入导出

Hadoop- MapReduce分布式计算框架原理

《世界金融史泡沫、战争与股票市场》

《会计简史：从结绳记事到信息化》

《千年金融史——金融如何塑造文明，从5000年前到21世纪》

《数字货币新论》

读懂Libra

《基于Python的金融分析与风险管理》

{{userData.name}}已认证

元数据的存储机制

NameNode和Secondary NameNode元数据管理机制

推荐阅读:

Sqooop- 使用Sqoop进行数据的导入导出

Hadoop- MapReduce分布式计算框架原理

Hadoop- Namenode经常挂掉 IPC's epoch 9 is less than the last promised epoch 10

Hadoop- Hadoop环境搭建

Hadoop- 流量汇总程序之如何实现hadoop的序列化接口及代码实现

Hadoop- DistCp(分布式拷贝)

《世界金融史 泡沫、战争与股票市场》

《会计简史：从结绳记事到信息化》

《千年金融史——金融如何塑造文明，从5000年前到21世纪》

《数字货币新论》

读懂Libra

《基于Python的金融分析与风险管理》

《世界金融史泡沫、战争与股票市场》