一文看懂PostgreSQL数据目录结构「建议收藏」

一文看懂PostgreSQL数据目录结构「建议收藏」├── base # use to store database file
├── global # under global, all the

大家好,欢迎来到IT知识分享网。

概述

我们一般解压PG后可以看到有很多个目录,那么这些目录都代表什么意思呢?


1、根目录介绍

data
├── base # use to store database file(SELECT oid, datname FROM pg_database;)
├── global # under global, all the filenode is hard-code(select oid,relname,relfilenode from pg_class where relfilenode=0 order by oid;)
├── pg_clog # dir of transaction commit log
│ └── 0000
├── pg_commit_ts
├── pg_dynshmem
├── pg_hba.conf # client authentication config file
├── pg_ident.conf # user ident map file
├── pg_logical
│ ├── mappings
│ └── snapshots
├── pg_multixact
│ ├── members
│ │ └── 0000
│ └── offsets
│ └── 0000
├── pg_notify
│ └── 0000
├── pg_replslot
├── pg_serial
├── pg_snapshots # dir of snapshot file
├── pg_stat
├── pg_stat_tmp # dir of tmp stat file
│ ├── db_0.stat
│ ├── db_12407.stat
│ ├── db_16384.stat
│ └── global.stat
├── pg_subtrans
│ └── 0000
├── pg_tblspc
├── pg_twophase
├── PG_VERSION # version file
├── pg_xlog # dir of xlog file
│ ├── 000000010000000000000001
│ └── archive_status # status info of xlog archive
├── postgresql.auto.conf
├── postgresql.conf # config file of postmaster progress
├── postmaster.opts
└── postmaster.pid # pid file of postmaster progress

IT知识分享网

可以看到有这么多的根目录,下面对每个目录做一下简单介绍。

一文看懂PostgreSQL数据目录结构「建议收藏」


2、global目录介绍

global名如其意,存放的文件用于存储全局的系统表信息和全局控制信息。

global下有四种文件:

  1. pg_control
  2. 用于存储全局控制信息
  3. pg_filenode.map
  4. 用于将当前目录下系统表的OID与具体文件名进行硬编码映射(每个用户创建的数据库目录下也有同名文件)。
  5. pg_internal.init
  6. 用于缓存系统表,加快系统表读取速度(每个用户创建的数据库目录下也有同名文件)。
  7. 全局系统表文件
  8. 数字命名的文件,用于存储系统表的内容。它们在pg_class里的relfilenode都为0,是靠pg_filenode.map将OID与文件硬编码映射。(注:不是所有的系统表的relfilenode都为0)

结构如下:

IT知识分享网data
├── global # under global, all the filenode is hard-code(select oid,relname,relfilenode from pg_class where relfilenode=0 order by oid;)
│ ├── 1136 # pg_pltemplate
│ ├── 1137 # pg_pltemplate_name_index
│ ├── 1213 # pg_tablespace
│ ├── 1214 # pg_shdepend
│ ├── 1232 # pg_shdepend_depender_index
│ ├── 1233 # pg_shdepend_reference_index
│ ├── 1260 # pg_authid
│ ├── 1261 # pg_auth_members
│ ├── 1262 # pg_database
│ ├── 2396 # pg_shdescription
│ ├── 2397 # pg_shdescription_o_c_index
│ ├── 2671 # pg_database_datname_index
│ ├── 2672 # pg_database_oid_index
│ ├── 2676 # pg_authid_rolname_index
│ ├── 2677 # pg_authid_oid_index
│ ├── 2694 # pg_auth_members_role_member_index
│ ├── 2695 # pg_auth_members_member_role_index
│ ├── 2697 # pg_tablespace_oid_index
│ ├── 2698 # pg_tablespace_spcname_index
│ ├── 2846 # pg_toast_2396
│ ├── 2847 # pg_toast_2396_index
│ ├── 2964 # pg_db_role_setting
│ ├── 2965 # pg_db_role_setting_databaseid_rol_index
│ ├── 2966 # pg_toast_2964
│ ├── 2967 # pg_toast_2964_index
│ ├── 3592 # pg_shseclabel
│ ├── 3593 # pg_shseclabel_object_index
│ ├── 4060 # pg_toast_3592x
│ ├── 4061 # pg_toast_3592_index
│ ├── 6000 # pg_replication_origin
│ ├── 6001 # pg_replication_origin_roiident_index
│ ├── 6002 # pg_replication_origin_roname_index
│ ├── pg_control # global control file, use pgcheck -pc to see it.
│ ├── pg_filenode.map # system table (oid -> filenode) mapping file, use pgcheck -pm to see it.
│ └── pg_internal.init # system table cache file, use pgcheck -pr to see it.
一文看懂PostgreSQL数据目录结构「建议收藏」


3、base目录介绍

base目录用于存放数据库的所有实体文件。例如,我们创建的第一个库testdb的OID为16384,那么在data/base下就会产生一个名为16384的目录,用于存储testdb的数据文件。

postgres=# select oid,datname from pg_database;
--base目录结构
data
├── base # use to store database file(SELECT oid, datname FROM pg_database;)
│ ├── 1 # template1 database
│ ├── 13857 # template0 database
│ ├── 13858 # postgres database
│ └── 16384 # hwbdb, first user database
│ │ ├── 3600
│ │ ├── 3600_fsm
│ │ ├── 3600_vm
│ │ ├── 16385
│ │ ├── pg_filenode.map
│ │ ├── pg_internal.init
│ │ └── PG_VERSION
一文看懂PostgreSQL数据目录结构「建议收藏」

  1. pg_filenode.map 是pg_class里relfilenode为0的系统表,OID与文件的硬编码映射。
  2. pg_internal.init 是系统表的cache文件,用于加快读取。默认不存在,查询系统表后自动产生。
  3. PG_VERSION 是当前数据库数据格式对应的版本号
  4. 其它文件是需要到pg_class里根据OID查到对应的relfilenode来与文件名匹配的。
  5. 例如:tab1的relfilenode是16385,那么16385这个文件就是tab1的数据文件
IT知识分享网 testdb=# select oid,relfilenode,relname from pg_class where relname='tab1';
 oid | relfilenode | relname
 -------+-------------+---------
 16385 | 16385 | tab1
 (1 row)
  1. 空闲空间映射表
  2. 名字以_fsm结尾的文件是数据文件对应的FSM(free space map)文件,用map方式来标识哪些block是空闲的。用一个Byte而不是bit来标识一个block。对于一个有N个字节的block,它在_fsm文件中第blknum个字节中记录的值是(31+N)/32。通过这种方式标识一个block空闲字节数。FSM中不是简单的数组,而是一个三层的树形结构。FSM文件是在需要用到它时才自动产生的。
  3. 可见性映射表文件
  4. 名字以_vm结尾的文件是数据文件对应的VM(visibility map)。PostgreSQL中在做多版本并发控制时是通过在元组头上标识“已无效”来实现删除或更新的,最后通过VACUUM功能来清理无效数据回收空闲空间。在做VACUUM时就使用VM开快速查找包含无效元组的block。VM仅是个简单的bitmap,一个bit对应一个block。

注:系统表分为全局系统表和库级系统表。

  • 全局系统表位于global下,例如:pg_database,pg_tablespace,pg_auth_members这种存储系统级对象的表。
  • 库级系统表位于数据库目录下,例如:pg_type,pg_proc,pg_attribute这种存储库级对象的表。

4、表空间目录介绍

postgres=# select oid,* from pg_tablespace;
一文看懂PostgreSQL数据目录结构「建议收藏」

每一个Oid都在data/pg_tblspc下对应一个名为Oid的软链接文件,指向真正的space目录。

 $ tree ../data/pg_tblspc/
一文看懂PostgreSQL数据目录结构「建议收藏」

在space目录是如何组织的呢?

postgres=# create table t2(a int) tablespace tbs_hwb;
CREATE TABLE
postgres=# select oid,relname,relfilenode from pg_class where relname='t2';
 oid | relname | relfilenode 
-------+---------+-------------
 16444 | t2 | 16444
(1 row)
postgres=# \q
[pg@PG bin]$ tree ../../data/pg_tblspc/16437/
../../data/pg_tblspc/16437/
└── PG_10_201707211
 └── 13858
 ├── 16439
 └── 16444
2 directories, 2 files
一文看懂PostgreSQL数据目录结构「建议收藏」


后面会分享更多devops和DBA方面的内容,感兴趣的朋友可以关注一下~

如果你觉得这篇文章对你有帮助,请小小打赏一下~

一文看懂PostgreSQL数据目录结构「建议收藏」

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://yundeesoft.com/6569.html

(0)
上一篇 2022-12-15 11:00
下一篇 2022-12-15 13:00

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信