Перейти до змісту

Кластер високої доступності з GlusterFS

Передумови

  • Вміння працювати з редактором командного рядка (у цьому прикладі використовується vi)
  • Високий рівень комфорту з видачею команд із командного рядка, переглядом журналів та іншими загальними обов’язками системного адміністратора
  • Усі команди виконуються від імені користувача root або sudo

Вступ

GlusterFS — це розподілена файлова система.

Це дозволяє зберігати великі обсяги даних, розподілених між кластерами серверів з дуже високою доступністю.

Він складається з серверної частини, яка встановлюється на всіх вузлах серверних кластерів.

Клієнти можуть отримати доступ до даних через клієнт glusterfs або команду mount.

GlusterFS може працювати в двох режимах:

  • реплікований режим: кожен вузол кластера має всі дані.
  • розподілений режим: без надмірності даних. Якщо сховище виходить з ладу, дані на несправному вузлі втрачаються.

Обидва режими можна використовувати разом, щоб забезпечити репліковану та розподілену файлову систему, якщо у вас є правильна кількість серверів.

Дані зберігаються всередині блоків.

Brick — це основна одиниця зберігання в GlusterFS, представлена каталогом експорту на сервері в довіреному пулі зберігання.

Тестова платформа

Наша фіктивна платформа складається з двох серверів і клієнта, всі сервери Rocky Linux.

  • Перший вузол: node1.cluster.local - 192.168.1.10
  • Другий вузол: node2.cluster.local - 192.168.1.11
  • Клієнт1: клієнт1.клієнти.локальний - 192.168.1.12

Примітка

Переконайтеся, що у вас є необхідна пропускна здатність між серверами кластера.

Кожен сервер у кластері має другий диск для зберігання даних.

Підготовка дисків

Ми створимо новий логічний том LVM, який буде змонтовано на /data/glusterfs/vol0 на обох серверах кластера:

$ sudo pvcreate /dev/sdb
$ sudo vgcreate vg_data /dev/sdb
$ sudo lvcreate -l 100%FREE -n lv_data vg_data
$ sudo mkfs.xfs /dev/vg_data/lv_data
$ sudo mkdir -p /data/glusterfs/volume1

Примітка

Якщо LVM недоступний на ваших серверах, інсталюйте його за допомогою наступної команди:

$ sudo dnf install lvm2

Тепер ми можемо додати цей логічний том до файлу /etc/fstab:

/dev/mapper/vg_data-lv_data /data/glusterfs/volume1        xfs     defaults        1 2

І змонтуйте його:

$ sudo mount -a

Оскільки дані зберігаються у підтомі, який називається цеглиною, ми можемо створити каталог у цьому новому просторі даних, призначеному для них:

$ sudo mkdir /data/glusterfs/volume1/brick0

Інсталяція

На момент написання цієї документації оригінальний репозиторій CentOS Storage SIG більше не доступний, а репозиторій RockyLinux ще не доступний.

Проте ми будемо використовувати (поки що) архівну версію.

Перш за все, необхідно додати спеціальний репозиторій до gluster (у версії 9) на обох серверах:

sudo dnf install centos-release-gluster9

Примітка

Пізніше, коли він буде готовий на стороні Rocky, ми зможемо змінити назву цього пакета.

Оскільки список сховищ і URL-адреса більше не доступні, давайте змінимо вміст /etc/yum.repos.d/CentOS-Gluster-9.repo:

[centos-gluster9]
name=CentOS-$releasever - Gluster 9
#mirrorlist=http://mirrorlist.centos.org?arch=$basearch&release=$releasever&repo=storage-gluster-9
baseurl=https://dl.rockylinux.org/vault/centos/8.5.2111/storage/x86_64/gluster-9/
gpgcheck=1
enabled=1
gpgkey=file:///etc/pki/rpm-gpg/RPM-GPG-KEY-CentOS-SIG-Storage

Тепер ми готові встановити сервер glusterfs:

$ sudo dnf install glusterfs glusterfs-libs glusterfs-server

Правила брандмауера

Для роботи сервісу необхідно дотримуватися кількох правил:

$ sudo firewall-cmd --zone=public --add-service=glusterfs --permanent
$ sudo firewall-cmd --reload

або:

$ sudo firewall-cmd --zone=public --add-port=24007-24008/tcp --permanent
$ sudo firewall-cmd --zone=public --add-port=49152/tcp --permanent
$ sudo firewall-cmd --reload

Роздільна здатність імен

Ви можете дозволити DNS виконувати розпізнавання імен серверів у вашому кластері, або ви можете звільнити сервери від цього завдання, вставивши записи для кожного з них у ваші файли /etc/hosts. Це також забезпечить роботу навіть під час збою DNS.

192.168.10.10 node1.cluster.local
192.168.10.11 node2.cluster.local

Запуск служби

Не зволікаючи, запустимо службу:

$ sudo systemctl enable glusterfsd.service glusterd.service
$ sudo systemctl start glusterfsd.service glusterd.service

Ми готові об’єднати два вузли в одному пулі.

Цю команду потрібно виконати лише один раз на одному вузлі (тут на node1):

sudo gluster peer probe node2.cluster.local
peer probe: success

Підтвердити:

node1 $ sudo gluster peer status
Number of Peers: 1

Hostname: node2.cluster.local
Uuid: c4ff108d-0682-43b2-bc0c-311a0417fae2
State: Peer in Cluster (Connected)
Other names:
192.168.10.11
node2 $ sudo gluster peer status
Number of Peers: 1

Hostname: node1.cluster.local
Uuid: 6375e3c2-4f25-42de-bbb6-ab6a859bf55f
State: Peer in Cluster (Connected)
Other names:
192.168.10.10

Тепер ми можемо створити том із 2 репліками:

$ sudo gluster volume create volume1 replica 2 node1.cluster.local:/data/glusterfs/volume1/brick0/ node2.cluster.local:/data/glusterfs/volume1/brick0/
Replica 2 volumes are prone to split-brain. Щоб уникнути цього, використовуйте Arbiter або Replica 3. Див.: https://docs.gluster.org/en/latest/Administrator-Guide/Split-brain-and-ways-to-deal-with-it/.
Do you still want to continue?
 (y/n) y
volume create: volume1: success: please start the volume to access data

Примітка

Як говорить команда return, кластер із 2 вузлами — не найкраща ідея проти розщепленого мозку у світі. Але цього буде достатньо для нашої тестової платформи.

Тепер ми можемо запустити том для доступу до даних:

$ sudo gluster volume start volume1

volume start: volume1: success

Перевірте стан гучності:

$ sudo gluster volume status
Status of volume: volume1
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick node1.cluster.local:/data/glusterfs/v
olume1/brick0                               49152     0          Y       1210
Brick node2.cluster.local:/data/glusterfs/v
olume1/brick0                               49152     0          Y       1135
Self-heal Daemon on localhost               N/A       N/A        Y       1227
Self-heal Daemon on node2.cluster.local     N/A       N/A        Y       1152

Task Status of Volume volume1
------------------------------------------------------------------------------
There are no active volume tasks
$ sudo gluster volume info

Volume Name: volume1
Type: Replicate
Volume ID: f51ca783-e815-4474-b256-3444af2c40c4
Status: Started
Snapshot Count: 0
Number of Bricks: 1 x 2 = 2
Transport-type: tcp
Bricks:
Brick1: node1.cluster.local:/data/glusterfs/volume1/brick0
Brick2: node2.cluster.local:/data/glusterfs/volume1/brick0
Options Reconfigured:
cluster.granular-entry-heal: on
storage.fips-mode-rchecksum: on
transport.address-family: inet
nfs.disable: on
performance.client-io-threads: off

Статус повинен бути «Started».

Ми вже можемо трохи обмежити доступ до тому:

$ sudo gluster volume set volume1 auth.allow 192.168.10.*

Це так просто.

Доступ клієнтів

Є кілька способів отримати доступ до наших даних від клієнта.

Переважний метод:

$ sudo dnf install glusterfs-client
$ sudo mkdir /data
$ sudo mount.glusterfs node1.cluster.local:/volume1 /data

Немає додаткових репозиторіїв для налаштування. Клієнт уже присутній у базовому репо.

Створіть файл і переконайтеся, що він присутній на всіх вузлах кластера:

На клієнті:

sudo touch /data/test

На обох серверах:

$ ll /data/glusterfs/volume1/brick0/
total 0
-rw-r--r--. 2 root root 0 Feb  3 19:21 test

Звучить добре! Але що станеться, якщо вузол 1 виходить з ладу? Саме він був вказаний при монтуванні віддаленого доступу.

Давайте зупинимо вузол один:

$ sudo shutdown -h now

Перевірте статус на node2:

$ sudo gluster peer status
Number of Peers: 1

Hostname: node1.cluster.local
Uuid: 6375e3c2-4f25-42de-bbb6-ab6a859bf55f
State: Peer in Cluster (Disconnected)
Other names:
192.168.10.10
[antoine@node2 ~]$ sudo gluster volume status
Status of volume: volume1
Gluster process                             TCP Port  RDMA Port  Online  Pid
------------------------------------------------------------------------------
Brick node2.cluster.local:/data/glusterfs/v
olume1/brick0                               49152     0          Y       1135
Self-heal Daemon on localhost               N/A       N/A        Y       1152

Task Status of Volume volume1
------------------------------------------------------------------------------
There are no active volume tasks

Node1 відсутній.

І на клієнті:

$ ll /data/test
-rw-r--r--. 1 root root 0 Feb  4 16:41 /data/test

Файл уже є.

Після підключення клієнт glusterfs отримує список вузлів, до яких він може звертатися, що пояснює прозоре перемикання, свідками якого ми щойно стали.

Висновки

Хоча поточних сховищ немає, використання архівних сховищ, які були в CentOS для GlusterFS, все одно працюватиме. Як було зазначено, GlusterFS досить легко встановити та підтримувати. Використання інструментів командного рядка є досить простим процесом. GlusterFS допоможе створити та підтримувати кластери високої доступності для зберігання та резервування даних. Ви можете знайти більше інформації про GlusterFS і використання інструменту на сторінках офіційної документації.


Востаннє оновлено: September 15, 2023

Author: Antoine Le Morvan

Contributors: Steven Spencer, Ganna Zhyrnova