Метрокластер

Метрокластер (или растянутый кластер) — это технология, которая объединяет системы хранения данных из двух ЦОДов в пределах города в единый кластер с синхронной репликацией данных и автоматическим переключением при сбоях. Такая архитектура позволяет обеспечить высокую отказоустойчивость и минимизировать время простоя критически важных систем.
Архитектура
Основой метрокластера является синхронная репликация: каждая операция записи выполняется одновременно на обеих площадках. Для предотвращения split-brain ситуации используется арбитр — третий компонент на отдельной площадке, который отслеживает доступность каждого ЦОДа и принимает решение о корректном переключении при сбое.
Требования
Для стабильной работы метрокластера необходимы низкая задержка передачи данных (до 5 мс), высокоскоростные оптоволоконные каналы и расстояние между ЦОДами до 40 км. Инфраструктура должна поддерживать постоянную синхронизацию и быстрый отклик системы на сбои.
Преимущества
Метрокластер обеспечивает минимальное время восстановления (RTO — секунды или минуты), автоматическое переключение при отказах и высокую доступность систем (до 99,99%). Это позволяет поддерживать непрерывность бизнес-процессов и защищать критически важные данные.
Недостатки
Реализация метрокластера связана с высокой стоимостью оборудования и обслуживания. Настройка и управление требуют квалифицированного персонала, а сама инфраструктура предъявляет строгие требования к сетевым каналам и оборудованию.
Применение
Метрокластеры применяются в финансовых организациях, здравоохранении и других сферах, где простой систем недопустим. Они обеспечивают катастрофоустойчивость и непрерывность бизнеса.
Сравнение с обычной репликацией
Метрокластер обеспечивает автоматическое переключение между площадками при сбоях, благодаря синхронной репликации и арбитру. Обычная репликация лишь копирует данные на вторую площадку, но при сбое требует ручного вмешательства для восстановления работы, что увеличивает время простоя и уязвимость критически важных систем.
Параметр | Метрокластер | Репликация |
Переключение при сбое | Автоматическое | Ручное |
Время простоя | Минимальное (секунды–минуты) | Зависит от вмешательства, может быть долгим |
Риск потери данных | Низкий | Выше, возможна потеря данных при сбое |
Тип репликации | Синхронная | Обычно асинхронная или синхронная без автоматического failover |
Применение | Критически важные системы, финансы, здравоохранение | Менее критичные системы, архивы, резервное копирование |