Одним из наиболее важных параметров облачной инфраструктуры является ее доступность. Эта характеристика зависит от времени восстановления отказавшего компонента кластера. В работе предлагается алгоритм размещения данных для кодов, которые применяются в распределенных облачных системах хранения. Применение данного алгоритма позволяет уменьшить время восстановления одного узла или диска в среднем на 70%-80% для LRC кодов и на 160% для регенерирующих кодов. Также предлагается новый способ масштабирования регенерирующих кодов, который позволяет применять эти коды в динамических кластерах. Приводится сравнение вышеописанных кодов и классического RAID-6 по скорости восстановления и избыточности.
Доклад адресован широкой IT-аудитории, в частности, специалистам по хранению данных и облачным вычислениям, сотрудникам IT-служб, инженерам по разработке и тестированию ПО. Информация, изложенная в докладе, имеет широкую практическую применимость, представляя рекомендации по увеличению доступности данных и производительности восстановления.
Рекомендовано для слушателей со средним уровнем подготовки.
Евгений Анастасиев
Разработчик исследовательской лаборатории, OOO “Рэйдикс”
Linux kernel разработчик. Области интересов – алгоритмы кэширования и префетча, помехоустойчивое кодирование, теория надежности. На данный момент занимается исследованием и математическим моделированием алгоритмов дедупликации в распределенных кластерах.
Comment