Распределенные файловые системы: обзор Докладчик: Тюлькин Антон, кафедра СП ВМиК МГУ Доклад.

Презентация:



Advertisements
Похожие презентации
Лекция 14 Файловые системы SAN, GFS, DFS. SCSI Small Computer System Interface - интерфейс, разработанный для объединения на одной шине различных по своему.
Advertisements

Файл (англ. file) блок информации на запоминающем устройстве компьютера, имеющий определённое логическое представление, соответствующие ему операции чтения-записи.
1 Современные системы программирования. Часть 2. Системное и прикладное программное обеспечение Малышенко Владислав Викторович.
GLite - EGEE middleware 22/12/2004, PNPI, Gatchina А. Кирьянов ОИТА ПИЯФ.
ИСПОЛЬЗОВАНИЕ NTFS REPARSE POINTS НА ПРИМЕРЕ WINDOWS HSM Кирилл Колотыгин. IBA.
Обзор операционных систем ВОУНБ им. М. Горького «Операционная система - это совокупность программ, обеспечивающих управление процессом обработки информации.
Тема 3 Рассматриваемые вопросы 1. Классификация сетей 2. Назначение сетей 3. Компоненты вычислительных сетей 4. Топологии сетей 5. Архитектура сетей.
Лекция 22 Лекция 22 Локальные, сетевые и распределенные базы данных. Архитектура «файл- сервер». Двух и трехуровневая архитектура «клиент-сервер». Модель.
Демидов А.В г. Операционные системы Лекция 4 Работа с файлами.
Архитектура ресурсной системы распределенных виртуальных сред Курсовая работа на тему: «Архитектура ресурсной системы распределенных виртуальных сред»
Технические возможности. Наши цели Максимальная гибкость Максимальная скорость считывания и обработки данных Стабильность работы Максимальная простота.
Организация распределенных прикладных систем. Попытаемся ответить на вопросы Как устроены распределенные прикладные системы? Каковы наиболее важные их.
Учебный курс Технологии и средства разработки корпоративных систем Лекция 1 Открытые системы. Клиент и сервер Лекции читает кандидат технических наук,
Физическая защита данных на дисках. Для обеспечения большей скорости чтения/записи и надёжности хранения записи на дисках используются RAID-массивы (Redundant.
Администрирование информационных систем Лекция 4. Система управления базами данных.
Локальная сеть Типы локальных сетей Топология сетей.
Windows Server 2008 R2 – новые сценарии и возможности для бизнеса.
Топология ЛВС. Топология – это конфигурация локальной сети, которая описывает схему физического соединения компьютеров, тип оборудования, методы управления.
1. Теоретические основы операционных систем (планирование заданий и использования процессора, обеспечение программ средствами коммуникации и синхронизации,
Лекция 23 Лекция 23 Схемы распределения данных и запросов. Обработка распределенных данных и запросов. Многопотоковые и многосерверные архитектуры. Типы.
Транксрипт:

Распределенные файловые системы: обзор Докладчик: Тюлькин Антон, кафедра СП ВМиК МГУ Доклад

Предпосылки развития Необходимость работать с удаленными данными Совместная работа с данными

Andrew FS Server (Vice) Server (Vice) Server (Vice) Client (Venus) Client (Venus) Client (Venus) Client (Venus) Volume Location Database на каждом сервере Все клиенты видят единое глобальное пространство имен

Кэширование на клиенте Файл целиком кэшируется на клиенте в момент открытия Нет обменов с сервером до закрытия файла Другие клиенты увидят изменения только тогда, когда файл будет закрыт

CIFS, NFS SMB, NFS – не распределенная файловая система, а протокол удаленного доступа к файловой системе Не рассматривают важные аспекты РФС Общего назначения

Дальнейшая эволюция Рост объема хранимых данных Необходимость выполнять операции над большими объемами данных Доступ к данным не смотря на географическую удаленность

Создание новых систем HPC (high performance computing) DISC (data-intensive scalable computing) SRB (storage resource broker) Отдельный интерес к системам построенным на базе стандартных машин –отказоустойчивость

Что ожидает пользователь Единое глобальное пространство имен Стабильность (надежность хранения/доступность данных) Производительность Корректность операций (выполнение гарантий)

Внутренние механизмы Способы хранения данных и метаданных Методы дублирования данных/ресурсов Кэширование данных, распараллеливание операций Методы работы с разделяемыми ресурсами

DISC Основные характеристики –Хранение огромных объемов данных –Выполнение длительных заданий (batch jobs) Часто используется MapReduce парадигма Использование дешевого оборудования Примеры –Google File System –Hadoop –Amazon S3

Ослабление семантики Использование определяет архитектуру и гарантии Пример: GFS операции записи в конец (append) может породить дубликаты записей, паддинг регионы.

Архитектура GFS Single Master Chunk Server Chunk Server Chunk Server Chunk Server Client Информация о файле Обмен данными Реплика 1 Реплика 2 Реплика 3

Отсутствие кэширования в GFS Ни клиент, ни чанк-сервер не осуществляют кэширование данных –Упрощает реализацию –Не проблема при потоковой обработке данных

HPC Эффективные вычисления и обработка данных для научных приложений Особенности –Параллельная обработка данных –Более дорогое оборудование (и соответственно более надежное) –Часто используется MPI Примеры –GPFS (IBM) –PVFS –Lustre (SUN)

GPFS Shared Disk Shared Disk Shared Disk File System Node File System Node File System Node Switching Fabric Блочный интерфейс доступа part1part2part3 файл

GPFS Один распределенный менеджер блокировок –атомарность операций чтения/записи –консистентность кэшей –исключение: atime Альтернативный режим – узел отвечает за блок, все запросы идут на соответствующий узел Используется упреждающая загрузка данных, с учетом структуры доступа (например, последовательная); можно дать подсказки

PVFS I/O сервера узлы используют локальную ФС для хранения частей файлов Нет никаких блокировок, но каждая субоперация должна быть атомарной по отношению к файловой системе Несколько серверов метаданных

GPFS Locking vs PVFS non-locking Преимущества не-блокировок –Проще реализовать –Меньше задержек (меньше обменов сообщениями) –Нет состояния (проще восстанавливать после сбоев) Недостатки –Не POSIX семантика –Нужно делать сборку мусора

Lustre POSIX семантика (c минимальными исключениями) В ранних версиях: один сервер метаданных (+ один запасной) Полагаются на надежные диски (RAID), в будущих версиях планируются разбиение данных с использованием механизмов избыточности Распределенные «целевые» блокировки –можно ли кэшировать операции с метаданными

CEPH РФС общего назначения Несколько серверов метаданных, учитывается популярность метаданных для динамической репликации Данные реплицируются на несколько OSD (object storage device) Поддерживает POSIX, но расширяет интерфейс

POSIX vs HPC POSIX разрабатывался для одномашинных систем, с единым пространством виртуальной памяти и простым периферийным устройством хранения данных Исследования экспертов HPC показали, что использование POSIX не позволяет эффективно использовать имеющиеся ресурсы

HPC нагрузки Одновременный доступ к одному файлу несколькими клиентами Непоследовательный доступ к файлу Активное использование операций с метаданными (например параллельное создание файлов в директории)

Пример расширения POSIX Readdirplus (nfs3) Openg, Openfh Statlite Writex, Readx

SRB Используется в большой, разнородной среде, используемой различными комьюнити Стандартные задачи –Найти данные –Получить данные –Как можно больше упростить жизнь клиента Особенности GRID –Разные форматы данных, разные хранилища данных –Разные сетевые топологии, технологии, методы доступа

SRB MCAT (metadata catalog) – URL – SQL –пути к файлам –и т.д. Драйверы для разных хранилищ данных Новые задачи: –Виртуализация доступа –Доступ к физически удаленным ресурсам –Работа через файерволы и т.п.

Тенденции в РФС Использование более интеллектуальных единиц хранения (например, OSD) Разделение данных и метаданных Упрощение механизмов обновления, создания файловой системы

Cloud computing Сервисы хранения (Amazon S3) Создание private cloud WAN РФС: XtreemFS, WheelFS

Wheel FS Основные принципы – Децентрализация – У каждого приложения свои потребности Способ – Управлять семантикой доступа к файлу /wfs/rtm/.anyversion/data /wfs/rtm/.latestversion/data – Давать подсказки системе WriteOnce – Локальные операции записи, чтение наподобие BitTorrent

Новая РФС от Google Существующие недостатки – Специальное поведение Например, записи в конец файла могут появляться в разном порядке, что неожиданно для программистов – Нет оптимизаций для real-time приложений – Один мастер Проблема с большим количеством файлов Неприемлемый простой в результате сбоя – Большой размер чанка Не эффективно работать с маленькими файлами

Много других задач Создание снапшотов Права доступа Оптимизация операций (например, collective IO) Синхронизация реплик

Конец Спасибо за внимание