Всеволод Дёмкин vseloved@gmail.com Новые нереляционные системы хранения данных.

Презентация:



Advertisements
Похожие презентации
Павел Светличный Senior iOS Developer Svitla Systems Киев, Построение кластера на базе Apache CouchDB.
Advertisements

Докладчик – Альперин Борис NOT ONLY SQL NOSQL 1. Различные модели представления информации: иерархическая, сетевая, реляционная, объектная, … Реляционная.
NoSQL – взрыв возможностей Алексей Солнцев, iForum, 17 апреля 2012.
BigData изнутри: технологии и алгоритмы Александр Сербул руководитель направления, разработчик Партнерская конференция «1С-Битрикс»
Ключ-значение. Обзор лекции 1.Ключ-значение 2.Колоночные 3.Документо-ориентированные 4.Графовые 2.
NOSQL NoSQL (англ. not only SQL, не только SQL) Обозначает ряд подходов, проектов, направленных на реализацию моделей баз данных, имеющих существенные.
О разработке приложений для разных мобильных платформ Виктор Кузьмин Руководитель разработки компании AlterGeo О разработке приложений для разных мобильных.
Мастер класс: Хайлоадблоки - использование, NoSQL Александр Сербул Руководитель направления контроля качества интеграции и внедрений 1С-Битрикс.
Денис Лунев Google App Engine. Облака Google App Engine Microsoft Azure Amazon WS Salesforce Rackspace.
Платформа разработки высоконагруженного веб-сервиса: инструменты отладки и возможности масштабирования Александр Демидов руководитель направления арендных.
Подготовил студент группы 3881 Рамзайцев А.В. Руководитель: Федоров Д.Ю.
Компьютер в моей жизни Дмитрий Сушко. Компьютер как инструмент Как термин, компьютер - это электро́нная вычисли́тельная маши́на предназначенная для передачи,
Винников Олег. NET Developer. Почему NoSQL Особенности NoSQL решений Модели данных NoSQL Масштабирование MongoDB.
Выполнила: Абдуллаева С.И. Проверила: Митющенко Е.В.
Информационные системы и базы данных. Информационная система - это совокупность базы данных и всего комплекса аппаратно-программных средств для её хранения,
Развитие методов и средств построения статистических облаков тегов на основе онтологической информации Фомин Илья Научные руководители: к. ф.-м. н., м.н.с.
Волгоградский государственный педагогический университет Учебный компьютерный центр ВГПУ Новые технологии Интернет и совместная работа в школьной сети.
Mongodb.org NoSQL база данных. Олег Качан Независимый разработчик twitter.com/maximalno.
Хранение дидактических и методических материалов Идеи. Проблемы. Решения.
НАЗНАЧЕНИЕ СИСТЕМ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ Реляционные СУБД Реляционные БД СИСТЕМА УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ (СУБД) – это программное обеспечение, предназначенное.
Транксрипт:

Всеволод Дёмкин Новые нереляционные системы хранения данных

Зачем всё это нужно? оно в облаке обещание масштабируемости много интересных идей как ни странно, это работает :)

Ландшафт средств хранения до Web Текстовые файлы Иерархические БД навигационные Реляционные БД Сетевые БД Объектные БД BerkleyDB

(с) artlebedev.ru NOSQ L постоянные хеш-таблицы колонко- ориентированные документо- ориентированные БД для графов

Наш случай 4 млн. пользователей 20 тыс. API / час 1 API запрос ~ … сек 40 сек чтобы дать ответ пользователю БД КЕШ: волатильность списки рекомендации DB

Постоянные ХТ BerkleyDB memcached memcachedb Tokyo Cabinet + Tyrant Redis Voldemort Amazon SimpleDB

Redis списки, множества, сортированные множества, … волатильность (EXPIRE, TTL) очень быстрый (110k SET/sec, 81k GET/sec) но жрет много памяти не дружит с остальными очень быстро развивается

Документо-ориентированные БД не очень быстро простое взаимод. только MapReduce стабильная! так себе админ. хорошая док. очень быстро взаимод. сложнее MapReduce + Dynamic есть баги удобная админ. так себе док.

API для взаимодействия raw sockets JSON HTTP REST Thrift (binary protocols)

Действительно распределенные CAP-теорема Брюэра Consistency Availability Partition tolerance

Колонко-ориентированные БД Google BigTable Facebook Cassandra HBase

Cassandra BigTable-база Dynamo-архитектура супер-колонки уровни Consistency P2P-распределенный: Gossip но Thrift

Сложность фичастость plain-text memcachedTokyo Redis Berkley Couch Mongo Voldemort Cassandra HBase

За счет чего масштабируются? HT non-blocking IO (iolib) DODB Join'ы уже сделаны MapReduce СODB архитектура

Take-away самое главное (как по мне):

Плюсы + некоторые действительно масштабируются + а другие быстро работают :) + есть специфические решения для некоторых задач + есть хорошие архитектурные решения

Минусы - незрелые - хайп - не до конца понятно - библиотеки, инструменты еще недоразвиты

«Литература» nosql-if-only-it-was-that-easy/ my-thoughts-nosql/ hbase-vs-cassandra-why-we-moved/ Getting_Real_about_NoSQL_and_the_SQL_ Isnt_Scalable_Lie/