Распределенный анализ данных ATLAS с использованием программы pathena(PANDA)

Презентация:



Advertisements
Похожие презентации
22 декабря 2006 г. 1Рабочее совещание ATLAS Проведение анализа данных ATLAS с применением программы GANGA Шиякова Мария Маринова НЭОВП - ATLAS.
Advertisements

Архитектура LCG Ткачев Игорь ОИЯИ, Дубна, Россия 16 мая 2006 г.
О ПРЕДЕЛЕНИЕ. Операционная система, сокр. ОС (англ. operating system, OS ) комплекс управляющих и обрабатывающих программ, которые, с одной стороны, выступают.
Сравнительный анализ отправки сообщений через http и socket протоколы Подготовил:Хаванских В.В. МОУ СОШ 38, 10 В г. Воронеж Руководитель:Куракова Е.В.
Схема проекта Декомпозирован на 4 уровня Может быть распределен между двумя связанными сетью машинами Пытаемся реализовать транзакционную модель операций.
GridCom, Grid Commander – графическая оболочка для работы с задачами и данными в Гриде Галактионов В.В. ОИЯИ, Дубна.
AJAX Asynchronous Javascript and XML. Для чего нужен AJAX Недостаточная функциональность HTTP и HTML Не интерактивен Нет частичных обновлений Альтернативы.
Анализ и моделирование течений жидкостей и газов c использованием комплекса ANSYS CFX Типы файлов ANSYS CFX.
Кафедра математики, логики и интеллектуальных систем ИЛ РГГУ 1 Система управления базой понятий ЭЗОП Е. М. Бениаминов © Институт лингвистики.
Это файл-шаблон для создания презентации в виде игры «Счастливый случай». Перед запуском презентации Вам следует сохранить этот файл на своем компьютере.
Файловые архивы Internet Файловые архивы Internet Протокол FTP Протокол FTP Режимы обмена данными Режимы обмена данными Программное обеспечение доступа.
GLite - EGEE middleware 22/12/2004, PNPI, Gatchina А. Кирьянов ОИТА ПИЯФ.
П. Боровая, 2, эт. 4, к. 402 Минская обл., Минский р-н Беларусь Возможности использования продуктов SAP при построении систем аналитики.
Структура компьютерных сетей. Компьютерная сеть Компьютерная сеть – соединение компьютеров для обмена информацией и совместного использования ресурсов.
ПРОГРАМНОЕ УПРАВЛЕНИЕ КОМПЬЮТЕРОМ. КОМПЬЮТЕР (computer)- автоматическое устройство или система, способная выполнять заданную, четко определенную последовательность.
WEB- ТЕХНОЛОГИИ Лекция 1. WEB- ПРИЛОЖЕНИЯ 1 Особый тип программ, построенных по архитектуре « клиент - сервер » Основа получение запросов от пользователя.
Раздел 3 Сетевые модели. Тема 3.1 Понятие сетевой модели. Архитектура сети определяет основные элементы сети, характеризует ее общую логическую организацию,
Microsoft Solutions Framework Технологии программирования. Курс на базе Microsoft Solutions Framework Семинар 2. Знакомство с построением диаграмм вариантов.
Локальная сеть Типы локальных сетей Топология сетей.
Удаленный доступ к МетаКластеру Менеджер Доступа Лабутин Дмитрий Юрьевич ННГУ 2002.
Транксрипт:

Распределенный анализ данных ATLAS с использованием программы pathena(PANDA)

Вступление Система PANDA предназначена для получения данных и проведения их распределенного анализа в эксперименте ATLAS Обладает высокой надежностью при работе с большими потоками данных,маштабируемостью гибкостью к использованию различного оборудования, минимальной необходимой для поддержки рабочей силой. К маю 2008 года обработано около 12 миллиардов заданий (job), с частотой около 50 тысяч в день.

Построение системы

Основные компоненты Job Interface – организует ввод заданий в систему Executor Interface – передающий уровень между ATLAS prodsys/prodDB Task Buffer – сохраняет текущее состояние каждого выполняющегося задания. Brokerage – организует взаимодействие с необходимыми входными данными. Dispatcher – посылает основное задание на выполнение, если все необходимые условия выполнены. Data Service – интерфейс к DQ2 Data Management System Job Scheduler – посылает управляющие задания на удаленные сайты. Logging and Monitoring System – системы помогающая осуществлять контроль над выполнением задач и загрузкой сайтов.

Job Flow

Pathena Работа с задачами осуществляется через python клиент интерфейс (запросы посылаются с помощью http POST) Pathena – интерфейс для распределенного анализа данных, использующий ATHENA software framework. Pathena использует python интерфейс для передачи задач ATHENe Работа осуществляется посредством двух шагов 1) Build Step: сборка кода, его сохранение и оправка его на вычисление 2)Run Step: запуск N Athena задач с определенными пользователями входными и выходными данными (dataset) Получение результатов происходит посредством dq2_get

Использование PANDA

В результате получим вывод, подобный данному. extracting run configuration PYTHIA : PYTHIA_INIT : submit =================== JobID : 178 Status : 0 > build PandaID= > run PandaID=

Bookkeeping >>pathena_util >>> show() See status of JobID=3. >>> status(3) Select records matching a given criteria. >>> select('outDS=user08.NameSurname.*') >>>kill(3) >>> help() >>pathena --help --outDS --inDS --split --site

Состояние выполнение задачи Для просмотра используется BNL monitor Типы состояния выполнения задачи: Defined – задача попадает в PandaDB Assigned – dispatchDBblock соединяется с сайтом Waiting – входные файлы еще не подготовлены Activated – ждет команды от управляющей задачи Sent – задача отправляется на выполнение Running – задача в процессе выполнения Holding - выходные файлы добавлются в DQ2 базу данных Transferring – выходные данные передаются из T2 в T1 Finished – задача успешно завершена Failed – задача не была выполнена Нормальная последовательность выполнения : defined -> assigned -> activated -> sent -> running -> holding -> transferring -> finished/failed