WWW.DISUS.RU

БЕСПЛАТНАЯ НАУЧНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА

 

Pages:     || 2 |
-- [ Страница 1 ] --

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
имени М.В.ЛОМОНОСОВА

НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ ЯДЕРНОЙ ФИЗИКИ
имени Д.В.СКОБЕЛЬЦЫНА

УДК 004.75

№ госрегистрации 0120.0 801882-

Инв.№ 105837/08

УТВЕРЖДАЮ

Директор НИИЯФ МГУ


______________ М.И.Панасюк
«___»_________ 2008 г.

ОТЧЕТ
О НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЕ

ГОСКОНТРАКТ ОТ 31.07.2007 №02.514.11.4072

ШИФР 2007-4-1.4-00-08-018

Исследование и разработка технологического задела по запуску в грид-инфраструктуру заданий, подготовленных для различных сред исполнения

4 этап

(заключительный)

по теме:

Экспериментальные исследования поставленных перед НИР задач. Обобщение и оценка результатов исследований

Руководитель работ ________
подпись, дата

В.А.Ильин

Москва 2008 г.

СПИСОК ИСПОЛНИТЕЛЕЙ

Руководитель работ, зам. директора НИИЯФ МГУ,
д-р физико-математических наук, с.н.с
_________________
подпись, дата
В.А.Ильин (Введение, Заключение)
Исполнители Кандидат физ.-мат.наук, с.н.с. _________________
подпись, дата
А.П.Крюков (раздел 2,3)
Кандидат физ.-мат.наук, с.н.с. _________________
подпись, дата
А.П.Демичев (разделы 4,5)
Программист _________________
подпись, дата
Е.Г.Боос (раздел 6)

Реферат

отчета по теме:

Экспериментальные исследования поставленных перед НИР задач. Обобщение и оценка результатов исследований.

Отчет: 45 с., 2 рис., 2 таблицы, 25 источников.

Ключевые слова: распределенные вычисления, грид, среда исполнения, виртуализация ресурсов.

Объектом исследования являются распределенные вычислительные ресурсы грид-инфраструктур, которые используются для решения задач, подготовленных для различных сред исполнения.

Целью работы является интеграция новых технологий виртуализации вычислительных ресурсов в большие системы распределенных вычислений и обработки данных (в первую очередь, в международную грид-инфраструктуру EGEE) для повышение эффективности их использования путем существенного расширения класса прикладных задач, которые могут быть решены с их помощью.

В процессе работы на четвертом (заключительном) этапе исследований проводились экспериментальные исследования поставленных перед НИР задач, а также обобщение и оценка результатов исследований, в том числе:

  • обобщение результатов предыдущих этапов работ;
  • оценка полноты решения задач и эффективности полученных результатов в сравнении с современным научно-техническим уровнем;
  • разработка Программы и методики комплексных испытаний системы запуска в рамках Российского грида для интенсивный операций с данными РДИГ (грид-сегмент EGEE);
  • проведение комплексных испытаний системы запуска в рамках РДИГ;
  • оценка возможности создания конкурентоспособной продукции и услуг и разработка рекомендаций по использованию результатов проведенных НИР;
  • формулирование технических требований для технического задания на разработку продукции.

Кроме того, в соответствии с календарным планом работ по контракту были осуществлены:

  • патентные исследования по ГОСТ 15.011-96;
  • мероприятия по достижению технико-экономических показателей (п. 6 Технического задания);
  • работа по составлению и оформлению заключительного отчета.

В рамках реализации мероприятий по достижению технико-экономических показателей, зафиксированных в Техническом задании, сделан доклад на Международной конференции "Распределённые вычисления и Грид-технологии в науке и образовании" ("The International Conference "Distributed Computing and Grid-technologies in Science and Education - GRID2008", 30 июня - 4 июля 2008 г., Дубна, Россия) и опубликована статья в Трудах конференции: V.A. Ilyin, A.P. Kryukov, L.V. Shamardin, A.P. Demichev, I.N. Gorbunov "Virtualization of grid working nodes for processing of jobs prepared for various runtime environments". Кроме того, по материалам работы представлен доклад на Международную конференцию "XII International Workshop on Advanced Computing and Analysis Techniques in Physics Research" (ACAT2008, 3 - 7 ноября 2008 г., Эриче, Италия): V.A. Ilyin, A.P. Kryukov, L.V. Shamardin, A.P. Demichev, I.N. Gorbunov "Various runtime environments in grid by means of virtualization of working nodes".

Оригинальные программные компоненты системы запуска заданий для различных сред исполнения официально зарегистрированы в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам; копия Свидетельства о государственной регистрации программы для ЭВМ № 2008614447 от 16 сентября 2008 г. прилагается к отчету.

Содержание

Определения……………………… ……………………………..………………………………..6

Обозначения и сокращения…… ……………………………………………..…………………..9

1 Введение 2

2 Обобщение результатов предыдущих этапов работ. 2

2.1 Выбор направления исследований 2

2.2 Теоретические исследования поставленных перед НИР задач 2

2.3 Экспериментальные исследования поставленных перед НИР задач 2

3 Проведение комплексных испытаний системы запуска в рамках Российского грида для интенсивный операций с данными РДИГ (грид-сегмент EGEE). 2

3.1 Состав комплексных испытаний 2

3.2 Результаты комплексных испытаний 2

4 Оценка полноты решения задач и эффективности полученных результатов в сравнении с современным научно-техническим уровнем. 2

4.1 Современный научно-технический уровень разработок в области предоставления сред исполнения 2

4.2 Оценка эффективности исследований 2

4.3 Оценка полноты решения задач 2

5 Оценка возможности создания конкурентоспособной продукции и услуг и разработка рекомендаций по использованию результатов проведенных НИР 2

6 Формулирование технических требований для технического задания на разработку продукции 2

6.1 Требования к функциональным характеристикам 2

6.1.1 Состав выполняемых функций 2

6.1.1.1 Служба предоставления сред исполнения (СПСИ) 2

6.1.1.2 Модуль разворачивания ВМ на рабочем узле 2

6.1.1.3 Монитор виртуальных машин (МВМ) 2

6.1.1.4 Модуль передачи данных в виртуальную среду 2

6.1.1.5 Модули безопасности 2

6.1.1.6 Репозиторий сред исполнения 2

6.1.2 Организация входных и выходных данных 2

6.2 Требования к надежности; 2

6.2.1 Обеспечения устойчивого функционирования 2

6.2.2 Контроль входной и выходной информации 2

6.2.3 Время восстановления системы после отказа 2

6.3 Условия эксплуатации; 2

6.3.1 Климатические условия и характеристики питающей сети 2

6.3.2 Вид обслуживания 2

6.3.3 Необходимое количество и квалификация персонала 2

6.4 Требования к составу и параметрам технических средств 2

6.4.1 Необходимый состав технических средств 2

6.4.2 Основные технические характеристики технических средств 2

6.5 Требования к информационной и программной совместимости 2

6.5.1 Требования к информационным структурам на входе и выходе 2

6.5.2 Программная совместимость 2

6.5.3 Исходные коды, языки программирования и программные средства, используемым программой 2

6.6 Специальные требования 2

6.7 Требования к программной документации 2

7 Заключение 2

8 Список использованных источников 2

Определения

В настоящем отчете о НИР применяют следующие термины с соответствующими определениями:


Аппаратная технология виртуализации - набор инструкций процессора Intel VT-x или AMD-V для упрощения и ускорения переключения контекста между гостевой и хостовой операционными системами.

Вычислительный элемент - в контексте грид-технологий термин "вычислительный элемент", используется для обозначения интерфейса ресурсного центра для запуска заданий на рабочие узлы.

Виртуальная машина - программная или аппаратная среда, в той или иной степени имитирующая работу реального компьютера. На виртуальную машину, так же как и на реальный компьютер можно инсталлировать операционную систему, у виртуальной машины так же есть BIOS, оперативная память, жёсткий диск (выделенное место на жёстком диске реального компьютера), могут эмулироваться периферийные устройства. На одном компьютере может функционировать несколько виртуальных машин.

Грид-инфраструктура – инфраструктура, обеспечивающая пользователям грида прозрачный, унифицированный, безопасный доступ к географически распределенным вычислительным ресурсам и ресурсам хранения данных через открытые компьютерные сети.

Гостевая операционная система - операционная система, работающая внутри виртуальной машины.

Инфраструктура безопасности грида - компонента промежуточного программного обеспечения грида; основывается на понятии открытого ключа, входит в инструментальный пакет Globus.

Кластер компьютерный - доступная по сети группа рабочих узлов (при необходимости вместе с головным узлом), размещённая на некотором сайте. Другими словами, кластер это "контейнер", который группирует вместе компьютерные узлы или подкластеры.

Монитор виртуальных машин (гипервизор) - программный уровень абстракции, разделяющий аппаратную платформу на несколько виртуальных машин; в более узком смысле - часть ядра хостовой операционной системы, ответственная за хостинг и управление виртуальными машинами; работает непосредственно с оборудованием.

Мониторинг/грид-мониторинг - грид-мониторинг подразумевает сбор, анализ и публикацию информации от распределенной инфраструктуры с целью определения статуса грид-ресурсов и хода выполнения заданий.

Приложение – любая компьютерная программа, предназначенная для решения конкретной задачи пользователя из некоторой прикладной области. В данном контексте рассматриваются грид-приложения, т.е. приложения, использующие грид-инфраструктуру для получения результата.

Промежуточное программное обеспечение/ППО - слой программного обеспечения, состоящий из агентов, являющихся посредниками между различными компонентами крупного приложения. Зачастую ППО используется в распределённых приложениях, причём агентов, составляющих этот слой, может быть несколько.

Ресурсный центр грид-инфраструктуры - может включает два типа ресурсов (или один из них): вычислительные ресурсы, на которых выполняется обработка данных; ресурсы хранения данных, которые обеспечивает хранение и транспортировку данных между аналогичными ресурсами и/или данным ресурсом и пользователем.



Рабочие узлы грид-системы - отдельный хост кластера; информация о вычислительном узле может быть видима гриду, но может быть и не видима - это зависит от способа администрирования кластера.

Сайт - используемое для администрирования логическое имя, обозначающее конкретный, стабильный, уникально идентифицируемый и тестируемый набор служб и ресурсов (вычислительных и ресурсов хранения данных).

Сервис/служба - абстрактный ресурс, представляющий возможность выполнения задач, которые имеют четкие функции с точки зрения поставщиков и потребителей. Чтобы службой можно было воспользоваться, она должна быть реализована конкретным агентом поставщика. В данном тексте термины "сервис" и "служба" используются как эквивалентные.

Хостовая операционная система - операционная система, в которой работает платформа виртуализации, исполняющаяся непосредственно на хосте

Хостовая система (хост) - компьютер, на котором работает платформа виртуализации.

Элемент хранения - любой ресурс хранения данных, зарегистрированный в информационной подсистеме грида и обеспечивающий доступ к удаленным сайтам посредством грид-интерфейса; элемент хранения может управлять большими массивами на дисках, системами хранения сверхбольшой ёмкости и подобными им системами.

Обозначения и сокращения

ВМ виртуальная машина

МВМ монитор виртуальных машин (гипервизор)

ОС операционная система

ПО программное обеспечение

ППО промежуточное программное обеспечение

РДИГ Российский грид для интенсивных операций с данными

РЦ ресурсный центр

СЗЗ-РСИ система запуска заданий, подготовленных для различных сред исполнения, в грид-среду

СПСИ служба предоставления сред исполнения

CE вычислительный элемент (Computing Element)

EGEE развертывание грид-систем для e-науки (The Enabling Grids for E-sciencE)

GT4 набор инструментальных средств Globus версии 4 (Globus Toolkit 4)

CLI интерфейс командной строки (Command Line Interface)

gLite промежуточное программное обеспечение проекта EGEE (Lightweight Middleware for Grid Computing)

GSI система безопасности (Grid Security Infrastructure)

JDL язык описания задания (Job Description Language)

KVM Linux Kernel Virtual Machine

OGSA открытая архитектура ГРИД-сервисов (Open Grid Service Architecture)

PBS портируемая система пакетной обработки (Portable Batch System)

RB сервис распределения ресурсов (Resource Broker)

SE элемент хранения; ресурс хранения данных (Storage Element)

UI интерфейс пользователя (User Interface)

UML User-mode Linux

VMM монитор виртуальных машин (Virtual Machines Monitor)

VW виртуальное рабочее пространство (Virtual Workspace)

VWS служба виртуального рабочего пространства (Virtual Workspace Service)

WM менеджер загрузки (Workload Manager)

WMS подсистема управления загрузкой (Workspace Management Service)

WN рабочий узел (Working Node)

  1. Введение

Данный отчет отражает результаты, полученные в результате выполнения работ по государственному контракту 02.514.11.4072 на четвертом (заключительном) этапе “Экспериментальные исследования поставленных перед НИР задач. Обобщение и оценка результатов исследований”.

Основными целями работы являлись:

  • существенное расширение класса прикладных задач, решаемых в глобальных грид-инфраструктурах, на основе технологии запуска и обработки заданий, подготовленных для различных сред исполнения, и, тем самым, повышение эффективности и обеспечение возможности широкого коммерческого использования грида;
  • выполнение международных обязательств, зафиксированных в контракте No. 031688 c Европейской Комиссией по Европейскому проекту EGEE (“Enabling Grids for E-sciencE”).

На предыдущих этапах выполнения работ по контракту были проанализированы возможные подходы к созданию технологии запуска в гриде заданий, подготовленных для различных сред исполнения (СЗЗ-РСИ) и сделан вывод, что основой такой технологии должна быть виртуализация вычислительных ресурсов (виртуальных машин). Были разработаны алгоритмы работы системы запуска заданий с различными средами исполнения в грид, выяснены взаимосвязи разрабатываемой системы с другими компонентами грид-инфраструктуры, выявлены направления экспериментальных проверок. Была осуществлена программная реализация разработанных алгоритмов, разработан макет сегмента грида с СЗЗ-РСИ, разработана программа и методика экспериментальных исследований и проведены соответствующие исследования, а также сопоставление их результатов с параметрами, определенными в Техническом задании. Кроме того, была разработана программно-техническая документация в соответствии с требованиями п. п. 4.4, 4.5 Технического задания и технико-экономические исследования эффективности внедрения исследования в народное хозяйство.

В соответствии с Календарным планом на каждом этапе осуществления работ проводились патентные исследования, в результате которых не обнаружено каких-либо материалов, которые бы препятствовали использованию результатов работ в Российской Федерации.

Анализ научно-технической литературы и нормативно-технической документации, а также результаты патентных исследований показали, что разработанная система запуска заданий в грид-систему для различных сред исполнения соответствует передовым мировым разработкам в области виртуализации вычислительных ресурсов, а по конкретным функциональным возможностям, определенным в Техническом задании, и уровню интеграции в грид-систему не имеет аналогов в мире. Такая оценка уровня разработки подтверждается, в частности, большой заинтересованностью в результатах настоящих исследований со стороны партнеров по крупнейшему международному грид-проекту EGEE.

На заключительном этапе выполнения работ, в соответствии с Календарным планом, были проведено обобщение результатов предыдущих этапов работ и сделана оценка полноты решения задач, а также эффективности полученных результатов в сравнении с современным научно-техническим уровнем. Разработана Программа и методика комплексных испытаний системы запуска в рамках Российского грида для интенсивный операций с данными РДИГ [1] (грид-сегмент EGEE) и проведены соответствующие комплексные испытания. Дана оценка возможности создания конкурентоспособной продукции и услуг и разработка рекомендаций по использованию результатов проведенных НИР. Сформулированы технические требования для технического задания на разработку соответствующей продукции.

В рамках реализации мероприятий по достижению технико-экономических показателей, зафиксированных в Техническом задании (пп. 6.1 и 6.4), сделан доклад на Третьей международной конференции "Распределённые вычисления и Грид-технологии в науке и образовании" (30 июня - 4 июля 2008 г., г. Дубна, Россия) и опубликована статья: В.А. Ильин, А.П. Крюков, Л.В. Шамардин, А.П. Демичев, И.Н. Горбунов "Виртуализация рабочих узлов грида для обработки заданий, подготовленных для различных сред исполнения" в Трудах конференции. Кроме того, представлен доклад на Международную конференцию "XII International Workshop on Advanced Computing and Analysis Techniques in Physics Research" (ACAT2008, 3 - 7 ноября 2008 г., Эриче, Италия): V.A. Ilyin, A.P. Kryukov, L.V. Shamardin, A.P. Demichev, I.N. Gorbunov "Various runtime environments in grid by means of virtualization of working nodes". Оригинальные программные компоненты системы запуска заданий для различных сред исполнения зарегистрированы в Федеральной службе по интеллектуальной собственности, патентам и товарным знакам; копия Свидетельства о государственной регистрации программы для ЭВМ № 2008614447 от 16.09 2008 г. прилагается к отчету.

В связи с тем, что по условиям Технического задания должна быть обеспечена совместимость системы запуска заданий, подготовленных для различных сред исполнения, в грид-среду с промежуточным программным обеспечением (ППО) gLite [2], названия компонент грид-инфраструктуры приводятся как на русском, так и на английском языках (ППО gLite разрабатывается в рамках международного проекта Enabling Grids for EsciencE (EGEE) [3]); также для согласованности используется англоязычная аббревиатура для компонент грид-инфраструктуры.

  1. Обобщение результатов предыдущих этапов работ.
    1. Выбор направления исследований

На первом этапе выполнения работ по контракту был проведен анализ и систематизация научно-технической документации в области технологии виртуализации вычислительных ресурсов и возможных путей интеграции этой технологии в распределенные системы вычислений и обработки данных. Отобраны варианты, наиболее подходящие для реализации в рамках грид-инфраструктур, и на этой основе сформулированы направления решения задачи создания системы запуска заданий, подготовленных для различных сред исполнения.

На основе полученных результатов разработаны:

  • общее архитектурное решение системы запуска заданий в грид-систему для различных сред исполнения,
  • общие алгоритмы работы системы запуска,
  • методика проведения исследований на последующих этапах работы.

Проведено сопоставление ожидаемых показателей новой продукции после внедрения результатов НИР с существующими показателями изделий-аналогов.

В результате проделанной работы получены следующие основные выводы:

  • основой предоставления различных сред исполнения в грид-среде являются виртуальные машины;
  • наиболее подходящим типами виртуализации для создания системы запуска заданий в грид, подготовленных для различных сред исполнения, являются паравиртуализация и полная виртуализация;
  • среди существующих реализаций паравиртуализации в среде ОС Linux наиболее подходящим для достижения параметров, определенных в Техническом задании настоящего проекта, по функциональным возможностям и характеристикам производительности является Xen [4];
  • разработанная на первом этапе общая архитектура и алгоритмы работы позволили создать систему запуска заданий в грид-систему для различных сред исполнения, удовлетворяющую требованиям Технического задания НИР.

Работа на первом этапе выполнения контракта основывалась на анализе самой современной научно-технической литературы и Интернет-источников. Благодаря этому, основные принципы, которые были заложены в архитектуре и алгоритмах работы модулей системы соответствуют передовым технологиям, используемым для построения систем подобного рода, а конкретные функциональные возможности и уровень интеграции в грид-систему не имеет аналогов в мире.

    1. Теоретические исследования поставленных перед НИР задач

На втором этапе выполнения работ по контракту были разработаны алгоритмы работы системы запуска заданий с различными средами исполнения в грид, выяснены взаимосвязи разрабатываемой системы с другими компонентами грид-инфраструктуры, выявлены направления экспериментальных проверок для подтверждения достижимости параметров работы системы, определенных в Техническом задании, проведены патентные исследования.

В результате работы, проделанной на втором этапе, были получены следующие основные выводы:

  • в рамках грид-инфраструктуры система запуска заданий для различных сред исполнения (СЗЗ-РСИ) должна непосредственно взаимодействовать с подсистемами управления загрузкой и информационного обслуживания и мониторинга грида ППО gLite, а также вычислительными элементами в ресурсных центрах;
  • формат запросов на запуск заданий в требуемой среде исполнения должен соответствовать общепринятой схеме GLUE [5], что обеспечивает совместимость создаваемой системы с подсистемами информационного обслуживания и мониторинга большинства существующих грид-инфраструктур, в том числе EGEE/РДИГ (совместимость с EGEE/РДИГ требуется Техническим заданием);
  • требуемая среда исполнения должна указываться в файле описания задания на языке JDL с помощью атрибута " Requirements";
  • для обеспечения общей безопасности грид-инфраструктуры с СЗЗ-РСИ должна использоваться инфраструктуры безопасности грида Globus GSI и программа "sudo";
  • система запуска заданий для различных сред исполнения должна быть реализована в соответствии с архитектурой и алгоритмами, представленными на рис. 1 и 2.

 бщая архитектура системы запуска заданий в грид для различных сред-0

Рис.1 Общая архитектура системы запуска заданий в грид для различных сред исполнения (СЗЗ-РСИ)

 бщий алгоритм работы сегмента грида с системой запуска заданий,-1

Рис. 2 Общий алгоритм работы сегмента грида с системой запуска заданий, подготовленных для различных сред исполнения

В соответствии с этим алгоритмом, общий сценарий использования системы запуска заданий, подготовленных для различных сред исполнения, является следующим:

  • Пользователь в описании задания на языке JDL указывает ПО-тег, соответствующий необходимости развертывания ВМ с необходимой средой исполнения ;
  • WMS с помощью информационной системы находит ресурсный центр с CE, имеющим такой ПО-тег, а также со свободными рабочими узлами и направляет туда задание;
  • на CE задание обрабатывается с участием службы предоставления сред исполнения (СПСИ) и "обертывается" специальным скриптом;
  • при запуске на рабочем узле с установленным монитором виртуальных машин (МВМ) обертывающий скрипт:
    • монтирует копию образа требуемой среды к файловой системе рабочего узла (рабочие узлы ППО gLite функционируют под управлением ОС Scientific Linux);
    • записывает входную "песочницу" (sandbox) задания в файл образа;
    • обеспечивает запуск задания после разворачивания ВМ (например, для гостевой ОС Windows соответствующим образом дополняет файл autoexec.bat);
    • размонтирует файл образа;
    • запускает ВМ и разворачивает файл образ требуемой среды исполнения;
    • после окончания выполнения задания останавливает ВМ;
    • вновь монтирует файл образа и копирует результаты в выходную песочницу на рабочем узле;
    • уничтожает использованную копию образа на локальном диске.
  • результаты задания (выходная песочница) доставляются пользователю стандартными средствами gLite.

Кроме того, обертывающий скрипт следит за тем, чтобы развернутая ВМ корректно уничтожалась, если время выполнения задания превысило время, выделенное системой управления пакетными заданиями кластера рабочих узлов.

Основные принципы, заложенные в предложенной архитектуре и алгоритмах работы модулей системы соответствуют передовым технологиям, используемым для построения систем подобного рода.

Был сделан вывод, что для подтверждения достижимости параметров работы системы, определенных в Техническом задании, необходимы экспериментальные исследования. Параметры работы создаваемой системы, достижимость которых нуждалась в проведении экспериментов, являются следующими:

П. 4.2.4 ТЗ: Созданная система должна обеспечивать возможность запуска на рабочие узлы, работающие под управлением операционной системы (ОС) Scientific Linux (стандартная ОС для ППО gLite), заданий в среде следующих ОС:

  • WindowsXP;
  • Fedora Core;
  • Ubuntu.

П. 4.2.5 ТЗ: Дополнительные (накладные) расходы рабочих узлов грид-системы на развертывание "гостевой" среды исполнения для типичных задач не должны превышать:

  • для ЦПУ - 15%;
  • для оперативной памяти - 30%.

П. 4.2.6 ТЗ: Время выполнения задания на рабочем узле с "гостевой" средой исполнения не должны превышать для типичных вычислительных задач времени исполнения того же задания на аналогичном компьютере, где указанная среда является основной на 15%.

Соответствующие экспериментальные исследования были выполнены на третьем этапе работ (п. 2.3 настоящего Отчета).

    1. Экспериментальные исследования поставленных перед НИР задач

На третьем этапе выполнения работ по контракту проводились экспериментальные исследования поставленных перед НИР задач, в том числе была осуществлена программная реализация разработанных алгоритмов, разработаны макет сегмента грида с СЗЗ-РСИ, программы и методики экспериментальных исследований, а также проведены экспериментальные исследования по этой программе и методикам.

Кроме того, в соответствии с календарным планом работ по контракту проводилась разработка программно-технической документации на компоненты системы и ее макет, технико-экономические исследования эффективности внедрения исследования в народное хозяйство.

В результате работы, проделанной на третьем этапе, были получены следующие основные результаты:

  • разработана программная реализация компонентов СЗЗ-РСИ, включающая как оригинальные компоненты разработанной системы, так и модули, в качестве основы которых были взяты готовые свободно распространяемые продукты с открытым исходным кодом;
  • для интеграции готовых компонент в систему запуска заданий для различных сред исполнения была проведена работа по их инсталляции и соответствующей конфигурации;
  • в качестве аппаратной основы макета использовались специально выделенные для этой цели компьютеры со следующими характеристиками: HP ProLiant DL140G3, 2x Dual-Core Xeon 5150, 2.66GHz, 8GB Memory, 1x160GB SATA HDD; важно отметить, что эти компьютеры обеспечивают аппаратную поддержку виртуализации, что является необходимым условием для развертывания с помощью монитора виртуальных машин Xen некоторых типов сред исполнения, например среды операционной системы WindowsXP;
  • экспериментальные исследования макета сегмента грида с системой запуска заданий для различных сред исполнения (СЗЗ-РСИ) показали, что создаваемая система удовлетворяет требованиям Технического задания и готова к комплексным исследованиям в рамках грид-инфраструктуры РДИГ, которые были выполнены на четвертом этапе работ по контракту;
  • технико-экономические исследования эффективности внедрения результатов НИР в народное хозяйство показали, что работа существенно превосходит средний уровень; оценки показывают, что если благодаря использованию СЗЗ-РСИ будут использоваться порядка 10 готовых программных продуктов для вычислений в грид-среде (вместо разработки/адаптации программ под хостовую среду рабочих узлов грида), капиталовложения в выполняемый НИР окупятся за срок порядка одного года; при этом выводе нижней оценки ожидаемого экономического эффекта от выполнения НИР не принимались во внимание косвенные положительные эффекты от ускорения научно-технических разработок, связанных с распределенными вычислениями, обусловленных экономией времени на разработку собственных программ для среды исполнения рабочих узлов грид-систем.

Экспериментальные исследования, выполненные на третьем этапе, показали, что основные принципы, заложенные в предложенной архитектуре и алгоритмах работы модулей системы, соответствуют передовым технологиям, используемым для построения систем подобного рода.

  1. Проведение комплексных испытаний системы запуска в рамках Российского грида для интенсивный операций с данными РДИГ (грид-сегмент EGEE).
    1. Состав комплексных испытаний

В рамках работ на четвертом (заключительном) этапе проекта были проведены комплексные испытания СЗЗ-РСИ в рамках Российского грида для интенсивных операций с данными РДИГ (грид-сегмент EGEE). Целью этих испытаний является проверка выполнения требований Технического задания (ТЗ) и, на основании этого, выработка оценки возможности создания конкурентоспособной продукции и услуг, а также разработка рекомендаций по использованию результатов проведенных НИР. Для этого производится проверка соответствия характеристик разработанной системы функциональным и отдельным иным видам требований, изложенных в ТЗ.

Испытания проводились в соответствии с разработанной на данном этапе Программой и методикой комплексных испытаний (прилагается к данному Отчету) в соответствии с ГОСТ 19.301-79.

Испытания проводились в два этапа:

  • Проверка документации, комплектности программных и технических средств
  • Испытания взаимодействия грид-служб РДИГ с системой запуска заданий для различных сред исполнения (СЗЗ-РСИ) и функциональных возможностей СЗЗ-РСИ.

На первом этапе проводилась проверка комплектности (соответствия ТЗ) и качества программной документации, а также проверка комплектности состава технических и программных средств.

На втором этапе испытаний проводилась проверка взаимодействия СЗЗ-РСИ с базовыми грид-службами РДИГ:

  • информационной службой;
  • службой распределения и загрузки заданий;
  • службой учета и протоколирования заданий РДИГ;

а также проверка надежности работы СЗЗ-РСИ в рамках РДИГ.

Количественной характеристикой, которая оценивалась в ходе комплексных испытаний, является надежность работы СЗЗ-РСИ. Хотя такая характеристика не установлена явно Техническим заданием, созданная система запуска заданий для различных сред исполнения не должна ухудшать соответствующую характеристику для всей инфраструктуры РДИГ, которая установлена следующим образом (см. Техническое задание государственного контракта № 02.447.11.1002 от 12 мая 2005 г.): аппаратно-программный комплекс РДИГ должен обеспечивать непрерывную бесперебойную работу в течение не менее семи суток. Другие количественные показатели работы СЗЗ-РСИ, предусмотренные п. 4.2 Технического задания, оценивались при испытаниях макета сегмента грида EGEE/РДИГ. При этом был получен положительный результат - разработанная система удовлетворяет требованиям п. 4.2 Технического задания.

Качественными (функциональными) характеристиками программы, которые проверялись в ходе проведения комплексных испытаний, являются:

  • возможность получения информации о ресурсах РДИГ с установленной СЗЗ-РСИ с помощью штатных средств информационной системы РДИГ;
  • обеспечение запуска заданий на грид-ресурс РДИГ в средах следующих ОС: WindowsXP, Fedora Core, Ubuntu и получение пользователем результатов;
  • возможность получения информации о статусе задания, направленного на выполнение с помощью СЗЗ-РСИ, с помощью штатных средств системы мониторинга РДИГ;
  • возможность получения информации о заданиях, выполненных в требуемых средах, с помощью штатных средств системы учета и протоколирования заданий РДИГ.
    1. Результаты комплексных испытаний

Результаты комплексных испытаний системы зафиксированы в Протоколах испытаний, которые прилагаются к данному Отчету. Общими выводами, полученными в результате испытаний являются:

  • комплект документации удовлетворяет требованиям ТЗ;
  • система позволяет запускать задания на вычислительные грид-ресурсы с исполнением в средах ОС Linux/Fedora, Linux/Ubuntu и WindowsXP; запуск заданий в других средах требует лишь подготовки соответствующих образов дисков;
  • СЗЗ-РСИ корректно взаимодействует с базовыми грид-службами:
    • информационной службой,
    • службой распределения и загрузки заданий,
    • службой учета и протоколирования заданий РДИГ;
  • указанное взаимодействие с грид-службами позволяет находить ресурсы с подходящей средой исполнения в грид-инфраструктуре РДИГ, запускать на эти ресурсы задания, отслеживать статус заданий в процессе их выполнения и получать результаты;
  • включение службы запуска заданий для различных сред исполнения в состав аппаратно-программного комплекса РДИГ не ухудшает надежность его работы и позволяет обеспечить непрерывную бесперебойную работу в течение не менее семи суток.

Таким образом, комплексные испытания СЗЗ-РСИ в рамках Российского грида для интенсивный операций с данными РДИГ показали, что созданная система удовлетворяет требованиям Технического задания, и результаты НИР могут быть использованы для разработки проекта технических требований на проведение ОКР по теме «Технология запуска в грид-инфраструктуру заданий, подготовленных для различных сред исполнения» (в соответствии с п. 8.1 Технического задания).

  1. Оценка полноты решения задач и эффективности полученных результатов в сравнении с современным научно-техническим уровнем.
    1. Современный научно-технический уровень разработок в области предоставления сред исполнения

Анализ показывает, что в научно-технической литературе обсуждаются два основных подхода к решению задачи предоставления сред исполнения по запросам пользователей. Первый подход основан на динамическом создании пула формальных (виртуальных) локальных пользователей (учетных записей), причем различные группы таких пользователей имеют доступ к учетным записям с различными средами исполнения (в частности, такое направление развивается в рамках проекта Globus [6]). Второй подход основан на использовании виртуальных машин (ВМ) [7]. Оба подхода обеспечивают исполнение заданий в изолированной среде, но уровень виртуализации оказывается различным, поэтому каждый из них лучше подходит для достижения различных целей. Решение, основанное на динамически создаваемых виртуальных локальных пользователях является более простым с точки зрения реализации, его легче интегрировать в существующие грид-инфраструктуры. Подход, основанный на ВМ является более сложным с точки зрения его реализации и требует существенной переработки существующего промежуточного программного обеспечения (ППО) для поддержки этого вида виртуализации ресурсов. Последнее в особенности относится к подсистемам запуска заданий, мониторинга и учета использования ресурсов в грид-инфраструктурах. Однако, такой подход дает более сильную изоляцию среды от сред исполнения других пользователей грида, большую гибкость (с точки зрения пользователя), возможность "замораживания" выполнения задания на промежуточном этапе и перемещения работы на другой ресурс, поддержку системы соглашений между пользователями и провайдерами по уровню обслуживания и ряд других функциональных преимуществ.

Анализ показывает, что подход, основанный на динамическом создании виртуальных учетных записей, не позволяет достичь показателей, установленных в Техническом задании настоящего контракта. В частности, этот метод не позволяет запускать на рабочих узлах грид-системы, работающей под одной операционной системой (ОС), задания, подготовленные для исполнения в другой ОС. Поэтому в дальнейшем будем рассматривать только подход, основанный на виртуальных машинах.

Благодаря превосходным свойствам изоляции сред исполнения различных пользователей, удобным средствам управления ресурсами и возможности развертывать различные среды исполнения заданий, это направление в последнее время привлекает повышенное внимание различных исследовательских групп [8,9]. Например, в рамках проекта In-Vigo [10,11] разрабатывается распределенная грид-инфраструктура на основе ВМ в качестве ресурсов. В проектах Virtuoso [12] and Violin [13] исследуются сетевые проблемы, связанные с использованием виртуальных машин в грид-среде. Кроме того, обширные исследования были посвящены инструментам конфигурации грид-ресурсов [14, 15], а также резервирования и динамического обеспечения доступа грид-клиентов к существующим исполнительным средам [16-18].

Наиболее разработанным среди таких проектов и наиболее близким к целям настоящей работы является проект Virtual Workspaces [19], осуществляемый в рамках сообщества Globus Alliance, разработчика инструментария для построения грид-систем Globus Toolkit [6]. На анализе этого проекта мы остановимся подробнее. Специализированный грид-сервис Virtual Workspace (VW) для разворачивания и конфигурирования виртуальных машин на рабочих узлах грид-системы, а также для взаимодействия с ними авторизованных пользователей и администрирования со стороны локальных грид-администраторов создан на основе Globus Toolkit версии 4 (GT4) и соответствует спецификациям WSRF [20]. Общая структура его следующая: на один или несколько физических серверов устанавливается монитор виртуальной машины Xen [4], ядро инструментария Globus Toolkit и серверная служба VW. Для запуска виртуальных машин (основанных на Xen) с отдельного компьютера необходимо установить Globus Toolkit и клиентскую службу VW. Можно также использовать готовые виртуальные приложения с VW-клиентом на основе Xen и VMware. При удаленном запуске ВМ на один из серверов необходимо указывать требования к ресурсам. В рамках проекта разрабатывается также некий аналог каталога (репозиторий) с виртуальными приложениями.

На текущий момент доступна тестовая версия Virtual Workspace 1.2.3 (Technology Preview), проект еще находится в стадии, так называемого, Globus-инкубатора.

Грид-инструментарий Globus Virtual Workspace предназначен для интерактивного режима работы с виртуальной средой рабочих узлов. Такой режим не является оптимальным для эффективного использования ресурсов больших грид-инфраструктур и поэтому эта разработка не может непосредственно использоваться для интеграции в такие грид-инфраструктуры как EGEE и РДИГ, что определено Техническим заданием настоящего контракта.

Исследования в области виртуализации грид-ресурсов, близкие к целям настоящего контракта, проводятся также в рамках европейского проекта CoreGRID [21]. Однако, исследования носят пока предварительно-теоретический характер и не вышли на стадию реализации конкретной цельной архитектуры, алгоритмов работы и создания действующей системы.

Amazon Elastic Compute Cloud (EC2) [22] обеспечивает масштабируемое развертывание приложений. В настоящее время пользователи имеют возможность (за установленную плату) создавать, запускать и останавливать экземпляры сервера по запросам (это объясняет слово elastic (упругий) в названии). EC2 использует ВМ Xen. Каждая виртуальная машина является "эквивалентом" системы с x86 процессора с частотой 1.7 GHz, 1.75 GB оперативной памяти, 160 GB на локальном диске и 250 Mb/s сетевой пропускной способности. Эта разработка к настоящему времени выходит на стадию реально действующего бизнес-проекта по предоставлению платных вычислительных услуг и некоторые решения могут быть полезны при дальнейшей работе по данному контракту. Однако, в целом EC2 не является грид-инфраструктурой и поэтому не может рассматриваться как аналог и конкурент системе предоставления сред исполнения по запросам, разрабатываемой в рамках настоящего контракта.

    1. Оценка эффективности исследований

Эффективность научных исследований устанавливается с учетом различных видов проявления полезного эффекта, который может быть получен при использовании результатов НИР. Такими видами эффекта могут быть:

  • научно-технический эффект - характеризуется как накопление новых знаний в области свойств и явлений материального мира, проявляется в виде научных публикаций, докладов, открытий, защищенных диссертаций, изобретений;
  • социальный эффект - проявляется в повышении безопасности дня жизни и здоровья человека, безопасности труда, в улучшении условий труда, снижении вероятности профессиональных заболеваний, повышении экологической безопасности и в получении других социально значимых результатов;
  • экономический эффект - характеризует стоимостную оценку результативности научных исследований, проявляется в снижении себестоимости продукции, работ, услуг, росте прибыли.

В первом случае принято использовать [24,25] коэффициент научно-технического эффекта HT - оценку по 10-балльной шкале, рассчитываемую по формуле:

HT = im ribi  ,

где m - количество признаков научно-технического эффекта; ri - балльная оценка i-го признака научно-технического эффекта; bi - уровень значимости i-го признака научно-технического эффекта.

В таблице 1 приведены типовые признаки научно-технического эффекта и значения ri.

Таблица 1. Типовые признаки научно-технического эффекта и значения ri.

Номер приз-нака, i Признаки научно-технического эффекта Значения ri
1 Ожидаемый уровень новизны результатов НИР принципиально новый 10
относительно новый 4
не обладающий новизной 0
2 Теоретический уровень, перспективность установление нового закона, теории 10
глубокая проработка проблемы 8
разработка способа, метода, программы 6
3 Возможность практического использования результатов в течение 1 - 2 лет 10
в течение 3-5 лет 5
в течение 5 и более лет 2
неопределенная 0

В таблице 2 приведены типовые значения bi, наиболее часто встречающиеся в литературе.

Таблица 2. Типовые признаки научно-технического эффекта и значения bi.

Номер приз-нака, i Признаки научно-технического эффекта Значения bi
1 Ожидаемый уровень новизны результатов НИР 0,3
2 Теоретический уровень, перспективность 0,4
3 Возможность практического использования 0,3


Pages:     || 2 |
 



<
 
2013 www.disus.ru - «Бесплатная научная электронная библиотека»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.