Главная
страница 1

Разработка архитектуры распределенной версии…

Н.В. РЯБОВА, А.Ю. ШЕВЧЕНКО, М.В. БЕЛОИВАНЕНКО, М.В. ГОЛОВЯНКО,
Н.А. ВОЛОШИНА, О.В. ШУБКИНА

Харьковский национальный университет радиоэлектроники, Украина
РАЗРАБОТКА АРХИТЕКТУРЫ РАСПРЕДЕЛЕННОЙ ВЕРСИИ

ОНТОЛОГИЧЕСКОГО ПОРТАЛА МОНУ
Рассмотрены вопросы разработки распределенной версии онтологического портала менеджмента образовательных и научных ресурсов министерства образования и науки Украины. Проведен сравнительный анализ моделей и архитектур распределения информационных систем, построенных на основе онтологического подхода. Обоснована программно-аппаратная архитектура портала. Проведены анализ современных интеллектуальных технологий и программных средств проектирования, создания и тестирования онтологических информационных систем.
Данная работа является составной частью комплекса прикладных исследований, направленных на разработку онтологического портала менеджмента и оценки национальных ресурсов Украины в области образования и науки путем создания крупномасштабной онтологии национальных образовательных ресурсов и разработки онтологической Web-ориентированной распределенной информационной системы для взаимодействия с этой онтологией. Для осуществления поставленной цели в Украине есть все необходимые составляющие информационной инфраструктуры, существует развитая телекоммуникационная структура, системы защиты информационного содержания и верификации информации в глобальной сети Интернет, разрабатываются различные технологии менеджмента информационных услуг.

Мировым сообществом накоплен определенный опыт по созданию онтологических систем и соответствующих порталов с использованием современных технологий Semantic Web (SW), позволяющих реализовывать семантическое описание и сравнение разнообразных информационных ресурсов, проводить их идентификацию и смысловой поиск. С этой целью создается современное программное обеспечение, которое используется для проектирования, создания и тестирования онтологий, содержащих семантическое описание ресурсов и предметной области.

Развитие подобных технологий позволяет разрабатывать системы автоматизированного контроля соблюдения учебными заведениями условий осуществления образовательной деятельности, формирование объемов и структуры подготовки специалистов по высшему образованию; формирование перечня направлений, специальностей, специализаций для подготовки специалистов по высшему образованию; формирования Государственного реестра учебных заведений, данных Единого лицензионного реестра и соответствующих информационных банков. Таким образом, возникает потребность использовать накопленные знания для разработки онтологического портала менеджмента и оценки национальных ресурсов Украины в области образования и науки.

В данной работе использованы результаты, полученные авторами при выполнении предыдущих проектов: «Онтологический портал для менеджмента и оценки национальных ресурсов Украины в области образования и науки», проект ДФФД МОН № Ф15/456-2007 (2007 г.), «Разработка Web-ориентированной системы для поддержки процедур аккредитации и лицензирования высших учебных заведений Украины», ДР № 0107U001569 (2007–2008 гг.); «Новейшая информационная технология обеспечения прозрачности аккредитации университетов», проект TEMPUS SM_SCM – T020B06-2006 (UA) (2007–2008 гг.). Адрес действующего прототипа портала http://ailab.kture.kharkov.ua/. В настоящее время функциональность портала ограничена, что связано с перестройкой его архитектуры.

На основе анализа проблемной области относительно осуществления процедур аккредитации и лицензирования в вузах Украины, которая была рассмотрена в предыдущих работах, разработчики пришли к выводу, что для более эффективной реализации онтологического портала менеджмента образовательных ресурсов Украины целесообразно модернизировать его архитектуру и использовать принципы распределеных систем для организации хранения информации и знаний. При этом возможно распределение системы как на уровне онтологической базы знаний, так и на уровне базы данных.

Существует несколько подходов к организации хранения знаний в распределенных онтологических хранилищах. Подход с использованием множества онтологий использует несколько онтологий, каждая из которых представляет отдельный источник данных. Между онтологиями устанавливаются соответствующие отношения. Запросы к интегрированным данным выполняются на локальных онтологиях, а координация и распределение запросов происходит с помощью установленных отношений. В такой архитектуре нет необходимости в единой интегрированной онтологии, кроме того, как правило, изменения в локальных онтологиях не приводят к изменению отношений между онтологиями.

Подход с использованием глобальной онтологии применяет интегрированную онтологию, которая описывает данные со всех распределенных источников данных. Все запросы направляются к этой единой онтологии. Такой подход, хотя и является наиболее очевидным способом организации распределения, требует дополнительных ресурсов: эксперта предметной области, который понимает семантику всех источников данных для определения глобальной онтологии. В качестве источников могут выступать отдельные специализированные онтологии.

Гибридный онтологический подход пытается решить недостатки двух предыдущих методов. Данные в каждом источнике представлены локальной онтологией, а распределенный словарь, который задается неонтологическим способом, строится для распределения словарей между локальными онтологиями. Главными преимуществами этого подхода по сравнению с предыдущими двумя является упрощение локального определения онтологий и механизма построения запросов к распределенному словарю.

Для географически распределенной системы важной особенностью является возможность локального изменения онтологической информации с ее последующей синхронизацией с общей онтологической базой. В процессе анализа была выбрана гибридная модель распределения информационных систем. При этом архитектура портала состоит из главного сервера, который содержит общую структуру онтологической информации и набор специальных объектов, выполняющих роль ссылок на фрагменты онтологии удаленных клиентов. Узлы клиентов являются равноправными и имеют достаточно высокую степень автономности для самостоятельного нормального функционирования в рамках локальных информационных систем, которые могут экспортировать и импортировать информацию из глобальной онтологической системы.

Онтология портала содержит два различных типа информации: а) перечень классов онтологии, перечень свойств, информацию о взаимодействии элементов этих классов (знания, характеризующие структуру онтологии), согласно W3C этот тип знаний представляется с помощью стандарта RDFS; б) перечень информации, привязанной к реальным объектам. Эта информация полностью соответствует общей структуре онтологии и может быть представлена в виде RDF-описаний [1].

Для разработки распределенных реальных систем (в частности, онтологического портала менеджмента и оценки ресурсов в области образования и науки) необходимо обеспечить возможность хранения и обработки больших объемов RDF-данных. Одним из решений данной задачи является применение технологии реляционных БД в сочетании с технологиями Semantic Web. Главным преимуществом такого объединения является то, что оно предоставляет решение проблемы масштабирования с помощью уже разработанных механизмов. На сегодня Sesame [2] может применять СУБД PostgreSQL, MySQL, Oracle (9i или выше) и SQL Server.

В классической базе данных MySQL данные организованы в виде таблиц, которые хранятся как файлы на диске сервера баз данных. Кластеризация распределяет обработку данных между несколькими серверами. Кластер серверов позволяет объединить несколько физических серверов (узлов), которые выступают партнерами друг для друга в процедуре перехода на резервный ресурс. Существует много причин для кластеризации БД и несколько различных способов ее реализации.

MySQL Cluster – это технология, которая делает возможной кластеризацию БД, находящейся в памяти системы, организованной без распределения ресурсов. MySQL Cluster построен таким образом, что каждый компонент системы имеет свою отдельную память и диск. MySQL Cluster интегрирует нормальный MySQL-сервер со встроенной кластерованой машиной вывода NDB, работающей с хранилищем данных.

MySQL кластер может использоваться вместе с существующими MySQL-приложениями. Такие клиентские приложения посылают SQL-утверждения и получают ответ от MySQL-серверов, работающих как SQL-узлы кластера так же, как отдельные MySQL-сервера. Однако MySQL-клиенты, использующие кластер MySQL в качестве источника данных могут изменяться для получения преимуществ соединения с различными MySQL-серверами для достижения выравнивания загрузки и перехвата управления в случае отказа.

Для распределения онтологического портала менеджмента национальных образовательных ресурсов Украины была выбрана организация кластера на основе СУБД MySQL версии 5.1. Типичная архитектура такого кластера представлена на рис. 1.

Рис. 1. Архитектура кластера MySQL
Инфраструктура кластера включает в себя следующие типы компонент:

MGM Node – узел управления кластером;

SQL Nod – узел обработки запросов, обеспечивает выполнение SQL-команд клиентов (в рамках онтологического портала – это серверы поддержки онтологий). Основная загрузка на сервер происходит при обработке запросов, что вызывает повышение требований к скорости и количеству процессоров, а также к объему ОЗУ;

Data Node – узел данных, который обеспечивает зеркальное (полное копирование данных) или дополнительное (несколько узлов создают единое пространство данных) хранилище данных. Такой сервер будет нагружен при доступе к данным, что повышает требования к системе управления дисками и объемами носителей.

После проведения анализа существующей системы, схем и моделей распределения онтологических систем и программного обеспечения, что дает возможность создания и управления распределенными онтологическими системами, была разработана общая архитектура распределенной версии онтологического портала поддержки аккредитации и лицензирования национальных образовательных ресурсов Украины [3]. Разработанная архитектура представлена на рис. 2.

Распределенная архитектура включает в себя следующие программные серверы:

Apache Tomcat – поддержка HTTP-запросов Web-клиентов, сервер статических файлов изображений и документов, сервер приложений для ядра и программных модулей портала;

Aduna Sesame – сервер поддержки RDF-графа и онтологической модели данных;

MySQL Cluster – набор серверов трех типов, которые реализуют кластер СУБД.

В связи с использованием распределения системы посредством организации кластера СУБД онтологии модулей системы вынесены в общее хранилище онтологических структур данных Sesame. При этом модификация программного кода не нужна, так как кластер СУБД имеет такой же SQL-интерфейс, что и автономный сервер СУБД MySQL. Что касается изменений, которые должны произойти в системе при создании ее распределенной модификации, нужно организовать дополнительную конфигурацию репозитория и стека хранения данных в стандартных настройках сервера Sesame.



Рис. 2. Архитектура распределенного онтологического портала


В результате выполнения работы были получены следующие результаты:

  • проведен сравнительный анализ моделей и архитектур распределения информационных систем, построенных на основе онтологического подхода; рассмотрены модели распределения, которые предполагают распределение информационной системы как на физическом уровне, так и на уровне бизнес-логики системы;

  • проведен анализ современных существующих программных сред, которые поддерживают обработку онтологических структур удаленно; в результате был выбран сервер SESAME, который содержит гибкие механизмы обработки онтологических структур и реализует взаимодействие с сервером MySQL на основе использования Java-машины;

  • на основе анализа моделей распределения и программных продуктов, которые необходимо использовать для распределения онтологической системы, была выбрана модель распределения на уровне данных и разработана программно-аппаратная архитектура распределенной версии онтологического портала.

Работа выполнена при поддержке гранта МОНУ ІТ/534-2009.
СПИСОК ЛИТЕРАТУРЫ


  1. Климова М.В., Шевченко А.Ю. // Штучний інтелект. 2009. № 2. С. 91.

  2. Broekstra J., Kampman A., Harmelen F. // International Semantic Web Conference. [Электронный ресурс] – Sardinia, Italy, 2002. – Режим доступа: http://www.openrdf.org/doc/papers/Sesame-ISWC2002.pdfs.

  3. Рябова Н.В., Волошина Н.А., Шубкина О.В. и др. // Материалы междунар. науч.-практ. конф.: «Информационные технологии и информационная безопасность в науке, технике и образовании «ИНФОТЕХ-2009». – Севастополь: Изд-во СЕВНТУ, 2009. С. 230.




Смотрите также:
Разработка архитектуры распределенной версии онтологического портала мону
82.01kb.
1 стр.
Орлов Иван Алексеевич моделирование вычислительных процессов на распределенной системе объектно-атрибутной архитектуры направление 23. 01. 00. 68 Информатика и вычислительная техника Магистерская программа
834.35kb.
4 стр.
Разработка портала дистанционного обучения вуза
46.37kb.
1 стр.
Группой историков архитектуры портала Архитектура России
106.12kb.
1 стр.
Проект портала «Гость портала»
237.2kb.
1 стр.
Творчество академика архитектуры а. А. Ященко >05. 23. 20 Теория и история архитектуры, реставрация и реконструкция историко-архитектурного наследия
268.27kb.
1 стр.
Эффективность централизованной и распределенной архитектуры памяти для параллельной обработки систем конец формы реферат диссертации на соискание академической степени магистра техники и технологии по
366.95kb.
1 стр.
Iii московская биеннале архитектуры 17 выставка архитектуры и дизайна арх москва 23 – 27 мая 2012 центральный дом художника
55.52kb.
1 стр.
1. Разработка структурной схемы программы
316.11kb.
1 стр.
Дипломная работа студента Коробкина А. А
588.33kb.
4 стр.
Для приобретения полной версии работы щелкните по ссылке
29.95kb.
1 стр.
Терминология малой распределенной энергетики в рамках разработки установочных документов Технологической платформы «Малая распределенная энергетика»
208.9kb.
1 стр.