Главная
страница 1 ... страница 2страница 3страница 4

ООБД.

Проблема объединения в рамках единой модели данных свойств, присущих реляционной и объектно-ориентированной схемам БД (ООБД) является актуальной на протяжении вот уже нескольких десятилетий [24,25]. Описанная теория каркасной модели данных позволяет иначе решить эту проблему. Новая модель одновременно обладает SQL и OQL полнотой [14], позволяет проектировать информационные системы, имеющие объединенные свойства. А теорема о модифицируемой ДКНФ-схеме БД [7] дает возможность рассматривать каркасную модель данных как единственно оптимальную платформу для такого объединения.


Идею, допускающую положительный результат такого объединения, высказал Дейт [24], где отношения реляционной модели можно рассматривать как объектные классы. Дейт утверждает, что "в реляционной модели не существует ничто, что может ограничить скалярные значения, существующие в доменах, … простыми формами. … Эти скалярные значения могут быть настолько сложными, насколько мы пожелаем".

В [5] указано, что под сущностью (объектом, фактом и т.п.) в ПрО понимается расширяемая совокупность атрибутов, объединенных единым уникальным в рамках этой ПрО многоместным предикатом. А под атрибутом сущности-объекта понимается некое абстрактное множество, объединенное одноместной частью этого уникального для ПрО многоместного предиката. Там же описано одно из принципиальных свойств каркасной модели - фиксированная структура единого для каждого атрибута ключа, являющегося следствием многоместного предиката. Такой подход к декомпозиции ПрО дает возможность каждый атрибут ПрО рассматривать как отдельный класс сущностей-объектов со своим фиксированным классом ID, каждый экземпляр которого, во-первых, имеет строго фиксированную предопределенную порождающим предикатом схему, а во-вторых, уникально определяет экземпляр атрибута. При работе с SQL-запросами такая БД форматируется как реляционно-табличная – все группы атрибутов-столбцов в строгом соответствии со своими ID могут быть объединены в отношения. При выполнении OQL-запроса можно использовать механизм индексирования базы по структуре ID, что повышает скорость выполнения запроса.

Теоремой 6 о модифицируемости реляционного каркаса рассмотрена классическая [26] задача о «неожиданном» дополнении сущности-объекта новым атрибутом, т. е., по сути, о модификации схемы БД [5,15]. Автор [26] для этой проблемы определил красноречивую рубрику «смерть обоим», указывая на невозможность корректного моделирования ситуации ни в рамках классической реляционной модели [12], ни известным алгоритмом ООБД [27]. Для каркасной же концепции подобные модификации являются естественным и корректным процессом, формально описанным теоремой, доказанной в [15].

Как указано в [5], модифицируемость схемы БД обеспечивается генерацией ключевых атрибутов по алгоритму сочетаний «всех со всеми», аналогичному булеану (множеству всех подмножеств). Там же показано, что любые агрегированные сущности-объекты, замаскированные под атомарные, продуцируются конечным набором атомарных. Такой подход обобщает процедуру моделирования ООБД [27], где любому искомому существительному (объекту) ставится в соответствие только атомарный предикат (неструктурированный ID), вне зависимости от семантики ПрО - внутренних взаимосвязей. Поэтому каркасная модель значительно расширяет возможности ООБД. Составные сущности-объекты являют собой постсвязные многоместные предикаты. А слабые сущности-объекты – цепочки иерархически-зависимых многоместных предикатов. Каркас моделирует единой процедурой и тот, и иной тип.



Каркасный метод анализа ПрО дает подход более строгого моделирования сущностей-объектов. Как известно [27], теория проектирования ООБД не дает точных рекомендаций, какие сущности-объекты или факты из описания ПрО должны быть объектами, а какие являются лишь маскирующими категориями (словами). Важным является то обстоятельство, что такая методика применима к проектированию любого программного обеспечения – от приложений БД до произвольных кибернетических систем.

При таком подходе к проектированию приложений БД каждое отношения автоматически становится объектом. А их совокупность – иерархической структурой программной системы. Потому, что любое сечение каркаса – это иерархия, древовидный граф, в узлах которого расположены отношения. А связи по дугам графа моделируются ключами отношений. Каждое отношение моделирует сущность-объект.

Каркасный анализ позволяет разработчику приложений и программных комплексов обще-вычислительного характера, работающих не только с БД, проектировать структуру исходного текста программ и соответствующей библиотека объектов так, чтобы дальнейшее сопровождение и обязательные постоянные модификации не вызывали ощутимых затруднений и значительных затрат ресурсов. Использование совокупности объектов и процедур, построенных в соответствии с каркасной схемой семантики специализированной ПрО – стационарных динамических задач теории упругости [28,29], заложенное в листинг программного комплекса на начальных этапах (в 1990 году), позволило значительно расширить и обобщить приложение, а также решить вопрос его интероперабельности (для кластеров СКИТ-3 и «Инпарком-256») за очень короткий отрезок времени.

Денормализация.

Из приведенной в [30] подробной классификации наиболее схожими с проектированием безаномальных схем БД на реляционном каркасе является метод нисходящей и восходящей денормализации схем БД. А приведенный в [30] пример о включении в отношение-связь атрибута атомарной сущности-объекта, функционально зависимого только от части составного ключа, вносит не только постороннюю ФЗ и нарушает условия нормализации отношения-связи, но является чуждым исходя из семантики высказывания, моделируемого отношением-связью. В ней нарушается «тема» отношения.

Тем не менее, при такой денормализации пользователь получает дополнительное конкурентное преимущество эксплуатации БД, потому что скорость доступа к данным значительно повышается из-за исключения операций соединения, что и отмечается в работах [30,31].

Каркасный синтез ДКНФ позволяет избегать денормализации, однако использовать нормализованные отношения-связи, которые также экономят операции соединения.

Рассмотрим более подробно пример из [31]. Если в ПрО «ЛПУ» (ПАЦИЕНТ, ТАЛОН, ПОЛ ПАЦИЕНТА) регулярно синтезируются отчеты по неключевому атрибуту Пол, то может быть использован принцип "маска для роли атомарной сущности-объекта" [4] – отдельное отношения, которое является частичной копией атомарного отношения ПАЦИЕНТ. При этом формируется отношение-связь ПОЛ ПАЦИЕНТА+ТАЛОН, которое приложением БД поддерживается в целостном и актуальном состоянии универсальными процедурами. В нем также может сохраняться необходимая статистика – формироваться неключевые шунтирующие атрибуты.

И хотя такая декомпозиция отношения ПАЦИЕНТ на два отношения (ПОЛ ПАЦИЕНТА и, например, ВОЗРАСТ ПАЦИЕНТА) некоторыми авторами оценивается как денормализация [31], у Фейджина в [8] аналогичный прием приведен как пример нормализации схемы отношения: «…схема может быть разложена на две схемы… кортеж, содержащий данные о поле человека, входит в первое отношение, а кортежи, содержащие данные о его профессии, входят во второе отношение. Схема SEX_ROLE удовлетворяет ФЗ PersonRole, в то же время схема PROF_ROLE не удовлетворяет этой зависимости. … Преимущество разложения состоит в том, что механизм обработки ключей системы может тогда предотвратить вставку двух ролей пола для одного человека».

При этом, как упоминалось в [31], тратится дополнительное время на поддержание ссылочной целостности. Однако эти потери, как и в [31], несоизмеримы с потерями при соединении.

Но если необходимо выполнить разовый отчет, создается запрос с операцией "выбор по выбору". Осуществляется выборка из отношения-связи ТАЛОНЫ ПАЦИЕНТОВ (соединения, в котором условно находятся миллионы записей) только тех ключевых значений атрибута КодПациента, для которых отфильтрована маленькая группа кортежей («пачка записей») в отношении ПАЦИЕНТЫ по любой совокупности вторичного ключа (скажем, по значению нескольких неключевых полей "мальчики, младшие 12 лет"). «Умные» СУБД выполнят эту операцию значительно быстрее прямого соединения, поскольку операция сводится лишь к выбору в «большом» отношении-связи отфильтрованной по первичному ключу (по индексу) группы кортежей в соответствии с малой группой «родительского» отношения. Однако, к сожалению, далеко не все СУБД предоставят такую возможность.

NoSQL - key-value БД.

Современные модели БД типа «ключ-значение» (key-value – KV-модель), которые более всего схожи с каркасными отношениями, относятся к новому, динамично развивающемуся направлению БД, объединенному красноречивым названием «не только SQL» (Not only SQL - NoSQL) [32]. Как правило, они представляют собой распределенные хеш-таблицы. Это самая сильная их сторона, т.к. предоставляет высокую производительность и модифицируемость. Тем не менее, эти свойства перестают быть преимуществами, когда необходимо обрабатывать списки.

В РМД же нижеследующие задачи являются типовыми:


- выбрать k последних покупателей,

- выбрать самые популярные товары текущей недели,

- найти склад, у которого максимальный оборот за последний месяц,

- найти покупателя по любому неключевому атрибуту (по номеру мобильного телефона, по адресу места жительства и т.п.)…

Но в KV-модели подобные задачи вызывают трудности. Например, когда необходимо осуществить выборку значений атрибутов одной сущности-объекта по вторичному ключу другой, ситуация становится схожей с подходом «нисходящей» или «восходящей» денормализации.

Таким образом, это - тот класс задач, для которых можно и нужно использовать РМД. На практике, поскольку такие задачи сильно взаимосвязаны, проектировщик передает БД в РМД-приложение. Потому что, как правило, применяется гибридное решение - комбинация KV-РМД. Все данные хранятся в KV, а те свойства, по которым необходимо осуществить агрегатные выборки, дублируются в РБД (с указателем на ключ). Но сложность заключается в том, что приходится следить за синхронизацией данных в двух БД, что сильно усложняет логику приложения.

Схема РБД, полученная на каркасной модели данных, автоматически обладает свойствами, подходящими и под модель NoSQL. Единственный структурированный ключ каждого отношения каркасной совокупности, полученный конъюнкцией одноместных ключевых предикатов (или, что то же самое, конкатенацией унарных ключевых атрибутов), являющийся ключом отношения для SQL-запроса от приложения РМД, одновременно является еще и KV для соответствующих значений неключевых атрибутов при нетабличном запросе к БД от KV-приложения. А так же, как указывалось выше, еще и ID для OQL-запроса.

Вывод


Таким образом, особое отношение со схемой R(X,A) является минимально возможным отношением в РМД и тем самым является частным случаем отношения. Но как уже неоднократно замечено [5,6,7,15], в РМД понятие частного случая имеет некоторую двойственность. Нами замечено уже как минимум четыре однотипных ситуации.

1. Частный случай, когда правая часть составного детерминанта является непустым множеством, позволила получить достаточно нетривиальный обобщающий результат со вполне определенным физическим смыслом – атрибутом много-арной связи.

2. Частный случай многозначности – ДЗ – позволила получить обладающее полнотой обобщающее отношение-связь, которое можно использовать в качестве шаблона для связей максимально-возможной степени и произвольной кратности

3. Частный случай совокупности отношений со схемой R(X1,X2,X3,…,Xn,Aj) и исключительно одной ФЗ позволил получить уникальный своей универсальностью реляционный каркас, пригодный в качестве шаблона практически для любой ПрО.

4. Частный случай ограничений на домены и ключи – минимально возможная ФЗ XA – позволила обнаружить элементарную безаномальную схему.

Видимо, не будет большим преувеличением предположение, что эти частные случаи взаимосвязаны и играют фундаментальную роль в РМД. И показанные в [5,6,7,15] важные свойства каркасной модели данных и каркасного метода проектирования схемы БД обосновываются именно этим обстоятельством.

К основным конкурентным преимуществам этого подхода относятся нижеследующие свойства (по убыванию значимости).

1. Безаномальность в смысле [8].

2. Высокая скорость доступа к данным благодаря значительному снижению операций соединения в запросах.

3. Динамическая модифицируемость схемы БД, что позволяет корректно вносить изменения в эксплуатируемое приложение, а также гибко модифицировать схемы не только пользовательских, но и управляющих БД (метабаз).

4. Подобие схем БД для разных ПрО несмотря на значительные отличия семантик, что обеспечивает интероперабельность и кросс-платформенность приложений [21].

Для исследователей также важны следующие выводы.

1. ДКНФ-cхема БД – это еще и схема семантики ПрО - формируя ДКНФ-схему БД, пользователь исследует семантику ПрО, и тем самым имеет возможность оптимизировать саму ПрО.

2. Совпадение с результатами исследований [19,20,21] в части «отдельных вспомогательных тернарных отношений», «ускорения доступа к данным из-за экономии на соединениях», «схожести схем БД разных ПрО» - не случайно. Оптимальная схема БД - единственна.

3. Основная классическая концепция «все связи должны быть декомпозированы к бинарным, а при подготовке ответа на запрос сервер осуществит соединения» устарела. Более актуальна концепция «все актуальные связи поддерживаются в режиме он-лайн».

4. Каждое отношение в ДКНФ-схеме – это одно предложение, соответствующее одной «теме» [3], а их совокупность соответствует ДНФ совокупности высказываний.

5. Любой текст – от одного атомарного предложения и до произвольного их количества, представляющий пользователю информацию, является фрагментом каркаса. Это означает, что каркасный подход позволяет синтезировать разборщик смыслов.

Все перечисленное дает возможность решить проблему унификации, типизации и минимизации СУБД. То есть, по сути, разработать инструментальную оболочку, которая масштабируется метаданными. И на этом основании создать малогабаритный CASE-генератор каркасных метаданных, управляющих универсальной каркасной оболочкой. А также снабдить этот гибкий инструмент библиотекой типовых функций навигации каркасной РБД, используемых в унифицированных запросах.

Такой подход минимизирует потребность в ресурсоемких операциях соединения в большинстве запросов к БД. И существенно упростит настройку приложения.

Благодарности.

Автор выражает искреннюю благодарность:

- своему учителю, члену-корреспонденту НАН Украины, профессору Перевозчиковой О.Л., к несчастью, так внезапно ушедшему из жизни в 2011 году, за большую помощь в проведении исследований, за искреннюю поддержку, чуткость и понимание в работе,

- академику НАН Украины, профессору Летичевскому А.А. за помощь и поддержку в работе.

- академику НАН Украины, профессору Андону Ф.И. за своевременные и важные замечания, помощь и поддержку в работе.

- д.т.н., профессору, г.н.с. Института системного программирования РАН Кузнецову С.Д. за длительную дискуссию по результатам исследований, за острую критику подхода и результатов, за непримиримую позицию оппонента и ценные замечания и подсказки



- официальному рецензенту работы [5], д.ф.-м.н., профессору Бую Д.Б. за ответственное отношение к экспертизе материала, за серьезные и глубокие замечания, за моральную поддержку.

литература

  1. Chen P.P. The Entity-Relationship Model: toward a unified view of data // ACM Trans. on Data base systems, v. 1, № 1, 1976. P.9 – 36.

  2. Codd E.F. Extending the Database Relational Model to Capture More Meaning. ACM Transactions on Database Systems, Vol. 4, № 4, December 1979

  3. Кренке Д.М. Теория и практика построения баз данных. – СПб.: Питер, 2003 г. - 800с

  4. Кузнецов С.Д. Базы данных: модели и языки. Учебник. – М.: Бином 2008 г. - 720с.

  5. Карпуша В.Д., Панченко Б.Е. Моделирование и проектирование реляционных баз данных. Учебное пособие. – Суми: Изд. СумДУ. – 2010, 385 с

  6. Панченко Б.Е. Каркасное проектирование доменно-ключевой схемы реляционной базы данных // Кибернетика и системный анализ, - Киев, 2012. – No 3. – C. 174-187

  7. Панченко Б.Е. К вопросу о модифицируемости и безаномальности схемы реляционной базы данных // Проблемы программирования, - Киев, 2012. – No 2-3. – C. 281-288

  8. Fagin R. A Normal Form for Relational Databases That Is Based on Domains and Keys// ACM Transactions on Database Systems, 1981, vol. 6, no. 3, pp. 387 415.

  9. Тарасов И. А., Целостность данных, аномалии модификации данных и нормальные формы таблиц реляционных баз данных/ Проектирование телекоммуникационных и информационных средств и систем. М.: МИЭМ, 2007, с. 195.

  10. Тарасов И. А., Недостатки теории доменно-ключевой нормальной формы (DKNF) Рональда Фагина, http://itsoft.ru/about/publication/dbdesign/dknf/

  11. Голосов А.О., Аномалии в реляционных базах данных// СУБД. – №3. – Москва, 1996, с. 23-38

  12. Codd E.F. The Relational Model For Database Management, Version 2, Reading Mass. – New York: Addison-Wesley Publishing Co, 1990. – 538p

  13. Цаленко М.Ш. Семантические и математические модели баз данных // Итоги науки и техники. Информатика. Том 9. – М: ВИНИТИ – 1985. - 207 с.

  14. Ульман Д.Д., Уидом Д. Основы реляционных баз данных. – М.: Лори 2006. - 374с.

  15. Панченко Б.Е., Писанко И.Н., Свойства реляционного каркаса на множестве семантически атомарных предикатов// Кибернетика и системный анализ, - Киев, 2009. – No 6. – C. 177-182

  16. Яловец А.Л. Представление и обработка знаний с точки зрения математического моделирования. Проблемы и решения. - К: Наук. думка. - 2011. - 360 с.

  17. Костюк А.И., Базы данных и знаний: Курс лекций. - Таганрог: Изд-во ТРТУ, 1999 г. - 175 с.

  18. Тарасов И.А., Метод проектирования логической структуры реляционной БД для веб-приложений без нормализации таблиц: Дисс. к.т.н. - М: МИЭМ, - 2009 г. – 112 с.

  19. Гречко В.О., Темперанский В.А., Некоторые вопросы организации данных в системном анализе сложных объектов/ Сб. "Автоматизация проектирования информационных систем", ИК АН УССР, 1976

  20. Grechko, V. and Tulchinsky, V. Building standard user interface: DBMS "MicroPoisk" approach // Informatica. - 1995. - N4. - P. 446-456.

  21. Перевозчикова О.Л., Тульчинский В.Г., Коломиец А.В. и др., Высокопродуктивные методы анализа и спецификации пространств атрибутов предметной области для организации вычислений//Отчет о НИР № 0107U000800 ВФ.145.09.11. - Киев, 2011 г. - 378 с.

  22. Панченко Б.Е., Гайдабрус В.Н., Церковицкий С.Л., Создание сетевых информационных комплексов // Компьютеры плюс программы, Киев, 1993. – No 5 (6), с. 46-50

  23. Панченко Б.Е., Гайдабрус В.Н., Церковицкий С.Л., Сетевые вычислительные комплексы // Компьютеры плюс программы, Киев, 1994. - спец. вып, с. 30-37

  24. Date C.J., Date on database: writings 2000-2006. – New York: Apress, 2006. – 539p.

  25. Чемберлин Д., Анатомия объектно-реляционных баз данных// СУБД, - Москва, 1998. - № 1-2. – C. 65-76

  26. Пржиялковский В., Что объектам здорово, то реляциям смерть, и наоборот, и еще пол-оборота//Персональный сайт автора, - Москва, 1998, - http://open.oracle.tu2.ru/OR.html

  27. Буч Г., Объектно-ориентированный анализ и проектирование с примерами приложений на С++, – М.: 2001- 560 с.

  28. Назаренко А.М., Панченко Б.Е. Дифракция волн сдвига на цилиндрических неоднородностях произвольного поперечного сечения //Динамика и прочность машин. Респ. межвед. научно-техн. сб. – 1991. – Вып. 52. – С. 38 - 45.

  29. Панченко Б.Е. Высокоточное кластерное решение задачи дифракции волн сдвига на системе отверстий в полубесконечной изотропной среде с защемленной границей // Проблемы программирования, - Киев, 2012. – No 1. – C. 121-131

  30. Кунгурцев А.Б., Зиноватная С.Л., Модель реструктуризации реляционной базы данных путем денормализации схемы отношений// Тр. Одес. политехн. ун-та. — Одесса: ОНПУ, 2006. — 2(26). — С. 105 — 111.

  31. Кунгурцев А.Б., Зиноватная С.Л., Анализ целесообразности реструктуризации базы данных методом введения нисходящей денормализации // Тр. Одес. политехн. ун-та. — Одесса: ОНПУ, 2006. — 1(25). — С. 104 — 108.

  32. Michael Stonebraker, The NoSQL Discussion has Nothing to Do With SQL// BLOG@CACM, - № 4 (November), - 2009 http://cacm.acm.org/blogs/blog-cacm/50678-the-nosql-discussion-has-nothing-to-do-with-sql/fulltext

В рамках предложенного нового подхода к синтезу ДКНФ-схемы БД для произвольной предметной области проведен анализ некоторых негативных публикаций. Проведено детальное сравнение разных аномалий в схемах БД. А также сравнение разных подходов к проектированию схем и совпадений каркасного метода проектирования. Делается вывод о том, что совпадения с результатами различных исследований является результатом строгой обоснованности предложенного метода.



Исследования доменно-ключової схеми реляційної бази даних
В рамках запропонованого нового підходу до синтезу ДКНФ-схеми БД для довільної предметної області проведено аналіз деяких негативних публікацій. Проведено детальне порівняння різних аномалій в схемах БД. А також порівняння різних підходів до проектування схем і співпадіння каркасного методу проектування з класичними та новими результатами. Показано, що співпадіння з результатами різних досліджень є наслідком строгої обґрунтованості пропонованого методу.
Investigations of the domain-key relational database scheme
Within the confines of the new approach to the DN/KF synthesis for an arbitrary domain, an analysis of certain negative publications is carried out. A detailed comparison of various abnormalities in the database schemes is held. A comparison of different approaches to the design of schemes and matches of the framework design method with the classic and new results is also carried out. It is shown that matches with the results of different investigations are the consequence of the strict validity of the proposed method.
Кибернетика и системный анализ, Киев, - 2012, - № 6 – С. 157–172




<< предыдущая страница  
Смотрите также:
Исследования дОменно-ключевой схемы реляционной базы данных Ключевые слова
432.17kb.
4 стр.
Курсовая работа Дисциплина Информационные системы и технологии
236.07kb.
1 стр.
Практические занятия к теме №3 задача 1 Задание Создание базы данных
83.93kb.
1 стр.
Материал из Semantic Future
425.22kb.
2 стр.
Темы дипломных проектов специальности 230105 Базы данных
122.96kb.
1 стр.
Отчет по результатам работы по программе усовершенствования базы данных по сортам растений и изложить предложения по усовершенствованию базы данных по сортам растений
712.53kb.
4 стр.
Лермонтов в тюркоязычном мире (к вопросу о диалоге литератур) Ключевые слова
179.47kb.
1 стр.
Доклад февраль Подготовка материалов по описанию базы данных проекта с использованием anova
38.33kb.
1 стр.
Лекция №1 по дисциплине «Базы данных» базы данных и системы управления базами данных план лекции
219.44kb.
1 стр.
Исследование архитектуры базы данных Oracle Архитектура базы данных Oracle Взаимодействие с базой данных Oracle
107.74kb.
1 стр.
Дисциплина. «Базы данных и субд»
127.3kb.
1 стр.
Сша-кнр: соперничество в юго-восточной азии обостряется я. В. Лексютина — Кандидат политических наук, доцент спбГУ. Ключевые слова
260.16kb.
1 стр.