Главная
страница 1страница 2страница 3страница 4

Использование тернарных таблиц.


Особое значение приобретает «теорема о шунтировании ДЗ» [5] в изложении Д.М.Кренке: «строка любого отношения должна отражать все необходимые данные, описывающие конкретный экземпляр темы, описываемой данным отношением» [2]. Для ДЗ это означает, что если отсутствуют непустые атрибуты связи, то нет возможности определить тему. Именно в этом – суть аномалии такого неактуального (нешунтированного) отношения по Д.М.Кренке. Именно поэтому такое отношение должно быть декомпозировано, т.е. по сути, преобразовано к нескольким актуальным.

В исследованиях некоторых авторов уже встречались отношения, моделирующие связи степени F:H, построенные на принципе шунтирования МЗ. Так, в [17] приведено отношение-связь ЗАЧЕТЫ = СЕМЕСТР+КУРС+СТУДЕНТ (Табл. 4).


Таблица 4. ЗАЧЕТЫ

КодСеместр

НомКурса

КодСтуд

Зачеты

01

ВТ608

967831201

4

01

ВТ608

897645123

2

01

ВТ62Э

967831201

3

01

ОФ500

967831201

4

02

ВТ601

123456789

3

02

ВТ601

897645123

2

02

ВТ605

123456789

2

02

ВТ623

967831201

3

02

ОФ500

897645123

3

Автор поясняет, что «с помощью отношения ЗАЧЕТЫ устанавливается связь между отношениями СЕМЕСТР, КУРС и СТУДЕНТ. Первичный ключ отношения составлен из атрибутов КодСеместр, НомКурса и КодСтуд. Неключевой атрибут один – Зачеты. В течение одного семестра преподается несколько курсов. Каждый курс изучает несколько студентов. С другой стороны, в течение данного семестра каждый студент может изучать несколько курсов. Эта таблица позволяет реализовать взаимосвязь «многие ко многим» между семестрами, курсами и студентами» [17].

В дальнейших работах этого автора мысль о том, что приведенная таблица не имеет ни МЗ, ни ЗПС, и потому не может быть подвергнута декомпозиции, не приведена.

В работе [18] ее автор также указывает на существование возможности в рамках РМД использования отношения с единственной ФЗ между «многозначной» конкатенацией совокупности атрибутов-ключей и неключевми атрибутами. Однако там делается ложный вывод о том, что такие отношения можно отнести к категории «денормализованных». Поэтому в дальнейших исследованиях этого автора принцип шунтирования МЗ и ЗПС не развивается. И соответствующая совокупность отношений не исследуется. «…Согласно теореме Р. Фейджина [8] таблицу R с тремя множествами атрибутов (A,B,C) и многозначной зависимостью можно декомпозировать на две таблицы (A,B) и (А,С). Но если в таблице R есть четвертое множество атрибутов D и функциональная зависимость (A,B,C)D, то выполнить декомпозицию таблицы R нельзя. А это в свою очередь, означает, что при использовании классического метода могут быть таблицы в БКНФ, но не в 4НФ, о которых известно, что они подвержены аномалиям модификации данных, но ничего с ними сделать нельзя. В качестве конкретного примера такой таблицы можно взять таблицу РУБАШКА с атрибутами: модель, цвет, размер, количество».

Однако совпадения схем отношений подтверждают наличие потребности у проектировщика использовать многоарное отношение как модель многосторонней связи степени F:H:…:Z. Этот же тип отношений был использован и в работе [19].

CASE-генерация метаданных - системы «МикроПоиск» и SWS.


Разработчики двух разных инструментальных программных систем - CASE «МикроПоиск» [19,20,21] и CASE-генератора SWS [22,23] обнаружили в РМД возможность реализации двух разных, однако взаимодополняющих подходов к проектированию приложений БД. Это – механизм семантических графовых запросов к частично оптимизированной схеме БД (не выше БКНФ, а то и 3НФ), и механизм типизации большинства запросов, унификации основных алгоритмов, с ними связанных, и «упрятывания» этих алгоритмов в оптимальную схему БД (на основе ДКНФ).

Поскольку оба эти подхода были хорошо формально обоснованы, хорошо тестированы, широко внедрены и претендуют на некоторую универсальность, они в некотором смысле конкурируют между собой. Однако максимальную эффективность пользователь получает именно при объединении этих подходов.

Основной критерий применимости подходов – это коэффициент прогнозирования развития ПрО и разнообразия запросов пользователей. Под таким коэффициентом понимается отношение числа подтвержденных изменений к суммарному числу прогнозированных и спонтанных изменений за определенный период времени, например, год. Очевидно, что в такой формулировке число подтвержденных изменений не может превышать числа прогнозируемых.

Показательно, что удовлетворительной для второго подхода является ПрО с коэффициентом, равным единице, т.е. те ПрО, которые можно глубоко изучить и развить, прогнозировать, моделировать с помощью оптимизированной РМД. И приложения, моделирующие процессы ПрО, могут иметь минимальный интерфейс для непродвинутого пользователя, позволяющий минимизировать (или практически исключить) использование механизма внешних запросов к БД. К таким ПрО можно отнести всевозможные бизнес-приложения компаний и корпораций, которые развиваются в соответствии с прогнозируемыми рыночными факторами.

Но для синтеза ДКНФ-схем необходимо исключить все замаскированные составные сущности-объекты. Однако в действительности это может быть не всегда реализуемо. Это означает, что в реальной схеме БД возможны участки не выше 3НФ. Компромисс между оптимальными и низко-нормализованными схемами (до 3НФ) достигается путем использования на таких участках механизма семантических графовых запросов.

Что же касается ПрО с малым коэффициентом прогнозирования развития ПрО и разнообразия запросов пользователей, как, например, поисковые машины в Интернет, всевозможные социальные сети, Интернет-витрины данных, схемы БД которых зависят не от реальных причинно-следственных связей ПрО и их собственников, а от хаотически обращающихся пользователей, запросы эффективно моделируются гибкими языковыми конструкциями. В приложениях для таких ПрО бесспорно преимущество механизма семантических графовых запросов. Эту проблему решает CASE-система «МикроПоиск» [19,20,21].

Особенность "МикроПоиска" состоит в применении SQL- и подобного языка запросов, ориентированного на ER-модель данных П.Чена [1]; интенсионал (схема БД) представляется графом, вершинам которого соответствуют классы объектов (сущностей), а ребрам – классы бинарных связей между объектами. Элементарные атрибуты объектов соответствуют основным типам данных. Допускаются атрибуты, содержащие тексты произвольной длины (целые документы). Поименованная совокупность элементарных атрибутов может составлять повторяющуюся группу. Через аппарат повторяющихся групп реализована зависимость по существованию.

«Связи имеют тип: 1:1, 1:H, F:H. Обычная операция над связями - переход по связи от множества экземпляров одного класса объектов; результат - множество соответствующих экземпляров другого класса связанных объектов (переход разрешен в обоих направлениях). В случае связи между однотипными объектами, направление уточняется с помощью роли. Например, чтобы получить список подчиненных сотрудника нужно перейти по связи СУБОРДИНАЦИЯ с указанием роли ПОДЧИНЕННЫЙ, а чтобы получить его начальника - по той же связи с указанием роли НАЧАЛЬНИК» [21].

Иное решение предоставляет каркасная модель. Каркас является частным случаем РМД. Причем, как показано выше, одним из важных свойств реляционного каркаса является возможность минимизировать объем запросов к БД, построенных на громоздких и вычислительно сложных операциях соединения.

Как показывают исследования, проведенные на значительном числе внедренных приложений, БД, схема которой построена на каркасе, моделирует до 90% запросов без операции соединения и ее модификаций. Это позволяет значительную часть данных обрабатывать по заранее сформированным индексным таблицам. А также подавляющее большинство запросов пользователей формализовать, унифицировать и интегрировать в приложении. Такой подход позволяет построить универсальную перенастраиваемую оболочку, управляемую группой метаданных. А массивы метаданных, отражающие ту или иную специфику ПрО, синтезировать с помощью программной оболочки по тем же высоко-нормализованным гибким схемам БД.

Длительные исследования ПрО автоматизации проектирования приложений показывают, что список основных операций реляционной алгебры, которые необходимо использовать, существенно сокращается. Сокращается также и группа операций по отслеживанию целостности БД. Это происходит потому, что основным инструментом манипулирования данными является индексный поиск и операция селекции данных.

Еще одной особенностью схемы БД, полученной с помощью каркасного анализа, является возможность моделирования связи любой кратности между сущностями-объектами со степенью F:H. Эта максимально возможная степень связи лежит, по сути, в основе анализа любой совокупности связей для любой ПрО - связи с меньшей степенью моделируются как частный случай.

При проектировании и инструментального средства, и приложений, была использована единая схема каждого отношения – схема, построенная на конкатенации (строковой сумме) унарных ключевых атрибутов типа A+B+C+D …+Z… . Известно, что для такой конструкции может быть построены элементарные индексные деревья. Именно такой механизм проектирования может быть унифицирован вплоть до стандартизации.

Таким образом, CASE-оболочка генерации метаданных SWS (от английских Server Workstation System) [22,23] - это не что иное, как генератор отношений, в каждом из которых унифицированным способом хранятся метаданные конкретной ПрО – имена отношений, имена полей, группы индексных заголовков, иные специализированные данные.

Принципиально важным признаком каркасной группы отношений является иерархическая связь кортежа из верхнего отношения с пачкой кортежей нижнего отношения. Причем, эта связь осуществляется по индексированному общему ключевому атрибуту. По сути, именно к такому атомарному сочетанию сводится вся совокупность отношений. Именно к такой паре «отношение-отношение» в конечном итоге сводится любой фрагмент ПрО. Дальнейшая унификация каскадных процедур уже не является сложным процессом.

Хотя описанные инструментальные средства имеют некоторые отличия, они сходны в одном – обе системы решают задачу автоматизации не только проектирования приложений БД, но и программирования их. Причем решают сходным способом.

Исследование закономерностей семантического ER-проектирования схем БД для разных ПрО, а также обобщение и унификация многообразия запросов пользователей позволило отказаться от подхода автоматизированного синтеза исходные текстов программ. И реализовать предложенный еще академиком В.М. Глушковым тезис «программирование без программистов», когда готовое работающее приложение БД непосредственно формируется инструментальной оболочкой, управляемой метаданными пользователя. Такой подход является крайне актуальным в связи с появлением распределенных вычислительных систем сверхмалых архитектур.

Основные совпадения с современными тенденциями в БД


<< предыдущая страница   следующая страница >>
Смотрите также:
Исследования дОменно-ключевой схемы реляционной базы данных Ключевые слова
432.17kb.
4 стр.
Курсовая работа Дисциплина Информационные системы и технологии
236.07kb.
1 стр.
Практические занятия к теме №3 задача 1 Задание Создание базы данных
83.93kb.
1 стр.
Материал из Semantic Future
425.22kb.
2 стр.
Темы дипломных проектов специальности 230105 Базы данных
122.96kb.
1 стр.
Отчет по результатам работы по программе усовершенствования базы данных по сортам растений и изложить предложения по усовершенствованию базы данных по сортам растений
712.53kb.
4 стр.
Лермонтов в тюркоязычном мире (к вопросу о диалоге литератур) Ключевые слова
179.47kb.
1 стр.
Доклад февраль Подготовка материалов по описанию базы данных проекта с использованием anova
38.33kb.
1 стр.
Лекция №1 по дисциплине «Базы данных» базы данных и системы управления базами данных план лекции
219.44kb.
1 стр.
Исследование архитектуры базы данных Oracle Архитектура базы данных Oracle Взаимодействие с базой данных Oracle
107.74kb.
1 стр.
Дисциплина. «Базы данных и субд»
127.3kb.
1 стр.
Сша-кнр: соперничество в юго-восточной азии обостряется я. В. Лексютина — Кандидат политических наук, доцент спбГУ. Ключевые слова
260.16kb.
1 стр.