15.3. Общая архитектура системы и ее внутреннее устройство
Поскольку обычный пользователь системы не обязан знать, как она устроена, данный раздел главы мы адресуем прежде всего тем людям, которым интересны технология построения и программирование баз данных.
С формальной точки зрения наша система представляет собой совокупность связанных друг с другом таблиц (их число на сегодняшний день — более 25). Каждая из таблиц имеет свою структуру и наполнение. Чтобы описать внутреннее устройство базы данных, следует, таким образом, охарактеризовать все таблицы по отдельности и эксплицитно указать связи между ними.
Чтобы не усложнять техническими деталями описание системы в целом, мы приведем здесь только основные таблицы, которые демонстрируют центральные элементы архитектуры системы, и раскроем некоторые важные связи между этими таблицами.
15.3.1. Внутреннее устройство таблиц
Среди основных таблиц есть та, в которой хранятся имена телесных объектов, причем не все возможные, а только стандартные, типовые. Другими словами, в этой таблице есть, например, слово голова (часть тела), но нет его словообразовательных производных, то есть слов головушка, головка и др. Имеется таблица, в которой хранятся имена признаков соматических объектов. Есть таблицы с информацией о наиболее частотных значениях каждого из признаков и о семантически и культурно выделенных значениях тех же признаков. Среди других таблиц системы отметим ту, в которой указаны возможные признаки обладателей соматических объектов.
Входом в каждую таблицу является кортеж, то есть упорядоченная последовательность, из нескольких элементов. Обязательными элементами каждого такого кортежа являются имя таблицы и идентификатор. Формально говоря, идентификатор — это множество, состоящее из трехэлементных кортежей (троек). В тройку входит порядковый номер элемента таблицы (это первый элемент кортежа), имя некоторой языковой или жестовой единицы, которая содержательно характеризует данную тройку (второй элемент кортежа), и название таблицы (третий элемент кортежа).
Пусть таблица имеет заголовок «имя соматического объекта». Ее идентификатором является множество троек следующего вида: <1, голова, имя соматического объекта>, <2,