Главная Страница > Инструм.среда |
Используется модель внешнего мира, который
квантуется на объекты и отношения между ними. При этом допускается интеграция
объектов – построение из простых объектов более сложных .
Например, ножки, сиденье и спинка ,
связанные определенными пространственными отношениями, образуют более сложный
объект – стул.
Возможны более высокие уровни интеграции – комнаты (
их части – пол, стены, потолки, мебель), дома (их части – комнаты, коридоры,
крыша), улицы и т.д.. Все это легко выражается на ЕЯ и должно быть представлено
в знаниях – на языке РСС. Обратный
процесс – детализация . Из каждого объекта
можно выделить его части, связанные определенными отношениями.
Обычные семантические сети состоят из вершин (они
соответствуют объектам) и связывающих их дуг; которые соответствуют отношениям.
Например, «Иван отец Петра»
представляется в виде :
Такое представление
не является точным и обладает ограниченными возможностями. Поэтому будем
различать:
-
отец , Иван, Петр,… - слова русского языка (имена,
отношения , концепты);
-
ИВАН1, ИВАН2,… ПЕТР1… - конкретные объекты, в
данном случае модели с именами Иван, Петр (их в БЗ может быть много и с одними и теми же именами).
Такое
различие необходимо для более точного представления информации. Далее вместо
дуги введем специальную вершину связи. Будем использовать элементарные
фрагменты (ЭФ) следующего вида:
На
рис.3 представлено, что ИВАН1 отец ПЕТР1. Цифра
1,2 указывают, что ИВАН1 – это первый объект
отношений, а ПЕТР1 – 2-й. Если поменять их местами ,
то уже будет ПЕТР1 отец ИВАН1.
При этом вершина – отношение (ОТЕЦ) выделена как самостоятельная. Она тоже
может быть связана отношением. Далее,
выделена комплексная вершина G1 , которая
соответствует объектам ИВАН1, ПЕТР1 с их отношением.
Все это образует часть семьи – более сложному объекту
, которому сопоставлена вершина G1.
В языке ДЕКЛ такой ЭФ записывается в виде:
ОТЕЦ(ИВАН!,ПЕТР/G1)
Будем
называть такую форму - записью в предикатном виде. Хотя отметим: что благодаря
комплексным вершинам РСС по своим логическим возможностям далеко выходит за
рамки логики предикатов 1-го и 2-го порядков.
Если вершина-отношение (ОТЕЦ) и комплексная вершина (G1) не связаны с какими-либо другими вершинами (не входят
в другие ЭФ в качестве вершин-объектов), то будем использовать более простую
запись ЭФ:
Запись
в предикатном виде: ОТЕЦ(ИВАН1,ПЕТР1)
Будем
различать 2 типа вершин.
1.
Вершины,
соответствующие определенным объектам, отношениям, классам объектов
(ИВАН1, ОТЕЦ,…).
2.
Вершины,
соответствующие неопределенным объектам (X1,
X2,…,Xn). Будем называть их
х-вершинами
или вершинами-переменными.
Будем выносить их обозначения за рамки вершин, указывая таким образом, что они
не означены.
ИВАН1 отец
неизвестно кому: ОТЕЦ(ИВАН1,X1)
ИВАН1 и
ПЕТР1 как-то связаны между собой, но неизвестно, каким отношением: X2(ИВАН1.ПЕТР1).
В дальнейшем будем понимать отношение
– в широком смысле и допускать множество объектов
отношений (более двух). В этом случае ЭФ в общем виде будет выглядеть следующим
образом:
Здесь
представлено n-арное
отношение R1 между объектами А1,А2,…,АN, которые образуют комплексный объект G2. Такой ЭФ записывается в
предикатном виде:
R1(A1,A2,…,AN/G2).
2. Представление
информации
2.1.
Представление отношений
Построение любой интеллектуальной
системы требует анализа предметной области – какие объекты
являются важными или значимыми и какими отношениями они связаны. Другими словами, требуется
выбор базиса объектов и отношений
Набор типовых отношений:
- родственные
(отец, брат,…);
- отношения: род – вид (SUB);
- часть – целое (S, Ч-Ц);
- временные отношения (вначале, затем, …);
- пространственные отношения
(слева, внутри, …);
- действия (люди или предметы,
участвующие в каком-либо действии, связаны между собой или находятся в
определенных отношениях, где их роли оцениваются характером действия).
Будем различать отношения:
-
бинарные (2 объекта отношения);
-
унарные (1 объект отношения, свойства);
-
N-арные (N объектов отношения или действия).
Примеры
таких отношений:
Будем
различать бинарные отношения:
-
быть отцом (или просто – отец);
-
иметь отца (здесь объекты – люди в других ролях, что будем
обозначать И-ОТЕЦ).
Пример
N-арного отношения:
“А1 взял А3 у А2”.
ВЗЯТЬ(А1,А2,А3).
В левой части указаны роли объектов или
актанты (их около 20). Мы им будем ставить в соответствие цифры –
позиции в предикатной записи. Для каждого действия такие позиции будут строго
определенными. При этом будем различать обязательные объекты действия ( для ВЗЯТЬ это КТО, У КОГО, ЧТО) и факультативные (время,
место действия, орудие и т.д.). Последние будут связываться с действиями через
комплексные вершины.
2.2. Родовидовые деревья
Родовидовые деревья являются основой
наших знаний, костяком, на котором строятся каталоги, толковые словари понятий
и др. Рассмотрим пример их представления на РСС.
На РСС рис. 4 представлено, что человек
- это мужчины и женщины. Класс женщин поделён на два подкласса ЖЕН1 (которые ЗАМУЖЕМ) и ЖЕН2 (каждая из них - НЕЗАМУЖНЯЯ). На
нижнем уровне находятся вершины, представляющие конкретных людей. У каждой
такой вершины могут быть свои связи, представляющие свойства, отношения.
Свойства (отношения) могут быть и у вершин – классов. Они справедливы для всех
элементов класса.
Например, МАША2
относится к подклассу ЖЕН1 со свойством ЗАМУЖЕМ. Это означает, что она тоже
обладает этим свойством.
РСС рис. 4 записывается в предикатном
виде следующим образом:
SUB(ЧЕЛОВЕК,МУЖЧИНЫ)
SUB(ЧЕЛОВЕК,ЖЕНЩИНЫ)
SUB(ЖЕНЩИНЫ,ЖЕН1)
ЗАМУЖЕМ(ЖЕН1)
SUB(ЖЕН1,МАША2)
…
Последовательность предикатов не
играет роли. Как и на схеме, рис. 4 расположение фрагментов тоже не играет
роли. Всё определяется цифрами, указывающими на аргументные
места. К такой РСС можно добавлять любые фрагменты или
удалять их. РСС с синтаксической точки зрения остаётся правильной (хотя может
представлять заведомо ложную иерархию: что системе даётся на входе, то она и
представляет в БЗ). Единственное ограничение – ветви типа SUB должны образовывать дерево (не должно быть циклов). Это
необходимо из следующих принципов.
Наследование свойств: свойства
каждой вершины более высокого уровня справедливы для всех её вершин более
низкого уровня.
Этот принцип позволяет значительно
сократить объём знаний, используя свойства (отношения) классов объектов и
автоматически перенося их на конкретные объекты.
2.3. Родственные отношения
Базис
объектов:
-
люди,
-
класс людей (мужчины, женщины).
Базис отношений:
-
имя, отчество,
фамилия (ФАМ),…
-
отец, сын, тёща,…
Пример родственных отношений:
«Петров Пётр отец Петрова Ивана, который муж Тани».
Это утверждение представляется с помощью РСС следующего
вида:
Вершина А1 соответствует Петрову
Петру, А2 – Петрову Ивану, А3
- Тане. Их имена и фамилии указаны с помощью ЭФ. Они позволяют
представлять информацию в точном (расширенном) виде. Такая информация должна
быть в БЗ. В частности, на рис. 5 представлено, что мужчины А1 и А2 имеют одну и ту же фамилию – Петров. Для
объекта А3 фамилия не указана. Информация на входе была не полной.
Запись
сети рис. 5 в предикатном виде:
ИМЯ(ПЕТР,А1)
ФАМ(ПЕТРОВ,А1)
ОТЕЦ(А1,А2)
…
2.4.
Представление запросов
Для представления вопросительных местоимений
кто, что, где, … будем использовать унарный фрагмент:
или
?(Х1)
Это означает, что нужно определить, какой
объект должен стоять на месте Х1. Другими словами,
необходимо определить вершину –
переменную Х1.
Приведём два примера:
1.
«Кто муж Тани?»
представляется в виде:
Здесь Х1
соответствует объекту по имени Таня, а Х2 – её мужу. На основе знаний в БЗ
нужно определить, кто является мужем: определить вершину Х2.
2.
«Как зовут отца
Ивана?» представляется в виде:
Здесь нужно определить Х3, т. е. определить имя
человека Х1, который является отцом Х2 с именем
Иван. Определение Х3 требует предварительного определения Х1 и Х2. Процесс носит последовательный характер.
2.5. Представление отношений между отношениями
Примером может быть: «отец и муж –
родственные отношения (РО)». Рассмотрим РСС, в которой представлены такие
отношения (как добавление к сети рис. 5).
Запись в предикатном виде:
SUB(РО,ОТЕЦ)
SUB(РО,МУЖ)
ОТЕЦ(А1,А2)
…
Если связей SUB нет, то ОТЕЦ и МУЖ могут быть записаны
внутри квадратов.
2.6. Комплексные объекты
ИВАН1 муж ТАНЯ1 – дружная семья.
В данной РСС отношению МУЖ между объектами
ИВАН1 и ТАНЯ1 сопоставлена комплексная вершина G1, которая представляет дружную семью.
Запись в предикатном виде:
МУЖ(ИВАН1,ТАНЯ1/G1) SUB(СЕМЬЯ,G1) ДРУЖНЫЙ(G1)
3. Толковые
словари понятий
Толковые словари дают общие знания о внешнем
мире. Их информация должна быть в БЗ интеллектуальной системы, задачей которой
является ответы на вопросы о фактах. Многие статьи толковых словарей, дающие
определение понятий, имеют одинаковую структуру: указывают на его
принадлежность к более общему понятию и на уникальные свойства исходного
понятия. Такие определения легко представляются на РСС. Рассмотрим примеры двух
статей:
1.
«Клюква –
красная, кислая ягода, которая растёт на болоте».
2.
«Болото –
местность, где много воды».
Такие определения представляются на РСС в
следующем виде:
Предикатная запись:
SUB(ЯГОДА,КЛЮКВА)
РАСТИ_НА(КЛЮКВА,Х1)
SUB(БОЛОТО,Х1)
SUB(КЛЮКВА,КЛЮКВА1)
…
На рис. 6 представлено, что клюква
относится к классу ЯГОДА и обладает свойствами КРАСНЫЙ и КИСЛЫЙ. К
этому классу относятся конкретные объекты КЛЮКВА1,
КЛЮКВА2, …, представленные в БЗ (например, это может быть клюква, которую Вы
купили на рынке, или собрали где-то). Эти объекты также обладают свойствами
КРАСНЫЙ, КИСЛЫЙ (наследование свойств). С помощью ЭФ РАСТИ_НА(КЛЮКВА,Х1),
SUB(БОЛОТО,Х1) представлено, что каждая клюква растёт на
некотором (неважно на каком) болоте. Аналогично с помощью
вершины – переменной Х2 представляется, что всякое
болото содержит некоторую воду, которой много. И тоже представляется
конкретные БОЛОТО1, …, обладающие этим же свойством.
Конечно, не все статьи толковых словарей
могут быть представлены в БЗ. Достаточно много статей требуют обобщающих механизмов
для их осмысления, что доступно только человеку. Например, «Каждый – и тот,
и другой, и третий». Представлять такие высказывания на РСС нет никакого
смысла.
4. Структура комплексных объектов.
Типовой вопросо-ответной
системой является информационно-справочная система, дающая фактические сведения
о структуре организаций.
Рассмотрим на примере МТУСИ, как такая
информация может быть представлена в БЗ – на РСС.
Базис отношений:
-
быть факультетом (ФАК);
-
быть группой (ГР);
-
быть студентом (СТУД);
-
быть деканом (ДЕК);
-
быть бухгалтером (БУХ).
Предикатная запись:
ФАК(АЭС,МТУСИ)
ГР(А593,АЭС)
СТУД(51)
ФАМ(ИВАНОВ,51)
…
На рис. 4 был использован один из возможных
базисов отношений. Возможны и другие варианты. Например, «быть факультетом
МТУСИ» можно расшифровать: «относиться к классу (SUB) факультетов и быть
частью (ЧЦ) МТУСИ», что можно представить в виде:
В РСС рис. 7 можно выделить уровни:
институт – факультеты – группы – студенты.
Аналогичным образом представляется информация в других
областях приложений. Например:
Библиотека:
комнаты – полки – книги – Авторы (содержания).
Метрополитен:
линии – станции – переходы.
Классификаторы:
рыбы – виды – подвиды – особенности.
Завод:
цеха - производимая продукция – где
используется, особенности.
5. Представление видеообразов
РСС могут быть
использованы для представления видеообразов –
картинок. Рассмотрим простой пример.
Базис отношений.
1)
Находится:
-
непосредственно
слева – направо (ЛП);
-
непосредственно
сверху – вниз (СВН);
-
внутри (ВНУТРИ);
-
слева, справа,
рядом.
2)
Классы объектов:
– треугольники, квадраты, кружки, …
3)
Конкретные
объекты (ТРЕУГ1,
ТРЕУР2, …, КВ1, КВ2,…).
4)
Свойства объектов (большой, маленький, … ).
Картинка, которую нужно представить в базе
знаний:
РСС, которая
представляет данную картинку, имеет вид:
На рис. 8 ТРЕУГ2
находится внутри кружка в правой нижней части картинки, а ТРЕУГ2 –
сверху квадрата, что представлено с помощью пространственных отношений:
SUB(ПРЕДМЕТЫ,ТРЕУГОЛЬНИКИ)
SUB(ТРЕУГОЛЬНИКИ,ТРЕУГ2)
МАЛЕНЬКИЙ(ТРЕУГ2)
ВНУТРИ(ТРЕУГ2,КРУГ1)
SUB(ТРЕУГОЛЬНИКИ,ТРЕУГ1)
БОЛЬШОЙ(ТРЕУГ1)
СВН(ТРЕУГ1,КВ1)
…
Для более точного представления картинок
нужно вводить расстояния, размеры и др. Будут другие отношения типа: «находится
слева – направо на указанном расстоянии», «находится под указанным
углом» и т. д., что представляется с помощью тернарных ЭФ (с тремя аргументными местами).
6. Сопоставления по образцу
Это основная операция
при реализации многих интеллектуальных функций. Её суть в следующем: имеется
запрос – фрагмент с вершиной – переменной Х1.
Сопоставление – это поиск аналогичных фрагментов в БЗ, где на месте вершины Х1 может стоять что угодно. В результате вершина Х1 означивается.
Оба фрагмента БЗ оказываются
аналогичными (сопоставимыми) фрагменту запроса, так как все их определённые
вершины совпадают и находятся на тех же аргументных
местах – к ним идут дуги с теми же цифрами. В результате вершина Х1 запроса будет означена вершинами А1 и А2 из БЗ, что
записывается: Х1={В1,В2}.
Пример 1. Запрос: «Кто друг Ивана?»
В результате сопоставления аргументов ИМЯ(ИВАН,Х1) и ИМЯ(ИВАН,ИВАН1) вершина Х1 будет означена
Х1=ИВАН1. Далее оказывается сопоставимыми фрагменты ДРУГ(…,ИВАН1),
что приведёт к означиванию Х2={ПЁТР1,ТАНЯ1}. Это и есть ответ на вопрос.
Пример 2.
«Кто отец друга Ивана?»
Как и в предыдущем примере будут означены Х1=ИВАН1, Х2={Пётр1,ТАНЯ1}. Далее последние вершины
последовательно ставятся на место Х2. Для фрагмента
ОТЕЦ(Х3,ПЁТР1) нет сопоставимого фрагмента в БЗ, а для
ОТЕЦ(Х3,ТАНЯ1) – имеется ОТЕЦ(ПЁТР1,ТАНЯ1). В результате Х3=ПЁТР1. Это и есть ответ на запрос.
Означиваться могут
не только отдельные переменные, но и пары (тройки:,…) переменных.
Например, на основе ДРУГ(X2,X1) может означиваться (X2,X1)=(ИВАН1,ПЕТР1) и т.д. В плане
уменьшения переборов очень важна последовательность означиваний, см. Часть2.
РСС нашли широкое применение
для представления семантической информации, содержащихся в текстах на ЕЯ (системы
"Криминал", ДИЕС, ИКС, "Аналитик" и др.). Одно и тоже понятие может называть различные объекты одного
типа, которые нужно различать. Отсюда необходимость в
внутрисистемных кодах. РСС ориентированы на отображение возможности интеграции
множества связанных объектов в один объект, что выражается на
ЕЯ в виде форм с отглагольными существительными. Понятие связи рассматривается
в широком смысле. Это могут быть не только отношения, но и зависимости.
Связанными считаются также объекты, участвующие в одном действии. Группа
связанных объектов может быть связана с другой группой, что на
ЕЯ выражается в виде глагольных форм с отглагольными существительными.
(Из монографии Кузнецова
И.П., Мацкевича А.Г. Семантико-ориентированные
системы на основе баз знаний.
Связьиздат
м, 2007 г.)