Главная Страница > Инструм.среда

          Расширенные семантические сети

          

            1. Элементарные фрагменты

 

            Используется  модель внешнего мира, который квантуется на объекты и отношения между ними. При этом допускается интеграция объектов – построение из простых объектов более сложных .

Например, ножки, сиденье и спинка , связанные определенными пространственными отношениями, образуют более сложный объект – стул.

Возможны более  высокие уровни интеграции – комнаты ( их части – пол, стены, потолки, мебель), дома (их части – комнаты, коридоры, крыша), улицы и т.д.. Все это легко выражается на ЕЯ и должно быть представлено в знаниях – на языке РСС. Обратный процесс – детализация . Из каждого объекта можно выделить его части, связанные определенными отношениями.

 

Обычные семантические сети состоят из вершин (они соответствуют объектам) и связывающих их дуг; которые соответствуют отношениям. Например, «Иван  отец Петра» представляется в виде :

 

                        

 

Такое представление  не является точным и обладает ограниченными возможностями. Поэтому будем различать: 

-          отец , Иван, Петр,… - слова русского языка (имена, отношения , концепты);

-          ИВАН1, ИВАН2,… ПЕТР1… - конкретные объекты, в данном случае модели с именами Иван, Петр (их в БЗ может быть много и с  одними и  теми же именами).

Такое различие необходимо для более точного представления информации. Далее вместо дуги введем специальную вершину связи. Будем использовать элементарные фрагменты (ЭФ) следующего вида:

 

 

             

 

На рис.3 представлено, что ИВАН1 отец ПЕТР1. Цифра 1,2 указывают, что ИВАН1 – это первый объект отношений, а ПЕТР1 – 2-й. Если поменять их местами , то уже  будет ПЕТР1 отец ИВАН1. При этом вершина – отношение (ОТЕЦ) выделена как самостоятельная. Она тоже может быть связана отношением.  Далее, выделена комплексная вершина G1 , которая соответствует объектам ИВАН1, ПЕТР1 с их отношением. Все это образует часть семьи – более сложному объекту , которому сопоставлена вершина G1. В языке ДЕКЛ такой ЭФ записывается в виде:

  

            ОТЕЦ(ИВАН!,ПЕТР/G1)

 

Будем называть такую форму - записью в предикатном виде. Хотя отметим: что благодаря комплексным вершинам РСС по своим логическим возможностям далеко выходит за рамки логики предикатов 1-го и 2-го порядков.

           Если вершина-отношение (ОТЕЦ)  и комплексная вершина (G1) не связаны с какими-либо другими вершинами (не входят в другие ЭФ в качестве вершин-объектов), то будем использовать более простую запись ЭФ:                

 

 

 

 

 

Запись в предикатном виде: ОТЕЦ(ИВАН1,ПЕТР1)

 

Будем различать 2 типа вершин.

1.      Вершины, соответствующие определенным объектам, отношениям, классам объектов (ИВАН1, ОТЕЦ,…).

2.      Вершины, соответствующие неопределенным объектам (X1, X2,…,Xn). Будем называть их

 х-вершинами или  вершинами-переменными. Будем выносить их обозначения за рамки вершин, указывая таким образом, что они не означены.

 

                                          

 

 

 

      

      ИВАН1 отец неизвестно кому: ОТЕЦ(ИВАН1,X1)

 

 

 

 

 

 

     

      

   

        ИВАН1 и ПЕТР1 как-то связаны между собой, но неизвестно, каким отношением: X2(ИВАН1.ПЕТР1).

 

         В дальнейшем будем понимать отношение – в широком смысле и допускать множество объектов отношений (более двух). В этом случае ЭФ в общем виде будет выглядеть следующим образом:

 

                              

 

Здесь представлено n-арное отношение R1 между объектами  А1,А2,…,АN, которые образуют комплексный объект G2. Такой ЭФ записывается в предикатном виде:

                                    R1(A1,A2,…,AN/G2).

 

 

 

         2. Представление информации

        

         2.1. Представление отношений

 

            Построение любой интеллектуальной системы требует анализа предметной области – какие объекты являются важными или значимыми и  какими отношениями они связаны. Другими словами, требуется выбор базиса объектов и отношений

 

Набор типовых отношений:

- родственные (отец, брат,…);

- отношения: род – вид (SUB);

- часть – целое (S, Ч-Ц);

- временные отношения (вначале, затем, …);

- пространственные отношения (слева, внутри, …);

- действия (люди или предметы, участвующие в каком-либо действии, связаны между собой или находятся в определенных отношениях, где их роли оцениваются характером действия).

 

     Будем различать отношения:

-          бинарные (2 объекта отношения);

-          унарные (1 объект отношения, свойства);

-          N-арные (N объектов отношения или действия).

 

Примеры таких отношений:

 

 

 

Будем различать бинарные отношения:

      -    быть отцом (или просто – отец);

-          иметь отца (здесь объекты – люди в других ролях, что будем обозначать И-ОТЕЦ).

 

Пример N-арного отношения:

                    

 

А1 взял А3 у А2”.

ВЗЯТЬ(А1,А2,А3).

 

        В левой части указаны роли объектов или актанты (их около 20). Мы им будем ставить в соответствие цифры – позиции в предикатной записи. Для каждого действия такие позиции будут строго определенными. При этом будем различать обязательные объекты действия ( для ВЗЯТЬ это КТО, У КОГО, ЧТО) и факультативные (время, место действия, орудие и т.д.). Последние будут связываться с действиями через комплексные вершины.

 

       2.2. Родовидовые деревья

  

        Родовидовые деревья являются основой наших знаний, костяком, на котором строятся каталоги, толковые словари понятий и др. Рассмотрим пример их представления на РСС.

 

 

         На РСС рис. 4 представлено, что человек - это мужчины и женщины. Класс женщин поделён на два подкласса ЖЕН1 (которые ЗАМУЖЕМ) и ЖЕН2 (каждая из них - НЕЗАМУЖНЯЯ). На нижнем уровне находятся вершины, представляющие конкретных людей. У каждой такой вершины могут быть свои связи, представляющие свойства, отношения. Свойства (отношения) могут быть и у вершин – классов. Они справедливы для всех элементов класса.

           Например, МАША2 относится к подклассу ЖЕН1 со свойством ЗАМУЖЕМ. Это означает, что она тоже обладает этим свойством.

          РСС рис. 4 записывается в предикатном виде следующим образом:

SUB(ЧЕЛОВЕК,МУЖЧИНЫ)

SUB(ЧЕЛОВЕК,ЖЕНЩИНЫ)

SUB(ЖЕНЩИНЫ,ЖЕН1)

ЗАМУЖЕМ(ЖЕН1)

SUB(ЖЕН1,МАША2)

         Последовательность предикатов не играет роли. Как и на схеме, рис. 4 расположение фрагментов тоже не играет роли. Всё определяется цифрами, указывающими на аргументные места. К такой РСС можно добавлять любые фрагменты или удалять их. РСС с синтаксической точки зрения остаётся правильной (хотя может представлять заведомо ложную иерархию: что системе даётся на входе, то она и представляет в БЗ). Единственное ограничение – ветви типа SUB должны образовывать дерево (не должно быть циклов). Это необходимо из следующих принципов.

         Наследование свойств: свойства каждой вершины более высокого уровня справедливы для всех её вершин более низкого уровня.

         Этот принцип позволяет значительно сократить объём знаний, используя свойства (отношения) классов объектов и автоматически перенося их на конкретные объекты.

        2.3. Родственные отношения

  

   Базис объектов:

-          люди,

-          класс людей (мужчины, женщины).

Базис отношений:

-          имя, отчество, фамилия (ФАМ),…

-          отец, сын, тёща,…

 

Пример родственных отношений:

«Петров Пётр отец Петрова Ивана, который муж Тани».

Это утверждение представляется с помощью РСС следующего вида:

 

  

Вершина А1 соответствует Петрову Петру, А2 –  Петрову Ивану, А3 - Тане. Их имена и фамилии указаны с помощью ЭФ. Они позволяют представлять информацию в точном (расширенном) виде. Такая информация должна быть в БЗ. В частности, на рис. 5 представлено, что мужчины А1 и А2 имеют одну и ту же фамилию – Петров. Для объекта А3 фамилия не указана. Информация на входе была не полной.

         Запись сети рис. 5 в предикатном виде:

ИМЯ(ПЕТР,А1)

ФАМ(ПЕТРОВ,А1)

ОТЕЦ(А1,А2)

  

      2.4. Представление запросов

 

   Для представления вопросительных местоимений кто, что, где, … будем использовать унарный фрагмент:

     

             

                  или 

                ?(Х1)

 

   Это означает, что нужно определить, какой объект должен стоять на месте Х1. Другими словами, необходимо определить  вершину – переменную Х1.

 

   Приведём два примера:

1.      «Кто муж Тани?» представляется в виде:

 

 

                

 

 

  Здесь Х1 соответствует объекту по имени Таня, а Х2 – её мужу. На основе знаний в БЗ нужно определить, кто является мужем: определить  вершину Х2.

2.      «Как зовут отца Ивана?» представляется в виде:

 

 

 

 

 

   Здесь нужно определить Х3, т. е. определить имя человека Х1, который является отцом Х2 с именем Иван. Определение Х3 требует предварительного определения Х1 и Х2. Процесс носит последовательный характер.

 

  2.5. Представление отношений между отношениями

 

   Примером может быть: «отец и муж – родственные отношения (РО)». Рассмотрим РСС, в которой представлены такие отношения (как добавление к сети рис. 5).

 

 

   Запись в предикатном виде:

   SUB(РО,ОТЕЦ)

   SUB(РО,МУЖ)

   ОТЕЦ(А1,А2)

  

   Если связей SUB нет, то ОТЕЦ и МУЖ могут быть записаны внутри квадратов.

  

  2.6. Комплексные объекты

 

   ИВАН1 муж ТАНЯ1 – дружная семья.

 

 

 

  

  В данной РСС отношению МУЖ между объектами ИВАН1 и ТАНЯ1 сопоставлена комплексная вершина G1, которая представляет дружную семью.

   Запись в предикатном виде:

  

МУЖ(ИВАН1,ТАНЯ1/G1)  SUB(СЕМЬЯ,G1)  ДРУЖНЫЙ(G1)

 

 

  3. Толковые словари понятий

 

   Толковые словари дают общие знания о внешнем мире. Их информация должна быть в БЗ интеллектуальной системы, задачей которой является ответы на вопросы о фактах. Многие статьи толковых словарей, дающие определение понятий, имеют одинаковую структуру: указывают на его принадлежность к более общему понятию и на уникальные свойства исходного понятия. Такие определения легко представляются на РСС. Рассмотрим примеры двух статей:

1.      «Клюква – красная, кислая ягода, которая растёт на болоте».

2.      «Болото – местность, где много воды».

   Такие определения представляются на РСС в следующем виде:

 

 

   Предикатная запись:

   SUB(ЯГОДА,КЛЮКВА)

   РАСТИ_НА(КЛЮКВА,Х1)

   SUB(БОЛОТО,Х1)

   SUB(КЛЮКВА,КЛЮКВА1)

  

   На рис. 6 представлено, что клюква относится к классу ЯГОДА и обладает свойствами КРАСНЫЙ и КИСЛЫЙ. К этому классу относятся конкретные объекты КЛЮКВА1, КЛЮКВА2, …, представленные в БЗ (например, это может быть клюква, которую Вы купили на рынке, или собрали где-то). Эти объекты также обладают свойствами КРАСНЫЙ, КИСЛЫЙ (наследование свойств). С помощью ЭФ РАСТИ_НА(КЛЮКВА,Х1), SUB(БОЛОТО,Х1) представлено, что каждая клюква растёт на некотором (неважно на каком) болоте. Аналогично с помощью вершины – переменной Х2 представляется, что всякое болото содержит некоторую воду, которой много. И тоже представляется конкретные БОЛОТО1, …, обладающие этим же свойством.

   Конечно, не все статьи толковых словарей могут быть представлены в БЗ. Достаточно много статей требуют обобщающих механизмов для их осмысления, что доступно только человеку. Например, «Каждый – и тот, и другой, и третий». Представлять такие высказывания на РСС нет никакого смысла.

 

 

 4. Структура комплексных объектов.

 

   Типовой вопросо-ответной системой является информационно-справочная система, дающая фактические сведения о структуре организаций.

   Рассмотрим на примере МТУСИ, как такая информация может быть представлена в БЗ – на РСС.

   Базис отношений:

-          быть факультетом (ФАК);

-          быть группой (ГР);

-          быть студентом (СТУД);

-          быть деканом (ДЕК);

-          быть бухгалтером (БУХ).

 

 

Предикатная запись:

ФАК(АЭС,МТУСИ)

ГР(А593,АЭС)

СТУД(51)

ФАМ(ИВАНОВ,51)

   На рис. 4 был использован один из возможных базисов отношений. Возможны и другие варианты. Например, «быть факультетом МТУСИ» можно расшифровать: «относиться к классу (SUB) факультетов и быть частью (ЧЦ) МТУСИ», что можно представить в виде:

 

 

          В РСС рис. 7 можно выделить уровни: институт – факультеты – группы – студенты.

Аналогичным образом представляется информация в других областях приложений. Например:

Библиотека: комнаты – полки – книги – Авторы (содержания).

Метрополитен: линии – станции – переходы.

Классификаторы: рыбы – виды – подвиды – особенности.

Завод: цеха  - производимая продукция – где используется, особенности.

 

 

  5. Представление видеообразов

 

   РСС могут быть использованы для представления видеообразов – картинок. Рассмотрим простой пример.

   

  Базис  отношений.

1)      Находится:

-          непосредственно слева – направо (ЛП);

-          непосредственно сверху – вниз (СВН);

-          внутри (ВНУТРИ);

-          слева, справа, рядом.

2)      Классы объектов:

    треугольники, квадраты, кружки, …

3)      Конкретные объекты (ТРЕУГ1, ТРЕУР2, …, КВ1, КВ2,…).

4)      Свойства объектов (большой, маленький, … ).

  Картинка, которую нужно представить в базе знаний:

 

 

 РСС, которая представляет данную картинку, имеет вид:

 

  

   На рис. 8 ТРЕУГ2 находится внутри кружка в правой нижней части картинки, а ТРЕУГ2 – сверху квадрата, что представлено с помощью пространственных отношений:

 

   SUB(ПРЕДМЕТЫ,ТРЕУГОЛЬНИКИ)

   SUB(ТРЕУГОЛЬНИКИ,ТРЕУГ2)

   МАЛЕНЬКИЙ(ТРЕУГ2)

   ВНУТРИ(ТРЕУГ2,КРУГ1)

   SUB(ТРЕУГОЛЬНИКИ,ТРЕУГ1)

   БОЛЬШОЙ(ТРЕУГ1)

   СВН(ТРЕУГ1,КВ1)

  

   Для более точного представления картинок нужно вводить расстояния, размеры и др. Будут другие отношения типа: «находится слева – направо на указанном расстоянии», «находится под указанным углом» и т. д., что представляется с помощью тернарных ЭФ (с тремя аргументными местами).

       

6. Сопоставления по образцу  

 

Это основная операция при реализации многих интеллектуальных функций. Её суть в следующем: имеется запрос – фрагмент с вершиной – переменной Х1. Сопоставление – это поиск аналогичных фрагментов в БЗ, где на месте вершины Х1 может стоять что угодно. В результате вершина Х1 означивается.

 

  

Оба фрагмента БЗ оказываются аналогичными (сопоставимыми) фрагменту запроса, так как все их определённые вершины совпадают и находятся на тех же аргументных местах – к ним идут дуги с теми же цифрами. В результате вершина Х1 запроса будет означена вершинами А1 и А2 из БЗ, что записывается: Х1={В1,В2}.

 

   Пример 1.    Запрос: «Кто друг Ивана?»

  

 В результате сопоставления аргументов ИМЯ(ИВАН,Х1) и ИМЯ(ИВАН,ИВАН1) вершина Х1 будет означена Х1=ИВАН1. Далее оказывается сопоставимыми фрагменты ДРУГ(…,ИВАН1), что приведёт к означиванию Х2={ПЁТР1,ТАНЯ1}. Это и есть ответ на вопрос.

  

   Пример 2.

   «Кто отец друга Ивана?»

   Как и в предыдущем примере будут означены Х1=ИВАН1, Х2={Пётр1,ТАНЯ1}. Далее последние вершины последовательно ставятся на место Х2. Для фрагмента ОТЕЦ(Х3,ПЁТР1) нет сопоставимого фрагмента в БЗ, а для ОТЕЦ(Х3,ТАНЯ1) – имеется ОТЕЦ(ПЁТР1,ТАНЯ1). В результате Х3=ПЁТР1. Это и есть ответ на запрос.

  

   Означиваться могут не только отдельные переменные, но и пары (тройки:,…) переменных. Например, на основе ДРУГ(X2,X1) может означиваться  (X2,X1)=(ИВАН1,ПЕТР1) и т.д. В плане уменьшения переборов очень важна последовательность означиваний, см. Часть2.

  

РСС нашли широкое применение для представления семантической информации, содержащихся в текстах на ЕЯ (системы "Криминал", ДИЕС, ИКС, "Аналитик" и др.). Одно и тоже понятие может называть различные объекты одного типа, которые нужно различать. Отсюда необходимость в внутрисистемных кодах. РСС ориентированы на отображение возможности интеграции множества связанных объектов в один объект, что выражается на ЕЯ в виде форм с отглагольными существительными. Понятие связи рассматривается в широком смысле. Это могут быть не только отношения, но и зависимости. Связанными считаются также объекты, участвующие в одном действии. Группа связанных объектов может быть связана с другой группой, что на ЕЯ выражается в виде глагольных форм с отглагольными существительными.

 

 

 (Из монографии Кузнецова И.П., Мацкевича А.Г. Семантико-ориентированные системы на основе баз знаний. Связьиздат м, 2007 г.)