Главная Страница > Публикации

                 Особенности извлечения знаний из текстов

семантико-ориенированным лингвистическим процессором

                                     Semantix

 

         Кузнецов Игорь Петрович (igor-kuz@mtu-net.ru), ИПИ РАН,

        Ефимов Дмитрий Алексеевич (d.efimov@synsys.ru),

        Кузнецов Константин ЗАО Синергетические Системы.

 

                                      Аннотация

   

    Лингвистический процессор Semantix предназначен для областей, где требуется автоматическая формализация потоков текстов на естественном языке: резюме, сообщения СМИ, информационно-рекламные материалы, почтовые сообщения, сводки происшествий, справки по уголовным делам, архивные материалы и др. Из текстов (документов) извлекаются интересующие пользователя объекты, их свойства и  связи. Представляются факты участия объектов в действиях. Последние сами рассматриваются как комплексные объекты с их свойствами и связями. В результате на основе каждого документа строится специального вида семантическая сеть, отражающая его семантическую структуру. Такие сети  отображаются на XML-файлы, которые служат для организации Баз Знаний, соответствующих семантических поисков, для решения логико-аналитических задач, а также для автоматического заполнения реляционнных БД.

                                      

                             

 

 

 

 

Полный текст статьи