Main Page > Papers

      Linguistic РrocessorSemantix” for Knowledge extraction from natural texts

                                 in Russia and English 

       

             Кузнецов Игорь Петрович (igor-kuz@mtu-net.ru),

             Козеренко Елена Борисовна (kozerenko@mail.ru) ИПИ РАН.

                           Аннотация

   

    Лингвистический процессор Semantix предназначен для областей, где требуется автоматическая формализация потоков текстов на естественном языке: резюме, сообщения СМИ, информационно-рекламные материалы, почтовые сообщения, сводки происшествий, справки по уголовным делам, архивные материалы и др. Из текстов (документов) извлекаются интересующие пользователя объекты, их свойства и  связи. Представляются факты участия объектов в действиях. Последние сами рассматриваются как комплексные объекты с их свойствами и связями. В результате на основе каждого документа строится специального вида семантическая сеть, отражающая его семантическую структуру. Такие сети  отображаются на XML-файлы, которые служат для организации Баз Знаний, соответствующих семантических поисков, для решения логико-аналитических задач, а также для автоматического заполнения реляционнных БД.

    Пример выделения объектов и их связей:

      

 

Full Text