Main Page > Papers |
Linguistic Рrocessor “Semantix” for Knowledge extraction from natural texts
in Russia and English
Кузнецов Игорь Петрович (igor-kuz@mtu-net.ru),
Козеренко Елена Борисовна (kozerenko@mail.ru)
ИПИ РАН.
Аннотация
Лингвистический процессор Semantix
предназначен для областей, где требуется автоматическая формализация потоков
текстов на естественном языке: резюме, сообщения СМИ, информационно-рекламные
материалы, почтовые сообщения, сводки происшествий, справки по уголовным делам,
архивные материалы и др. Из текстов (документов) извлекаются интересующие
пользователя объекты, их свойства и связи. Представляются факты участия объектов в
действиях. Последние сами рассматриваются как комплексные объекты с их
свойствами и связями. В результате на основе каждого документа строится
специального вида семантическая сеть, отражающая его семантическую структуру.
Такие сети отображаются на XML-файлы,
которые служат для организации Баз Знаний, соответствующих семантических
поисков, для решения логико-аналитических задач, а также для автоматического заполнения
реляционнных БД.
Пример выделения объектов и их связей:
Full Text |