Главная Страница > Публикации |
Особенности обработки текстов
естественного языка на основе
технологии баз знаний
Кузнецов Игорь Петрович
(ИПИ РАН)
Аннотация
Рассматривается система, ориентированная на обработку текстов
естественного языка - сводок происшествий, сообщений средств массовой
информации и др. Система выделяет из текстов семантически значимую информацию:
интересующие пользователя объекты, их количественные, качественные
характеристики и связи. Например, это могут быть конкретные люди, их адреса,
телефоны, организации, а также производства с указанием их месторасположения,
состава
выпускаемой продукции, их количества,
качества и т.д. Их еще называют значимыми или информационными объектами. Под
связями понимаются отношения (принадлежности, родственные), участие в одном
действии, время, место события. Выделение осуществляется лингвистическим
процессором, который состоит из оболочки, управляемой лингвистическими
знаниями. Рассматриваются особенности их организации с примерами в конкретной
прикладной области - криминалистике.
Пример
1.05.98г. в 7.10 Фирсова Владимира
Николаевича 1953г.р прож.ул.Глаголева
25-1-273, работает АОЗТ "ХДУ", зам. директора, о том, что 1-05-98г.
неизвестные от д.22 кор.3 по ул.Тухачевского,
похитили
а/м ГАЗ 31029, черная, 1995 г/в, дв.402-0019476, кузов 0285927...
Полный текст статьи |