Главная Страница > Публикации |
Англо-русская система извлечения знаний из потоков
информации
в среде Интернет
Кузнецов Игорь Петрович, Сомин Николай
Владимирович (ИПИ РАН)
Аннотация
Рассматриваются лингвистические и
алгоритмические аспекты проблемы извлечения знаний из текстов среды Интернет.
Предлагаются средства, повышающие качество работы лингвистического процессора и
учитывающие особенности документов в Интернет, в том числе, наличие большого
количества англо-язычных
текстов. С этой целью в блок морфологического анализа введены дополнительные
средства для выявления формальных и содержательных признаков английских слов.
Расширены возможности предметных каталогов в плане выявления семантических
категорий английских слов. Разработаны контекстные правила для
синтактико-семантического анализа типовых форм английского языка. Предлагаются
средства настройки блоков морфологического и синтактико-семантического анализа
(через предметные каталоги) на язык входного текста.
Пример
12:16 27.12.2002
One of leaders of insurgents - Arabian Abu-Tarik is destroyed in the
Chechen Republic.
In the
Chechen Republic one of leaders of Islam terroristic group the mercenary Abu-Tarik –
assistant of Abu al-Valod, successor
of Hattab, is destroyed. As have informed the
Ministry of Foreign
Affairs of
the Chechen Republic, joint forces of Chechen special militia and divisions
of federal forces destroy the insurgent in settlement Starye Atagi of Groznensky region
during the addressed check up. . .
Граф связей:
Полный текст статьи |