Главная Страница > Публикации

 Англо-русская система извлечения знаний из потоков

               информации в среде Интернет

              

                Кузнецов Игорь Петрович, Сомин Николай Владимирович (ИПИ РАН)

   

                         Аннотация

 

     Рассматриваются лингвистические и алгоритмические аспекты проблемы извлечения знаний из текстов среды Интернет. Предлагаются средства, повышающие качество работы лингвистического процессора и учитывающие особенности документов в Интернет, в том числе, наличие большого количества англо-язычных текстов. С этой целью в блок морфологического анализа введены дополнительные средства для выявления формальных и содержательных признаков английских слов. Расширены возможности предметных каталогов в плане выявления семантических категорий английских слов. Разработаны контекстные правила для синтактико-семантического анализа типовых форм английского языка. Предлагаются средства настройки блоков морфологического и синтактико-семантического анализа (через предметные каталоги) на язык входного текста.

 

  Пример

 

    12:16 27.12.2002 One of leaders of insurgents - Arabian Abu-Tarik is  destroyed in the Chechen Republic.

     In the Chechen Republic one of leaders of Islam terroristic group the mercenary Abu-Tarik

assistant of Abu al-Valod, successor of Hattab, is destroyed. As have informed the Ministry of Foreign

    Affairs of the Chechen Republic, joint forces of Chechen special militia and divisions

of federal forces destroy the insurgent in settlement Starye Atagi of Groznensky region

during the addressed check up. . .

 Граф связей:

 

 

 

 

Полный текст статьи