Главная Страница > Публикации |
Семантико-ориентированный
лингвистический процессор для
автоматической формализации автобиографических данных.
Кузнецов Игорь Петрович, Мацкевич Андрей
Георгиевич
(ИПИ РАН)
Аннотация
Рассматриваются прямой и обратный
лингвистические процессоры для обработки автобиографических данных, заявок на
работу (резюме), представляющих собой тексты естественного языка. Человек в
свободной форме дает сведения о себе: ФИО, год рождения, адрес, время и место
учебы с указанием наименования учебного заведения, факультета, специальности,
места работы (организации) с указанием периода работы, должности, основных
обязанностей и др. Эти данные могут быть выражены различными способами и
произвольным образом разбросаны по тексту. Задача прямого лингвистического
процессора - выделение этих данных, приведение их к стандартному виду и
установлению связей между ними: соотнесение организаций с датами, должностями и
др. На этой основе строятся структуры знаний. Задача обратного лингвистического
процессора - представление этих структур в виде компонент естественного языка
(словосочетаний, предложений) и их отображение на поля формализованной анкеты
или структурированного сайта.
Пример:
Ф.И.О. Евгения Александровна Петрова.
Дата рождения: 27 февраля 1978
года
Образование высшее: Ташкентский Финансовый институт,
Финансово-кредитный факультет, специальность - <Финансы предприятий
различных форм собственности>.
Время обучения: 1995-2000г.г.
Результат обработки:
Язык
резюме:-> Русский
Фамилия:-> Петрова.
Имя:-> Евгения
Отчество:-> Александровна
Пол:->
Женский
Дата рождения:-> 27 февраль 1978
Образование:-> 1 - (Высшее)
Профессиональная область:-> 5 - Банки-Инвестиции-Лизинг.
. . .
УЧЕБА:->
Название:-> Ташкентский Финансовый
институт.
Факультет (специальность):-> Финансово
кредитный факультет,
специальность - <Финансы предприятий
различных форм собственности>.
Диплом (степень):->
Начало учебы:-> 1995
Окончание учебы:-> 2000
. . .
Полный текст статьи |