Большакова Елена Игоревна

Факультет компьютерных наук

Профиль на hse.ru ↗ тел.: +7(495) 772-9590 *2707

Публикаций

Языков

Наград

Конференций

Профиль Публикации (45) Курсы (5)

Профессиональные интересы

28.23.00 Искусственный интеллект50.05.09 Языки программирования

Должности

Доцент — Факультет компьютерных наук, Департамент анализа данных и искусственного интеллекта

Био

· Начала работать в НИУ ВШЭ в 2009 году.
· Научно-педагогический стаж: 42 года.

Образование

2000 · Ученое звание: Доцент
1986 · Кандидат физико-математических наук
1980 · Специалитет: Московский государственный университет им. М.В. Ломоносова, специальность «Прикладная математика», квалификация «Математик»

Опыт работы

· 1983-1993: гг. – ассистент кафедры алгоритмических языков факультета ВМК МГУ
· В 1983-90 гг. – преподаватель Вечерней Математической Школы для школьников на ВМК МГУ, организатор на ВМК двух первых олимпиад по программированию для школьников.
· 1993-96 гг. – старший преподаватель факультета ВМК МГУ им. М.В.Ломоносова.
· 1996 г.: с по наст. время – доцент кафедры алгоритмических языков факультета ВМК МГУ
· 2002-2012: 1997-99 гг гг. – старший научный сотрудник (по совместительству) филологического факультета МГУ им. М.В.Ломоносова
· 2000-2001: гг. – профессор-исследователь Центра компьютерных исследований Национального Политехнического института, г. Мехико
· 2009-нв.: с доцент департамента анализа данных и искусственного интеллекта факультета НИУ ВШЭ (по совместительству)

Награды и поощрения

· Персональная надбавка ректора (2013–2014)

Гранты и проекты

— · Грант РФФИ № 06-01-00571 «Методы и средства интеллектуальной автоматической обработки текстов русскоязычных научно-технических документов», руководитель

Идентификаторы исследователя

ORCID: 0000-0002-8659-5978
ResearcherID: M-1401-2016
SPIN РИНЦ: 1341-0349
Google Scholar: https://scholar.google.com/citations?user=AHHkgHcAAAAJ&hl=en
Scopus AuthorID: 13608846000

Публикации (45)

Аффиксальный критерий паронимии для построения компьютерного словаря паронимов русского языка

2015 · ARTICLE · ru

Описывается аффиксальный критерий паронимии, предложенный в результате исследования наиболее крупного печатного словаря паронимов русского языка и формализующий понятие паронимии для построения компьютерных словарей. Паронимами считаются пары слов единого корня и одной части речи, у которых различия в аффиксах находятся в строго установленных рамках. На основе критерия построен объемный компьютерный словарь русских паронимов, предназначенный в первую очередь для автоматизированного исправления паронимических ошибок в текстах. Намечены пути уточнения критерия и предложена общая структура компьютерных словарей паронимов.

Алгоритмы построения компьютерного словаря русских буквенных паронимов и его применение

2015 · ARTICLE · ru

В работе рассматриваются вопросы построения и применения компьютерного словаря русских однобуквенных паронимов, т.е. слов, отличающихся одной буквой и получающихся друг из друга в результате замены, вставки, удаления буквы или же перестановки двух стоящих рядом букв (например: время – бремя, отпечатать – опечатать). Словарь разрабатывался для автоматизиpованного исправления в тексте случайных ошибок (так называемых малапропизмов), при которых одно знаменательное слово заменяется другим похожим словом, отличным от первого по смыслу и тем самым нарушающим исходный смысл высказывания. Паронимы построенного словаря служат вариантами исправления однобуквенных ошибок, при котором не требуется изменение контекста ошибочного слова. В связи с последним требованием в работе уточняется понятие буквенных паронимов за счет дробления морфологических парадигм слов (лексем) и учета свойства параллельности морфологических парадигм. Параллельными считаются морфопарадигмы двух лексем, для которых существует элементарная редактирующая операция (вставка, удаление, замена буквы, перестановка двух соседних букв), переводящая каждую словоформу первой лексемы в соответствующую словоформу второй лексемы. В работе описывается процесс построения компьютерного словаря однобуквенных паронимов, а также формулируются основные шаги алгоритмов поиска исправляющих слов для найденных в тексте ошибок, с помощью построенного словаря – соответственно для случаев полной и неполной параллельности морфопарадигм исправляемого слова и его паронима. Приводится также статистика контента построенного компьютерного словаря однобуквенных паронимов, общий объем которого достиг 70 тыс. вокабул, в среднем с тремя паронимами на вокабулу.

Программные средства поддержки практикума по функциональному программированию

2015 · CHAPTER · ru

В данной работе характеризуются программные средства, разработанные в поддержку практикума по функциональному программированию, проводимого у студентов кафедры алгоритмических языков факультета ВМК МГУ. Программные средства включают интерпретатор для языка Рефал-2У, среду разработки рефал-программ, а также средство пошаговой интерпретации и визуализации выражений языка Хаскель. Реализованные средства предназначены в первую очередь для использования начинающими программистами – студентами 3 курса, изучающими языки Рефал-2 и Хаскель.

A Heuristics Strategy for Extracting Terms from Scientific Texts

2015 · CHAPTER · en

The paper describes a strategy that applies heuristics to combine sets of terminological words and words combination pre-extracted from a scientific text by several term recognition procedures. Each procedure is based on a collection of lexico-syntactic patterns representing specific linguistic information about terms within scientific texts. Our strategy is aimed to improve the quality of automatic term extraction from a particular scientific text. The experiments have shown that the strategy gives 11-17% increase of F-measure compared with the commonly-used methods of term extraction.

Язык лексико-синтаксических шаблонов LSPL: опыт использования и пути развития Программные системы и инструменты

2014 · CHAPTER · ru

В работе рассматривается опыт использования языка лексико-синтаксических шаблонов LSPL, предназначенного для формального описания лексических и поверхностно-синтаксических свойств языковых конструкций в системах автоматической обработки текстов на русском языке. Кратко характеризуются и сравниваются выразительные возможности языка LSPL и аналогичных языков наиболее известных систем извлечения информации из русскоязычных текстов. Обсуждаются разработанные с помощью LSPL приложения, требующие анализа текстов на естественном языке (ЕЯ) и реализованные на базе поддерживающего LSPL программного комплекса. Для каждого приложения указываются особенности построенного для него набора LSPL-шаблонов. Успешное применение языка позволило проверить его выразительные возможности и на этой основе расширить язык новыми средствами, упрощающими построение приложений. В работе описываются новые средства, уже включенные в язык и опробованные в нескольких приложениях, а также намечаются направления дальнейшего развития LSPL для повышения его гибкости и выразительности.

Извлечение однословных терминов из текстовых коллекций на основе методов машинного обучения

2013 · ARTICLE · ru

В статье представлены результаты экспериментов по автоматическому извлечению однословных терминов из русскоязычных текстов на основе машинного обучения, позволяющего комбинировать применяемые статистические и лингвистические признаки терминов. Эксперименты показывают, что комбинирование значительно улучшает результаты извлечения терминов, а найденная комбинация признаков может быть использована на расширенной текстовой коллекции без значительной потери качества.

Компьютерный словарь русских паронимов, основанный на формальном критерии паронимии

2013 · CHAPTER · ru

В результате исследования наиболее крупного печатного словаря паронимов русского языка предложен формальный критерий паронимии. Паронимами считаются те пары слов одного корня и одной части речи, у которых различия в аффиксах (раздельно в префиксах и суффиксах) находятся в фиксированных рамках. Согласно этому критерию построен компьютерный словарь русских паронимов, имеющий 21.8 тыс. статей с 192 тыс. паронимов и по объему превышающий все известные словари. В первую очередь словарь предназначен для исправления в текстах ошибочных замен слов их паронимами

Correcting collocation errors in learners’ writing based on probability of syntactic links

2013 · CHAPTER · en

The paper describes a novel method for automatic collocation error correction in NL texts that are written by language learners or are translated from another NL with the aid of machine translators. We assume that the main reason of collocation errors is the strategy of word-by-word translation used by authors of the texts or the machine translators, so the errors essentially depends on the source language. While processing a sentence from the text, the method considers as potential correcting variants all its paraphrases that have the same syntactic structure and are built by replacing of all sentence words by their substitute words. Substitute words are automatically generated using word translation equivalents taken from a particular translation dictionary. For detecting an error in the sentence, we propose a relevance degree function computed from the probability of word syntactic links and applied to the sentence and its paraphrases. If the value of the function for the sentence is less than for some of its paraphrases, our method signals an error, then it is corrected by appropriate sentence paraphrase. The method was approved for correction collocation errors in English texts written by Russian speakers. Stanford Parser and English text collection were used to gather statistics and compute probability of English word syntactic links. Within certain limitation, the experiments gave promising results: there were detected about 80% of collocation errors (with words of various POS) and 87% of proposed correcting paraphrases included “gold” correction.

Topic models can improve domain term extraction

2013 · CHAPTER · en

The paper describes the results of an experimental study of topic models applied to the task of single-word term extraction. The experiments encompass several probabilistic and non-probabilistic topic models and demonstrate that topic information improves the quality of term extraction, as well as NMF with KL-divergence minimization is the best among the models under study.

Topic Models Can Improve Domain Term Extraction

2013 · CHAPTER · en

Abstract. The paper describes the results of an experimental study of topic models applied to the task of single-word term extraction. The experiments encompass several probabilistic and non-probabilistic topic models and demonstrate that topic information improves the quality of term extraction, as well as NMF with KL-divergence minimization is the best among the models under study.

Курсы (5)

Компьютерная лингвистика и анализ текста · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Магистратура / Маго-лего · рус
Онтологии и семантические технологии · 2 раза

2024/2025, 2023/2024 · Магистратура / Маго-лего · рус
45.04.03. Фундаментальная и прикладная лингвистика

2023/2024 · Магистратура · рус
01.04.02. Прикладная математика и информатика

2022/2023 · Магистратура · рус
Onthologies and Semantic Technologies

2022/2023 · Магистратура / Маго-лего · Анг