Ляшевская Ольга Николаевна

Факультет гуманитарных наук

Профиль на hse.ru ↗ тел.: 22724 | +7 (906) 798-60-21

Публикаций

116

Языков

Наград

Конференций

Профиль Публикации (116) Курсы (12)

Профессиональные интересы

русский языклексикографиякомпьютерная лингвистикасемантикакогнитивная лингвистикакорпусная лингвистикасемантика грамматики16.00.00 Языкознание

Должности

Профессор — Факультет гуманитарных наук, Школа лингвистики

Био

· Начала работать в НИУ ВШЭ в 2011 году.
· Научно-педагогический стаж: 28 лет.

Образование

1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»

Опыт работы

· 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
· 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
· 2010–2011: : førsteamanuensis (Associate Professor)
· 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
· 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
· 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
· 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
· 1997–2001: : преподаватель русского языка как иностранного
· 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
· 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ

Награды и поощрения

· Благодарность проректора НИУ ВШЭ (июль 2025)
· Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
· Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
· Благодарность проректора НИУ ВШЭ (ноябрь 2021)
· Благодарность Высшей школы экономики (январь 2017)
· Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
· Надбавка за академическую работу (2016–2017)
· Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
· Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
· Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
· Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
· Лучший преподаватель — 2019, 2017, 2013

Гранты и проекты

— · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
— · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
— · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)

Конференции (30)

Показать все

· 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
· 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
· 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
· 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
· 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
· 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
· 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
· 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
· 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
· 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
· 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
· 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
· 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
· 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
· 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
· 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
· 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
· 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
· 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
· 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
· 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
· 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
· 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
· 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
· 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios

Идентификаторы исследователя

ORCID: 0000-0001-8374-423X
ResearcherID: E-8855-2014
SPIN РИНЦ: 6340-5599
Google Scholar: https://scholar.google.ru/citations?user=5XzprO8AAAAJ&hl=ru
Scopus AuthorID: 37090988800

Публикации (116)

Semantic profiles of five Russian prefixes: po-, s-, za-, na-, pro-

2013 · ARTICLE · en

We test the hypothesis that Russian verbal prefixes express meaning even when they are used to create a “purely aspectual” pair (“čistovidovaja para”). This is contrary to traditional assumptions that prefixes in this function are semantically “empty”. We analyze the semantic tags independently established in the Russian National Corpus (www.ruscorpora.ru) for 382 perfective partner verbs with five of the most common verbal prefixes in Russian: po-, s-, za-, na-, and pro-. Statistical tests show that the relationship between prefixes and semantic tags is significant and robust, and further identify which relationships constitute attractions, repulsions, and neutral relationships. It is possible to specify a unique meaning for each prefix in terms of the semantic tags it attracts or repulses. A detailed analysis of all the verbs in the study shows that the meanings of the prefixed perfective partners yield consistent patterns. Even verbs in repulsed semantic classes are consistent with these patterns. The meaning patterns of verbs with “purely aspectual” prefixes can be compared with the meanings of the prefixes as established on the basis of previous scholarship, which was primarily focused on the meanings of prefixes in their “non-empty” uses. This comparison shows that the verb meanings that appear with “purely perfectivizing” prefixes are the same as those found for “non-empty” uses of prefixes. We conclude that verbs select the prefix that is most compatible with their meanings when forming “purely aspectual” perfective partners, confirming our hypothesis.

PDF ↗

YARN: начало

2013 · CHAPTER · ru

В статье представлен проект создания большого открытого тезауруса русского языка YARN (Yet Another RussNet). Основная особенность проекта — использование wiki-подхода к наполнению и редактированию ресурса. В статье описаны лингвистические принципы создания тезауруса YARN, формат данных, а также ближайшие практические шаги, которые планируется предпринять в рамках проекта

PDF ↗

Learning Computational Linguistics through NLP Evaluation Events: the experience of Russian evaluation initiative

2013 · CHAPTER · en

We present in the paper our experience of involving the students of the department of theoretical and computational linguistics of the Moscow State University into full-cycle activities of preparing and evaluating the results of the NLP Evaluation forums, held in 2010 and 2012 in Russia. The forum of 2010 started as a new initiative and was the first independent evaluation of morphology parsers for Russian in Russia. At the same time the forum campaign has been a source of a successful academic course which resulted in a close-knit student team, strong enough to implement the two-year research for the second forum on syntax, held in 2012. The new forum of anaphora (to be held in 2014) is now prepared mostly by students.

PDF ↗

Эксперименты по автоматическому разрешению лексико-семантической неоднозначности и выделению конструкций (на материале Национального корпуса русского языка)

2012 · CHAPTER · ru

Настоящее исследование имеет целью автоматическое извлечение лингвистической информации из контекстов Национального корпуса русского языка (НКРЯ) с последующим использованием данных в построении комплексного лексикографического ресурса – каталога русских конструкций. Предлагаемый подход предполагает автоматическую классификацию контекстов, направленную на автоматическое разрешение лексико-семантической неоднозначности (WSD) и выделение конструкций (CxI). Процедура автоматической классификации контекстов учитывает следующие типы контекстной информации, представленной в многоярусной разметке НКРЯ: лексические теги (теги лемм) (lex), морфологические теги (gr), лексико-семантические теги (sem), а также комбинации различных видов тегов. Серии экспериментов по WSD и CxI выполнены с использованием репрезентативных выборок контекстов из НКРЯ. В каждой серии экспериментов анализируются (1) различные контекстные маркеры значений целевых слов и (2) конструкции, включающие контекстные маркеры и целевые слова.

PDF ↗

К построению инвентаря русских именных конструкций

2012 · CHAPTER · ru

В докладе обсуждаются результаты экспериментов по автоматическому выделению конструкций, проводимых на материале Национального корпуса русского языка (НКРЯ). С этой целью разработан компьютерный инструмент, позволяющий извлекать и обрабатывать сочетаемостные данные из выборок НКРЯ. В качестве целевых слов выступают русские имена существительные. Для каждого из целевых слов получены списки конструкций – наиболее частотные сочетания, включающие целевое слово, частотные лексико-семантические теги – контекстные маркеры того или иного значения целевого слова, а также частотные леммы, характеризуемые этими семантическими тегами. Например: ВИД (разновидность, тип) + r:abstr t:sport: спорт, футбол, биатлон и т.д. Выделенные конструкции систематизируются по структуре и лексико-семантическому наполнению. В заключение проводится проверка результатов экспериментов, предполагающая сравнение списков конструкций со сведениями о коллокациях, устойчивых сочетаниях и т.д., зарегистрированных в различных лингвистических источниках (сервисы поиска биграмм, словари).

PDF ↗

Оценка методов автоматического анализа текста 2011–2012: синтаксические парсеры русского языка

2012 · CHAPTER · ru

"Второй раунд форума «Оценка методов автоматического анализа текста» в 2011–2012 гг. был посвящен синтаксическим анализаторам русскоязычных текстов. В статье описываются принципы и процедура проведения дорожек форума, состав участников, тестовая коллекция и Золотой Стандарт, на основе которого осуществлялась оценка, принципы сопоставления ответов систем, сложные для оценки случаи, а также некоторые проблемные точки в работе синтаксических парсеров, которые выявила экспертиза результатов."

PDF ↗

Dictionary of Valencies Meets Corpus Annotation: A Case of Russian FrameBank

2012 · CHAPTER · en

Статья посвящена разметке реализаций фреймов в текстов Национального корпуса русского языка и пополнению словаря валентностей и других лексических конструкций.

The Locative Alternation and the Russian ‘empty’ prefixes: A case study of the verb gruzit’ ‘load’

2012 · CHAPTER · en

Исследуется феномен мены диатезы в локативных конструкциях. Проводится статистический анализ распределения грамматических конструкций (конструкционный профиль) в зависимости от выбора приставки у глагола, полной/неполной диатезы и финитной/причастной формы.

PDF ↗

Russian purely aspectual prefixes: Not so empty after all?

2012 · ARTICLE · en

Nearly two thousand perfective verbs in Russian are formed via the addition of so-called "empty prefixes" (čistovidovye pristavki) to imperfective base verbs. The traditional assumption that prefixes are semantically "empty" when used to form aspectual pairs is problematic because the same prefixes are clearly "non-empty" when combined with other base verbs. Though some scholars have suspected that the prefixes are not empty but instead have meanings that overlap with the meanings of the base verbs, proof of this hypothesis has eluded researchers. With the advent of corpora and electronic resources it is possible to explore this question on the basis of large quantities of data. This article presents a new methodology, called "radial category profiling", in which the semantic network of a prefix is established on the basis of its "non-empty" uses and then compared, node by node, with the semantic network of base verbs that use the same prefix as an "empty" perfectivizing morpheme. This methodology facilitates a comprehensive analysis of ten prefixes, comparing their meanings in "non-empty" and "empty" uses and showing precisely how in the latter case overlap produces the illusion of emptiness. We are able to fully specify the semantic network of each prefix, and discover that for some prefixes there is overlap throughout the network, while for others overlap is restricted to a contiguous subsection of the network. We investigate the dynamic interactions among prefixes, and identify what meanings are incompatible with the "purely aspectual" function of the so-called "empty" prefixes. The results of our analyses, including complete lists of verbs, are publicly available at: http://emptyprefixes.uit.no/ and http://emptyprefixes. uit.no/methodology-eng.htm.

DOI ↗ PDF ↗

RU-EVAL-2012: Evaluating dependency parsers for Russian

2012 · CHAPTER · en

RU-EVAL – это форум по оценке русскоязычных ресурсов, методов и инструментов автоматической обработки текста. Первый этап форума состоялся в 2010 году и был посвящен оценке морфологических парсеров (Lyashevskaya et al. 2010), второй цикл (2011-2012) связан с оценкой синтаксического анализа текста (Toldova et al. 2012). На синтаксическом форуме результаты разметки тестового корпуса в формате синтаксиса зависимостей прислали 8 участников из коммерческих компаний и академических учреждений. В статье описываются принципы «мягкой» оценки, позволившие сравнивать ответы, которые весьма значительно различались как теоретическими подходами и методами парсинга, так и по конкретному составу тегов и направлению зависимостей. Обсуждаются результаты, сложные для оценки случаи, а также некоторые проблемные точки в работе русских синтаксических парсеров, которые выявила экспертиза результатов.

Курсы (12)

Computer Tools for Linguistic Research · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Нижний Новгород · Анг
Научно-исследовательский семинар "Анализ и визуализация текстовых данных" · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
Научно-исследовательский семинар «Интерпретация лингвистических явлений в больших языковых моделях»

2025/2026 · Бакалавриат · рус
Fundamentals of Corpus Research

2025/2026 · Магистратура / Маго-лего · Анг
Программирование и лингвистические данные · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
Теоретическая и прикладная лексикография · 4 раза

2025/2026, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
Корпусная лингвистика · 3 раза

2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
Мастер-классы

2024/2025 · Магистратура · рус
Научно-исследовательский семинар "Нейросетевое моделирование длинных языковых единиц"

2024/2025 · Бакалавриат · рус
Дополнительные главы корпусной лингвистики

2023/2024 · Магистратура / Маго-лего · рус
Анализ и визуализация текстовых данных

2022/2023 · Магистратура · рус
Научно-исследовательский семинар "Корпусная лингвистика и изучение иностранных языков"

2022/2023 · Нижний Новгород · рус