Ляшевская Ольга Николаевна

Факультет гуманитарных наук

Профиль на hse.ru ↗ тел.: 22724 | +7 (906) 798-60-21

Публикаций

116

Языков

Наград

Конференций

Профиль Публикации (116) Курсы (12)

Профессиональные интересы

русский языклексикографиякомпьютерная лингвистикасемантикакогнитивная лингвистикакорпусная лингвистикасемантика грамматики16.00.00 Языкознание

Должности

Профессор — Факультет гуманитарных наук, Школа лингвистики

Био

· Начала работать в НИУ ВШЭ в 2011 году.
· Научно-педагогический стаж: 28 лет.

Образование

1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»

Опыт работы

· 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
· 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
· 2010–2011: : førsteamanuensis (Associate Professor)
· 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
· 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
· 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
· 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
· 1997–2001: : преподаватель русского языка как иностранного
· 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
· 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ

Награды и поощрения

· Благодарность проректора НИУ ВШЭ (июль 2025)
· Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
· Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
· Благодарность проректора НИУ ВШЭ (ноябрь 2021)
· Благодарность Высшей школы экономики (январь 2017)
· Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
· Надбавка за академическую работу (2016–2017)
· Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
· Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
· Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
· Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
· Лучший преподаватель — 2019, 2017, 2013

Гранты и проекты

— · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
— · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
— · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)

Конференции (30)

Показать все

· 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
· 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
· 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
· 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
· 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
· 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
· 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
· 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
· 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
· 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
· 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
· 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
· 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
· 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
· 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
· 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
· 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
· 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
· 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
· 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
· 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
· 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
· 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
· 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
· 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
· 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios

Идентификаторы исследователя

ORCID: 0000-0001-8374-423X
ResearcherID: E-8855-2014
SPIN РИНЦ: 6340-5599
Google Scholar: https://scholar.google.ru/citations?user=5XzprO8AAAAJ&hl=ru
Scopus AuthorID: 37090988800

Публикации (116)

О задачах и методах словообразовательной разметки в корпусе текстов (Word-formation annotation of the Russian National Corpus – aims and methods)

2009 · ARTICLE · ru

Русский Фреймнет: к задаче создания корпусного словаря конструкций

2009 · CHAPTER · ru

В российской компьютерной лингвистике до сих пор нет ресурсов, аналогичных FrameNet, VerbNet и PropBank, в которых можно было бы получить иллюстрации глагольного и именного управления, а также периферийных лексически ориентированных конструкций. В работе описываются задачи создания и структура FrameNet-ориентированной системы, предназначенной для исследования морфологических, синтаксических, семантических и лексических ограничений в русских конструкциях.

PDF ↗

Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)

2009 · BOOK · ru

Частотный словарь содержит сведения о наиболее употребительных словах современного русского языка. Он создан на основе Национального корпуса русского языка, авторитетного и представительного электронного ресурса. Подкорпус 1950-2007 гг. объемом 92 млн. словоупотреблений включает тексты художественной литературы, средств массовой информации, технические, деловые документы и т.д., а также записи разговорной речи. Словарь представляет разнообразную статистическую информацию для 50 тыс. слов общей лексики и 3 тыс. имен собственных и аббревиатур. Приводятся частотные списки лексики, характерной для публицистики, устной речи и других функциональных жанров, а также списки наиболее употребительных существительных, прилагательных, глаголов и слов других частей речи. Частотный словарь может быть использован в различных приложениях, таких как обучение русскому языку как родному и иностранному, лингвистические исследования, создание русских одноязычных и двуязычных словарей, информационный поиск, обнаружение спама, проверка орфографии и т.д.

Инкорпорация и экскорпорация в глагольном управлении: имена частей тела

2008 · CHAPTER · ru

Рассматриваются конструкции с инкорпорированным актантом и условия его проявления в тексте.

PDF ↗

Топологические классы имен в семантической разметке Национального корпуса русского языка

2008 · CHAPTER · ru

Предлагается предварительная классификация лексики по топологическим типам (в модели Л.Талми и Е.В.Рахилиной).

Конструкция с творительным формы «X Y-ом»

2008 · CHAPTER · ru

В работе проводится исследование семантики русской конструкции с творительным формы типа хвост кольцом, сложить губки бантиком. Пространственная семантика конструкции описывается в терминах топологических классов (Talmy 2000, Рахилина 2000): анализируются явления совпадения топологических классов и их взаимной аккомодации.

PDF ↗

Эксперименты по статистическому разрешению лексико-семантической неоднозначности русских имен существительных в корпусе

2008 · CHAPTER · ru

С помощью компьютерного инструмента автоматического разрешения лексико-семантической неоднозначности слов в контекстах НКРЯ проведены эксперименты а) с использованием не только лексической и семантической, но также и грамматической информации, извлекаемой из контекстов, определение наличия или отсутствия зависимости между данными критериями; б) с изменением ширины контекстного окна и с учётом границ синтагм; в) с установлением объёмов эталонных выборок пропорционально долям контекстов для разных значений в экспериментальной выборке. Обсуждаемые эксперименты направлены на оценку эффективности разрешения неоднозначности с более гибкими параметрами и в условиях недостаточности исходных обучающих данных.

Статистическое разрешение лексико-семантической неоднозначности в контекстах для предметных имён существительных

2008 · CHAPTER · ru

В докладе обсуждаются результаты экспериментов по автоматизации процесса разрешения лексико-семантической неоднозначности слов. Эмпирическим материалом исследования являются примеры употребления предметных имён, извлечённые из Национального корпуса русского языка. Оцениваются оптимальные условия разрешения неоднозначности с учётом двух факторов: лексического наполнения контекстов и лексико-семантической разметки контекстов.

PDF ↗

Частотный словарь Национального корпуса русского языка: концепция и технология создания

2008 · CHAPTER · ru

Словарь содержит представительный базовый словник современного русского языка (2-я половина XX – начало XXI вв.), снабженный информацией о частотности употребления, статистическом распределении по текстам и жанрам, по времени создания текстов. Словарь основан на текстах Национального корпуса русского языка объемом 100 млн. словоупотреблении.

PDF ↗

Semantic Annotation Layer in Russian National Corpus: Lexical Classes of Nouns and Adjectives

2008 · CHAPTER · en

Описаны правила разрешения лексико-семантической омонимии для имен существительных и прилагательных.

PDF ↗

Курсы (12)

Computer Tools for Linguistic Research · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Нижний Новгород · Анг
Научно-исследовательский семинар "Анализ и визуализация текстовых данных" · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
Научно-исследовательский семинар «Интерпретация лингвистических явлений в больших языковых моделях»

2025/2026 · Бакалавриат · рус
Fundamentals of Corpus Research

2025/2026 · Магистратура / Маго-лего · Анг
Программирование и лингвистические данные · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
Теоретическая и прикладная лексикография · 4 раза

2025/2026, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат · рус
Корпусная лингвистика · 3 раза

2024/2025, 2023/2024, 2022/2023 · Магистратура / Маго-лего · рус
Мастер-классы

2024/2025 · Магистратура · рус
Научно-исследовательский семинар "Нейросетевое моделирование длинных языковых единиц"

2024/2025 · Бакалавриат · рус
Дополнительные главы корпусной лингвистики

2023/2024 · Магистратура / Маго-лего · рус
Анализ и визуализация текстовых данных

2022/2023 · Магистратура · рус
Научно-исследовательский семинар "Корпусная лингвистика и изучение иностранных языков"

2022/2023 · Нижний Новгород · рус