DSA Faculty
API
← к списку преподавателей

Ляшевская Ольга Николаевна

Факультет гуманитарных наук

Профиль на hse.ru ↗ тел.: 22724 | +7 (906) 798-60-21
Публикаций
116
Языков
3
Наград
12
Конференций
30
Профиль Публикации (116) Курсы (12)

Профессиональные интересы

русский языклексикографиякомпьютерная лингвистикасемантикакогнитивная лингвистикакорпусная лингвистикасемантика грамматики16.00.00 Языкознание

Должности

  • ПрофессорФакультет гуманитарных наук, Школа лингвистики

Био

  • · Начала работать в НИУ ВШЭ в 2011 году.
  • · Научно-педагогический стаж: 28 лет.

Образование

  • 1999 · Кандидат филологических наук: Всероссийский институт научной и технической информации РАН, специальность 05.13.17 «Теоретические основы информатики», тема диссертации: Нестандартное числовое поведение русских существительных
  • 1998 · Аспирантура: Всероссийский институт научной и технической информации РАН, специальность «Теоретические основы информатики»
  • 1995 · Специалитет: Российский государственный гуманитарный университет, факультет: Факультет теоретической и прикладной лингвистики, специальность «Лингвистика», квалификация «Лингвист-специалист в области теоретической и прикладной лингвистики»

Опыт работы

  • · 2011: с : Старший научный сотрудник отдела корпусной лингвистики и лингвистической поэтики, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва (совместитель)
  • · 2011–2012: : менеджер группы онтологий отдела лингвистики ООО "Яндекс"
  • · 2010–2011: : førsteamanuensis (Associate Professor)
  • · 2008–2010: : post-doc, Институт лингвистики Университета Тромсё, Норвегия
  • · 2008–2011: : докторант, Институт русского языка им. В.В.Виноградова РАН (ИРЯ РАН), Москва
  • · 2002–2008: : cтарший научный сотрудник Отдела лингвистических исследований
  • · 2000–2002: : старший научный сотрудник Отдела теоретических и прикладных проблем информатики, Всероссийский институт научной и технической информации (ВИНИТИ РАН), Москва
  • · 1997–2001: : преподаватель русского языка как иностранного
  • · 1996–1998: : учебный мастер, филологический факультет МГУ им. М.В.Ломоносова
  • · 1995-1996: : ведущий специалист деканата, факультет теоретической и прикладной лингвистики РГГУ

Награды и поощрения

  • · Благодарность проректора НИУ ВШЭ (июль 2025)
  • · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
  • · Почетная грамота Министерства науки и высшего образования Российской Федерации (ноябрь 2022)
  • · Благодарность проректора НИУ ВШЭ (ноябрь 2021)
  • · Благодарность Высшей школы экономики (январь 2017)
  • · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2017–2019)
  • · Надбавка за академическую работу (2016–2017)
  • · Надбавка за публикацию в журнале из Списка B (2025–2026, 2024–2025)
  • · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2023–2024)
  • · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022, 2019–2020)
  • · Надбавка за статью в зарубежном рецензируемом журнале (2014–2016, 2012–2014)
  • · Лучший преподаватель — 2019, 2017, 2013

Гранты и проекты

  • · Научно-учебная группа «Материалы к частотному словарю русской поэзии»» (Научный фонд НИУ ВШЭ, 2018, руководитель)
  • 2020 · DiAsPol250 «The Development of the Polish Aspect System in the Last 250 Years against the Background of Neighbouring Languages», Beethoven II – Polish-German Funding Initiative (DFG/NCN), 2018-2020, cooperation partner
  • · TWIRLL: Targeting Wordforms in Russian Language Learning, грант международного академического сотрудничества Норвежского научного фонда SIU c Университетом Тромсе (CPRU-2017/10027)
  • 2020 · DigiPalSlav: Digital Paleoslavistics, Alexander von Humboldt-Stiftung, Programm zur Förderung von Institutspartnerschaften Abteilung Förderung und Netzwerk, 2018-2020, cooperation partner
  • 2017 · Научно-учебная группа «REALEC для реально необходимых слов» (Научный фонд НИУ ВШЭ, 2016-2017, руководитель)
  • 2018 · Разработка модулей НКРЯ для автоматической разметки и словарной поддержки старорусских и церковнославянских текстов (РГНФ, грант № 17-04-12064, 2017-2018, исполнитель)
  • 2016 · Стандарты оценки методов автоматического извлечения информации из текстов (РФФИ, грант № 15-07-09306, 2014-2016, руководитель)
  • 2016 · Развитие Исторических модулей НКРЯ (РГНФ, грант № 15-04-12050, 2015-2016, исполнитель)
  • 2015 · Квантитативное корпусное исследование грамматической категории числа (Научный фонд НИУ ВШЭ, индивидуальный проект, 2014-2015)
  • 2014 · Синтаксическая разметка корпуса со снятой лексико-грамматической омонимией (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
  • 2014 · ФреймБанк: разметка семантических ролей и морфосинтаксического оформления участников фреймов (на базе НКРЯ) (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2012-2014)
  • 2013 · Частотный словарь русской грамматики и лексической сочетаемости (Научный фонд НИУ ВШЭ, индивидуальный проект, 2012 - 2013) Словообразовательная разметка НКРЯ (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
  • · Фреймбанк (Программа фундаментальных исследований Президиума РАН "Корпусная лингвистика", 2011)
  • 2012 · От корпуса к словарю: автоматические методы выявления и построения каталога русских конструкций (РФФИ, грант № 10-06-00586а, совместно с О.А.Митрофановой, 2010-2012)
  • 2012 · Exploring Emptiness: Russian Verbal Morphology and Cognitive Linguistics" (Norsk forskningsråd/Норвежского совета научных исследований, грант проекта Лоры Янды и Туре Нессета, 2008 - 2012)
  • 2009 · Топологические типы русских предметных имен (РГНФ, грант № 07-04-00240а, 2007 - 2009)

Конференции (30)

Показать все
  • · 2025: 10th Workshop on Slavic Natural Language Processing (Slavic NLP 2025), 31.07.2025, Вена, Австрия (Вена). Доклад: Rubic2: Ensemble Model for Russian Lemmatization
  • · 2025: Third Workshop on Resources and Representations for Under-Resourced Languages and Domains (RESOURCEFUL-2025) (Таллинн). Доклад: The application of corpus-based language distance measurement to the diatopic variation study (on the material of the Old Novgorodian birchbark letters)
  • · 2024: Русский язык в многоязычном мире (Москва). Доклад: Русский конструктикон как научный и учебный ресурс
  • · 2022: 6-й Колмогоровский семинар по компьютерной лингвистике и наукам о языке (Москва). Доклад: К задаче разработки версии корпусов НКРЯ с разрешенной неоднозначностью морфологической и синтаксической разметки
  • · 2022: 46-я школа-конференция ИППИ РАН «Информационные технологии и системы» (ИТиС-2022) (Огниково Московской области). Доклад: Опыт применения моделей-трансформеров для лемматизации современных и исторических текстов русского языка
  • · 2022: International Conference on Historical Lexicography and Lexicology (ICHLL 2022) (Lorient). Доклад: Automatic collection of parallel thesauri in dictionary/corpus joint system
  • · 2022: 25th International Conference on Text, Speech, and Dialogue (TSD 2022) (Брно). Доклад: Review of Practices of Collecting and Annotating Texts in the Learner Corpus REALEC
  • · 2022: 13th Conference on Language Resources and Evaluation (LREC 2022) (Марсель). Доклад: Constructing a Lexical Resource of Russian Derivational Morphology
  • · 2022: Гаспаровские чтения - 2022 (Москва). Доклад: В стенах кипучих городов: О семантических границах эпитета в свете корпусных данных
  • · 2021: 27-ая Международная конференция по компьютерной лингвистике и интеллектуальным технологиям «Диалог-2021» (Москва). Доклад: Adjunct role labeling for Russian
  • · 2021: XIX EURALEX Congress (Александруполис). Доклад: Revised entries in the multi-volume edition and TEI encoding: a case of the historical dictionary of Russian
  • · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Example, usage variant, and linking between dictionary and corpus data
  • · 2021: 11th International Conference on Historical Lexicography and Lexicology (ICHLL 11) (Logroño, La Rioja). Доклад: Lemmatization in corpus-to-dictionary systems: The case study for Old Church Slavonic
  • · 2021: 18th International Conference on Distributed Computing and Artificial Intelligence (DCAI) (Саламанка). Доклад: Automated Metaphor Identification in Russian and its Implications for Metaphor Studies
  • · 2021: 11th International Conference SLOVKO 2021: NLP, Corpus Linguistics and Interdisciplinarity (Братислава). Доклад: An HMM-based PoS Tagger for Old Church Slavonic
  • · 2021: SCLC-2020/2021: The Slavic Cognitive Linguistics Conference (June 3-6, 2021) (Тромсё). Доклад: On syntactic structures in the Russian Constructicon entries and beyond
  • · 2021: El’Manuscript 2021. Textual heritage and information technologies (Фрайбург). Доклад: Lemmatization of the Middle Russian Corpus within the RNC: Choice of Solutions
  • · 2021: Slavic aspect and (diachronic) corpora. International workshop (Майнц). Доклад: Profiling the behavior of verbs in the Middle Russian Corpus
  • · 2021: The 10th International Conference on Analysis of Images, Social Networks and Texts (Тбилиси). Доклад: Sculpting enhanced dependencies for Belarusian
  • · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: Русский конструктикон: новый лингвистический ресурс, его устройство и специфика
  • · 2020: 26-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям (Москва). Доклад: GRAMEVAL 2020 Shared Task: Russian Full Morphology and Universal Dependencies Parsing
  • · 2019: Digital Transformations & Global Society 2019 (DTGS’2019) (Санкт-Петербург). Доклад: A cross-genre morphological tagging and lemmatization of the Russian poetry: distinctive test sets and evaluation
  • · 2019: Диалог (25-я международная конференция по компьютерной лингвистике и интеллектуальным технологиям) (Москва). Доклад: A Simple Fingerprint Approach to Extracting the Global Prosodic Properties from Field Data
  • · 2019: Historical Corpora and Variation (Кальяри). Доклад: Spelling variation and word clusters in the Middle Russian Corpus
  • · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
  • · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
  • · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
  • · 2019: QUANTITATIVE APPROACHES TO VERSIFICATION (Прага). Доклад: Lexical Diversity and Colour Hues in Russian Poetry: A Corpus-Based Study of Adjectives
  • · 2019: Межкампусная конференция по Digital Humanities «DH Meet-Up HSE» (Москва). Доклад: Данные поэтического корпуса НКРЯ как объект цифровой культуры
  • · 2019: Towards a multilingual constructicon: issues, approaches, perspectives (Дюссельдорф). Доклад: Russian Constructicon: clusters, families, and usage scenarios

Идентификаторы исследователя

Публикации (116)

О задачах и методах словообразовательной разметки в корпусе текстов (Word-formation annotation of the Russian National Corpus – aims and methods)

2009 · ARTICLE · ru

Русский Фреймнет: к задаче создания корпусного словаря конструкций

2009 · CHAPTER · ru

В российской компьютерной лингвистике до сих пор нет ресурсов, аналогичных FrameNet, VerbNet и PropBank, в которых можно было бы получить иллюстрации глагольного и именного управления, а также периферийных лексически ориентированных конструкций. В работе описываются задачи создания и структура FrameNet-ориентированной системы, предназначенной для исследования морфологических, синтаксических, семантических и лексических ограничений в русских конструкциях.

Частотный словарь современного русского языка (на материалах Национального корпуса русского языка)

2009 · BOOK · ru

Частотный словарь содержит сведения о наиболее употребительных словах современного русского языка. Он создан на основе Национального корпуса русского языка, авторитетного и представительного электронного ресурса. Подкорпус 1950-2007 гг. объемом 92 млн. словоупотреблений включает тексты художественной литературы, средств массовой информации, технические, деловые документы и т.д., а также записи разговорной речи. Словарь представляет разнообразную статистическую информацию для 50 тыс. слов общей лексики и 3 тыс. имен собственных и аббревиатур. Приводятся частотные списки лексики, характерной для публицистики, устной речи и других функциональных жанров, а также списки наиболее употребительных существительных, прилагательных, глаголов и слов других частей речи. Частотный словарь может быть использован в различных приложениях, таких как обучение русскому языку как родному и иностранному, лингвистические исследования, создание русских одноязычных и двуязычных словарей, информационный поиск, обнаружение спама, проверка орфографии и т.д.

Инкорпорация и экскорпорация в глагольном управлении: имена частей тела

2008 · CHAPTER · ru

Рассматриваются конструкции с инкорпорированным актантом и условия его проявления в тексте.

Топологические классы имен в семантической разметке Национального корпуса русского языка

2008 · CHAPTER · ru

Предлагается предварительная классификация лексики по топологическим типам (в модели Л.Талми и Е.В.Рахилиной).

Конструкция с творительным формы «X Y-ом»

2008 · CHAPTER · ru

В работе проводится исследование семантики русской конструкции с творительным формы типа хвост кольцом, сложить губки бантиком. Пространственная семантика конструкции описывается в терминах топологических классов (Talmy 2000, Рахилина 2000): анализируются явления совпадения топологических классов и их взаимной аккомодации.

Эксперименты по статистическому разрешению лексико-семантической неоднозначности русских имен существительных в корпусе

2008 · CHAPTER · ru

С помощью компьютерного инструмента автоматического разрешения лексико-семантической неоднозначности слов в контекстах НКРЯ проведены эксперименты а) с использованием не только лексической и семантической, но также и грамматической информации, извлекаемой из контекстов, определение наличия или отсутствия зависимости между данными критериями; б) с изменением ширины контекстного окна и с учётом границ синтагм; в) с установлением объёмов эталонных выборок пропорционально долям контекстов для разных значений в экспериментальной выборке. Обсуждаемые эксперименты направлены на оценку эффективности разрешения неоднозначности с более гибкими параметрами и в условиях недостаточности исходных обучающих данных.

Статистическое разрешение лексико-семантической неоднозначности в контекстах для предметных имён существительных

2008 · CHAPTER · ru

В докладе обсуждаются результаты экспериментов по автоматизации процесса разрешения лексико-семантической неоднозначности слов. Эмпирическим материалом исследования являются примеры употребления предметных имён, извлечённые из Национального корпуса русского языка. Оцениваются оптимальные условия разрешения неоднозначности с учётом двух факторов: лексического наполнения контекстов и лексико-семантической разметки контекстов.

Частотный словарь Национального корпуса русского языка: концепция и технология создания

2008 · CHAPTER · ru

Словарь содержит представительный базовый словник современного русского языка (2-я половина XX – начало XXI вв.), снабженный информацией о частотности употребления, статистическом распределении по текстам и жанрам, по времени создания текстов. Словарь основан на текстах Национального корпуса русского языка объемом 100 млн. словоупотреблении.

Semantic Annotation Layer in Russian National Corpus: Lexical Classes of Nouns and Adjectives

2008 · CHAPTER · en

Описаны правила разрешения лексико-семантической омонимии для имен существительных и прилагательных.

Курсы (12)