DSA Faculty
API
← к списку преподавателей

Орехов Борис Валерьевич

Факультет гуманитарных наук

Профиль на hse.ru ↗ тел.: +7 (495) 772-9590 доб. 22724
Публикаций
109
Языков
4
Наград
11
Конференций
0
Профиль Публикации (109) Курсы (11)

Профессиональные интересы

16.21.65 Лексикография16.21.47 Лексикология. Терминоведение17.00.00 Литература. Литературоведение. Устное народное творчество16.31.61 Приложение языкознания к другим наукам16.31.21 Автоматическая обработка текста. Автоматический перевод. Автоматическое распознавание речи28.23.00 Искусственный интеллект

Должности

  • ДоцентФакультет гуманитарных наук, Школа лингвистики

Био

  • · Начал работать в НИУ ВШЭ в 2013 году.
  • · Научно-педагогический стаж: 20 лет.

Образование

  • 2008 · Кандидат филологических наук: Воронежский государственный университет, специальность 10.01.01 «Русская литература», тема диссертации: Принципы организации мотивной структуры в лирике Ф. И. Тютчева
  • 2005 · Специалитет: Башкирский государственный университет, факультет: филологический, специальность «Филология», квалификация «Магистр филологии»
  • 2003 · Бакалавриат: Башкирский государственный университет, факультет: филологический, специальность «Русский язык и литература»

Опыт работы

  • · 2013: Начал работать как библиотекарь, затем (2004-2011) преподавал дисциплины литературоведческого цикла в ВЭГУ (Восточная академия экономики, гуманитарных наук, управления и права), Башкирском государственном педагогическом университете (г. Уфа). С года в Вышке занят преподаванием программирования и Digital Humanities
  • · Как научный работник привлекался в Башкирском университете, университете Осло, Университете Ниццы, РАНХиГС, СПбГУ, МГУ.

Награды и поощрения

  • · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
  • · Благодарность проректора НИУ ВШЭ (ноябрь 2023)
  • · Благодарность Факультета гуманитарных наук НИУ ВШЭ (декабрь 2020)
  • · Благодарность первого проректора НИУ ВШЭ (декабрь 2017)
  • · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2020–2022)
  • · Надбавка за академическую работу (2017–2018, 2016–2017, 2014–2015)
  • · Надбавка за публикации, вносящие особый вклад в международную научную репутацию НИУ ВШЭ (2024–2027)
  • · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022)
  • · Лучший преподаватель — 2022, 2018
  • · Победитель Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ – 2024, 2023, 2021
  • · Лучший академический руководитель в номинации «Межфакультетское взаимодействие» — 2023

Гранты и проекты

  • · на соискание учёной степени кандидата наук

Идентификаторы исследователя

Публикации (109)

Сюжетная цитата из Набокова в «Хищных вещах века»

2020 · ARTICLE · ru

В статье рассматривается проблема литературного цитирования. На примере цитаты из романа Набокова "Лолита" в повести "Хищные вещи века" А. и Б. Стругацких показывается, что недостаточно просто установить литературную параллель между двумя текстами, требуется ещё и описать функциональность этой цитаты.

Унификация данных музейного Госкаталога РФ

2020 · ARTICLE · ru

В эпоху больших данных растет интерес в том числе и к большим данным в гуманитарных сферах (на- пример, в рамках цифровой гуманитаристики). В России существует Государственный каталог Музейного фонда Российской Федерации, где собирается информация об экспонатах из коллекций российских му- зеев. В настоящее время описано более 16 млн экспонатов. Многие поля в базе заполнены на естествен- ном языке, например, «XIX век» в качестве даты создания предмета, что делает практически невозможным анализ данных. Инструменты автоматической обработки языка (например, извлечение именованных сущ- ностей) позволяют унифицировать данные и привести их в удобный для анализа вид. В работе показано, как можно обрабатывать информацию о дате создания, месте создания, авторах и техниках. В качестве иллюстрации того, как можно использовать нормализованные данные, приводится некоторая аналитика по странам и периодам в разных категориях экспонатов, что позволяет увидеть известные закономерности.

“Volume 91”: An electronic index to the complete works of Leo Tolstoy

2020 · ARTICLE · en

Собрание сочинений Льва Толстого было опубликовано в 90 томах объемом около 46 000 страниц в период с 1928 по 1958 год. Но наша статья о 91-м томе этого издания, томе-приложении, содержащем указатели произведений и имена собственные как из художественных произведений, так и из других томов, содержащих письма и дневники Толстого. «91-й том» - это веб-приложение, основанное на оцифрованном указателе имен собственных для 90-томного собрания сочинений Толстого (http://index.tolstoy.ru/). Оцифрованные данные имеют дополнительные свойства, которые могут быть полезны как энтузиастам, так и специалистам. В этой статье делается попытка не только представить новый инструмент для литературоведов, но и обобщить, как можно использовать такого рода ресурсы для получения нового знания из крупных текстовых коллекций.

Tolstoy semanticized: Constructing a digital edition for knowledge discovery

2019 · ARTICLE · en

The paper presents the results of a project devoted to the creation of a digital edition of Leo Tolstoy's complete works. Our primary source is the 90-volume critical print edition of Tolstoy's oeuvre. We discuss the rationale for semantic markup of metadata for three classes of texts: works, letters and diaries. We extract information from the critical apparatus and supplement it with some new additional markups that enable visualizing the evolution of Tolstoy as a publicist. We show that the named entity index constitutes a valuable knowledge base, which can serve as a basis for generating a knowledge graph that is more detailed and systematic than the open linked databases like DBpedia.

Башкирский стих XX века. Корпусное исследование

2019 · BOOK · ru

В книге предпринимается всестороннее количественное исследование башкирской системы версификации в XX веке. Анализу с использованием современных статистических инструментов подвергаются все уровни организации стихотворного текста от фоники до лексики и грамматики, с особенным вниманием к метру и ритму. Количественные данные получены на корпусе текстов 103 башкирских поэтов общим объемом в 1.77 млн. словоупотреблений. Собственно анализ предварен подробным обзором науки о тюркском стихе, начиная с 1950-х годов. Утверждается, что основную роль в башкирском стихосложении XX века играют силлабические формы фольклорного происхождения узун-кюй и кыска-кюй, первая из которых специфична для поволжско-кыпчакского слогосчитающего стиха. В одной из глав приводится подробное сопоставление башкирского стиха с киргизским. Книга завершается примерами поэтических текстов на башкирском языке, сгенерированных с использованием искусственных нейронных сетей.

Специфические слова и выражения русских классиков XIX века: опыт контрастивного корпусного исследования

2019 · ARTICLE · ru

Статья представляет результаты количественного исследования, выявляющего характерные и специ­фические низкочастотные слова для прозы русских классиков XIX века. С помощью меры TF-IDF и большой коллекции текстов XIX века для Тургенева, Гончарова, Лескова, Достоевского рассчитываются слова и обороты, которые редко встречаются или не встречаются у других авторов, но не­сколько раз появляются в прозе классиков. Такой контрастивный подход способен дополнить тради­ционную авторскую лексикографию, выявить специфические черты стиля конкретного автора на фоне современного ему языка. Специфические слова и обороты писателей разнообразны, имеют ино­язычное происхождение, восходят к современным писателю реалиям либо отражают особенности его авторского стиля. Характерные слова Гончарова отражают жанровую специфику его корпуса. Слова, рассчитанные для Тургенева, Лескова и Достоевского, хорошо соотносятся с особенностями стиля этих писателей. При этом выявленная лексика Достоевского еще раз подчеркивает его истори­ко-литературную связь с Гоголем и дает материал для филологического анализа, который может при­вести к обоснованию знакомства автора «великого пятикнижия» с трудами П. А. Кропоткина

Метр отрезков длиннее строки в башкирском силлабическом стихе

2019 · ARTICLE · ru

В статье на башкирском материале рассматривается специфический элемент силлабического стихосложения: упорядоченные чередования строк разной длины. Такие стиховые формы существуют в тюркском стихе наряду с привычными изосиллабическими стихотворениями. Статус таких форм неоднозначен, их можно рассматривать и как строфу, и как отдельный метр. Аналогичным трудным случаем для традиционного стиховедения служит элегический дистих. На материале корпуса текстов 103 башкирских поэтов мы проанализировали соотношение изосиллабических и гетеросиллабических стиховых форм. Наиболее распространенными среди последних являются “узун-кюй” и “кыска-кюй”, формы фольклорного происхождения, представленные в виде регулярного чередования 10- и 9-сложных, а также 8- и 7-сложных строк. Результаты подсчетов показали, что ритм 8-сложников в изосиллабических текстах и в кыска-кюй серьезно отличается. В изосиллабических текстах обязательна цезура после 4-го слога, а в кыска-кюй ее обычно не бывает.

Preface: Data-Driven Formalism

2019 · ARTICLE · en

The idea of producing a special volume of hitherto untranslated texts by Russian formalists owes its existence to a newly awakened interest in quantification in the (digital) literary studies. A first indication of this was the conference in Stanford in 2015, entitled »Russian Formalism and the Digital Humanities«. The reason for this interest is simple: With the manifold practices developed in the digital literary studies in the past decade, we are now able to operationalise and automatise formalist research ideas, to reproduce them, to scale them up and to further develop methods along those lines. In this volume, we present three articles by Russian scholars, Muscovite scholars, to be precise. Boris I. Yarkho (1889–1942), Mikhail L. Gasparov (1935–2005) and Maksim I. Shapir (1962–2006) come from different periods representing three generations of Russian formalism, and their works are strongly intertwined.

Нейрошағир

2019 · ARTICLE · ba

«Праздник урожая во Дворце труда» в контексте поэтики Б. Гребенщикова

2019 · CHAPTER · ru

В статье даётся построчный комментарий к тексту песни Б. Гребенщикова «Праздник урожая во дворце труда», предлагаются варианты интерпретаций образного ряда. Концептуальная рамка для декодирования текста – отклик на события переломной эпохи, контраст 1990-х и современности, интертекстуальные источники – другие тексты того же автора, артефакты массовой культуры, язык советского времени.

Курсы (11)