Орехов Борис Валерьевич
Факультет гуманитарных наук
Профессиональные интересы
Должности
- Доцент — Факультет гуманитарных наук, Школа лингвистики
Био
- · Начал работать в НИУ ВШЭ в 2013 году.
- · Научно-педагогический стаж: 20 лет.
Образование
- 2008 · Кандидат филологических наук: Воронежский государственный университет, специальность 10.01.01 «Русская литература», тема диссертации: Принципы организации мотивной структуры в лирике Ф. И. Тютчева
- 2005 · Специалитет: Башкирский государственный университет, факультет: филологический, специальность «Филология», квалификация «Магистр филологии»
- 2003 · Бакалавриат: Башкирский государственный университет, факультет: филологический, специальность «Русский язык и литература»
Опыт работы
- · 2013: Начал работать как библиотекарь, затем (2004-2011) преподавал дисциплины литературоведческого цикла в ВЭГУ (Восточная академия экономики, гуманитарных наук, управления и права), Башкирском государственном педагогическом университете (г. Уфа). С года в Вышке занят преподаванием программирования и Digital Humanities
- · Как научный работник привлекался в Башкирском университете, университете Осло, Университете Ниццы, РАНХиГС, СПбГУ, МГУ.
Награды и поощрения
- · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
- · Благодарность проректора НИУ ВШЭ (ноябрь 2023)
- · Благодарность Факультета гуманитарных наук НИУ ВШЭ (декабрь 2020)
- · Благодарность первого проректора НИУ ВШЭ (декабрь 2017)
- · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2020–2022)
- · Надбавка за академическую работу (2017–2018, 2016–2017, 2014–2015)
- · Надбавка за публикации, вносящие особый вклад в международную научную репутацию НИУ ВШЭ (2024–2027)
- · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022)
- · Лучший преподаватель — 2022, 2018
- · Победитель Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ – 2024, 2023, 2021
- · Лучший академический руководитель в номинации «Межфакультетское взаимодействие» — 2023
Гранты и проекты
- — · на соискание учёной степени кандидата наук
Идентификаторы исследователя
- ORCID:
0000-0002-9099-0436 - ResearcherID:
LSL-3714-2024 - SPIN РИНЦ:
1668-7217 - Google Scholar: https://scholar.google.ru/citations?user=EMcL0ioAAAAJ&hl=en
- Scopus AuthorID:
24577640400
Публикации (109)
Сюжетная цитата из Набокова в «Хищных вещах века»
2020 · ARTICLE · ru
В статье рассматривается проблема литературного цитирования. На примере цитаты из романа Набокова "Лолита" в повести "Хищные вещи века" А. и Б. Стругацких показывается, что недостаточно просто установить литературную параллель между двумя текстами, требуется ещё и описать функциональность этой цитаты.
Унификация данных музейного Госкаталога РФ
2020 · ARTICLE · ru
В эпоху больших данных растет интерес в том числе и к большим данным в гуманитарных сферах (на- пример, в рамках цифровой гуманитаристики). В России существует Государственный каталог Музейного фонда Российской Федерации, где собирается информация об экспонатах из коллекций российских му- зеев. В настоящее время описано более 16 млн экспонатов. Многие поля в базе заполнены на естествен- ном языке, например, «XIX век» в качестве даты создания предмета, что делает практически невозможным анализ данных. Инструменты автоматической обработки языка (например, извлечение именованных сущ- ностей) позволяют унифицировать данные и привести их в удобный для анализа вид. В работе показано, как можно обрабатывать информацию о дате создания, месте создания, авторах и техниках. В качестве иллюстрации того, как можно использовать нормализованные данные, приводится некоторая аналитика по странам и периодам в разных категориях экспонатов, что позволяет увидеть известные закономерности.
“Volume 91”: An electronic index to the complete works of Leo Tolstoy
2020 · ARTICLE · en
Собрание сочинений Льва Толстого было опубликовано в 90 томах объемом около 46 000 страниц в период с 1928 по 1958 год. Но наша статья о 91-м томе этого издания, томе-приложении, содержащем указатели произведений и имена собственные как из художественных произведений, так и из других томов, содержащих письма и дневники Толстого. «91-й том» - это веб-приложение, основанное на оцифрованном указателе имен собственных для 90-томного собрания сочинений Толстого (http://index.tolstoy.ru/). Оцифрованные данные имеют дополнительные свойства, которые могут быть полезны как энтузиастам, так и специалистам. В этой статье делается попытка не только представить новый инструмент для литературоведов, но и обобщить, как можно использовать такого рода ресурсы для получения нового знания из крупных текстовых коллекций.
Tolstoy semanticized: Constructing a digital edition for knowledge discovery
2019 · ARTICLE · en
The paper presents the results of a project devoted to the creation of a digital edition of Leo Tolstoy's complete works. Our primary source is the 90-volume critical print edition of Tolstoy's oeuvre. We discuss the rationale for semantic markup of metadata for three classes of texts: works, letters and diaries. We extract information from the critical apparatus and supplement it with some new additional markups that enable visualizing the evolution of Tolstoy as a publicist. We show that the named entity index constitutes a valuable knowledge base, which can serve as a basis for generating a knowledge graph that is more detailed and systematic than the open linked databases like DBpedia.
Башкирский стих XX века. Корпусное исследование
2019 · BOOK · ru
В книге предпринимается всестороннее количественное исследование башкирской системы версификации в XX веке. Анализу с использованием современных статистических инструментов подвергаются все уровни организации стихотворного текста от фоники до лексики и грамматики, с особенным вниманием к метру и ритму. Количественные данные получены на корпусе текстов 103 башкирских поэтов общим объемом в 1.77 млн. словоупотреблений. Собственно анализ предварен подробным обзором науки о тюркском стихе, начиная с 1950-х годов. Утверждается, что основную роль в башкирском стихосложении XX века играют силлабические формы фольклорного происхождения узун-кюй и кыска-кюй, первая из которых специфична для поволжско-кыпчакского слогосчитающего стиха. В одной из глав приводится подробное сопоставление башкирского стиха с киргизским. Книга завершается примерами поэтических текстов на башкирском языке, сгенерированных с использованием искусственных нейронных сетей.
Специфические слова и выражения русских классиков XIX века: опыт контрастивного корпусного исследования
2019 · ARTICLE · ru
Статья представляет результаты количественного исследования, выявляющего характерные и специфические низкочастотные слова для прозы русских классиков XIX века. С помощью меры TF-IDF и большой коллекции текстов XIX века для Тургенева, Гончарова, Лескова, Достоевского рассчитываются слова и обороты, которые редко встречаются или не встречаются у других авторов, но несколько раз появляются в прозе классиков. Такой контрастивный подход способен дополнить традиционную авторскую лексикографию, выявить специфические черты стиля конкретного автора на фоне современного ему языка. Специфические слова и обороты писателей разнообразны, имеют иноязычное происхождение, восходят к современным писателю реалиям либо отражают особенности его авторского стиля. Характерные слова Гончарова отражают жанровую специфику его корпуса. Слова, рассчитанные для Тургенева, Лескова и Достоевского, хорошо соотносятся с особенностями стиля этих писателей. При этом выявленная лексика Достоевского еще раз подчеркивает его историко-литературную связь с Гоголем и дает материал для филологического анализа, который может привести к обоснованию знакомства автора «великого пятикнижия» с трудами П. А. Кропоткина
Метр отрезков длиннее строки в башкирском силлабическом стихе
2019 · ARTICLE · ru
В статье на башкирском материале рассматривается специфический элемент силлабического стихосложения: упорядоченные чередования строк разной длины. Такие стиховые формы существуют в тюркском стихе наряду с привычными изосиллабическими стихотворениями. Статус таких форм неоднозначен, их можно рассматривать и как строфу, и как отдельный метр. Аналогичным трудным случаем для традиционного стиховедения служит элегический дистих. На материале корпуса текстов 103 башкирских поэтов мы проанализировали соотношение изосиллабических и гетеросиллабических стиховых форм. Наиболее распространенными среди последних являются “узун-кюй” и “кыска-кюй”, формы фольклорного происхождения, представленные в виде регулярного чередования 10- и 9-сложных, а также 8- и 7-сложных строк. Результаты подсчетов показали, что ритм 8-сложников в изосиллабических текстах и в кыска-кюй серьезно отличается. В изосиллабических текстах обязательна цезура после 4-го слога, а в кыска-кюй ее обычно не бывает.
Preface: Data-Driven Formalism
2019 · ARTICLE · en
The idea of producing a special volume of hitherto untranslated texts by Russian formalists owes its existence to a newly awakened interest in quantification in the (digital) literary studies. A first indication of this was the conference in Stanford in 2015, entitled »Russian Formalism and the Digital Humanities«. The reason for this interest is simple: With the manifold practices developed in the digital literary studies in the past decade, we are now able to operationalise and automatise formalist research ideas, to reproduce them, to scale them up and to further develop methods along those lines. In this volume, we present three articles by Russian scholars, Muscovite scholars, to be precise. Boris I. Yarkho (1889–1942), Mikhail L. Gasparov (1935–2005) and Maksim I. Shapir (1962–2006) come from different periods representing three generations of Russian formalism, and their works are strongly intertwined.
«Праздник урожая во Дворце труда» в контексте поэтики Б. Гребенщикова
2019 · CHAPTER · ru
В статье даётся построчный комментарий к тексту песни Б. Гребенщикова «Праздник урожая во дворце труда», предлагаются варианты интерпретаций образного ряда. Концептуальная рамка для декодирования текста – отклик на события переломной эпохи, контраст 1990-х и современности, интертекстуальные источники – другие тексты того же автора, артефакты массовой культуры, язык советского времени.
Курсы (11)
-
Дигитализация гуманитарного знания · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Аспирантура / Аспирантура направление: 00.00.00. Аспирантура / Аспирантура направление: 45.06.01. Языкознание и литературоведение · рус
-
Семинар наставника "Digital Humanities" · 3 раза
2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
-
Программирование · 4 раза
2024/2025, 2023/2024, 2022/2023, 2021/2022 · Аспирантура / Аспирантура направление: 00.00.00. Аспирантура / Аспирантура направление: 45.06.01. Языкознание и литературоведение · рус
-
Количественные исследования в гуманитарных науках: критическое введение
2023/2024 · Дисциплина общефакультетского пула · рус
-
Мастер-классы
2023/2024 · Магистратура · рус
-
Проектно-исследовательский семинар "Цифровые проекты" · 3 раза
2023/2024, 2022/2023, 2021/2022 · Магистратура · рус
-
Семинар наставника · 2 раза
2023/2024, 2022/2023 · Магистратура · рус
-
Научно-исследовательский семинар "Digital Humanities"
2022/2023 · Магистратура / Пермь · рус
-
Программирование (язык Python)
2021/2022 · язык Python · рус
-
Проектно-исследовательский семинар "Проектирование цифровых гуманитарных ресурсов и систем"
2021/2022 · Магистратура · рус
-
Цифровые гуманитарные науки
2021/2022 · Магистратура · рус