Орехов Борис Валерьевич
Факультет гуманитарных наук
Профессиональные интересы
Должности
- Доцент — Факультет гуманитарных наук, Школа лингвистики
Био
- · Начал работать в НИУ ВШЭ в 2013 году.
- · Научно-педагогический стаж: 20 лет.
Образование
- 2008 · Кандидат филологических наук: Воронежский государственный университет, специальность 10.01.01 «Русская литература», тема диссертации: Принципы организации мотивной структуры в лирике Ф. И. Тютчева
- 2005 · Специалитет: Башкирский государственный университет, факультет: филологический, специальность «Филология», квалификация «Магистр филологии»
- 2003 · Бакалавриат: Башкирский государственный университет, факультет: филологический, специальность «Русский язык и литература»
Опыт работы
- · 2013: Начал работать как библиотекарь, затем (2004-2011) преподавал дисциплины литературоведческого цикла в ВЭГУ (Восточная академия экономики, гуманитарных наук, управления и права), Башкирском государственном педагогическом университете (г. Уфа). С года в Вышке занят преподаванием программирования и Digital Humanities
- · Как научный работник привлекался в Башкирском университете, университете Осло, Университете Ниццы, РАНХиГС, СПбГУ, МГУ.
Награды и поощрения
- · Почетная грамота факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
- · Благодарность проректора НИУ ВШЭ (ноябрь 2023)
- · Благодарность Факультета гуманитарных наук НИУ ВШЭ (декабрь 2020)
- · Благодарность первого проректора НИУ ВШЭ (декабрь 2017)
- · Надбавка за академические достижения и вклад в репутацию НИУ ВШЭ (2020–2022)
- · Надбавка за академическую работу (2017–2018, 2016–2017, 2014–2015)
- · Надбавка за публикации, вносящие особый вклад в международную научную репутацию НИУ ВШЭ (2024–2027)
- · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023, 2021–2022)
- · Лучший преподаватель — 2022, 2018
- · Победитель Конкурса лучших русскоязычных научных и научно-популярных работ работников НИУ ВШЭ – 2024, 2023, 2021
- · Лучший академический руководитель в номинации «Межфакультетское взаимодействие» — 2023
Гранты и проекты
- — · на соискание учёной степени кандидата наук
Идентификаторы исследователя
- ORCID:
0000-0002-9099-0436 - ResearcherID:
LSL-3714-2024 - SPIN РИНЦ:
1668-7217 - Google Scholar: https://scholar.google.ru/citations?user=EMcL0ioAAAAJ&hl=en
- Scopus AuthorID:
24577640400
Публикации (109)
История стиховедения и формализм
2024 · ARTICLE · ru
Ядерная идея формализма в том, что литература не является простой функцией психологии или социальной теории и не может быть объяснена с помощью аппарата этих наук. Можно сказать, что стиховедение едва ли не единственная филологическая субдисциплина, которая сумела сохранить основную идею формализма, объясняя стиховедческие факты стиховедчески, а не экономически, социологически или психологически. Именно так, не прибегая к редукционизму, но выстраивая свою концепцию истории культуры как череды кризисов и их разрешений, действует в статье об истории русской рифмы М. Л. Гаспаров. М. И. Шапир в известной работе об эволюции русского четырехстопного ямба специально подчеркивает необычность применяемого им хода — объяснения стиховедческого факта с помощью исторически зафиксированных социально значимых событий. Стиховедение более всех остальных литературоведческих направлений сохраняет герметичность, предполагающую объяснение литературных данных через литературные обстоятельства. То, как литература оказывается в ситуации необходимости отстаивать свою обособленность от других наук, напоминает положение, в котором оказались в свое время социология и лингвистика, борьбу за отделенность которых от психологии вели Дюркгейм и Соссюр. В новейшее время под методологию формалистов пытался мимикрировать Франко Моретти, который при этом все же отстаивал ценности методологически враждебного лагеря, предполагающего, что литературные факты можно объяснять, используя логику социальных наук.
Парадоксы парадигмы: проблемы и решения в организации учебной программы по Digital Humanities
2024 · CHAPTER · ru
В главе говорится о вызовах, с которыми приходится сталкиваться тому, кто организовывает учебную программу по digital humanities
Hacking stylometry with multiple voices: Imaginary writers can override authorial signal in Delta
2023 · ARTICLE · en
It is a basic assumption of stylometry that texts written by the same person show greater stylometric similarity even if published under multiple pennames. Statistical authorship attribution strongly relies on the ability of Burrows’s Delta and its variants to cluster one author together regardless of pseudonyms. At the same time, the very first computational discoveries by the founder of modern stylometry showed that a single author is capable of producing multiple voices (Burrows, 1987, Computation into Criticism: A Study of Jane Austen’s Novels and an Experiment in Method. Clarendon Press). We investigate two authors whose stylistically autonomous pennames seem to deceive Delta and override authorial signals: a Portuguese poet Fernando Pessoa and a French novelist Romain Gary. Pessoa managed to create at least three pennames (the author himself used the term ‘heteronym’) who exhibit all traits of individual human beings from the stylometric point of view. Gary’s alter ego Emile Ajar, who was an intentional literary mystification, also demonstrates traits of stylometric autonomy. At the same time, other pseudonyms used by Gary lack that autonomy completely. Our investigation shows that there appears to be a continuum between a purely formal use of a penname, which brings almost no distinction from the real name of an author, and a strong literary sub-personality such as those created by Pessoa.
Identifying the style by a qualified reader on a short fragment of generated poetry
2023 · PREPRINT · en
Style is an important concept in today's challenges in natural language generating. After the success in the field of image style transfer, the task of text style transfer became actual and attractive. Researchers are also interested in the tasks of style reproducing in generation of the poetic text. Evaluation of style reproducing in natural poetry generation remains a problem. I used 3 character-based LSTM-models to work with style reproducing assessment. All three models were trained on the corpus of texts by famous Russian-speaking poets. Samples were shown to the assessors and 4 answer options were offered, the style of which poet this sample reproduces. In addition, the assessors were asked how well they were familiar with the work of the poet they had named. Students studying history of literature were the assessors, 94 answers were received. It has appeared that accuracy of definition of style increases if the assessor can quote the poet by heart. Each model showed at least 0.7 macro-average accuracy. The experiment showed that it is better to involve a professional rather than a naive reader in the evaluation of style in the tasks of poetry generation, while lstm models are good at reproducing the style of Russian poets even on a limited training corpus.
Цифровые гуманитарные исследования
2023 · BOOK · ru
Впервые на русском языке комплексно рассмотрено актуальное междисциплинарное направление — цифровые гуманитарные исследования, или digital humanities. Приведены примеры (само)определения направления, дан их обзор. «Цифровой поворот» в гуманитарных исследованиях и масштабные проекты оцифровки историко-культурного наследия описаны в контексте датафикации и вызовов больших данных и машинного обучения. Особое внимание уделено современным подходам к компьютерному анализу текстов и культуромике, направлению исследований культуры и языка с помощью больших текстовых данных. Представлена широкая палитра цифровых подходов, призванных находить решения насущных гуманитарных исследовательских задач: от базы данных к сетевому анализу, от геоинформационных систем к виртуальным реконструкциям и дополненной реальности. Происходящие процессы рассмотрены в связи со становлением сложной и противоречивой информационной инфраструктуры цифровых гуманитарных исследований. Будет интересна широкому кругу гуманитариев — историкам, филологам, философам, культурологам — и всем сочувствующим и сопереживающим цифровой трансформации современной культуры.
Как «толстый» журнал изменил заглавия русских романов: эволюция 2000 заглавий (1763–1917)
2023 · ARTICLE · ru
На материале датасета из 2036 заглавий русских романов с 1763 по 1917 годы в статье ставится вопрос об эволюции средней длины заглавия за 150 лет истории оригинальных романов. В отличие от британских романов, в которых заглавия, согласно гипотезе Ф. Моретти, укорачивались в результате рыночной конкуренции, заглавия российских романов начиная с 1840-х годов становились короче в первую очередь за счет влияния толстого журнала как особой культурной формы и институциональной рамки. Ведущие российские критики, обладавшие большим авторитетом, задавали тренд на короткие и более символически нагруженные заглавия, дискредитируя архаичные и длинные названия, характерные для жанров авантюрно-плутовских романов. Кроме того, оказалось, что укорачивание заглавий повлекло за собой изменение в соотношении элементов: дополнительная метатекстуальная информация (аннотация, жанр, автор) с 1830-х годов почти полностью ушла из заглавия в подзаголовок, вследствие чего заглавия приобрели особый художественный статус и большую смысловую значимость. Ключевые слова: роман, заглавие романа, толстый литературный журнал, литература Российской империи, цифровые гуманитарные исследования
Индивидуальная семантика Л. Н. Толстого в свете векторных моделей
2023 · ARTICLE · ru
Статья представляет цифровой подход к установлению особенностей индивидуальной семантики Л.Н. Толстого с помощью векторно-семантических моделей. Сравнение данных таких моделей позволяет отразить особенности индивидуальной авторской семантики. На лемматизированных текстах Толстого с помощью программного модуля gensim было построено две модели. Одна из них сравнивалась с уже имеющейся моделью с сайта rusvectores. Особенное внимание в статье уделено лексемам «любовь» и «поле». Для первого установлена значимая в контексте мировоззрения писателя оппозиция истинной и неистинной любви, последняя выражается нейтральными для русского языка (но не для языка Толстого) словами «боготворить» и «обожать». Лексема «поле» против ожиданий выражает не батальный, а аграрный и пейзажный смысл. При сравнении векторов слов идиостиля Толстого и «Национального корпуса русского языка» оказалось возможным выявить те лексемы, которые в наименьшей степени отличаются по семантике в языке и идиостиле. К таким принадлежат, например, слова «социалист» и «таинство». Метод оказывается перспективным для дополнения традиционных лексикографических практик.
The Typology of Physical Qualities
2022 · BOOK · en
This book presents a lexico-typological study of several domains of physical qualities: ‘sharp’/‘blunt’, ‘wet’, ‘empty’/‘full’, ‘old’, as well as dimensions temperature and surface texture. It discusses several theoretical issues including intragenetic language sampling, the possibility of signed vs. spoken language comparison at the lexicon level, and the potential of applying computational models of distributional semantics to lexical typology.
ПЕРСИДСКИЙ ПОЭТИЧЕСКИЙ КОРПУС
2022 · ARTICLE · ru
В тексте речь идет о технических принципах, легших в основу нового корпуса персидского языка, размещенного в интернете по адресу linghub.ru/persian_poet_ corpus. Корпус принадлежит к типу поэтических, то есть содержит в себе стихотворные произведения и имеет специальную разметку, отражающую стиховой уровень организации текста, в нашем случае — это метр и рифма. Корпуса подобного типа уже созданы для русского, башкирского и чешского языков. В случае с персидским языком создание корпуса было сопряжено с дополнительными сложностями, так как мы не располагаем инструментами автоматической разметки нескольких ключевых параметров персидского языка (например, нет возможности сделать фонетическую транскрипцию или транслитерацию текста). Корпус составляют тексты общим объемом около 4 млн токенов, представленных в 16 тыс. произведений. Корпус разнообразен с жанровой (15 наименований), авторской и временной точки зрения, так как охватывает сочинения нескольких десятков авторов, живших на протяжении IX–XVII веков. Тексты имеют морфологическую разметку. Стихотворный метр заимствован с сайта ganjoor.net, а разметка рифмы и редифа осуществлена собственными силами.
Курсы (11)
-
Дигитализация гуманитарного знания · 5 раза
2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Аспирантура / Аспирантура направление: 00.00.00. Аспирантура / Аспирантура направление: 45.06.01. Языкознание и литературоведение · рус
-
Семинар наставника "Digital Humanities" · 3 раза
2025/2026, 2024/2025, 2023/2024 · Магистратура · рус
-
Программирование · 4 раза
2024/2025, 2023/2024, 2022/2023, 2021/2022 · Аспирантура / Аспирантура направление: 00.00.00. Аспирантура / Аспирантура направление: 45.06.01. Языкознание и литературоведение · рус
-
Количественные исследования в гуманитарных науках: критическое введение
2023/2024 · Дисциплина общефакультетского пула · рус
-
Мастер-классы
2023/2024 · Магистратура · рус
-
Проектно-исследовательский семинар "Цифровые проекты" · 3 раза
2023/2024, 2022/2023, 2021/2022 · Магистратура · рус
-
Семинар наставника · 2 раза
2023/2024, 2022/2023 · Магистратура · рус
-
Научно-исследовательский семинар "Digital Humanities"
2022/2023 · Магистратура / Пермь · рус
-
Программирование (язык Python)
2021/2022 · язык Python · рус
-
Проектно-исследовательский семинар "Проектирование цифровых гуманитарных ресурсов и систем"
2021/2022 · Магистратура · рус
-
Цифровые гуманитарные науки
2021/2022 · Магистратура · рус