DSA Faculty
API
← к списку преподавателей

Старченко Алексей Миронович

Факультет гуманитарных наук

Публикаций
23
Языков
2
Наград
4
Конференций
20
Профиль Публикации (23) Курсы (11)

Профессиональные интересы

лингвистикаформальная лингвистиканоминализациялингвистика стихаполевая лингвистикачукотский языкхантыйский язык

Должности

  • Старший преподавательФакультет гуманитарных наук, Школа лингвистики
  • аспирантФакультет гуманитарных наук, Школа лингвистики
  • Младший научный сотрудникЦентр фундаментальных исследований, Лингвистическая лаборатория по корпусным технологиям
  • Младший научный сотрудникФакультет гуманитарных наук, Научно-учебная лаборатория социогуманитарных исследований Севера и Арктики

Био

  • · Начал работать в НИУ ВШЭ в 2018 году.
  • · Научно-педагогический стаж: 8 лет.

Образование

  • 2023 · Магистратура: Национальный исследовательский университет "Высшая школа экономики", специальность «Фундаментальная и прикладная лингвистика», квалификация «Магистр»
  • 2021 · Бакалавриат: Национальный исследовательский университет "Высшая школа экономики", специальность «Фундаментальная и прикладная лингвистика», квалификация «Бакалавр»

Опыт работы

  • · Работа в НИУ ВШЭ.

Награды и поощрения

  • · Благодарность факультета гуманитарных наук НИУ ВШЭ (ноябрь 2024)
  • · Надбавка за публикацию в журнале из Списка B (2025–2026)
  • · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2024–2025)
  • · Группа высокого профессионального потенциала (кадровый резерв НИУ ВШЭ)Категория "Новые исследователи" (2024–2025)

Конференции (20)

Показать все
  • · 2025: Rencontres Autour de la Linguistique Formelle (Lille). Доклад: Experiential predicative nominalization as nominal predication in Chukchi
  • · 2025: 58th Annual Meeting of the Societas Linguistica Europaea (Бордо). Доклад: Perception-finding polysemy: Chukchi and beyond
  • · 2025: Пятая конференция по уральским, алтайским и палеоазиатским языкам (Санкт-Петербург). Доклад: База редупликаций в чукотском языке
  • · 2025: Пятая конференция по уральским, алтайским и палеоазиатским языкам (Санкт-Петербург). Доклад: База редупликаций в чукотском языке
  • · 2024: Rencontres Autour de la Linguistique Formelle 2024 (Bayonne). Доклад: An unusual n-based nominalization in Northern Khanty
  • · 2024: 57th Annual Meeting of the Societas Linguistica Europaea (Хельсинки). Доклад: Dual in Numeral Constructions
  • · 2024: Syntax of Uralic languages 5 (Гамбург). Доклад: General noun modifying clause construction in Northern Khanty
  • · 2024: Типология морфосинтаксических параметров (Москва). Доклад: Мал мала меньше: малые именные группы в казымском диалекте хантыйского языка
  • · 2023: TripleA Workshop for Semantic Fieldworkers (Потсдам). Доклад: Complementary pieces of NP structure: Nominalizations and proprietive attributives in Kazym Khanty
  • · 2023: 56th Annual Meeting of the Societas Linguistica Europaea (Афины). Доклад: Two functions of nominalizations in Amguema Chukchi: Shift to uncommon
  • · 2023: 13-я конференция «Типология морфосинтаксических параметров» (Москва). Доклад: Person-number asymmetry: Agreement of passive miratives in Kazym Khanty
  • · 2022: XIX конференция по типологии и грамматике для молодых исследователей (Санкт-Петербург). Доклад: How languages with the dual differ from the others: The case of numeral-noun constructions
  • · 2022: Syntax of Uralic Languages 4 (St. Petersburg (online)). Доклад: The mirative construction in Kazym Khanty
  • · 2021: XVIII Конференция по типологии и грамматике для молодых исследователей (Санкт-Петербург). Доклад: В имя или в глагол: инкорпорация в номинализацию в амгуэмском диалекте чукотского языка
  • · 2021: Причинные конструкции в языках мира (синхрония, диахрония, типология) (Санкт-Петербург). Доклад: Causal particle I in Russian
  • · 2020: XVII конференция по типологии и грамматике для молодых исследователей (Санкт-Петербург). Доклад: Сегодня холоднее вчерашнего: сравнительные конструкции с атрибутивным стандартом сравнения
  • · 2019: 3rd SOUL - Syntax of Uralic Languages (Tartu). Доклад: Periphrastic Nominalization in Kazym Khanty
  • · 2019: 9-я тематическая конференция серии «Типология морфосинтаксических параметров» (Москва). Доклад: Relative Clause or Nominalized Clause: the evidence from Kazym Khanty
  • · 2018: Пятнадцатая Конференция по типологии и грамматике для молодых исследователей (Санкт-Петербург). Доклад: Аналитическая номинализация в хантыйском языке
  • · 2018: Первая конференция по уральским, алтайским и палеоазиатским языкам. Памяти А. П. Володина (Санкт-Петербург). Доклад: Маркирование актантов номинализации в чукотском языке

Идентификаторы исследователя

Публикации (23)

Кодирование ядерных аргументов абсолютивного имени действия в чукотском языке

2027 в печати · ARTICLE · ru

Работа впервые подробно описывает маркирование аргументов имени действия, стоящего в абсолютивном падеже, в чукотском языке. На материале амгуэмского диалекта мы выявляем доступные опции кодирования аргументов имён действия от непереходных и переходных глаголов: абсолютив, эргатив/инструменталис, притяжательная форма и инкорпорация. Мы демонстрируем, что аргументы имени действия имеют расщеплённое кодирование: возможны аккузативная, активно-стативная и трёхчленная схемы. Это отличает нефинитную клаузу с именем действия от финитной, где доступны эргативная и активно-стативная схемы. Мы даём этому различию структурное объяснение, которое состоит в ограниченном наборе глагольных свойств, которые сохраняет имя действия. Мы также сравниваем данные амгуэмского диалекта с другими чукотскими идиомами и формулируем роль полученных результатов для описания чукотской грамматики и для типологии имён действия.

О гортанных смычках и редупликации в чукотском языке

2026 · ARTICLE · ru

В работе рассматриваются два связанных сюжета из чукотской фонетики: статус гортанной смычки как сегмента или просодического средства и правила удвоения основы в неполных редупликациях, образующих номинатив единственного числа. В работе используется специально созданная база, включающая 181 словоизменительную редупликацию. Подробно обсуждаются редупликации, которые содержат гортанную смычку и находятся «на стыке» этих двух сюжетов. Мы демонстрируем, что, вопреки наблюдениям предыдущих исследователей, поведение гортанной смычки в редупликациях не может служить аргументом в пользу ее просодического анализа. Это позволяет считать сегментный анализ чукотской гортанной смычки наиболее правдоподобным. На материале выборки мы уточняем правило упрощения конечных кластеров согласных в редупликациях этого типа, показывая, что в результате разрешения кластера может сохраняться не только первый, но и второй согласный. Распределение вариантов упрощения предлагается объяснять с опорой на более общие свойства чукотской фонотактики, связанные с ограничениями на сочетаемость фонем разного места образования. Мы также делаем ряд наблюдений о синхронном и историческом составе конкретных чукотских лексем, дополняя прачукотско-корякскую реконструкцию.

К вопросу о частеречной принадлежности и именовании нефинитных форм в лесном ненецком языке

2026 · ARTICLE · ru

В статье рассматривается проблема частеречной принадлежности и терминологического описания нефинитных форм в лесном ненецком языке, с привлечением новых данных пуровского диалекта. В систему лесных ненецких нефинитных форм включаются имена действия, причастия, деепричастие, условная форма и супин. Анализ строится в рамках двухмерного подхода, предполагающего рассмотрение нефинитных форм с опорой на их синтаксическую функцию и через призму их частеречных свойств: подробно описывается синтаксическое распределение каждой из форм и дается характеристика их морфологических свойств. Полученные данные выявляют сложность и разнообразие в употреблении лесных ненецких нефинитных форм. Показано, что синтаксису определённой части речи вполне соответствует только поведение имён действий. Оно при этом оказывается более сложным, чем поведение существительного в строгом смысле по той причине, что ненецкие существительные регулярно используются в атрибутивных контекстах. С опорой на синтаксические функции признаётся возможным классифицировать супин. Остальные нефинитные формы демонстрируют сложное морфосинтаксическое поведение и черты смешанных частей речи. В работе анализируется устоявшаяся терминология обозначения лесных ненецких форм с точки зрения внутриязыковых свойств; делается вывод, что переход к контрастивному или типологическому описанию грамматики требует пересмотра классификации нефинитных форм.

Путешествие по лингвистике с чукотским языком

2025 · BOOK · ru

Научно-популярная книга рассказывает о лингвистике, помещая в центр внимания чукотский язык. Книга основана на материалах, собранных в результате лингвистических экспедиций в село Амгуэма Чукотского автономного округа. Издание адресовано всем, кто хотел бы познакомиться с лингвистикой, всем, кому интересны языки Сибири и Дальнего Востока, а также самим чукчам, носителям чукотского языка и чукотской культуры.

Fighting Evaluation Inflation: Concentrated Datasets for Grammatical Error Correction

2024 · ARTICLE · en

Background: Grammatical error correction (GEC) systems have greatly developed over the recent decade. According to common metrics, they often reach the level of or surpass human experts. Nevertheless, they perform poorly on several kinds of errors that are effortlessly corrected by humans. Thus, reaching the resolution limit, evaluation algorithms and datasets do not allow for further enhancement of GEC systems. Purpose: To solve the problem of the resolution limit in GEC. The suggested approach is to use for evaluation concentrated datasets with a higher density of errors that are difficult for modern GEC systems to handle. Method: To test the suggested solution, we look at distant-context-sensitive errors that have been acknowledged as challenging for GEC systems. We create a concentrated dataset for English with a higher density of errors of various types, half-manually aggregating pre-annotated examples from four existing datasets and further expanding the annotation of distant-context-sensitive errors. Two GEC systems are evaluated using this dataset, including traditional scoring algorithms and a novel approach modified for longer contexts. Results: The concentrated dataset includes 1,014 examples sampled manually from FCE, CoNLL-2014, BEA-2019, and REALEC. It is annotated for types of context-sensitive errors such as pronouns, verb tense, punctuation, referential device, and linking device. GEC systems show lower scores when evaluated on the dataset with a higher density of challenging errors, compared to a random dataset with otherwise the same parameters. Conclusion: The lower scores registered on concentrated datasets confirm that they provide a way for future improvement of GEC models. The dataset can be used for further studies focusing on distant-context-sensitive GEC.

Семантическое поле поиска в амгуэмском диалекте чукотского языка: от морфосинтаксиса к семантике и обратно

2024 · ARTICLE · ru

Работа описывает семантическое поле поиска в амгуэмском диалекте чукотского языка в рамках фреймового подхода к лексической типологии. В исследовании рассматриваются лексические единицы макрофреймов поиска объекта (‘искать’): глагол qərirək и лексические аффиксы -rerək и -ɣiɬik; глаголы макрофрейма обследования пространства (‘обыскивать’): ojpətkok и rəritɬʔewək — и глагол enarerək, который покрывает оба макрофрейма, а также может обозначать безобъектный поиск. Помимо семантических противопоставлений внутри каждого макрофрейма, работа обсуждает взаимодействие морфосинтаксиса, этимологии и семантики единиц поля. Во-первых, получают историческое объяснение свойства глагола enarerək, уникального с точки зрения выражения валентностей, благодаря чему становится возможна его широкая семантика. Объяснение опирается на историческое присутствие в этом глаголе показателя антипассива и одновременно на факт утраты этой залоговой альтернации в амгуэмском диалекте. Во-вторых, рассматриваются различия в поведении самостоятельных лексем и лексических аффиксов, конкурирующих в макрофрейме поиска объекта. Делается вывод о корреляции референтности / нереферентности объекта и степени связанности морфемы со значением поиска, причем корреляция внутри рассматриваемого семантического поля проявляется в виде ограничений на сочетаемость, не обязательных для самостоятельных глаголов и лексических аффиксов вне поля. В-третьих, для макрофрейма обыскивания пространства прослеживается перенос семантических ограничений на сочетаемость из поля-донора.

Лично-числовая асимметрия: согласование пассивных миративов в казымском диалекте хантыйского языка

2023 · ARTICLE · ru

Работа рассматривает ранее не засвидетельствованную модель расщеплённого согласования в парадигме миратива в казымском диалекте хантыйского языка. Расщеплённое согласование выявляется при сравнении активной и пассивной миративных конструкций, а также в ограниченном наборе употреблений нефинитных форм и выражается в том, что в пассивном залоге, в отличие от активного, 3 лицо немаркировано — наблюдается согласование только по числу. При этом согласовательные показатели 1 и 2 лица выглядят одинаково вне зависимости от диатезы. В других парадигмах хантыйского глагола, в частности, в субъектном и объектном индикативе расщепления не наблюдается. Работа подробно характеризует выявленную модель согласования, соотнося её фрагменты с другими словоизменительными парадигмами казымского диалекта хантыйского языка: субъектным и объектным спряжениями индикатива, посессивной парадигмой и именными показателями числа. В исследовании выдвигается гипотеза о том, что для полноценного, недефектного согласования по лицу хантыйской именной группе требуется или достаточно высокая синтаксическая позиция (внешний аргумент), или полноценный набор признаков лица, которым обладают местоимения 1–2 лица. Работа также рассматривает хантыйские данные в свете типологии расщеплённого согласования.

Two functions of nominalizations in Amguema Chukchi: Shift to uncommon

2023 · CHAPTER · en

Тезисы к докладу Две функции номинализаций в амгуэмском диалекте чукотского языка: сдвиг к редкому

Here We Go Again: Modern GEC Models Need Help with Spelling

2023 · ARTICLE · en

The study focuses on how modern GEC systems handle character-level errors. We discuss the ways these errors effect the performance of models and test how models of different architectures handle them. We conclude that specialized GEC systems do struggle against correcting non-existent words, and that a simple spellchecker considerably improve overall performance of a model. To evaluate it, we assess the models over several datasets. In addition to CoNLL-2014 validation dataset, we contribute a synthetic dataset with higher density of character-level errors and conclude that, provided that models generally show very high scores, validation datasets with higher density of tricky errors are a useful tool to compare models. Lastly, we notice cases of incorrect treatment of non-existent words on experts' annotation and contribute a cleared version of this dataset. In contrast to specialized GEC systems, LLaMA model used for GEC task handles character-level errors well. We suggest that this better performance is explained by the fact that Alpaca is not extensively trained on annotated texts with errors, but gets as input grammatically and orthographically correct texts.

How languages with the dual differ from the others: The case of numeral-noun constructions

2022 · CHAPTER · en

The abstract for the talk presented at 19th Conference on Typology and Grammar for Young Scholars, Saint Petersburg, 24–26 November 2022.

Курсы (11)