DSA Faculty
API
← к списку преподавателей

Рябинин Максим Константинович

Факультет компьютерных наук

Профиль на hse.ru ↗ тел.: +7 (495) 531-00-00 | 28841
Публикаций
14
Языков
1
Наград
3
Конференций
0
Профиль Публикации (14) Курсы (4)

Профессиональные интересы

глубинное обучениеобработка естественного языка

Должности

  • Старший преподавательФакультет компьютерных наук, Департамент больших данных и информационного поиска, Базовая кафедра Яндекс

Био

  • · Начал работать в НИУ ВШЭ в 2017 году.

Образование

  • 2021 · Магистратура: Национальный исследовательский университет "Высшая школа экономики", специальность «Прикладная математика и физика», квалификация «Магистр»
  • 2019 · Бакалавриат: Национальный исследовательский университет "Высшая школа экономики", специальность «Прикладная математика и информатика», квалификация «Бакалавр»

Опыт работы

  • · Яндекс, исследователь

Награды и поощрения

  • · Персональная надбавка ректора (2021–2022)
  • · Надбавка за публикацию в журнале из Списка А (и приравненном к нему научном издании) (2024–2025, 2023–2024)
  • · Надбавка за публикацию в международном рецензируемом научном издании (2022–2023)

Идентификаторы исследователя

Публикации (14)

Distributed Deep Learning In Open Collaborations

2021 · CHAPTER · en

Moshpit SGD: Communication-Efficient Decentralized Training on Heterogeneous Unreliable Devices

2021 · CHAPTER · en

Towards Crowdsourced Training of Large Neural Networks using Decentralized Mixture-of-Experts

2020 · CHAPTER · en

Embedding Words in Non-Vector Space with Unsupervised Graph Learning

2020 · CHAPTER · en

It has become a de-facto standard to represent words as elements of a vector space (word2vec, GloVe). While this approach is convenient, it is unnatural for language: words form a graph with a latent hierarchical structure, and this structure has to be revealed and encoded by word embeddings. We introduce Graph-Glove: unsupervised graph word representations which are learned end-to-end. In our setting, each word is a node in a weighted graph and the distance between words is the shortest path distance between the corresponding nodes. We adopt a recent method learning a representation of data in the form of a differentiable weighted graph and use it to modify the GloVe training algorithm. We show that our graph-based representations substantially out-perform vector-based methods on word similarity and analogy tasks. Our analysis reveals that the structure of the learned graphs is hierarchical and similar to that of WordNet, the geometry is highly non-trivial and contains subgraphs with different local topology.

Курсы (4)