Миркин Борис Григорьевич

Факультет экономических наук

Профиль на hse.ru ↗ тел.: +7(499) 152-0151 | 27776 | +7(963) 723-4021

Публикаций

147

Языков

Наград

Конференций

Профиль Публикации (147) Курсы (6)

Профессиональные интересы

математические методы анализа

Должности

Ведущий научный сотрудник — Факультет экономических наук, Международный центр анализа и выбора решений
Профессор — Факультет компьютерных наук, Департамент анализа данных и искусственного интеллекта

Био

· Начал работать в НИУ ВШЭ в 2008 году.
· Научно-педагогический стаж: 51 год.

Образование

1990 · Доктор наук: Институт системных исследований АН СССР и ГКНТ, специальность 05.13.01 «Системный анализ, управление и обработка информации», тема диссертации: Матрично-аппроксимационный подход к анализу разнотипной информации
1975 · Старший научный сотрудник
1975 · Ученое звание: Доцент
1966 · Кандидат наук: специальность 01.01.06 «Математическая логика, алгебра и теория чисел», тема диссертации: Некоторые построения в алгебре событий
1964 · Специалитет: Саратовский государственный университет им. Н.Г. Чернышевского, специальность «Математика», квалификация «Математик»

Опыт работы

· 1967-1982: Мнс, снс (1968), зав. сектором (1975) Институт Экономики и организации промышленного производства СО АН СССР, г. Новосибирск
· 1982-2000: Снс, внс (1989) Центральный экономико-математический институт РАН РФ, г. Москва
· 2000-2008: Профессор Биркбек колледж Лондонского университета, Лондон, Великобритания
· 2008-н.вр. Профессор Национальный исследовательский университет Высшая школа экономики, г. Москва, РФ
· Совместительство
· 1970-1982: Доцент Кафедра мат. методов в экономике, Новосибирский госуниверситет МВССО РФ, г. Новосибирск
· 1984-1991: Доцент Кафедра высшей математики и статистики, Высшая школа профдвижения ВЦСПС СССР, г. Москва
· 2008-2010: Профессор Биркбек колледж Лондонского университета, г. Лондон, Великобритания
· 2009-2024 г.: Внс Международная лаборатория анализа и выбора решений, НИУ ВШЭ, г. Москва, РФ

Награды и поощрения

· Благодарность НИУ ВШЭ (апрель 2025)
· Почетная грамота Министерства науки и высшего образования Российской Федерации (июль 2023)
· Медаль "Признание - 15 лет успешной работы" НИУ ВШЭ (декабрь 2022)
· Почетный знак II степени Высшей школы экономики (март 2018)
· Почётная грамота Факультета компьютерных наук НИУ ВШЭ (декабрь 2017)
· Почетная грамота Высшей школы экономики (декабрь 2016)
· Премия Высшей школы экономики "Золотая Вышка" (декабрь 2012)
· Благодарность Высшей школы экономики (ноябрь 2012)
· Надбавка за публикацию в международном рецензируемом научном издании (2020–2021, 2018–2020)
· Надбавка за регулярные публикации в международных рецензируемых научных изданиях (2021–2026)
· Надбавка за статью в зарубежном рецензируемом журнале (2015–2017, 2013–2015, 2011–2013)
· Надбавка за статью в зарубежном рецензируемом научном издании (2016–2018)
· Лучший преподаватель — 2013, 2011
· Лауреат премии "Золотая Вышка" 2012 в номинации Достижения в науке

Гранты и проекты

— · на соискание учёной степени кандидата наук

Конференции (3)

Показать все

· 2021: 2021 IEEE International Conference on Artificial Intelligence and Big Data Analytics (Bandung). Доклад: Method for Taxonomic Content-Analysis of Text Collections
· 2020: Научно-практическая конференция "Наука о данных" (Санкт-Петербург). Доклад: Наука о данных и статистика: история, содержание, перспективы
· 2015: Systems Analysis 2015 (Vienna). Доклад: Data Summarization at Clustering and Ranking

Идентификаторы исследователя

ORCID: 0000-0001-5470-8635
ResearcherID: B-6591-2013
SPIN РИНЦ: 3067-5534
Google Scholar: https://scholar.google.com/citations?user=MpNtL58AAAAJ
Scopus AuthorID: 35428028600

Публикации (147)

Computationally refining a taxonomy by using annotated suffix trees over Wikipedia resources

2013 · CHAPTER · en

A two-step approach to devising a hierarchical taxonomy of a domain is outlined. As the first step, a coarse “high-rank” taxonomy frame is built manually using the materials of the government and other representative sites. As the second step, the frame is refined topic-by topic using the Russian Wikipedia category tree and articles filtered of “noise”. A topic-to-text similarity score, based on annotated suffix trees, is used throughout. The method consists of three main stages: 1) clearing Wikipedia data of noise, such as irrelevant articles and categories; 2) refining the taxonomy frame with the remaining relevant Wikipedia categories and articles; 3) extracting key words and phrases from Wikipedia articles. Also, a set of so-called descriptors is assigned to every leaf; these are phrases explaining aspects of the leaf topic. In contrast to many existing taxonomies, our resulting taxonomy is balanced so that all the branches are of similar depths and similar numbers of leaves. The method is illustrated by its application to a mathematics domain, “Probability theory and mathematical statistics”.

PDF ↗

Использование ресурсов Интернета для построения таксономии

2013 · CHAPTER · ru

В работе предложен двухшаговый подход к построению предметных таксономий на русском языке. На первом шаге строятся высокие уровни таксономии на основе паспортов специальностей ВАК. На втором шаге таксономические темы последовательно достраиваются новыми темами, извлеченными и отфильтрованными из дерева категорий и статей русского сегмента Википедии. Во всех расчетах используется мера сходства между строкой и текстом, основанная на аппарате аннотированных суффиксных деревьев.

PDF ↗

Methods for interpretation of data in medical informatics

2013 · CHAPTER · en

An outline of a few methods in an emerging field of data analysis, “data interpretation”, is given as pertaining to medical informatics and being parts of a general interpretation issue. Specifically, the following subjects are covered: measuring correlation between categories, conceptual clustering, and generalization and interpretation of empirically derived concepts in taxonomies. It will be shown that all of these can be put as parts of the same inquiry.

PDF ↗

Методы многокритериальной стратификации и их экспериментальное сравнение

2013 · PREPRINT · ru

При многомерном ранжировании интерес может представлять не столько сама упорядоченность рассматриваемых объектов, сколько ее разбиение на группы более или менее эквивалентных объектов – следуя социологии и минералогии, такие группы можно называть стратами. Такова, например, известная «одномерная» задача об АВС-разбиении. В данной работе предлагаются два метода автоматической стратификации (при заданном числе страт). Один подбирает веса критериев таким образом, чтобы объекты каждой отдельной страты были как можно ближе друг к другу на оси агрегированного критерия. Другой, наоборот, исходит из принципа несравнимости критериев и формирует страты из последовательных границ Парето. Эти методы экспериментально сравниваются с известными методами многомерного ранжирования, в связи с чем в работе рассматриваются некоторые механизмы генерации страт.

PDF ↗

Анализ паттернов в статике и динамике, часть 1: обзор литературы и уточнение понятия

2013 · ARTICLE · ru

Анализ паттернов – это новая область анализа данных, связанная с поиском взаимосвязей исследуемых объектов, построением их классификации и исследованием развития объектов во времени. В первой части статьи вводится понятие «паттерн» и приводится обзор литературы по методам кластерного анализа и анализа паттернов.

PDF ↗

Laplacian normalization for deriving thematic fuzzy clusters with an additive spectral approach

2013 · ARTICLE · en

This paper presents a further investigation into computational properties of a novel fuzzy additive spectral clustering method, Fuzzy Additive Spectral clustering (FADDIS), recently introduced by authors. Specifically, we extend our analysis to ‘difficult’ data structures from the recent literature and develop two synthetic data generators simulating affinity data of Gaussian clusters and genuine additive similarity data, with a controlled level of noise. The FADDIS is experimentally verified on these data in comparison with two state-of-the-art fuzzy clustering methods. The claimed ability of FADDIS to help in determining the right number of clusters is experimentally tested, and the role of the pseudo-inverse Laplacian data transformation in this is highlighted. A potentially useful extension of the method to biclustering is introduced.

PDF ↗

Individual approximate clusters: methods, properties, applications

2013 · CHAPTER · en

A least-squares data approximation approach to finding individual clusters is advocated. A simple local optimization algorithm leads to suboptimal clusters satisfying some natural tightness criteria. Three versions of an iterative extraction approach are considered, leading to a portrayal of the cluster structure of the data. Of these, probably most promising is what is referred to as the incjunctive clustering approach. Applications are considered to the analysis of semantics, to integrating different knowledge aspects and consensus clustering.

PDF ↗

Эффективность критерия наименьших квадратов в задаче построения согласованного разбиения

2012 · CHAPTER · ru

В данном докладе приводится постановка проблемы формирования согласованного разбиения и результаты двух серий экспериментов. Первая серия позволяет сравнить эффективности алгоритмов основанных на критерии наименьших квадратов с другими недавно разработанными методами консенсусной кластеризации. Вторая серия экспериментов позволяет оценить преимущества подхода консенсусной кластеризации над выбором лучшего разбиения, полученного по критерию метода k-средних.

PDF ↗

Additive spectral method for fuzzy cluster analysis of similarity data including community structure and affinity matrices

2012 · ARTICLE · en

An additive spectral method for fuzzy clustering is proposed. The method operates on a clustering model which is an extension of the spectral decomposition of a square matrix. The computation proceeds by extracting clusters one by one, which makes the spectral approach quite natural. The iterative extraction of clusters, also, allows us to draw several stopping rules to the procedure. This applies to several relational data types differently normalized: network structure data (the first eigenvector subtracted), affinity between multidimensional vectors (the pseudo-inverse Laplacian transformation), and conventional relational data including in-house data of similarity between research topics according to working of a research center. The method is experimentally compared with several classic and recent techniques and shown to be competitive.

DOI ↗ PDF ↗

Экспериментальное сравнение некоторых алгоритмов трикластеризации

2012 · CHAPTER · ru

В статье приводится экспериментальное сравнение пяти алгоритмов трикластеризации на реальных и синтетических данных по ресурсной эффективности, 4 мерам качества.

PDF ↗

Курсы (6)

Basics of Data Analysis · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура / Маго-лего · Анг
Основные методы анализа данных · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат / Маго-лего · рус
Mentor's Seminar · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура · Анг
Data Analysis

2023/2024 · Магистратура / Маго-лего · Анг
01.04.02. Прикладная математика и информатика

2022/2023 · Магистратура · Анг
Modern Methods of Data Analysis · 2 раза

2022/2023, 2021/2022 · Магистратура / Маго-лего · Анг