Миркин Борис Григорьевич

Факультет экономических наук

Профиль на hse.ru ↗ тел.: +7(499) 152-0151 | 27776 | +7(963) 723-4021

Публикаций

147

Языков

Наград

Конференций

Профиль Публикации (147) Курсы (6)

Профессиональные интересы

математические методы анализа

Должности

Ведущий научный сотрудник — Факультет экономических наук, Международный центр анализа и выбора решений
Профессор — Факультет компьютерных наук, Департамент анализа данных и искусственного интеллекта

Био

· Начал работать в НИУ ВШЭ в 2008 году.
· Научно-педагогический стаж: 51 год.

Образование

1990 · Доктор наук: Институт системных исследований АН СССР и ГКНТ, специальность 05.13.01 «Системный анализ, управление и обработка информации», тема диссертации: Матрично-аппроксимационный подход к анализу разнотипной информации
1975 · Старший научный сотрудник
1975 · Ученое звание: Доцент
1966 · Кандидат наук: специальность 01.01.06 «Математическая логика, алгебра и теория чисел», тема диссертации: Некоторые построения в алгебре событий
1964 · Специалитет: Саратовский государственный университет им. Н.Г. Чернышевского, специальность «Математика», квалификация «Математик»

Опыт работы

· 1967-1982: Мнс, снс (1968), зав. сектором (1975) Институт Экономики и организации промышленного производства СО АН СССР, г. Новосибирск
· 1982-2000: Снс, внс (1989) Центральный экономико-математический институт РАН РФ, г. Москва
· 2000-2008: Профессор Биркбек колледж Лондонского университета, Лондон, Великобритания
· 2008-н.вр. Профессор Национальный исследовательский университет Высшая школа экономики, г. Москва, РФ
· Совместительство
· 1970-1982: Доцент Кафедра мат. методов в экономике, Новосибирский госуниверситет МВССО РФ, г. Новосибирск
· 1984-1991: Доцент Кафедра высшей математики и статистики, Высшая школа профдвижения ВЦСПС СССР, г. Москва
· 2008-2010: Профессор Биркбек колледж Лондонского университета, г. Лондон, Великобритания
· 2009-2024 г.: Внс Международная лаборатория анализа и выбора решений, НИУ ВШЭ, г. Москва, РФ

Награды и поощрения

· Благодарность НИУ ВШЭ (апрель 2025)
· Почетная грамота Министерства науки и высшего образования Российской Федерации (июль 2023)
· Медаль "Признание - 15 лет успешной работы" НИУ ВШЭ (декабрь 2022)
· Почетный знак II степени Высшей школы экономики (март 2018)
· Почётная грамота Факультета компьютерных наук НИУ ВШЭ (декабрь 2017)
· Почетная грамота Высшей школы экономики (декабрь 2016)
· Премия Высшей школы экономики "Золотая Вышка" (декабрь 2012)
· Благодарность Высшей школы экономики (ноябрь 2012)
· Надбавка за публикацию в международном рецензируемом научном издании (2020–2021, 2018–2020)
· Надбавка за регулярные публикации в международных рецензируемых научных изданиях (2021–2026)
· Надбавка за статью в зарубежном рецензируемом журнале (2015–2017, 2013–2015, 2011–2013)
· Надбавка за статью в зарубежном рецензируемом научном издании (2016–2018)
· Лучший преподаватель — 2013, 2011
· Лауреат премии "Золотая Вышка" 2012 в номинации Достижения в науке

Гранты и проекты

— · на соискание учёной степени кандидата наук

Конференции (3)

Показать все

· 2021: 2021 IEEE International Conference on Artificial Intelligence and Big Data Analytics (Bandung). Доклад: Method for Taxonomic Content-Analysis of Text Collections
· 2020: Научно-практическая конференция "Наука о данных" (Санкт-Петербург). Доклад: Наука о данных и статистика: история, содержание, перспективы
· 2015: Systems Analysis 2015 (Vienna). Доклад: Data Summarization at Clustering and Ranking

Идентификаторы исследователя

ORCID: 0000-0001-5470-8635
ResearcherID: B-6591-2013
SPIN РИНЦ: 3067-5534
Google Scholar: https://scholar.google.com/citations?user=MpNtL58AAAAJ
Scopus AuthorID: 35428028600

Публикации (147)

Minkowski metric, feature weighting and anomalous cluster initializing in K-Means clustering

2012 · ARTICLE · en

В статье делается еще один шаг для исправления основного недостатка метода к-средних: он не может отделить информативные признаки от шума. Мы расространяем метод взвешенных к-средних Хуанга и др. на пространство Минковского. При этом веса признаков получают разумный интуитивный смысл коэффициентов поправки масштабов измерения признаков. К этому мы добавляем метод аномальных кластеров для определения инициализации метода.Новый метод экспериментально верифицирован на данных машинного обучения (Ирвайн) и сгенерированных данных о Гауссовских кластерах, как в присутствии случайных признаков, так и в их отсутствие. Метод оказался не хуже, а в большинстве случаев - лучше методов, вычисляющих веса признаков в методе к -средних.

DOI ↗ PDF ↗

Автоматизация использования таксономий для аннотирования текстовых документов.

2012 · CHAPTER · ru

Работа посвящена проблеме автоматического анно- тирования текстового документа ключевыми словами. Обычно, в качестве источника ключевых слов для аннотирования документа используют таксономии. Наш метод состоит из двух этапов, на- званных нами «отображением» и «аннотацией». Процедура ото- бражения соотносит таксономические единицы с рассматривае- мым текстом. Ее результатом является четкое или нечеткое мно- жество таксономических единиц, иначе множество запроса к так- сономии, которое характеризует содержание документа само по себе. На этапе аннотации требуется найти несколько таксономи- ческих единиц на высших уровнях таксономии, покрывающих все или почти все множество запроса. Эту задачу можно решить с помощью процедуры оптимального подъема. Найденные таксо- номические единицы следует считать искомой аннотацией тек- стового документа. Предлагаемый метод можно применять не только к одному текстовому документу, но и к коллекции тексто- вых документов. В таком случае, возникает необходимость в еще одном дополнительном этапе – кластеризации таксономических единиц.

PDF ↗

Метод аннотированного суффиксного дерева для оценки степени вхождения строк в текстовые документы

2012 · ARTICLE · ru

Излагается модификация метода аннотированного суффиксного дерева (АСД), разработанного с участием одного из авторов, которая ориентирована на то, чтобы, во-первых, убрать априорное ограничение на глубину конструируемого дерева, во-вторых, сделать более адекватной оценку сте- пени вхождения последовательности букв в текст, и, в-третьих, рассмотреть другие приложения метода. На конкретных примерах описываются методы разработки и использования АСД для двух классов задач анализа текстовой информации: (а) связь корпуса текстов и совокупности ключевых словосочетаний; (б) связь корпуса текстов с таксономией предметной области.

PDF ↗

Clustering: A Data Recovery Approach

2012 · BOOK · en

One of the goals of the first edition of this book back in 2005 was to present a coherent theory for K-Means partitioning and Ward hierarchical clustering. This theory leads to effective data pre-processing options, clustering algorithms and interpretation aids, as well as to firm relations to other areas of data analysis. The goal of this second edition is to consolidate, strengthen and extend this island of understanding in the light of recent developments. Moreover, the material on validation and interpretation of clusters is updated with a system better reflecting the current state of the art and with our recent ``lifting in taxonomies'' approach. The structure of the book has been streamlined by adding two Chapters: ``Similarity Clustering'' and ``Validation and Interpretation'', while removing two chapters: ``Different Clustering Approaches'' and ``General Issues.'' The Chapter on Mathematics of the data recovery approach, in a much extended version, almost doubled in size, now concludes the book. Parts of the removed chapters are integrated within the new structure. The change has added a hundred pages and a couple of dozen examples to the text and, in fact, transformed it into a different species of a book. In the first edition, the book had a Russian doll structure, with a core and a couple of nested shells around. Now it is a linear structure presentation of the data recovery clustering.

PDF ↗

Method for Intelligent Representation of Research Activities of an Organization over a Taxonomy of Its Field

2012 · CHAPTER · en

We describe a novel method for the analysis of research activities of an organization by mapping that to a taxonomy tree of the field. The method constructs fuzzy membership profiles of the organizationmembers or teams in terms of the taxonomy’s leaves (research topics), and then it generalizes them in two steps. These steps are: (i) fuzzy clustering research topics according to their thematic similarities in the department, ignoring the topology of the taxonomy, and (ii) optimally lifting clusters mapped to the taxonomy tree to higher ranked categories by ignoring “small” discrepancies. We illustrate the method by applying it to data collected by using an in-house e-survey tool from a university department and from a university research center. The method can be considered for knowledge generalization over any taxonomy tree.

Core concepts in data analysis: summarization, correlation, visualization (Undergraduate topics in Computer Science)

2011 · BOOK · en

This is a textbook in data analysis. Its contents are heavily influenced by the idea that data analysis should help in enhancing and augmenting knowledge of the domain as represented by the concepts and statements of relation between them. According to this view, two main pathways for data analysis are summarization, for developing and augmenting concepts, and correlation, for enhancing and establishing relations. Visualization, in this context, is a way of presenting results in a cognitively comfortable way. The term summarization is understood quite broadly here to embrace not only simple summaries like totals and means, but also more complex summaries such as the principal components of a set of features or cluster structures in a set of entities. The material presented in this perspective makes a unique mix of subjects from the fields of statistical data analysis, data mining, and computational intelligence, which follow different systems of presentation.

DOI ↗ PDF ↗

Choosing the number of clusters

2011 · ARTICLE · en

The issue of determining “the right number of clusters” is attracting ever growing interest. The paper reviews published work on the issue with respect to mixture of distributions, partition, especially in K-Means clustering, and hierarchical cluster structures. Some perspective directions for further developments are outlined.

PDF ↗

Методы кластер-анализа для поддержки принятия решений: обзор

2011 · PREPRINT · ru

В работе приведен обзор методов кластер-анализа, накопленных в литературе за 50 лет их активной разработки. При этом вместо обзора публикаций, которых имеются многие тысячи с самыми разнообразными алгоритмами и приложениями, в работе систематизированы задачи – по видам данных, видам кластерных структур, видам критериев и методов. Число подробно рассматриваемых методов относительно невелико. Зато большинство из них нетрудно перенести на другие виды данных и кластерных структур. Специальное внимание уделено принятию решений о параметрах алгоритмов, валидации и интерпретации. Во Введении систематизированы основные типы приложений для принятия решений. В Заключении обсуждаются основные нерешенные проблемы кластеранализа. Большая часть текста написана так, чтобы человек с высшим техническим образованием мог быстро уяснить суть дела без углубления в технические детали.

PDF ↗

Abstracting concepts from text documents by using an ontology

2011 · CHAPTER · en

A method for computationally visualizing and interpreting a text or corpus of texts in a taxonomy of the field is described. The method involves such stages as matching taxonomy topics and text(s) by using annotated suffix trees (ASTs), combining multiple information such as text abstracts, key-words and taxonomy cross-references, building clusters of taxonomy topics and their profiles, and lifting the profiles to higher ranks of the taxonomy hierarchy.

PDF ↗

Approximate bicluster and tricluster boxes in the analysis of binary data

2011 · ARTICLE · en

A disjunctive model of box bicluster and tricluster analysis is considered. A least-squares locally-optimal one cluster method is proposed, oriented towards the analysis of binary data. The method involves a parameter, the scale shift, and is proven to lead to ”contrast” box biand tri-clusters. An experimental study of the method is reported.

PDF ↗

Курсы (6)

Basics of Data Analysis · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура / Маго-лего · Анг
Основные методы анализа данных · 5 раза

2025/2026, 2024/2025, 2023/2024, 2022/2023, 2021/2022 · Бакалавриат / Маго-лего · рус
Mentor's Seminar · 3 раза

2025/2026, 2024/2025, 2023/2024 · Магистратура · Анг
Data Analysis

2023/2024 · Магистратура / Маго-лего · Анг
01.04.02. Прикладная математика и информатика

2022/2023 · Магистратура · Анг
Modern Methods of Data Analysis · 2 раза

2022/2023, 2021/2022 · Магистратура / Маго-лего · Анг