МФТИ и ИППИ РАН: hybrid Random Forest Traffic Classifier (hRFTC)

Продукт
Разработчики: Московский физико-технический институт (МФТИ), ИППИ РАН (Институт проблем передачи информации РАН им. А. А. Харкевича)
Дата премьеры системы: 2025/01/21
Технологии: Data Quality - Качество данных

Основная статья: Управление качеством данных

2025: Представление алгоритма hRFTC

Предложенный объединённой научной группой из МФТИ и ИППИ РАН алгоритм под названием hybrid Random Forest Traffic Classifier (hRFTC) позволяет эффективно определять тип передаваемых данных, даже если они зашифрованы с использованием последних технологий. Для анализа его эффективности была собрана база данных шифрованного трафика шести стран Северной Америки, Европы и Азии. Доказанное качество классификации  — 94,6%. Об этом МФТИ сообщил 21 января 2025 года.

С увеличением объёма шифрованного интернет-трафика задача определения типа передаваемых данных становится всё более сложной. Протокол Transport Layer Security (TLS) обеспечивает защиту данных, однако новая версия протокола — Encrypted ClientHello (ECH) — скрывает ключевые метаданные, такие как Server Name Indication (SNI), что затрудняет процесс ранней классификации трафика (eTC). Это может негативно сказаться на качестве обслуживания в сетях, так как правильная классификация трафика необходима для эффективного управления ресурсами.

Этот алгоритм использует не только открытые параметры TLS ECH, но и статистические признаки трафика, такие как размеры пакетов и интервалы между их приходами. Такой подход позволил существенно увеличить точность распознавания данных с 38,4% до 96,4% по метрике F-score.  Системы управления проектами: особенности рынка, ключевые технотренды. Обзор TAdviser 11.9 т

Как отмечает один из авторов проекта, студент базовой кафедры МФТИ в ИППИ РАН Антон Курапов, разработанный алгоритм может быть использован на промежуточных сетевых узлах для повышения качества обслуживания.

«
Наш алгоритм hRFTC превзошёл лучшие существующие классификаторы и может быть использован на промежуточных сетевых узлах для повышения качества обслуживания. С другой стороны, мы выявили оставшиеся утечки приватности шифрованного трафика, которые необходимо устранить в будущих версиях протоколов защиты транспортного уровня, —  продолжил Антон Курапов.
»

На январь 2025 года командой лаборатории беспроводных сетей ведётся исследование по устранению этих утечек приватности с помощью рандомизации открытых параметров, а также изменения длин первых пакетов потока и отправки дополнительных фиктивных пакетов. 



Подрядчики-лидеры по количеству проектов

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (272)
  Axelot (Акселот) (150)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (125)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (48)
  АйТи Про (IT Pro) (18)
  Другие (558)

  Datareon (Датареон) (41)
  Axelot (Акселот) (32)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (2)
  Московский центр инновационных технологий в здравоохранении Медтех (2)
  Другие (41)

  Datareon (Датареон) (32)
  Axelot (Акселот) (19)
  Софрос (Sofros) (8)
  Яндекс.Облако (Yandex Cloud) (3)
  Инфосистемы Джет (2)
  Другие (47)

  Datareon (Датареон) (19)
  Axelot (Акселот) (9)
  Софрос (Sofros) (3)
  Теком (3)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (3)
  Другие (66)

  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Qsoft (Кьюсофт) (1)
  Skyeer (СКАЙЕР ИТ) (1)
  Газинформсервис (ГИС) (1)
  СберМаркетинг (Sber Marketing) РА С-Маркетинг (1)
  Другие (16)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon (Датареон) (1, 421)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (3, 236)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (4, 49)
  АйТи Про (IT Pro) (1, 18)
  Дата-Центр Автоматика (1, 16)
  Другие (63, 61)

  Datareon (Датареон) (1, 71)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 2)
  Loginom Company (ранее BaseGroup Labs Аналитические технологии) (1, 2)
  Теком (1, 2)
  TData (ТДата) (1, 1)
  Другие (4, 4)

  Datareon (Датареон) (1, 57)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 1)
  Дата-Центр Автоматика (1, 1)
  Теком (1, 1)
  АйТи Про (IT Pro) (1, 1)
  Другие (1, 1)

  Datareon (Датареон) (1, 32)
  HFLabs (ХФ Лабс), ранее HumanFactorLabs (2, 3)
  Теком (1, 3)
  TData (ТДата) (1, 2)
  Ростелеком (1, 2)
  Другие (1, 1)

  Datareon (Датареон) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2022 год
2023 год
2024 год
Текущий год

  Datareon Platform - 421
  Deductor - 226
  HFLabs Фактор - 28
  HFLabs Единый клиент - 23
  АйТи Про: BI.Qube - 18
  Другие 95

  Datareon Platform - 71
  HFLabs Единый клиент - 2
  Loginom Аналитическая платформа - 2
  Теком: Orbox - 2
  Informatica Data Quality - 1
  Другие 4

  Datareon Platform - 57
  АйТи Про: BI.Qube - 1
  HFLabs Единый клиент - 1
  МТС DataOps Platform - 1
  Дата-Центр Автоматика: Data-Track Индустриальная платформа - 1
  Другие 2

  Datareon Platform - 32
  Теком: Orbox - 3
  HFLabs Единый клиент - 2
  RT.DataGovernance Инструмент документирования данных - 2
  МТС DataOps Platform - 1
  Другие 1

  Datareon Platform - 1
  Другие 0