Что такое метаданные

Метаданные — это данные о данных. Не содержимое вашего сообщения, а всё то, что его окружает. Когда было отправлено, кому, с какого устройства, какого размера, через какую сеть.

Хорошая аналогия: представьте конверт с письмом. E2E шифрование защищает содержимое письма — никто не может его прочитать. Но конверт всё равно виден: на нём написан адрес отправителя, адрес получателя, дата, почтовый штамп. Это и есть метаданные.

Бывший директор АНБ Майкл Хайден сказал прямо: «Мы убиваем людей на основе метаданных». Это не преувеличение — метаданные позволяют строить точные поведенческие профили без доступа к содержимому переписки.

Что собирают мессенджеры

Даже мессенджеры с E2E шифрованием неизбежно видят часть метаданных — иначе им просто невозможно доставить сообщение. Вопрос в том, что они с этим делают.

Сетевые метаданные

  • IP-адрес при каждом подключении — привязка к геолокации
  • Тип соединения (WiFi/мобильный), тип устройства, операционная система
  • Провайдер интернета

Временны́е метаданные

  • Время каждого входа и выхода
  • Время отправки каждого сообщения с точностью до миллисекунды
  • Длительность звонков
  • Время суток, когда вы активны

Социальный граф

  • С кем вы переписываетесь (имена, ID, номера телефонов)
  • Частота общения с каждым контактом
  • В каких группах состоите и кто там
  • Кто кому первым пишет

Поведенческие паттерны

  • Средний размер сообщений (косвенно указывает на характер переписки)
  • Реакция-время: как быстро вы отвечаете разным людям
  • Паттерны активности: рабочая неделя vs выходные

Почему метаданные опаснее содержимого

Звучит контринтуитивно, но это правда. Содержимое сообщения — разовый факт. Метаданные — непрерывный поток данных, который накапливается месяцами и строит детальный профиль.

Из метаданных можно восстановить:

  • Социальный круг — кто ваши близкие, коллеги, партнёры
  • Иерархию отношений — с кем вы общаетесь чаще и в каком режиме
  • Распорядок дня — когда просыпаетесь, когда работаете, когда отдыхаете
  • Перемещения — через IP и смену сетей
  • Деловые связи — с кем из партнёров вы переписываетесь перед важными событиями
  • Эмоциональное состояние — частота и объём сообщений меняются при стрессе

Для корпоративного шпионажа: даже без доступа к содержимому переговоров, анализ метаданных покажет, что CEO активно переписывается с незнакомым контактом в нерабочее время за неделю до слияния. Этого достаточно.

Реальные примеры использования метаданных

Программа АНБ «Prism» и «Boundless Informant»

Документы Сноудена (2013) показали: АНБ систематически собирало метаданные звонков и сообщений миллионов граждан. Содержимое — реже и с ордером. Метаданные — автоматически и массово.

Реклама на основе социального графа

Meta (Facebook/WhatsApp) использует данные о социальных связях для таргетированной рекламы. Зашифрованное содержимое WhatsApp Meta не читает — но знает, что вы переписываетесь с врачом, юристом и риелтором. Этого достаточно для показа нужной рекламы.

Корпоративная разведка

Анализ метаданных корпоративной переписки позволяет восстановить организационную структуру, выявить неформальных лидеров мнений, предсказать увольнения и слияния — всё без чтения ни единого сообщения.

Исследование MIT «Wie wir kommunizieren» (2016) показало: только по метаданным звонков с точностью 97% можно определить, состоит ли человек в романтических отношениях, его политические взгляды и состояние здоровья.

Почему E2E не защищает от этого

E2E шифрование защищает содержимое. Метаданные существуют на уровне выше — на уровне протокола доставки. Чтобы доставить сообщение от Алисы к Бобу, сервер должен знать, кто такие Алиса и Боб и когда им нужно доставить пакет.

Это не недостаток конкретной реализации — это фундаментальное ограничение клиент-серверной архитектуры. Пока сервер участвует в доставке, он видит маршрутизационную информацию.

Единственные способы минимизировать метаданные:

  • Self-hosted — метаданные остаются внутри вашей инфраструктуры
  • Onion routing (Tor) — скрывает IP, но не граф общения
  • Sealed Sender (как в Signal) — скрывает отправителя от сервера, но не получателя

Как self-hosted минимизирует метаданные

При использовании SecureChat на собственном сервере метаданные технически существуют — но они остаются внутри вашей инфраструктуры. Разница принципиальная:

  • Внешний доступ к метаданным — только через вас. Никакой автоматической передачи третьим сторонам
  • Нет рекламного профилирования. SecureChat — не рекламная платформа, монетизации данных нет
  • Вы контролируете логирование. Можно отключить сбор избыточных метаданных на уровне конфигурации
  • Данные не покидают юрисдикцию. Метаданные остаются там, где стоит сервер

Для компаний это ещё и вопрос конкурентной разведки: граф общения вашего руководства — ценная информация. Хранить её на серверах американской корпорации — значит потенциально отдавать её конкурентам или регуляторам другой страны.

«Зашифровано» и «приватно» — не одно и то же. Приватность требует контроля над метаданными. Контроль над метаданными требует контроля над сервером.