Связаться

Практический разбор

Какие данные можно загружать в сегменты и где чаще всего ломается совпадение

Телефон, электронная почта, куки-файлы, идентификатор устройства: что брать за основу, как не испортить файл и почему совпадение падает еще до запуска.

Какие данные можно загружать в сегменты и где чаще всего ломается совпадение в блоге TargetFox

Проблема с загрузкой сегмента почти никогда не начинается в кабинете. Обычно все ломается раньше: в выгрузке, в формате, в смешанных колонках и в неверном типе идентификатора. Разберем, что именно стоит проверить до старта, чтобы потом не искать виноватого между площадкой и исходным файлом.

Ситуация

Чаще всего команда начинает со слова «загрузим базу», но не уточняет, что именно лежит в файле: телефон, электронная почта, идентификатор устройства или куки-файлы. Когда тип идентификатора не сопоставлен с каналом активации, файл может пройти загрузку формально, но сегмент окажется слишком маленьким или плохо совпадет с доступными пользователями площадки.

Осложнение

  • Файл собирают из нескольких источников, и формат строк внутри одной выгрузки становится неоднородным.
  • Алгоритм хеширования выбирают по привычке, а не по текущим требованиям площадки.
  • Тест проводят без контрольного минимума по доле совпадений и размеру сегмента.
  • Правила обновления файла не описаны, поэтому уже через неделю сегмент живет собственной устаревшей жизнью.

Факт: в Яндекс Аудиториях для загрузки собственных данных требуется файл от 100 записей; для полей телефон и электронная почта поддерживается хеширование по алгоритму SHA-256, а загрузка новых хешей MD5 прекращена с января 2025 года. (Источник: https://yandex.ru/support2/audience/ru/file, проверено: 2026-03-06)

Факт: в МТС DSP для внешних сегментов поддерживаются куки, номера телефонов и идентификаторы мобильных устройств; для куки-сегментов в справке перечислены партнерские системы Adriver, Weborama, AiData и Konnektu. (Источник: https://support.mts.ru/mts_dsp/rabota-s-dannimi/zagruzka-vneshnih-segmentov, проверено: 2026-03-06)

Гипотеза: если сначала выбрать канал активации, а уже потом готовить формат идентификатора, доля совпадений и скорость первого запуска будут выше. (Метрика: доля совпадений и время до статуса «готово», период: 72 часа)

Рекомендация: не объединяйте разные типы идентификаторов в одну неструктурированную выгрузку; сначала сделайте по одному чистому файлу на один сценарий активации.

Вопрос

Как понять, какой идентификатор брать и где мы теряем совпадение еще до запуска?

Ответ

  1. Сначала выберите канал активации

Что делаем: Определите один или два кабинета, где вы будете использовать сегмент в ближайшие две недели. Только после этого решайте, какой идентификатор собирать. На что смотрим: Для каждого канала есть выбранный тип идентификатора и понятный способ загрузки. Окно наблюдения: 30 минут. Что делаем дальше: Если канал не поддерживает ваш тип данных, не подгоняйте формат вслепую; смените канал или источник.

  1. Сопоставьте канал и формат файла

Что делаем: Соберите таблицу: канал, допустимый идентификатор, минимальный объем, требования к хешированию, сроки обновления и ответственный. На что смотрим: Нет ни одного поля в формате, которое площадка не принимает. Окно наблюдения: 1 час. Что делаем дальше: Если таблица не закрывается официальной справкой, остановите подготовку и уточните требования до выгрузки.

  1. Подготовьте данные без мусора

Что делаем: Удалите пустые строки, дубли, служебные символы, объединенные ячейки и смешение нескольких типов идентификаторов в одной колонке. На что смотрим: Доля валидных строк понятна и зафиксирована до загрузки. Окно наблюдения: 1 рабочий день. Что делаем дальше: Если после очистки рабочий объем слишком мал, сначала доберите данные, а не запускайте слабый сегмент.

  1. Примените правильный способ защиты данных

Что делаем: Там, где площадка требует хеширование, используйте только тот алгоритм, который указан в текущей справке площадки. На что смотрим: Файл проходит проверку без ошибок по формату и алгоритму защиты. Окно наблюдения: 1 час. Что делаем дальше: Если вы не уверены в способе хеширования, не продолжайте тест; сначала перепроверьте на небольшой выборке.

  1. Сделайте тестовую загрузку на небольшой выборке

Что делаем: Загрузите пробный файл, проверьте статус обработки и оцените долю совпадений до запуска кампании. На что смотрим: Есть понятная доля совпадений и размер сегмента, пригодный для первого запуска. Окно наблюдения: 24-72 часа. Что делаем дальше: Если доля совпадений заметно ниже внутреннего минимума, вернитесь к очистке источника и формату идентификатора.

  1. Опишите правила обновления

Что делаем: Зафиксируйте, кто и как часто обновляет файл, где лежит эталонный шаблон и как вы помечаете дату последней выгрузки. На что смотрим: У каждого сегмента есть владелец и понятная дата следующего обновления. Окно наблюдения: 1 час. Что делаем дальше: Если регулярного обновления нет, не называйте такой сегмент рабочим активом; это разовая выгрузка, а не процесс.

Границы применимости

  • TargetFox достаточно, если у вас один-два источника идентификаторов, понятный кабинет активации и задача сводится к настройке загрузки и проверке качества файла.
  • Нужен разбор через Artel, если придется сводить несколько систем хранения, строить регулярные выгрузки из корпоративного контура или настраивать согласия и юридические ограничения по нескольким странам.

Артефакт

Чеклист «Подготовка файла для загрузки аудитории»

  • В одном файле только один тип идентификатора.
  • У файла есть дата выгрузки и ответственный.
  • Удалены дубли и пустые строки.
  • Проверены требования к кодировке и разделителям.
  • Алгоритм защиты данных соответствует справке площадки.
  • Перед полной загрузкой сделана пробная выборка.
  • Зафиксирована доля совпадений и итоговый размер сегмента.

Вставки из исследования

Факт: требования Яндекса к файлам и алгоритму защиты данных вынесены в отдельную справку: https://yandex.ru/support2/audience/ru/file (проверено: 2026-03-06)

Факт: требования МТС DSP к внешним сегментам, минимальному объему и допустимым типам идентификаторов описаны в справке: https://support.mts.ru/mts_dsp/rabota-s-dannimi/zagruzka-vneshnih-segmentov (проверено: 2026-03-06)

Держите таблицу для обновления: канал | идентификатор | требуется ли защита данных | минимальный объем | срок обработки | где смотреть статус. В отдельной колонке отмечайте, какой файл является эталоном, а какой используется только для пробной загрузки.

Типичные ошибки

  • Подготавливать формат файла до выбора канала активации.
  • Смешивать телефон, электронную почту и идентификатор устройства в одной колонке.
  • Использовать устаревший алгоритм защиты данных по памяти, а не по актуальной справке.
  • Оценивать успешность загрузки только по факту статуса, а не по доле совпадений и размеру сегмента.

Чеклист действий

  • Выбран один или два канала активации.
  • Для каждого канала выбран свой тип идентификатора.
  • Файл очищен от дублей, пустых строк и смешения форматов.
  • Проверен актуальный алгоритм защиты данных.
  • На небольшой выборке проверены статус загрузки и доля совпадений.
  • Назначены владелец файла и частота обновления.

Следующий шаг

Оставьте заявку в TargetFox и получите быструю проверку файла, идентификаторов и сценария загрузки до того, как потратите время на неудачный запуск.

Форма заявки по теме статьи

Оставьте заявку по теме статьи. Запрос уйдёт в тот же обработчик, что и форма на главной странице.

Похожие статьи

Материалы по смежным сценариям таргетинга и сегментации.