Проблема с загрузкой сегмента почти никогда не начинается в кабинете. Обычно все ломается раньше: в выгрузке, в формате, в смешанных колонках и в неверном типе идентификатора. Разберем, что именно стоит проверить до старта, чтобы потом не искать виноватого между площадкой и исходным файлом.
Ситуация
Чаще всего команда начинает со слова «загрузим базу», но не уточняет, что именно лежит в файле: телефон, электронная почта, идентификатор устройства или куки-файлы. Когда тип идентификатора не сопоставлен с каналом активации, файл может пройти загрузку формально, но сегмент окажется слишком маленьким или плохо совпадет с доступными пользователями площадки.
Осложнение
- Файл собирают из нескольких источников, и формат строк внутри одной выгрузки становится неоднородным.
- Алгоритм хеширования выбирают по привычке, а не по текущим требованиям площадки.
- Тест проводят без контрольного минимума по доле совпадений и размеру сегмента.
- Правила обновления файла не описаны, поэтому уже через неделю сегмент живет собственной устаревшей жизнью.
Факт: в Яндекс Аудиториях для загрузки собственных данных требуется файл от 100 записей; для полей телефон и электронная почта поддерживается хеширование по алгоритму SHA-256, а загрузка новых хешей MD5 прекращена с января 2025 года. (Источник: https://yandex.ru/support2/audience/ru/file, проверено: 2026-03-06)
Факт: в МТС DSP для внешних сегментов поддерживаются куки, номера телефонов и идентификаторы мобильных устройств; для куки-сегментов в справке перечислены партнерские системы Adriver, Weborama, AiData и Konnektu. (Источник: https://support.mts.ru/mts_dsp/rabota-s-dannimi/zagruzka-vneshnih-segmentov, проверено: 2026-03-06)
Гипотеза: если сначала выбрать канал активации, а уже потом готовить формат идентификатора, доля совпадений и скорость первого запуска будут выше. (Метрика: доля совпадений и время до статуса «готово», период: 72 часа)
Рекомендация: не объединяйте разные типы идентификаторов в одну неструктурированную выгрузку; сначала сделайте по одному чистому файлу на один сценарий активации.
Вопрос
Как понять, какой идентификатор брать и где мы теряем совпадение еще до запуска?
Ответ
- Сначала выберите канал активации
Что делаем: Определите один или два кабинета, где вы будете использовать сегмент в ближайшие две недели. Только после этого решайте, какой идентификатор собирать. На что смотрим: Для каждого канала есть выбранный тип идентификатора и понятный способ загрузки. Окно наблюдения: 30 минут. Что делаем дальше: Если канал не поддерживает ваш тип данных, не подгоняйте формат вслепую; смените канал или источник.
- Сопоставьте канал и формат файла
Что делаем: Соберите таблицу: канал, допустимый идентификатор, минимальный объем, требования к хешированию, сроки обновления и ответственный. На что смотрим: Нет ни одного поля в формате, которое площадка не принимает. Окно наблюдения: 1 час. Что делаем дальше: Если таблица не закрывается официальной справкой, остановите подготовку и уточните требования до выгрузки.
- Подготовьте данные без мусора
Что делаем: Удалите пустые строки, дубли, служебные символы, объединенные ячейки и смешение нескольких типов идентификаторов в одной колонке. На что смотрим: Доля валидных строк понятна и зафиксирована до загрузки. Окно наблюдения: 1 рабочий день. Что делаем дальше: Если после очистки рабочий объем слишком мал, сначала доберите данные, а не запускайте слабый сегмент.
- Примените правильный способ защиты данных
Что делаем: Там, где площадка требует хеширование, используйте только тот алгоритм, который указан в текущей справке площадки. На что смотрим: Файл проходит проверку без ошибок по формату и алгоритму защиты. Окно наблюдения: 1 час. Что делаем дальше: Если вы не уверены в способе хеширования, не продолжайте тест; сначала перепроверьте на небольшой выборке.
- Сделайте тестовую загрузку на небольшой выборке
Что делаем: Загрузите пробный файл, проверьте статус обработки и оцените долю совпадений до запуска кампании. На что смотрим: Есть понятная доля совпадений и размер сегмента, пригодный для первого запуска. Окно наблюдения: 24-72 часа. Что делаем дальше: Если доля совпадений заметно ниже внутреннего минимума, вернитесь к очистке источника и формату идентификатора.
- Опишите правила обновления
Что делаем: Зафиксируйте, кто и как часто обновляет файл, где лежит эталонный шаблон и как вы помечаете дату последней выгрузки. На что смотрим: У каждого сегмента есть владелец и понятная дата следующего обновления. Окно наблюдения: 1 час. Что делаем дальше: Если регулярного обновления нет, не называйте такой сегмент рабочим активом; это разовая выгрузка, а не процесс.
Границы применимости
- TargetFox достаточно, если у вас один-два источника идентификаторов, понятный кабинет активации и задача сводится к настройке загрузки и проверке качества файла.
- Нужен разбор через Artel, если придется сводить несколько систем хранения, строить регулярные выгрузки из корпоративного контура или настраивать согласия и юридические ограничения по нескольким странам.
Артефакт
Чеклист «Подготовка файла для загрузки аудитории»
- В одном файле только один тип идентификатора.
- У файла есть дата выгрузки и ответственный.
- Удалены дубли и пустые строки.
- Проверены требования к кодировке и разделителям.
- Алгоритм защиты данных соответствует справке площадки.
- Перед полной загрузкой сделана пробная выборка.
- Зафиксирована доля совпадений и итоговый размер сегмента.
Вставки из исследования
Факт: требования Яндекса к файлам и алгоритму защиты данных вынесены в отдельную справку: https://yandex.ru/support2/audience/ru/file (проверено: 2026-03-06)
Факт: требования МТС DSP к внешним сегментам, минимальному объему и допустимым типам идентификаторов описаны в справке: https://support.mts.ru/mts_dsp/rabota-s-dannimi/zagruzka-vneshnih-segmentov (проверено: 2026-03-06)
Держите таблицу для обновления: канал | идентификатор | требуется ли защита данных | минимальный объем | срок обработки | где смотреть статус. В отдельной колонке отмечайте, какой файл является эталоном, а какой используется только для пробной загрузки.
Типичные ошибки
- Подготавливать формат файла до выбора канала активации.
- Смешивать телефон, электронную почту и идентификатор устройства в одной колонке.
- Использовать устаревший алгоритм защиты данных по памяти, а не по актуальной справке.
- Оценивать успешность загрузки только по факту статуса, а не по доле совпадений и размеру сегмента.
Чеклист действий
- Выбран один или два канала активации.
- Для каждого канала выбран свой тип идентификатора.
- Файл очищен от дублей, пустых строк и смешения форматов.
- Проверен актуальный алгоритм защиты данных.
- На небольшой выборке проверены статус загрузки и доля совпадений.
- Назначены владелец файла и частота обновления.
Следующий шаг
Оставьте заявку в TargetFox и получите быструю проверку файла, идентификаторов и сценария загрузки до того, как потратите время на неудачный запуск.