Система распознавания полки: кому нужно внедрение и как добиться от проекта максимума?
Системы автоматического распознавания полки переживают сейчас свое второе рождение. За последние три года технологии и техника совершили фантастический рывок. Точность распознавания у большинства операторов достигла 96—98%. Время и стоимость обработки фотографий снизились до приемлемых для большинства клиентов величин. В итоге системы Image Recognition оказались в центре внимания специалистов по мерчендайзингу и ритейл-аудитам.
Глаза боятся, программы делают
Всего за пару лет быстро и гибко обучаемые нейронные сети стали технологией, доступной большинству разработчиков. Освоить нейронные сети сейчас может практически любой IT-специалист. Благодаря чему на рынке появилось множество решений, основанных, в том числе, на «компьютерном зрении». Часть из них оказалась крайне востребована в ритейле. Например, нейронные сети позволили анализировать полки магазинов на предмет наличия или отсутствия там конкретных товаров.
Распознавание полки позволяет решать стандартные мерчендайзинговые задачи, но гораздо быстрее и удобнее. Теперь мерчендайзерам не нужно копаться в своих записях, вручную считать продукты, тратить время на поиск товаров на полках разных магазинов. Вместо этого им достаточно просто сделать фотографию и загрузить ее в специальное мобильное приложение. Далее нужно лишь следовать указаниям программы и выполнить свою работу в соответствии с имеющимися стандартами. При этом информация о положении дел на местах почти мгновенно попадает в офис компании, в оответствующую базу данных.
На рынке появилось множество решений, основанных на «компьютерном зрении»: нейронные сети позволили анализировать полки магазинов на предмет наличия или отсутствия там конкретных товаров.
Давайте посмотрим, чем системы распознавания будут полезны FMCG-компаниям:
- Аудит торговой точки проводится быстрее. Поставщики ПО заявляют, что временные затраты снижаются в среднем на 40—60%. Но есть и более впечатляющие примеры экономии времени: до 80% за один визит.
- Скорость обработки входящих данных возрастает практически на два порядка. Большинство систем обрабатывают визуальные данные практически в режиме реального времени. Отчет программы относительно соответствия планограмме, расчет доли полки, а также количества фейсингов поступит в течение 20-30 секунд.
- Вероятность ошибки минимальна. Точность систем распознавания полки на данный момент составляет от 92% до 98%. Хотя есть несколько «проблемных» товарных категорий, которые «портят статистику».
- Можно решать сразу несколько задач. Система распознавания полки позволяет проводить мониторинг цен и отслеживать промоакции (наличие рекламных материалов, специальных ценников, оформление дополнительных мест продаж и т.п.).
- Применение Image Recognition помогает компаниям существенно оптимизировать свой штат полевых сотрудников. Благодаря тому что рутинные задачи теперь занимают меньше времени, персонал можно переключать на другие задачи.
Поставщики систем распознавания привлекают клиентов обещаниями быстрого внедрения (один-два месяца), легким переходом от тестирования к полному внедрению и простой интеграцией с CRM-системой заказчика.
«Решения автоматического распознавания можно применять для автоматического контроля качества визита. Это пока не самая популярная опция у клиентов, но уверен – скоро большинство активных пользователей IR будут использовать этот функционал.
Система в любом случае анализирует состояние полки до и после визита, так что научить ее оценивать произошедшие изменения несложно. Приблизился ли магазин к идеальному perfect store (с точки зрения поставщика) и насколько?
Накопление данных с оценками визитов позволяет сравнивать эффективность отдельных мерчендайзеров, долгосрочное изменение качества их работы, эффект от мотивационных программ. Можно сравнивать успехи в разных сетях и на разных территориях. В общем, множество возможностей для пытливого маркетолога».
Решения автоматического распознавания можно применять для автоматического контроля качества визита. Это пока не самая популярная опция у клиентов, но уверен – скоро большинство активных пользователей IR будут использовать этот функционал.
Система в любом случае анализирует состояние полки до и после визита, так что научить ее оценивать произошедшие изменения несложно. Приблизился ли магазин к идеальному perfect store (с точки зрения поставщика) и насколько?
Накопление данных с оценками визитов позволяет сравнивать эффективность отдельных мерчендайзеров, долгосрочное изменение качества их работы, эффект от мотивационных программ. Можно сравнивать успехи в разных сетях и на разных территориях. В общем, множество возможностей для пытливого маркетолога.
Накопление данных с оценками визитов позволяет сравнивать эффективность отдельных мерчендайзеров, долгосрочное изменение качества их работы, эффект от мотивационных программ. Можно сравнивать успехи в разных сетях и на разных территориях. В общем, множество возможностей для пытливого маркетолога».
- Подготовка фотографий стеллажей магазинов, на которых находится продукт компании-заказчика. На данный момент баз данных таких изображений достойного качества не существует. Предоставление материала для обучения нейросетей ложится на плечи FMCG-производителей и торговых сетей. На первый взгляд, кажется, что это несложно, однако не все компании обладают такими запасами. В идеале фотографии должны быть сделаны при одинаковом освещении и с одинакового ракурса. При этом нужно отслеживать, чтобы на предоставленных изображениях ваш товар присутствовал на полке и не перекрывался другим. Учтите, чем больше фотографий одной и той же полки одного и того же магазина вы предоставите, тем точнее будет распознавание. Некоторые поставщики систем распознавания требуют по 100-200 фотографий для каждого SKU, некоторые говорят о 1500.
- После того как фотографии получены, нужно разметить находящиеся на них товары. Эту задачу могут взять на себя представители компании-поставщика, однако все же желательно оставить разметку на стороне заказчика. Ведь мерчендайзерам, которые видят торговые полки каждый день, проще ориентироваться в товарах и брендах. К тому же готовая база качественных фотографий – это актив компании, который поможет не зависеть от поставщика в дальнейшем. Обычно разметка занимает довольно много времени, но все усилия, затраченные на этом этапе, в дальнейшем окупятся сторицей.
- Следующий шаг — детектирование объектов. Эта часть подготовки проекта полностью лежит на стороне исполнителя. Границы каждого объекта выделяются и переводятся в координаты. Далее все объекты с их координатами в виде списка передаются модели, идентифицирующей распознанные объекты.
- Идентификация SKU. Всем распознанным объектам модель присваивает класс, к которому тот принадлежит. В нашем случае это будет SKU. Чем больше фотографий было загружено в систему для каждого класса, тем выше окажется качество распознавания.
- Составление отчета. Проанализировав выкладку, система распознавания готовит отчет. Формат его получения может быть разным. Все зависит от задач заказчика. Возможны следующие варианты:
- Система отслеживает аут-оф-сток, и в случае его обнаружения отправляет ответственному сотруднику сообщение в мессенджер или электронное письмо;
- Система анализирует соответствие выкладки планограмме, в режиме реального времени, сообщая об обнаруженных проблемах мерчендайзеру через специальное мобильное приложение;
- Система может анализировать состояние выкладки в динамике. В этом случае получаемые отчеты о размере доли полки, количестве SKU и т.п. могут записываться в базу данных компании для дальнейшего анализа и контроля качества работы полевых команд.
Многие разработчики говорят о том, что для них предпочтительнее обучение системы не в «лабораторных», а в полевых условиях. И это очень важный момент, ведь нейронные сети «умнеют» по мере загрузки все новой и новой информации, в нашем случае реальных полевых фотографий.
Накопление данных с оценками визитов позволяет сравнивать эффективность отдельных мерчендайзеров, долгосрочное изменение качества их работы, эффект от мотивационных программ. Можно сравнивать успехи в разных сетях и на разных территориях. В общем, множество возможностей для пытливого маркетолога».
Разработчики говорят о том, что для них предпочтительнее обучение системы не в «лабораторных», а в полевых условиях. И это очень важный момент, ведь нейронные сети «умнеют» по мере загрузки все новой и новой информации.
Узкие места во внедрении Image Recognition
Безусловно, никакое ПО не застраховано от ошибок или не совсем качественной работы. В случае с нейронными сетями принципиальную важность приобретает качество загружаемых в систему данных. И здесь количество всегда благотворно влияет на качество.
Те, кто уже работал с подобными системами сообщают о проблемах, которые могут возникать в процессе распознавания, по самым разным причинам. Например:
- Если фотографии, загруженные в систему, были сделаны при обычном освещении, а в дальнейшем магазин решил подсветить стеллаж неоновыми лампочками, распознавание может значительно ухудшиться.
- Иногда получается так, что мерчендайзер не может сфотографировать весь стеллаж сразу. Приходится делать несколько фотографий и затем их «склеивать» в приложении. Хорошо, если в ПО поставщика есть функция такого «склеивания» и она работает четко. В противном случае опять-таки могут случиться искажения и, как результат, ошибки анализа.
- На качество распознавания может повлиять и угол, под которым была сделана фотография. Так что после запуска проекта стоит провести среди мерчендайзеров небольшой мастер-класс по тому, как и что именно нужно фотографировать. Благо, поставщики почти всегда предоставляют заказчикам обучающие гайды, в которых прописаны все правила фотосъёмки.
- Если фотографируемый товар находится за стеклом, помешать качественному распознаванию могут блики и отражения.
- Нестандартная форма стеллажей или расположения товара также может вызывать затруднения.
С другой стороны, плюсами систем распознавания является возможность их бесконечного обучения. Более того, по мере загрузки все большего числа данных, нейронные сети только «умнеют». Так что многие из перечисленных нами проблем могут быть решены в будущем и уже решаются сейчас. В любом случае, вам стоит уточнить у поставщика, какие «узкие места» есть в его системе и постараться максимально нивелировать их влияние на конечный результат.
Памятка по внедрению Image Recognition
Итак, вас заинтересовала технология, но вы хотите получить больше подробностей, чтобы принять окончательное решение? Мы обратились за комментариями к поставщикам, а также пользователям систем распознавания и выяснили неочевидные детали подобных проектов.
Кому нужно внедрение?
Решения для распознавания будут полезны производителям любых FMCG-товаров, имеющих понятную читабельную упаковку с конкретным «фейсингом» (лицевой стороной упаковки, где есть идентификаторы – название, бренд, картинка и т.п.), и DIY (например, краски, штукатурка, малярка и т.д.). Распознавание не сработает для весовой/нарезной продукции, товаров, продающихся россыпью, в пакетах, и просто очень небольших по размеру.
Принимая решение о внедрении, стоит отталкиваться от количества SKU, которые будут участвовать в проекте, и задач по покрытию адресной программы (чем больше АП, тем выше потребность в оптимизации времени, затрачиваемого на сбор оперативной полевой информации). Также внедрение необходимо компаниям, которые тратят много времени и ресурсов на содержание штата аудиторов. Ведь Image Recognition позволяет существенно оптимизировать временные и финансовые инвестиции на точку, 40—80% оптимизации в зависимости от задач проекта (аудит/мерчендайзинговое обслуживание).
В целом, решение необходимо большинству производителей, представленных в торговых сетях.
Какова точность распознавания и как можно его повысить?
«Нет и не будет моделей, которые бы работали со 100% точностью. Точность в 95-98% уже очень хороший результат. Надо помнить, что качество распознавания может улучшаться в процессе работы по мере накопления новых изображений.
Чтобы добиться максимально возможной точности, следует обратить особое внимание на загружаемые фотографии. Вот основные требования к ним:
- фотографии должны быть сделаны при достаточном освещении и быть хорошего качества;
- снимать полку необходимо фронтально, захватывая как можно большую площадь, желательно чтобы объекты на полке не были обрезаны;
- чем больше фотографий будет приходиться на каждый SKU, тем лучше;
- минимальное количество фотографий – 200 изображений на один SKU».
«Обычно мы говорим с клиентами о точности в районе 95+%. Это хороший показатель. Но тем не менее периодически бывают ошибки: что-то определяется неверно, что-то вообще не определяется. Когда такое происходит, мы добавляем неверно распознанные фотографии в обучающую выборку и переобучаем систему. Это улучшает точность и позволяет бороться с ошибками.
В каждом проекте мы собираем независимую тестовую выборку из фотографий, сделанных мерчендайзерами в реальных торговых точках, на которых все необходимые товары встречаются примерно по 100 раз. Фотографии из тестовой выборки не участвуют в обучении системы, но каждый раз после обучения, мы замеряем точность распознавания сервиса на этой независимой тестовой выборке.
Если говорить о требованиях к фото, то нужна камера с сенсором на 8Мп. Размер снимка по меньшей стороне должен быть от 2000 пикселей. Также важно, чтобы при фотографировании соблюдались следующие простые правила:
- камера смотрит в центр стеллажа;
- стеллаж входит в снимок полностью;
- все SKU хорошо видны, нет бликов и засвеченных областей;
- каждое SKU распознается вами самими.
Конечно, бывают длинные или высокие стеллажи. Для таких случаев предусмотрен режим склейки, который срабатывает автоматически».
Насколько быстро можно внедрить решение?
Конечно, здесь все зависит от конкретного решения. Но в одном наши эксперты оказались единодушны – скорость внедрения напрямую связана с количеством участвующих SKU и, соответственно, скоростью, с которой компания сможет подготовить данные для загрузки в систему.
«Обычно мы говорим с клиентами о точности в районе 95+%. Это хороший показатель. Но тем не менее периодически бывают ошибки: что-то определяется неверно, что-то вообще не определяется. Когда такое происходит, мы добавляем неверно распознанные фотографии в обучающую выборку и переобучаем систему. Это улучшает точность и позволяет бороться с ошибками.
«Обычно мы говорим с клиентами о точности в районе 95+%. Это хороший показатель. Но тем не менее периодически бывают ошибки: что-то определяется неверно, что-то вообще не определяется. Когда такое происходит, мы добавляем неверно распознанные фотографии в обучающую выборку и переобучаем систему. Это улучшает точность и позволяет бороться с ошибками.
В каждом проекте мы собираем независимую тестовую выборку из фотографий, сделанных мерчендайзерами в реальных торговых точках, на которых все необходимые товары встречаются примерно по 100 раз. Фотографии из тестовой выборки не участвуют в обучении системы, но каждый раз после обучения, мы замеряем точность распознавания сервиса на этой независимой тестовой выборке.
Если говорить о требованиях к фото, то нужна камера с сенсором на 8Мп. Размер снимка по меньшей стороне должен быть от 2000 пикселей. Также важно, чтобы при фотографировании соблюдались следующие правила.
Когда не стоит внедрять IR?
Любая технология не тольrо упрощает жизнь пользователю. Одновременно и неизбежно возникают дополнительные расходы и ограничения. В случае с автоматическим распознаванием полки к ограничениям можно отнести:
- Расходы на внедрение системы. Разовые затраты на настройку и обучение системы в зависимости от товарной категории, ее глубины и сложности оцифровки составят от 700 тысяч до 2,5 миллионов рублей. Это существенные деньги для компаний с небольшой SKU-матрицей и в категориях с низкой ротацией товаров;
- Дополнительные расходы на поддержание системы. Минимальный ценник на обработку изображения на рынке сейчас порядка 2 рублей, но эта цена действует для крупных и особо крупных клиентов. Небольшая компания может рассчитывать не менее, чем на 15-25 рублей за снимок.
- Затраты времени. Да, в ряде случаев, когда маркетолог хочет собрать слишком много данных. Например, небольшая компания, представленная в нескольких товарных подкатегориях, решает замерить долю полки и ее динамику. Мерчендайзер вынужден добавлять к визиту по 15-20 минут, чтобы обойти все места продаж и сделать в каждом по несколько фотографий, которые потом программно «склеиваются».
Подводим итоги
Подводя итоги, можно сказать, что технологии распознавания полки способны произвести настоящую революцию в мерчендайзинге. Контроль за полевым персоналом становится проще и эффективнее, данные из магазинов поступают в режиме онлайн, а процент ошибок при этом минимален. Главное не забывать об ограничениях технологии и ответственности, которая лежит на каждом заказчике, по сбору и предоставлению качественных вводных данных. Можно сказать, что в случае с IR успех проекта действительно в ваших руках.