CoderCastrov logo
CoderCastrov
Мобильные приложения

Как Intelligence Node переопределяет парсинг мобильных приложений для розницы

Как Intelligence Node переопределяет парсинг мобильных приложений для розницы
просмотров
3 мин чтение
#Мобильные приложения

Введение

Постпандемический мир в значительной степени полагается на мобильные приложения для покупок. Исследования показывают, что пользователи смартфонов проводят более 3 часов в день на своих телефонах, и один из пяти пользователей проводит более 4,5 часов ежедневно, смотря на свои телефоны. Учитывая среднее время, проводимое на мобильных телефонах ежедневно, неудивительно, что приложения быстро заменяют электронные коммерческие сайты и становятся основным каналом покупок для современных покупателей. Чтобы быть в курсе изменяющегося розничного ландшафта сегодня, Intelligence Node представила передовое решение для парсинга мобильных приложений, чтобы дополнить свою проверенную временем, награжденную технологию парсинга электронных коммерческих сайтов. Давайте ближе рассмотрим технологию и процесс парсинга мобильных приложений:

Есть 2 способа парсить мобильные приложения:

Сценарий 1

  • Когда композитные API открыты (например, Amazon) - В таких случаях требуется небольшая настройка, но в конечном итоге парсинг не отличается от стандартных веб-сайтов.

Сценарий 2

  • Когда композитные API зашифрованы (например, HEB, Dollar General, Stop & Shop, Target и т. д.). В этом случае все гораздо сложнее и требуется специализированный парсинг мобильных устройств, OCR (оптическое распознавание символов) и другие техники машинного обучения. Ниже приведено краткое объяснение подхода Intelligence Node:

Методология

Шаг 1) Запись сессии/навигации на мобильном устройстве (с помощью специальных визуальных парсеров навигации)

Технические соображения: Чтобы сделать процесс масштабируемым, мы используем облачное реальное устройство и эмулируем кластер устройств, которые используют нашу умную прокси-сеть.

Шаг 2) Определение ROI продукта (Region of Interest)

Поскольку в одном кадре может быть несколько продуктов, сложно парсить текст для конкретного продукта. Если попытаться это сделать, это может привести к несоответствующей информации. Чтобы справиться с этим, мы использовали алгоритм обнаружения объектов в качестве первого шага для получения ROI каждого продукта, независимо от того, сколько продуктов находится в одном кадре.

Входные файлы передаются в YoloV5, который настроен на определение ROI продуктов. Архитектура YoloV5 имеет преимущество перед другими моделями благодаря быстрой и точной инференции.

Видео содержит определенное количество кадров в секунду, что может привести к дублированию продуктов. Чтобы справиться с этим, мы вводим этап удаления дубликатов, где мы можем удалить определенные ROI продуктов, которые идентичны. Это дальше помогает обрабатывать данные более быстро и эффективно. ROI из видео затем кэшируется в виде изображений.

Шаг 2

Шаг 3) Определение компонентов продукта

В этом этапе определяются компоненты, такие как цена, информация о продукте, изображение продукта и т. д. (Компоненты могут варьироваться в зависимости от приложения). Применяется YoloV5 (отдельный экземпляр по сравнению с шагом 2 выше, так как нам нужно точное уровневое рассмотрение для определения компонентов).

Шаг 3

Шаг 4) Извлечение компонентов с помощью OCR

На этом этапе мы можем завершить извлечение текста, так как все детали продуктов были определены. Применяется специально обученная система OCR для получения подробного извлечения текста.

Шаг 4

Шаг 5) Получение конечного результата

Извлеченный текст, вместе с метаданными, сохраняется в базе данных. Применяются модульные тесты и проверки качества. На этом этапе информация преобразуется в требуемый формат клиента и готова к отправке/загрузке/запросу через API.

шаг 5

Заключение

Поскольку розничная экономика все больше отходит от традиционных кирпично-мортельных магазинов в сторону современных, технологически продвинутых альтернатив, таких как мобильная и социальная коммерция, а также приходящий метавселенной, розничным компаниям необходимо быть готовыми к быстрой перестройке с помощью передовых ИИ и аналитических решений. Intelligence Node понимает это и нацелена на предоставление брендам и розничным компаниям самой точной и сложной аналитики по всей их розничной сфере и продвигает свои цели, разрабатывая решения, такие как передовое решение по парсингу мобильных приложений. И она не останавливается на этом. Intelligence Node расширила свою проприетарную технологию на метавселенную - парсинг розничных магазинов во вселенной метавселенной, охватывая основные платформы, такие как Roblox, Meta, Decentraland, Sandbox и т. д.


Оригинальная публикация на сайте https://www.linkedin.com.