CASE / OPENEDSMARTPARSE-AI
← все кейсыAI · SaaSгод · 2025длительность · 5 месяцевОткрыть вживую

SmartParse AI

AI-парсер маркетплейсов с дашбордом для селлеров.

parser.py
docs
pricing
py · utf-8
1
2
3
4
5
6
7
8
9
10
11
12
from smartparse import Schema
schema = Schema(
url="…/catalog?p=*",
fields=[
"title", "price", "sku"
],
render=True, retry=3,
)
for row in schema.stream():
yield row.json()
build · passingspaces: 2 · ln 12 · col 18
{}SmartParse
v2.1 · stream
parse.loglive
12:04:01GET200page 1 · 60 items
12:04:01GET200page 2 · 60 items
12:04:02GET429rate-limit · backoff
12:04:03GET200page 2 · retry ✓
12:04:03PARSE200→ schema ok
output · row[0]application/json
{
"title": "Куртка зимняя XS",
"price": 4290,
"sku": "WB-10493",
"in_stock": true
}
12.4M
rows / run
99.7%
schema hit
vs ручной
01 / CONTEXTКонтекст

Контекст

Селлеры на Wildberries и Ozon тратили по 8 часов в неделю на ручную выгрузку конкурентов и ценовой анализ. Существующие сервисы работали со скрапингом, который ломался раз в неделю.

Решили построить ML-индекс: одна модель распознавала структуру карточки на любой площадке, вторая — извлекала факты в нормализованной форме.

02 / BRIEFЗадача

Задача

  1. 01Парсинг 4 маркетплейсов: WB, Ozon, Я.Маркет, Lamoda
  2. 02ML-нормализация карточек к единой схеме
  3. 03Дашборд селлера с алертами по цене и stock-out
  4. 04API для интеграции с 1С и Bitrix24
  5. 05AI-аналитика «почему конкурент выиграл выдачу»
03 / SOLUTIONРешение

Решение

/ step 01

Лента конкурентов

Все карточки конкурентов в одной ленте с дельтами по цене, остаткам, рейтингу. Сортировка по «угроза для вашей позиции».

/ step 02

AI-разбор позиции

Просишь объяснить, почему конкурент выше — модель сравнивает заголовок, инфографику, отзывы и тэги, выдаёт чек-лист правок.

/ step 03

Ценовые алерты

Push, telegram-бот, email — выбирай канал. Алерт срабатывает с правилом, а не просто по дельте.

/ step 04

Интеграции

Готовые коннекторы к 1С и Bitrix24 — выгрузка не вручную, а по расписанию. Открытый REST API с подписями HMAC.

04 / STACKАрхитектура

Архитектура

Next.jsPythonOpenAIClickHousePlaywrightRedis

Парсинг — пул Playwright-инстансов в Kubernetes, антибот-стратегия с ротацией прокси. Извлечение фактов через LLM с контролем выхода через JSON Schema.

Хранилище — ClickHouse для исторических цен (50G/день) + Postgres для сущностей. Дашборд читает только агрегаты, рейтинги OLAP-цепочкой.

05 / RESULTSРезультаты

Результаты

0M
карточек в индексе
−84%
времени на анализ
0
активных селлеров
₽0.0M
MRR через 4 месяца
06 / HONESTЧто не получилось с первого раза

Что не получилось с первого раза

  • Извлечение фактов сначала шло свободным промптом — LLM на каждой сотой карточке возвращала битый JSON, и ночные выгрузки падали. Зажали выход через JSON Schema, парсинг перестал ломаться.
  • Антибот-стратегию недооценили: WB начал отдавать капчу, и часть индекса протухала на сутки незаметно. Добавили ротацию прокси и алерт на проседание свежести данных.
07 / VOICEСлово клиента
С первого месяца я перестал залезать в WB-аналитику вручную. Когда конкурент сбрасывает цену — я узнаю быстрее него самого.
RT
Roman Tikhonov
Top-100 селлер на WB · SmartParse
08 / TEAMКоманда

Команда

DK
Product lead
LO
AI lead
AL
Backend
AS
Designer
09 / ROADMAPЧто дальше

Что дальше

  • Расширение на eBay и Amazon
  • AI-генератор инфографики карточек
  • Marketplace-агент для автоматических действий
10 / RELATEDСвязанные кейсы