



Rivalli Data Extraction
parsers
Python
ETL
Pandas
Excel
Industrial-grade парсер мебельного производства с полным циклом ETL.
Технологический стек
Python 3.10PandasOpenpyxlRequests
Возможности v1.0
- Глубокий парсинг характеристик
- Склейка вариативных товаров
- Скачивание документации и видео
- Генерация Excel-каталогов
Подробная документация
Высоконагруженный промышленный парсер для сбора данных с сайта производителя мебели Rivalli.ru. Выполняет полный цикл ETL: от анализа HTML до формирования отчетов.
Возможности
- Deep Data Scraping: Сбор детальных характеристик, описание, "фишек" товара.
- Медиа-архивация: Скачивание фото, видео и технической документации.
- Обработка вариативности: Склейка данных для товаров с разными цветами.
- Аналитика: Генерация Quality Reports для выявления пропусков.
Надежность
Использование ротации User-Agent, адаптивных задержек и автоматического повтора запросов (Retry logic).