Машинное обучение · Содовое производство · НИР-2

Умное
управление
карбонизацией

Полный ML-пайплайн для диагностики и прогнозирования процесса карбонизации аммонизированного рассола — от сырых данных SCADA до советника оператора в реальном времени

0,844 ROC-AUC
0,689 Точность классификации
5/5 Сценарный тест
8 Экспериментов
Главный результат GitHub
Постановка задачи

Зачем это нужно

Карбонизация аммонизированного рассола — центральная стадия метода Сольве. Лабораторный контроль выполняется раз в смену: если что-то пошло не так, оператор узнаёт с задержкой 4–8 часов. ML-система решает эту проблему.

📡

SCADA K5

6-минутные данные с датчиков

🧠

ML-модель

XGBoost классификатор режима

⚖️

Правиловый слой

10 диагностических правил

🔍

Корневая причина

RC-01 до RC-06

📊

Риск-скор

Оценка от 0 до 1

💬

Советник

Действия и целевые параметры

Главный результат

V8 / K5 — SCADA-first диагностика

Полный диагностический пайплайн для карбоколонны K5 — от обнаружения аномалии до рекомендации оператору. Проверен на реальных данных производства.

Ключевые метрики

Датасет: 4 503 строки, 19.02–10.03.2026, шаг 6 минут. Рабочий набор признаков: 26 (ядро + флаги состояния + коротковременные окна).

Balanced accuracy 0,689
ROC-AUC (LightGBM) 0,844
Quality Score — норма 0,94
Горизонт прогноза 2 часа

Сценарный тест 5/5

Система верно диагностирует все пять производственных сценариев — от отказа датчика до критического падения уровня.

Потеря охлаждения

RC-02
КРИТИЧНО

Потеря газа II входа

RC-03
СРОЧНО

Отказ датчика

RC-01
НЕМЕДЛЕННО

Перегрев суспензии

RC-05
НАБЛЮДЕНИЕ

Падение уровня

RC-04
ПРЕДУПРЕЖДЕНИЕ
Исследовательские контуры

Что исследуется

Два параллельных контура — прогностический soft-sensor и диагностика режима по данным SCADA.

КОНТУР 1 · SOFT SENSOR · V1–V7

Температура суспензии

target_t · NaHCO₃ · °C

Приоритетный показатель. Краткосрочный прогноз на горизонте 2 часа по данным SCADA колонны.

0,80
КОНТУР 1 · SOFT SENSOR · ЛИНИЯ 66

Содержание хлоридов

target_cl · Cl⁻ · г/л

Химический показатель смены. Ненаблюдаем из доступных SCADA-признаков — физическое ограничение системы.

0,31
КОНТУР 2 · SCADA-FIRST · V8/K5

Классификация режима

K5 · XGBoost · 6 мин

Диагностика аномального / нормального режима в реальном времени с корневой причиной и советником.

0,844
История экспериментов

Все эксперименты

Восемь последовательных экспериментов от базового baseline до полного диагностического пайплайна с советником оператора.

# Проект Суть Статус
01 v8_scada_operator_ftc SCADA-first диагностика K5 + пайплайн V8.2–V8.5 Главный контур
02 targetB_v7 Soft sensor: RF + LightGBM, автогенерация сводки Soft sensor
03 targetB_v6 Baseline с контролем утечки данных Опорная версия
04 rf_tuning_v5 RF + XGBoost для K1 Завершён
05 lags_no_offgas_v4 Признаки с лагами без отходящего газа Архив
06 lags_v3 Baseline с лаговыми признаками Архив
07 baseline_v2 Сравнение: с отходящим газом / без Архив
08 baseline_v1 Первый базовый baseline Архив
Также: soda-ml-obn_v9 — родственный контур цеха ОБН. Исследование downstream-показателей качества методами машинного обучения. Статус: закрыт, результаты задокументированы.
Переход от сменных лабораторных таргетов к часовым данным SCADA поднял R² с 0,05 до 0,80. Граница наблюдаемости химических показателей подтверждена на двух независимых цехах.

Система V8/K5 верно диагностирует все пять производственных сценариев в реальном времени. Советник оператора работает на колонне K5 с подтверждённой точностью ROC-AUC 0,844.

Python 3.10 scikit-learn 1.3 XGBoost 3.2 LightGBM 4.6 SHAP pandas numpy