Summary
마키나락스의 AI 기반 최적 제어 로직 도출 방법을 다룬 세미나 내용이다. 현장 최적 제어의 어려움(복잡한 시스템, 실시간 변수, 불확실성), AI를 활용한 해결 방안(강화학습, 시뮬레이션 기반 학습, 디지털 트윈), 실제 산업 현장 적용 사례, 그리고 AI 제어 시스템의 안전성 검증 방법을 포함한다.
유튜브 URL: https://www.youtube.com/watch?v=iD4hy6UXTYA
현장 최적 제어의 어려움
- 산업의 복잡성
- 장비 내외부 환경 조건과 조건 및 결과의 복잡한 인과 관계
- 변화와 편차
- 변동하는 제품, 공정, 레시피와 장비 유지보수로 인한 조건 변화, 작업 숙련도에 따른 품질 차이
- 사람의 한계
- 인간의 능력으로는 복잡한 조건과 변화에 대한 최적의 제어를 항상 보장하기 어려움

문제 해결을 위한 두 가지 기술
- Digital Twin
- 주어진 조건과 상태에서 특정 제어가 이루어졌을 때 다음 상태 변화를 예측
- 머신러닝 기반
- Explorer
- Digital Twin과 연계한 최적화 알고리즘

마키나락스의 제어 최적화 방법론
- 문제 정의
- 현황 파악
- 현재 제어의 문제 및 원인 파악
- 제어 목표와 제약사항 합의
- 시뮬레이션 환경 구축
- 변수 유형 분류
- 시스템과 데이터 특성을 고려한 모델 구조 설계
- 시뮬레이션을 위한 모델 학습 전략 수립
- 최적 제어 로직 도출
- 데이터 분포를 고려한 최적 제어 로직 알고리즘 선택
- 알고리즘의 성능과 효율성을 높이기 위한 전략 수립
KG 스틸 철강 공정 라인에 AI 적용하기
개요
- 철강 공정: 냉연, 칼라, 석도 및 PEB 생산 및 판매로 매출 발생
- 퍼니스 장비: 철강 공정에서 가열로 역할
문제 파악
- 작업자의 경험과 숙련도에 의존하여 제어
- 단순 가이드로는 극복이 어려운 작업자 간의 편차 존재
- 제어의 편차에 따라 LNG 사용량 편차 존재
에너지 효율성 문제
- 목표 온도 달성은 이루어졌으나, 비효율적 제어
- 목표 온도 달성 실패로 인한 LNG 낭비

Dynamics Model 기반 철강 공정 시뮬레이션 환경 구현
실제 환경 묘사

- Actor: 의사 결정을 하는 엔지니어 → 최적 제어 로직
- Dynamics Model: 환경의 변화를 예측
Dynamics Model 변수 유형 정의

- 관측 변수: 제어에 따라 변화 (Model 입력 변수)
- 조건 변수: 제어에 영향을 받지 않지만 시스템에 영향을 주는 변수
- 제어 변수: 최적화 대상 변수
시뮬레이션 플로우 (What-if Simulation)

- 관측 변수를 조절 시 영향 계산: initial input 값이 입력되었을 때와 사람이 관측 변수를 입력했을 때 비교
Dynamics Model Modeling 시 고려사항
- Delay System: 상황 및 변수별 Delay가 존재하는 시스템 특성
- 열전도율 차이로 인해 같은 제어에도 코일 온도 변화율이 다름
- 센서 위치에 따른 시간차 존재
- 해결법:
- 주요 제어 변수와 관측 변수의 Time-lagged Cross Correlation을 통해 delay 정도 파악
- 변수별 약 5~10분 정도 시간차 확인
Time-lagged Cross Correlation:
- 시간 shift하며 correlation 계산 → correlation이 가장 높을 때 시간 shift 계산

- 변수별로 다른 delay system을 가진 시스템에 적합한 모델 개발

- Training과 Inference 차이 줄이는 학습 방법:
- 이전 단계의 예측 결과가 다음 단계의 입력으로 입력되도록 설계
Scheduled Sampling
- 학습 초기엔 Ground Truth를 입력으로 활용
- 학습이 진행됨에 따라 예측치를 입력으로 활용

모델 성능 평가
- 코일 온도에 대한 N-step MAE(Mean Absolute Error)를 주요 지표로 활용
- 전체 loss보다는 주요 feature를 잘 맞추는 모델이 우선
1-step MAE: 직전 Step의 Ground Truth가 주어졌을 때 다음 Step에 대한 예측 오차 평가 N-step MAE: N-Step 동안 Autoregressive하게 예측을 진행했을 때 예측 오차 평가

- TabNet: Sequential Data를 다루진 못하지만, Tabular 데이터에 강해 Baseline으로 선정
오프라인 데이터셋의 한계
- Out of Distribution / Sim2RealGap
- 작업자 간 편차가 존재하지만, 제어 패턴이 한정되어 있음 → 너무 다른 패턴 입력 시 신뢰도 하락
-
최적화 알고리즘 선택 시 이런 문제를 고려해야 함
MPC를 통한 최적 제어 로직 도출
강화학습 알고리즘


- 강화학습이 부적합한 이유:
- Dynamics Models 한계
- Dynamics Model이 학습한 영역 내에서 제어하기 어려움 → 신뢰성 없는 결과를 기반으로 학습
- Dynamics Models 한계
Model Predictive Control (MPC)
- 실현 가능한 미래를 둘러보고 최적의 미래 선택

- Planning: 진행 가능한 제어 Sequence 계획
- 계획된 제어 Sequence를 모델에 대입하여 시나리오 예측
- 시나리오 평가 후 최적 제어 Sequence 선택
- 고려사항:
- 모델의 정확도 중요
- Planning 시 유의미하고 다양한 제어 Sequence 생성 필요 (Computing Resource 고려)
- 시나리오 평가를 위한 Cost Function에 원하는 목적 포함

Generate Candidate Action Sequence using VAE
VAE(Variation Auto Encoder): Generative AI 계열 모델
- 목적: 원본 제어와 유사하지만 조금씩 다른 Sequence 생성

통합 시스템 구축과 기대 효과


Q&A
공정에 AI를 도입하려면 데이터가 얼마만큼 필요한가요?
- 데이터가 많을수록 좋지만, 부족한 경우 직접 문의 바람
산업 현장에 최적화된 로직을 도입할 때 가장 큰 허들은?
- 인프라: 노후화된 장비
- 데이터는 존재하지만 직접 적용하기 어려움 → 가이드라인까지만 제공하고 이후 자동화
- 현장 엔지니어의 신뢰도
- 파일럿 테스트 시 문제로 이어질 수 있음
- MPC 모델의 장점: 강화학습과 다르게 설명 가능하고 효과 예측이 가능 → 설득 용이
- 그럼에도 100% 정확도를 가지지 않기 때문에 신뢰도 얻기 어려움
AI 모델의 유지보수는 어떻게 이루어지나요?
- 재학습 파이프라인 제공