유튜브 URL: https://www.youtube.com/watch?v=iD4hy6UXTYA
현장 최적 제어의 어려움
- 산업의 복잡성
- 장비 내외부 환경 조건과 조건 및 결과의 복잡한 인과 관계
- 변화와 편차
- 변동하는 제품, 공정, 레시피와 장비 유지보수로 인한 조건 변화, 작업 숙련도에 따른 품질 차이
- 사람의 한계
- 인간의 능력으로는 복잡한 조건과 변화에 대한 최적의 제어를 항상 보장하기 어려움
문제 해결을 위한 두 가지 기술
- Digital Twin
- 주어진 조건과 상태에서 특정 제어가 이루어졌을 때 다음 상태 변화를 예측
- 머신러닝 기반
- Explorer
- Digital Twin과 연계한 최적화 알고리즘
마키나락스의 제어 최적화 방법론
- 문제 정의
- 현황 파악
- 현재 제어의 문제 및 원인 파악
- 제어 목표와 제약사항 합의
- 시뮬레이션 환경 구축
- 변수 유형 분류
- 시스템과 데이터 특성을 고려한 모델 구조 설계
- 시뮬레이션을 위한 모델 학습 전략 수립
- 최적 제어 로직 도출
- 데이터 분포를 고려한 최적 제어 로직 알고리즘 선택
- 알고리즘의 성능과 효율성을 높이기 위한 전략 수립
KG 스틸 철강 공정 라인에 AI 적용하기
개요
- 철강 공정: 냉연, 칼라, 석도 및 PEB 생산 및 판매로 매출 발생
- 퍼니스 장비: 철강 공정에서 가열로 역할
문제 파악
- 작업자의 경험과 숙련도에 의존하여 제어
- 단순 가이드로는 극복이 어려운 작업자 간의 편차 존재
- 제어의 편차에 따라 LNG 사용량 편차 존재
에너지 효율성 문제
- 목표 온도 달성은 이루어졌으나, 비효율적 제어
- 목표 온도 달성 실패로 인한 LNG 낭비
Dynamics Model 기반 철강 공정 시뮬레이션 환경 구현
실제 환경 묘사
- Actor: 의사 결정을 하는 엔지니어 -> 최적 제어 로직
- Dynamics Model: 환경의 변화를 예측
Dynamics Model 변수 유형 정의
- 관측 변수: 제어에 따라 변화 (Model 입력 변수)
- 조건 변수: 제어에 영향을 받지 않지만 시스템에 영향을 주는 변수
- 제어 변수: 최적화 대상 변수
시뮬레이션 플로우 (What-if Simulation)
- 관측 변수를 조절 시 영향 계산: initial input 값이 입력되었을 때와 사람이 관측 변수를 입력했을 때 비교
Dynamics Model Modeling 시 고려사항
- Delay System: 상황 및 변수별 Delay가 존재하는 시스템 특성
- 열전도율 차이로 인해 같은 제어에도 코일 온도 변화율이 다름
- 센서 위치에 따른 시간차 존재
- 해결법:
- 주요 제어 변수와 관측 변수의 Time-lagged Cross Correlation을 통해 delay 정도 파악
- 변수별 약 5~10분 정도 시간차 확인
Time-lagged Cross Correlation:
- 시간 shift하며 correlation 계산 -> correlation이 가장 높을 때 시간 shift 계산
- 변수별로 다른 delay system을 가진 시스템에 적합한 모델 개발
- Training과 Inference 차이 줄이는 학습 방법:
- 이전 단계의 예측 결과가 다음 단계의 입력으로 입력되도록 설계
Scheduled Sampling
- 학습 초기엔 Ground Truth를 입력으로 활용
- 학습이 진행됨에 따라 예측치를 입력으로 활용
모델 성능 평가
- 코일 온도에 대한 N-step MAE(Mean Absolute Error)를 주요 지표로 활용
- 전체 loss보다는 주요 feature를 잘 맞추는 모델이 우선
1-step MAE: 직전 Step의 Ground Truth가 주어졌을 때 다음 Step에 대한 예측 오차 평가 N-step MAE: N-Step 동안 Autoregressive하게 예측을 진행했을 때 예측 오차 평가
- TabNet: Sequential Data를 다루진 못하지만, Tabular 데이터에 강해 Baseline으로 선정
오프라인 데이터셋의 한계
- Out of Distribution / Sim2RealGap
- 작업자 간 편차가 존재하지만, 제어 패턴이 한정되어 있음 -> 너무 다른 패턴 입력 시 신뢰도 하락
최적화 알고리즘 선택 시 이런 문제를 고려해야 함
MPC를 통한 최적 제어 로직 도출
강화학습 알고리즘
- 강화학습이 부적합한 이유:
- Dynamics Models 한계
- Dynamics Model이 학습한 영역 내에서 제어하기 어려움 -> 신뢰성 없는 결과를 기반으로 학습
- Dynamics Models 한계
Model Predictive Control (MPC)
- 실현 가능한 미래를 둘러보고 최적의 미래 선택
- Planning: 진행 가능한 제어 Sequence 계획
- 계획된 제어 Sequence를 모델에 대입하여 시나리오 예측
- 시나리오 평가 후 최적 제어 Sequence 선택
- 고려사항:
- 모델의 정확도 중요
- Planning 시 유의미하고 다양한 제어 Sequence 생성 필요 (Computing Resource 고려)
- 시나리오 평가를 위한 Cost Function에 원하는 목적 포함
Generate Candidate Action Sequence using VAE
VAE(Variation Auto Encoder): Generative AI 계열 모델
- 목적: 원본 제어와 유사하지만 조금씩 다른 Sequence 생성
통합 시스템 구축과 기대 효과
Q&A
공정에 AI를 도입하려면 데이터가 얼마만큼 필요한가요?
- 데이터가 많을수록 좋지만, 부족한 경우 직접 문의 바람
산업 현장에 최적화된 로직을 도입할 때 가장 큰 허들은?
- 인프라: 노후화된 장비
- 데이터는 존재하지만 직접 적용하기 어려움 -> 가이드라인까지만 제공하고 이후 자동화
- 현장 엔지니어의 신뢰도
- 파일럿 테스트 시 문제로 이어질 수 있음
- MPC 모델의 장점: 강화학습과 다르게 설명 가능하고 효과 예측이 가능 -> 설득 용이
- 그럼에도 100% 정확도를 가지지 않기 때문에 신뢰도 얻기 어려움
AI 모델의 유지보수는 어떻게 이루어지나요?
- 재학습 파이프라인 제공