QAQC_5기 부트캠프/시계열 데이터

[내일배움캠프] QA/QC_5기 본캠프(0526) - 1

두껍22 2026. 5. 26. 17:10

도쿄일렉트론 역검떨의 충격으로 한동안 TIL 안썼는데 다시 시작...;;

 

오늘은 태블로 개인 과제 해설외에 특별한 일은 없다. 그래서 대여 노트북 세팅을 마저 하고 시계열 내용 정리를 하려고 함.

 

 

1. 시계열데이터란 무엇인가

더보기

시계열 데이터는 단순히 날짜나 시간이 포함된 데이터가 아니라, 시간 순서에 따라 연속적으로 기록되고 이전 값이 현재 값과 관련을 가지는 데이터.

다음의 특징을 갖는다.

 

 

2. 시계열 데이터 전처리와 Feature Engineering

 - 날짜 형식 변환

더보기

1) 월별/분기별/계절별 패턴을 모델이 인식

2) 다양한 주기적인 변동 예측 가능

3) 계절성이나 주말/평일 차이를 반영

 - Lag Feature

 - Rolling Statistics

더보기

window 크기는 도메인 지식 + 데이터 주기성으로 직접 찾아야 한다.

 - diff feature(변화량 feature)

 

 

3. SPC( Statistical Process Control)와 관리도

더보기

SPC - 공정의 변동을 사전에 파악하여 불량을 방지하는 데 목적이 있다.

관리도 - 평균선, UCL, LCL을 기준으로 공정이 안정적인 상태인지 판단하는 도구.

 

관리 한계선은 보통 평균 ±3σ를 기준으로 설정한다. 정규분포를 가정하면 대부분의 데이터가 ±3σ 안에 들어오기 때문에, 이 범위를 벗어나는 값은 공정 이상 가능성이 있다고 판단할 수 있다.

 

구역을 나눠서 보는데 zone rule이라는 걸로 이상을 판별함.

zone rule을 좀 많아서;; 스킵