전체 글 16

[내일배움캠프] QA/QC_5기 본캠프(0529)

코드카타더보기더보기 import pandas as pdimport numpy as npdata = {'signal': [10.0, 10.2, 10.5, 13.5, 13.6, 13.4, 10.0, 9.8, 9.9, 15.0]}df = pd.DataFrame(data)df['diff_1'] = abs(df['signal'].diff(1))threshold=2.0df['gradient_outlier'] = (df['diff_1'] >2.0)df_1 = df[['signal', 'gradient_outlier']]print(df_1)실전 프로젝트 3일차아무것도 모르겠다. 더보기더보기TIL: 금속 에칭 시계열 데이터 분석 방향 정리1. 오늘 학습한 내용오늘은 금속 에칭 공정 데이터 분석을 본격적으로 진행하기 위해..

[내일배움캠프] QA/QC_5기 본캠프(0528)

코드카타더보기더보기 문제에서 제시된 대로 mean, std를 사용해서 풀이하면 이상치가 존재해서 제대로 상한선 하한선이 적용되지 않는다. # mean, std 방식import pandas as pdimport numpy as npdata = {'value': [10.0, 10.2, 9.8, 10.1, 9.9, 10.3, 25.0, 10.0, 9.7, 10.2, -5.0, 10.1]}df = pd.DataFrame(data)df_mean = df['value'].mean()df_std = df['value'].std()df_UCL = df_mean + 3*df_stddf_LCL = df_mean - 3*df_stddf['static_outlier'] = (df_UCL df['value'])print(df)..

[내일배움캠프] QA/QC_5기 본캠프(0527)

실전 프로젝트 발제날. 우선 코드카타더보기 시계열 코드 6번. LOT 단위 요약 통계 생import pandas as pddata = {'LOT_ID': ['LOT123','LOT123','LOT123','LOT123','LOT123','LOT124','LOT124','LOT124','LOT124','LOT124'],'PRODUCT': [1, 2, 3, 4, 5, 1, 2, 3, 4, 5],'WIDTH': [10.23, 10.15, 9.87, 10.31, 10.08,11.02, 10.94, 11.21, 11.13, 10.87],'DEFECT': ['OK','OK','NG','OK','OK','OK','NG','NG','OK','OK']}df = pd.DataFrame(data)test = df.group..

[내일배움캠프] QA/QC_5기 본캠프(0526) - 2

시계열 계속 A. 통계적 시계열 모델 전처리 1. 정상성과 비정상성더보기더보기비정상성 데이터란?시간이 지날수록 데이터의 평균(Trend)이 증가/감소하는 경우 (추세)계절성(Seasonality) 이 포함되어 특정 주기마다 패턴이 달라지는 경우시간이 지날수록 데이터의 변동성(Variance)이 증가하는 경우쉽게 말해 추세와 계절성이 하나라도 있으면 비정상성 데이터 정상적이다. (Stationary) = 안정적이다.추세(Trend)나 계절성이 없고, 데이터의 평균과 분산이 일정한 경우주어진 시간 간격에서 변동성이 안정적이며 예측 가능한 수준시계열의 통계적 특징(평균, 분산, 자기 상관)이 변하지 않는다. (일정한 패턴을 유지)랜덤한 움직임을 가지지만, 시점마다 유사하게 동작하는 특징이 있어 시간에 따라 안..

[내일배움캠프] QA/QC_5기 본캠프(0526) - 1

도쿄일렉트론 역검떨의 충격으로 한동안 TIL 안썼는데 다시 시작...;; 오늘은 태블로 개인 과제 해설외에 특별한 일은 없다. 그래서 대여 노트북 세팅을 마저 하고 시계열 내용 정리를 하려고 함. 1. 시계열데이터란 무엇인가더보기시계열 데이터는 단순히 날짜나 시간이 포함된 데이터가 아니라, 시간 순서에 따라 연속적으로 기록되고 이전 값이 현재 값과 관련을 가지는 데이터.다음의 특징을 갖는다. 2. 시계열 데이터 전처리와 Feature Engineering - 날짜 형식 변환더보기1) 월별/분기별/계절별 패턴을 모델이 인식2) 다양한 주기적인 변동 예측 가능3) 계절성이나 주말/평일 차이를 반영 - Lag Feature더보기 - Rolling Statistics더보기window 크기는 도메인 지식 +..