2026/06 10

[내일배움캠프] QA/QC_5기 본캠프(0625)

최종 프로젝트 시작했다.반도체 도메인인데 갑자기 뭔 제조 데이터가,,반도체 테스트 소켓 제조 데이터가 반도체 데이터는 아니잖소 암튼 오늘 한 거 지피티가 정리해줬다.더보기TIL — IPQC/AOI 데이터 시간축 정렬과 SN 기반 사출 후보 묶음 검증오늘 한 일오늘은 월별 IPQC/AOI 원본 데이터를 바로 모델링하지 않고, 먼저 시간축과 사출 후보 단위가 분석에 사용할 수 있는 구조인지 확인했다.초기 데이터 감사에서는 2025년 7월부터 2026년 2월까지 총 8개 CSV, 237,039행을 대상으로 파일 구조, 결측, 중복, 이상값, 누수 위험 컬럼을 점검했다. 이 과정에서 2026년 1월과 2월의 FAIL 비율이 높아지는 현상은 확인했지만, 공정 문제라고 단정하지 않고 검사 기준, 데이터 수집 방식,..

[내일배움캠프] QA/QC_5기 본캠프(0618)

오늘의 아티클 스터디더보기주제 : 열심히 공부하는 당신이 서류조차 못 넘는 이유https://yozm.wishket.com/magazine/detail/3729/ 열심히 공부하는 당신이 서류조차 못 넘는 이유 | 요즘IT오늘도 퇴근하고 지친 몸으로 다시 모니터 앞에 앉았습니다. 하루가 다르게 쏟아지는 새로운 기술 사이에서 도태되지 않으려고 유명한 강의를 결제하고 주말까지 반납해 가며 스터디에 참여합yozm.wishket.com 1. 요약이 글은 서류 전형에서 계속 떨어지는 이유를 단순히 “공부가 부족해서”가 아니라, 회사와의 적합성을 제대로 보여주지 못했기 때문이라고 설명한다.많은 지원자는 이력서를 자신의 노력과 기술을 기록한 문서로 생각한다. 어떤 강의를 들었고, 어떤 기술을 배웠고, 어떤 프로젝트를 ..

[내일배움캠프] QA/QC_5기 본캠프(0604)

오늘 한거더보기# TIL — Unified Features 기반 FDC 조기경보 시스템 재구축 및 기존 방식 비교 ## 오늘 한 일 오늘은 기존에 진행했던 `metal_etch_fdc` 방식과 별도로, `unified_features.csv`를 기반으로 FDC 조기경보 시스템을 처음부터 다시 구축했다. 기존 방식은 EV/OES/RFM 원본 데이터를 직접 정렬하고 bin 단위 anomaly score를 계산하는 구조였다면, 이번 방식은 이미 wide-format으로 펼쳐진 `unified_features.csv`의 컬럼명을 파싱해 source / sensor / time index 구조를 복원하는 방향으로 진행했다. 즉, row 방향의 시계열이 아니라 컬럼 방향에 펼쳐진 시계열 구조를 다시 해석하고, 이를..

[내일배움캠프] QA/QC_5기 본캠프(0604)

문제풀이더보기왜 SHAP가 특별한가SHAP의 가장 큰 강점은 수학적으로 유일하고 공정한 특성 기여도 측정 방법을 제공한다는 거예요. 단순히 특성의 중요도만 평가하는 것이 아니라, 각 특성이 예측값에 실제로 얼마나 더하거나 뺐는지를 추적할 수 있습니다.이렇게 하면 모델의 예측 과정을 투명하게 설명할 수 있고, 잘못된 예측이 나왔을 때 어느 특성 때문에 그렇게 되었는지 명확히 파악할 수 있어요.헷갈리기 쉬운 지점특성의 "중요도"와 특정 예측에서의 "기여도"는 다른 개념이라는 점을 기억해요. 중요도는 전체 모델 관점이고, 기여도는 개별 예측 관점이에요.복습 정말 잘했어요! 설명 가능한 AI의 핵심을 이해하셨어요 더보기 실전 프로젝트더보기EV+OES 기반 금속 식각 공정 양불 분류 모델링오늘 진행한 내용오늘은..

[내일배움캠프] QA/QC_5기 본캠프(0602)

문제풀이더보기**Recall은 "실제로 Positive인 것 중에서 모델이 제대로 맞힌 비율"**입니다. 따라서:분자: TP (실제 Positive이면서 맞게 예측한 것)분모: TP + FN (실제 Positive인 모든 것)**Precision은 "모델이 Positive라고 예측한 것 중에서 실제로 맞은 비율"**입니다. 따라서:분자: TP (같음)분모: TP + FP (모델이 Positive라고 예측한 모든 것)✅ 올바른 이해: "분자는 같지만, 분모의 기준이 다르다"두 지표 모두 분자는 **TP(진짜 양성)**로 동일해요. 하지만 분모가 달라요:Precision의 분모 = 모델의 관점 (모델이 Positive라고 말한 것 전체)Recall의 분모 = 현실의 관점 (실제로 Positive인 것 전체)..

[내일배움캠프] QA/QC_5기 본캠프(0601)

에이타니 문제풀이 시계열 개념, 머신러닝 문제더보기시계열 데이터 구성 요소 구분이 개념이 무엇인지시계열 데이터는 시간 순서대로 쌓인 데이터예요. 예를 들어 매일의 주식 가격, 매월 판매량, 시간대별 기온 같은 것들이죠. 이런 데이터를 분석할 때 중요한 건 "시간에 따라 어떤 패턴이 있는가" 를 찾는 거예요.시계열 데이터 구성 요소 구분은 이 시간의 흐름 속에서 여러 가지 움직임을 각각 구분해서 이해하는 것이에요. 마치 음악에서 악기별 음성을 분리하듯이, 시계열 데이터에 숨어 있는 각각의 신호를 따로따로 봐야 한다는 뜻입니다.시계열 데이터의 주요 구성 요소시계열 데이터는 보통 네 가지 요소로 이루어져 있어요:추세(Trend): 장기적으로 위쪽 또는 아래쪽으로 향하는 움직임. 예를 들어 매년 매출이 계속 올..