본문 바로가기

AI/AI TECH

(7)
[플레이데이터 SK네트웍스 Family AI 캠프 21기] 11월 4주차 회고 - 2차 단위프로젝트 벌써 어느새,,, 머신러닝 모델 종류들과 딥러닝 역전파에대해서 배울 수 있었다. 특별히 이번주는 팀프로젝트도 진행해서 엄청 빨리 지나갔다.1차 프로젝트는 자동차 관련 자유 주제였는데 2차 프로젝트는 가입 고객 이탈 예측하는 모델을 개발하는것이었다. 가입 고객 이탈 예측 데이터를 찾기에는 아무래도 공개해주는 기업이 많이 없고 종류도 많이 없기때문에 어떤 데이터로 개발을 진행할지에대한 고민이 많았다.Kaggel 데이터셋 중 사용할 수 있는 데이터들 목록을 추렸고 Churn 예측 연구에서 가장 많이 쓰는 표준 데이터셋은 Telco Customer Churm 이었다. 다른 팀에서 무조건 겹칠 주제로 생각이 되어서 제외시켰다. Spotify 주제로 결정을 했으나 이것또한 다른 팀에서 이미 한다고 해서 다른 주제로..
[sklearn.metrics] 분류형 평가지표 자세히 분석하기 ✔ confusion_matrix실제 값(y_true)과 예측 값(y_pred)을 비교하여 오차 행렬을 반환한다.ConfusionMatrixDisplay : 오차 행렬을 시각화 할 수 있는 모듈from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplaycm = confusion_matrix(y_test, y_pred)disp = ConfusionMatrixDisplay(confusion_matrix=cm)disp.plot(cmap="Blues")cm 오차행렬 : train set [[1167 45] [ 27 108]] 여러 모델을 학습 시켜보면서 오차행렬을 구하고, 오차행렬을 통해 평가지표를 만든다.각 모델마다 평가지표를 비교해..
[플레이데이터 SK네트웍스 Family AI 캠프 21기] 11월 1주차 회고 이번주에 드디어 머신러닝이 시작했다. 먼저 기존 프로그램 방식과 머신러닝의 프로그램 방식의 차이점에대해서 이해하고 실제 데이터 분석 실습까지 진행했다.🤖 AI, 머신러닝, 딥러닝의 차이AI (인공지능) : 딥러닝 & 머신러닝 기술로 사용자들에게 서비스를 제공하는 형태.Machine Learning (머신러닝) : 대부분 정형 데이터. 학습 데이터를 통해 규칙(함수)를 만들어내 결과를 예측하거나 분류하는 기술 분야.Deep Larning (딥러닝) : 인공신경망 알고리즘 기반으로 머신러닝의 한 분야. 비정형 데이터에서 뛰어난 성능을 나타냄.딥러닝 🆚 기존 프로그래밍 방식 vs 머신러닝 방식기존 프로그래밍 방식 : 데이터 / 프로그램 (함수, 알고리즘) -> 컴퓨터 -> 결과 (Output)머신러닝 프로..
모델 성능을 높이기 위한 데이터 전처리 ✨ 데이터 전처리는 데이터들을 분석하고 머신러닝 모델에 적합한 형태로 데이터셋을 변환하거나 조정하는 과정을 말한다. 데이터도 다양하고 좋아야하지만 동일한 데이터로 데이터 전처리를 어떻게 하냐에따라 모델 성능 결과가 크게 달라진다. 데이터 전처리는 결측치 처리 -> 이상치 처리 -> 인코딩 -> 스케일링 순서로 이루어진다.데이터 중에 결측치(Missing Value)와 이상치(Outlier)가 존재한다. 결측치는 NA, NaN, None, null로 표현되고, 이상치는 잘못된 값이나 극단치를 가지고 있는 값을 말한다.데이터에서 결측치와 이상치의 존재여부를 확인해서 해당 데이터 행를 삭제하거나 해당 값을 대체해주는 작업을 해줘야한다.1️⃣ 결측치 검증 + 대체df.isnull().sum()각 컬럼별 결측 개수..
[플레이데이터 SK네트웍스 Family AI 캠프 21기] 10월 4주차 회고 - 1차 단위프로젝트 이번주에는 SQL을 끝내고 웹크롤링을 배울 수 있었다.웹크롤링은 미리 SKN에서 제공해준 인프런 강의를 통해 미리 공부한 부분도 있고 iOS 개발을 할 때 웹앱의 경우, 웹 디버깅 경험이 있기때문에 어렵게 느껴지진 않았다.WebCrawling 관련 내용은 따로 정리했다. [Python] Web Crawling - 정적 웹 페이지 🆚 동적 웹 페이지📌 Crawling일단 정적 웹페이지와 동적 웹페이지가 존재하는데 그 차이를 알아야한다.정적 웹페이지는 움직이지 않고 현재 상태 그대로 html을 가져와 사용할 수 있는 사이트를 말한다.검색했을때itstudentstudy.tistory.com 🧩 The four Fs✅ FACTS (사실, 객관)무엇보다 이번주는 WebCrawling, SQL, Streaml..
[플레이데이터 SK네트웍스 Family AI 캠프 21기] 2주차 회고 시간이 벌써 일주일이 넘게 지났고,,,아무래도 샌드위치 추석이 있어서 휴가쓰는 수강생들이 많아 이번주는 살짝 어수선한 느낌이 있었다.중고 맥북을 구매해서 이번주부터는 맥북으로 수업을 들었다. 강사님께서 수업 중 맥북은 이걸 쓰면 될거다~ 라고 말씀 해주셔서 쉽게 따라갈 수 있었다.추가로,,, iOS 개인앱 배포도 있어서 새벽 2시에 잠들어서 새벽 6시 좀 넘어서 기상해서 학원을 나왔다.하루 지날수록 컨디션이 안좋아졌는데 다행히 10월 3일 금요일이 쉬는 날이라 버텼다!!! iOS 개인앱도 배포 완료!! ✌️이번주에 제일 맛있게 먹은 히나타 가츠동! [플레이데이터 SK네트웍스 Family AI 캠프 21기] 1주차 회고OT어떤 내용들로 6개월을 채우게 될까 걱정반 기대반을 하고 있었는데 OT날이 불쑥 다..
[플레이데이터 SK네트웍스 Family AI 캠프 21기] 1주차 회고 OT어떤 내용들로 6개월을 채우게 될까 걱정반 기대반을 하고 있었는데 OT날이 불쑥 다가왔다.한달, 두달이 아닌 6개월은 예상치 못한 일들이 발생할 수 있는 기간이라 휴가, 병가, 조퇴 등 사용하는 방법들을 알려주시고출석하는 법, 커리큘럼 설명 등을 듣게 되는 시간을 가졌고,마지막 시간엔 아이스브레이킹 시간으로 조를 짜서 서로 소개하고 6개월 과정에서 어떤것을 얻어가고 싶은지 나누는 시간을 가졌다.다 같이 레고를 만들면서 어떤 6개월을 지내고 싶은지 표현하는 시간도 가졌는데 저 포함 4분 중 3분이 러너가 계셔서 마라톤 트랙과 목적지를 향해 뛰어가는 형태로 만들었다.1주차 수업첫날엔 강사님 소개와 커리큘럼을 더 상세하게 알려주셨는데 추 후 어떤 서비스를 이용해서 어떤것들을 배우고 어떤 클라우드를 구독해서..