AI 23

[플레이데이터 SK네트웍스 Family AI 캠프 21기] 11월 4주차 회고 - 2차 단위프로젝트

벌써 어느새,,, 머신러닝 모델 종류들과 딥러닝 역전파에대해서 배울 수 있었다. 특별히 이번주는 팀프로젝트도 진행해서 엄청 빨리 지나갔다.1차 프로젝트는 자동차 관련 자유 주제였는데 2차 프로젝트는 가입 고객 이탈 예측하는 모델을 개발하는것이었다. 가입 고객 이탈 예측 데이터를 찾기에는 아무래도 공개해주는 기업이 많이 없고 종류도 많이 없기때문에 어떤 데이터로 개발을 진행할지에대한 고민이 많았다.Kaggel 데이터셋 중 사용할 수 있는 데이터들 목록을 추렸고 Churn 예측 연구에서 가장 많이 쓰는 표준 데이터셋은 Telco Customer Churm 이었다. 다른 팀에서 무조건 겹칠 주제로 생각이 되어서 제외시켰다. Spotify 주제로 결정을 했으나 이것또한 다른 팀에서 이미 한다고 해서 다른 주제로..

AI/AI TECH 2025.12.01

[sklearn.metrics] 분류형 평가지표 자세히 분석하기

✔ confusion_matrix실제 값(y_true)과 예측 값(y_pred)을 비교하여 오차 행렬을 반환한다.ConfusionMatrixDisplay : 오차 행렬을 시각화 할 수 있는 모듈from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplaycm = confusion_matrix(y_test, y_pred)disp = ConfusionMatrixDisplay(confusion_matrix=cm)disp.plot(cmap="Blues")cm 오차행렬 : train set [[1167 45] [ 27 108]] 여러 모델을 학습 시켜보면서 오차행렬을 구하고, 오차행렬을 통해 평가지표를 만든다.각 모델마다 평가지표를 비교해..

AI/AI TECH 2025.11.23

[플레이데이터 SK네트웍스 Family AI 캠프 21기] 11월 1주차 회고

이번주에 드디어 머신러닝이 시작했다. 먼저 기존 프로그램 방식과 머신러닝의 프로그램 방식의 차이점에대해서 이해하고 실제 데이터 분석 실습까지 진행했다.🤖 AI, 머신러닝, 딥러닝의 차이AI (인공지능) : 딥러닝 & 머신러닝 기술로 사용자들에게 서비스를 제공하는 형태.Machine Learning (머신러닝) : 대부분 정형 데이터. 학습 데이터를 통해 규칙(함수)를 만들어내 결과를 예측하거나 분류하는 기술 분야.Deep Larning (딥러닝) : 인공신경망 알고리즘 기반으로 머신러닝의 한 분야. 비정형 데이터에서 뛰어난 성능을 나타냄.딥러닝 🆚 기존 프로그래밍 방식 vs 머신러닝 방식기존 프로그래밍 방식 : 데이터 / 프로그램 (함수, 알고리즘) -> 컴퓨터 -> 결과 (Output)머신러닝 프로..

AI/AI TECH 2025.11.10

모델 성능을 높이기 위한 데이터 전처리 ✨

데이터 전처리는 데이터들을 분석하고 머신러닝 모델에 적합한 형태로 데이터셋을 변환하거나 조정하는 과정을 말한다. 데이터도 다양하고 좋아야하지만 동일한 데이터로 데이터 전처리를 어떻게 하냐에따라 모델 성능 결과가 크게 달라진다. 데이터 전처리는 결측치 처리 -> 이상치 처리 -> 인코딩 -> 스케일링 순서로 이루어진다.데이터 중에 결측치(Missing Value)와 이상치(Outlier)가 존재한다. 결측치는 NA, NaN, None, null로 표현되고, 이상치는 잘못된 값이나 극단치를 가지고 있는 값을 말한다.데이터에서 결측치와 이상치의 존재여부를 확인해서 해당 데이터 행를 삭제하거나 해당 값을 대체해주는 작업을 해줘야한다.1️⃣ 결측치 검증 + 대체df.isnull().sum()각 컬럼별 결측 개수..

AI/AI TECH 2025.11.09

AI에서 화이트박스와 블랙박스🤖⁉️

AI(인공지능) 기술이 점점 더 복잡해지면서,"이 모델이 왜 이런 결과를 냈는가?"라는 질문이 중요해지고 있다고 한다.이 때 자주 등장하는 개념이 "화이트박스(White Box)"와 "블랙박스(Black Box)" 모델이다.🧩 화이트박스(White Box)란?화이트박스 모델은 내부의 작동 원리를 사람이 직접 이해할 수 있는 AI 모델로,입력부터 출력까지 어떻게 처리되어 어떤 결과로 이어지는지 투명하게 확인할 수 있는 모델을 말한다.예를들어, 선형회귀(Linear Regression), 의사결정트리(Decision Tree), 로지스틱 회귀(Logistic Regression) 모델들은 화이트 박스 모델에 속한다.선형회귀는 $ y=β_0​+β_1​x_1​+β_2​x_2​+⋯+β_n​x_n​ $ 입력변수..

AI 2025.11.04

[Pandas] DataFrame - iloc, loc 인덱서

Row (행)데이터프레임의 행 데이터를 구분하는 방법에는 index position(위치 기반) 과 index label(이름 기반) 존재한다.import pandas as pddf = pd.DataFrame({ 'name': ['Tom', 'Jane', 'Steve', 'Lucy'], 'age': [28, 31, 24, 27], 'city': ['Seoul', 'Busan', 'Incheon', 'Daegu'] }, index=['a', 'b', 'c', 'd']) # index label 지정, 없으면 default 0,1,2,,, 설정됨.dfdf의 index position은 [0,1,2,3]이고, 인덱스 이름은 ['a', 'b', 'c', 'd']이다.iloclocindex po..

AI/Python 2025.10.29

[논문] Attention Is All You Need - Transformer 모델

Attention Is All You NeedThe dominant sequence transduction models are based on complex recurrent or convolutional neural networks in an encoder-decoder configuration. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a newarxiv.org내 인생 첫 논문! Transformer 모델의 시작인 논문으로 너에게 필요한 모든 것은 Attention만이다. 제목으로 시작한다.1. Introduction기존의 RNN, LSTM, GRU 기..

AI 2025.10.28

[플레이데이터 SK네트웍스 Family AI 캠프 21기] 10월 4주차 회고 - 1차 단위프로젝트

이번주에는 SQL을 끝내고 웹크롤링을 배울 수 있었다.웹크롤링은 미리 SKN에서 제공해준 인프런 강의를 통해 미리 공부한 부분도 있고 iOS 개발을 할 때 웹앱의 경우, 웹 디버깅 경험이 있기때문에 어렵게 느껴지진 않았다.WebCrawling 관련 내용은 따로 정리했다. [Python] Web Crawling - 정적 웹 페이지 🆚 동적 웹 페이지📌 Crawling일단 정적 웹페이지와 동적 웹페이지가 존재하는데 그 차이를 알아야한다.정적 웹페이지는 움직이지 않고 현재 상태 그대로 html을 가져와 사용할 수 있는 사이트를 말한다.검색했을때itstudentstudy.tistory.com 🧩 The four Fs✅ FACTS (사실, 객관)무엇보다 이번주는 WebCrawling, SQL, Streaml..

AI/AI TECH 2025.10.26

[Python] Web Crawling - 정적 웹 페이지 🆚 동적 웹 페이지

📌 Crawling일단 정적 웹페이지와 동적 웹페이지가 존재하는데 그 차이를 알아야한다.정적 웹페이지는 움직이지 않고 현재 상태 그대로 html을 가져와 사용할 수 있는 사이트를 말한다.검색했을때 url 링크가 검색어가 q = "hello" 형태로 붙는다거나상세 페이지 url을 가지고 해당 상품의 상세 정보 내용을 모두 가져올 수 있는 페이지를 정적 웹페이지라고 한다.동적 웹페이지는 동일한 url인데 사용자의 컨트롤에 따라 화면의 결과, html이 달라지는 사이트를 말한다.무한 스크롤이 가능한 페이지나 tab 버튼을 눌렀는데 현재 페이지에서 하단 결과 값만 달라지거나 한다.📌 Crawling에선 뭐가 다른데??!!!정적 웹페이지는 requests 모듈을 사용하여 url의 html을 가져오는 방법을 배..

AI/Python 2025.10.26

의사결정나무(Decision Tree) + ID3 알고리즘

인공지능에 학습방법 중 지도학습이 있는데, 지도학습이란❓정답이 있는 데이터를 가지고 학습을 시켜, 새로운 데이터의 결과를 예측하는 방법이다.지도학습 종류 중 하나가 의사결정나무(Decision Tree)이다.📌 의사결정나무(Decision Tree)란❓아무것도 모르는 상태에서 정답이 있는 데이터를 제시해주고,제시해준 데이터에서 특징을 찾아 조건문을 제시해 트리를 만들고,테스트 데이터를 보여주면서 스스로 대답할 수 있는지 확인한다.음,, 뭔말이져?🤔예를들어 이미지가 주어지는데 바다 vs 산? 바다에서 해안도로 vs 해수욕장인지 알아내야한다고 가정하자.아무것도 모르는 AI가 어떻게 알 수 있나?제시해준 데이터들을 분석해 특징을 찾아낸다. 특징 차이가 가장 큰 값부터 분류하기 시작한다.세부 특징 차이로 트..

AI 2025.10.16