본문 바로가기
[스파르타코딩클럽]데이터분석 과정/TIL&WIL

[TIL] 24.02.28

by doo_ 2024. 2. 28.

[오늘 한 일]

1. 아티클 읽기 : Here

> 여러 정보들을 얻기 위해, 알아가기 위해서 아티클을 읽었었다. 그러다가 오픈서베이에서 제공하는 글을 읽으면서, 단순히 정보를 얻는 것보다도 더 나아가 설정한 지표는 뭐고, 어떤 도구, 어떤 방식으로 분석하고 시각화를 어떻게 했는지도 참고하며 읽어야 함을 깨달았다.

2. 코드카타 풀었던 문제들 되돌아보기

> SQL (41 ~ 50 / 77~90 / 127 ~ 130)

- 85번) DATEDIFF or DATE_SUB 활용해서 풀기 / Lag함수에는 첫 행의 null값 때문에 한계가 존재

- 3중 조인 : 순서대로 조인

- 셀프 조인 : 부서 관련 데이터를 조회할 때 주로 사용한다.

> Python (31 ~ 40)

- zip(list_a, list_b) : 각 값을 하나의 튜플 형태로 만들어준다.

+) 37번) zip(*x)는 x라는 리스트 or 튜플을 unpack 풀어준다는 뜻이다. **는 딕셔너리형태를 풀어준다.

- 33번) 약수에는 항상 짝이 있어서 x**0.5의 값이 int인 경우에는 약수의 개수가 홀수

- ''.join(list_a) : list_a의 각 값들 사이에 ' '안의 문자와 함께 합쳐주는 함수

- 유클리드 호제법 : a = b*q + r 일 때, a와 b의 최대공약수는 b와 r의 최대공약수와 같다.

- 최대공배수는 a와 b의 곱 / a와 b의 최대공약수

- 파이썬 정규표현식은 내일 공부하기..!

3. 머신러닝 강의 관련 정리 잘 못한 내용 github에 push하기 : here

- 다시금 대략적인 쓰임들에 대해서 복습했다. 모델링은 아직 이해하기 어려운 것 같아서 우선 이런 이런 모델링 방법이 있구나 정도만 파악하는 시간을 가졌다.

> 데이터 전처리

- 이상치 처리 : mean + or - 3std | boxplot - iqr계산을 통해 q1 - 1.5iqr과 q3 + 1.5iqr 사이값

- 널값 처리 : mean값 대치 또는 Simpleinputer (디폴트는 mean)

- 수치형 데이터 스케일링 : MinMaxScaler, StandardScaler

- 범주형 데이터 인코딩 : LabelEncoder, OneHotEncoder

> 데이터 모델링 : LogistcRegression, K-fold, GridSearchCV, KNeighborsClassifier, DecisionTreeClassifier, XGBClassifie

- 와인 가격 예측, 금융 대출 등급 예측 등 좀 더 다양한 데이터 샘플을 통해서 다뤄봐야겠다는 필요성을 많이 느낀다..

4. Tableau 개인 과제 8번 t-test 이해 및 풀어보기 : 참고문서

- 풀지 못했다

- 잘 이해하지 못한 LOD식은 내일 공식문서 참고해서 이해하기 

5. Tableau와 Pigma 활용 : 참고

> 피그마를 통해 프레임을 만들고 Tableau에서 작업하는 것으로 튜터님이 강의때 설명해주신 것처럼 대시보드 스케치를 Pigma를 통해 만들면 되구나를 이해했다.

tip) 작업하면서 적절한 프레임 간 간격을 대략 정해두면 작업할 때 편하다. (영상 속 강사님은 30정도)

> 영상보며 따라 만든 프레임 + Tableau에 넣어보기

- 프레임 크기 맞추는 게 어렵다..


> 유용한 피그마 플러그인

- Unsplash : 다양한 무료 이미지

- Iconfy : 다양한 이모티콘

- Blush : 일러스트 커스텀

- Brandfetch : 브랜드 로고 및 컬러

- Color Palettes : 컬러 조합

6. SQLD 자격증 공부 '2023 유선배 SQL개발' 내용 정리한 것 복습

'[스파르타코딩클럽]데이터분석 과정 > TIL&WIL' 카테고리의 다른 글

[TIL]24.03.01  (0) 2024.03.01
[TIL] 24.02.29  (1) 2024.02.29
[TIL] 24.02.27  (0) 2024.02.27
[TIL] 24.02.26  (0) 2024.02.27
[WIL] 10주차  (0) 2024.02.25