[오늘 한 일]
1. 아티클 읽기 : Here
> 여러 정보들을 얻기 위해, 알아가기 위해서 아티클을 읽었었다. 그러다가 오픈서베이에서 제공하는 글을 읽으면서, 단순히 정보를 얻는 것보다도 더 나아가 설정한 지표는 뭐고, 어떤 도구, 어떤 방식으로 분석하고 시각화를 어떻게 했는지도 참고하며 읽어야 함을 깨달았다.
2. 코드카타 풀었던 문제들 되돌아보기
> SQL (41 ~ 50 / 77~90 / 127 ~ 130)
- 85번) DATEDIFF or DATE_SUB 활용해서 풀기 / Lag함수에는 첫 행의 null값 때문에 한계가 존재
- 3중 조인 : 순서대로 조인
- 셀프 조인 : 부서 관련 데이터를 조회할 때 주로 사용한다.
> Python (31 ~ 40)
- zip(list_a, list_b) : 각 값을 하나의 튜플 형태로 만들어준다.
+) 37번) zip(*x)는 x라는 리스트 or 튜플을 unpack 풀어준다는 뜻이다. **는 딕셔너리형태를 풀어준다.
- 33번) 약수에는 항상 짝이 있어서 x**0.5의 값이 int인 경우에는 약수의 개수가 홀수
- ''.join(list_a) : list_a의 각 값들 사이에 ' '안의 문자와 함께 합쳐주는 함수
- 유클리드 호제법 : a = b*q + r 일 때, a와 b의 최대공약수는 b와 r의 최대공약수와 같다.
- 최대공배수는 a와 b의 곱 / a와 b의 최대공약수
- 파이썬 정규표현식은 내일 공부하기..!
3. 머신러닝 강의 관련 정리 잘 못한 내용 github에 push하기 : here
- 다시금 대략적인 쓰임들에 대해서 복습했다. 모델링은 아직 이해하기 어려운 것 같아서 우선 이런 이런 모델링 방법이 있구나 정도만 파악하는 시간을 가졌다.
> 데이터 전처리
- 이상치 처리 : mean + or - 3std | boxplot - iqr계산을 통해 q1 - 1.5iqr과 q3 + 1.5iqr 사이값
- 널값 처리 : mean값 대치 또는 Simpleinputer (디폴트는 mean)
- 수치형 데이터 스케일링 : MinMaxScaler, StandardScaler
- 범주형 데이터 인코딩 : LabelEncoder, OneHotEncoder
> 데이터 모델링 : LogistcRegression, K-fold, GridSearchCV, KNeighborsClassifier, DecisionTreeClassifier, XGBClassifie
- 와인 가격 예측, 금융 대출 등급 예측 등 좀 더 다양한 데이터 샘플을 통해서 다뤄봐야겠다는 필요성을 많이 느낀다..
4. Tableau 개인 과제 8번 t-test 이해 및 풀어보기 : 참고문서
- 풀지 못했다
- 잘 이해하지 못한 LOD식은 내일 공식문서 참고해서 이해하기
5. Tableau와 Pigma 활용 : 참고
> 피그마를 통해 프레임을 만들고 Tableau에서 작업하는 것으로 튜터님이 강의때 설명해주신 것처럼 대시보드 스케치를 Pigma를 통해 만들면 되구나를 이해했다.
tip) 작업하면서 적절한 프레임 간 간격을 대략 정해두면 작업할 때 편하다. (영상 속 강사님은 30정도)
> 영상보며 따라 만든 프레임 + Tableau에 넣어보기
- 프레임 크기 맞추는 게 어렵다..
![]() |
![]() |
![]() |
![]() |
> 유용한 피그마 플러그인
- Unsplash : 다양한 무료 이미지
- Iconfy : 다양한 이모티콘
- Blush : 일러스트 커스텀
- Brandfetch : 브랜드 로고 및 컬러
- Color Palettes : 컬러 조합
6. SQLD 자격증 공부 '2023 유선배 SQL개발' 내용 정리한 것 복습
'[스파르타코딩클럽]데이터분석 과정 > TIL&WIL' 카테고리의 다른 글
[TIL]24.03.01 (0) | 2024.03.01 |
---|---|
[TIL] 24.02.29 (1) | 2024.02.29 |
[TIL] 24.02.27 (0) | 2024.02.27 |
[TIL] 24.02.26 (0) | 2024.02.27 |
[WIL] 10주차 (0) | 2024.02.25 |