[스파르타코딩클럽]데이터분석 과정163 [TIL] 24.02.23 1. 아티클 읽기 : here 2. SQLD 공부 (3) : here 3. Github 정리하기 > Python 기초 및 전처리 시각화 부분 4. 기초학습반(A반)에서 어떤 내용들을 배웠는지 살펴보기 > 문제를 풀 때, 1) 내장 함수를 활용하기 2) 직접 구현하기 3) 다른 모듈(Pandas 등)을 활용하기가 있다. - 아무래도 1, 2번이 가장 중요하다고 느껴서 최대한 1, 2번만 사용해서 풀었고 풀이도 관련 풀이만 주로 봤었다. - 하지만 3번을 잘 활용하는 것 또한 효율적이기에 최대한 1, 2번 중심으로 풀고 3번은 다른 사람들의 해답에서 참고사항으로 봐야겠다고 느꼈다. > 오늘은 다른 학습 정리로 내일부터 하루 알고리즘 코드카타 1문제 이상 풀기..! 5. 코드카타 (이전에 푼 문제들 다시 보며.. 2024. 2. 23. SQLD 공부 (4) SQL 활용 1. 서브쿼리 > 하나의 쿼리 안에 존재하는 또 다른 쿼리를 말한다. 위치에 따라 다음과 같이 나뉜다. 1) 스칼라 서브쿼리(Scalar Subquery) > 주로 SELECT 절에서 사용하지만, 칼럼이 올 수 있는 대부분 위치(UPDATE문의 SET절, ORDER BY절 등)에 사용할 수 있다. 값은 반드시 하나의 값만 반환해야 한다. 2) 인라인 뷰(Inline View) > FROM 절에서 사용 3) 중첩 서브쿼리 > WHERE절과 HAVING절에서 사용 > 메인쿼리와 관계 여부에 따라 비연관 / 연관 서브쿼리로 나뉜다. 2. 뷰(VIEW) > 가상 테이블로 실제 데이터를 저장하지는 않고 해당 데이터를 조회해오는 것이다. CREATE VIEW VIEW_NAME AS ( SELECT ~ FROM ~ .. 2024. 2. 23. SQLD 공부 (3) SQL 기본 1. 관계형 데이터베이스 개요 1) 데이터베이스 > 데이터 : > 데이터 베이스 2) 관계형 데이터베이스 (RDB : Relational Database) > 관계형 데이터 모델에 기초를 둔 데이터베이스로 데이터를 2차원 테이블 형태로 표현한다. > RDB를 관리하는 시스템으로 RDBMS가 있다. (ex.Oracle, MySQL 등) 3) TABLE 구성 > 로우(인스턴스, 행), 칼럼(속성, 열)로 표현 4) SQL(Structured Query Language) > 데이터를 다루기 위해 사용하는 언어다. > 기본 형태 SELECT COLUMN1, COLUMN2 FROM TABLE1 WHERE COLUMN1 = 'Condition' 2. SELECT문 > 저장된 데이터를 조회할 때 사용하는 명령어 1).. 2024. 2. 22. [TIL] 24.02.21 [오늘 한 일] 1. 아티클 읽기 : Here 2. 도서 - 통계 101 & 데이터 분석 (11장_베이즈 통계) 더보기 [베이즈 통계의 사고방식] > 빈도주의(t분포 등)는 모집단에서 표본을 추출할 때의 불확실성을 다루며, 빈도주의에서의 확률은 무한히 반복 실행한 결과로서의 객관적인 빈도를 나타낸다. > 반면, 베이즈통계는 확률을 얼마나 확신하는지로 해석하는 원리다. 분석자가 그 파라미터 θ를 어느 정도 알고 있는지를 확률 분포로 나타내는 것이다. 통계 모형의 파라미터 θ를 확률변수로 취급하여, 그 확률분포를 생각한다. - 베이즈 통계의 추정은 데이터를 알기 전에 갖고 있던 파라미터 θ에 관한 정보가 데이터를 알면서 갱신되어, 어떤 θ의 값이 얼마나 나타나기 쉬운지를 알아가는 것이다. 3. SQLD 자격.. 2024. 2. 21. [데이터 시각화] Tableau 기초 강의 공부 (1) 1. 비즈니스 인텔리전스( BI : Business Intelligence)란? 더보기 [비즈니스 인텔리전스( BI : Business Intelligence)란?] - 조직이 좀 더 데이터 기반의 의사 결정을 빠르게 할 수 있도록 서포트하는 비즈니스 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구를 말한다. > 다양한 BI툴 - Google Looker Studio / - Microsoft PowerBI / Redash / Apache Superset / MicroStrategy(MSTR) > 프로덕트 대시보드 툴 - Google Analytics 4 / Amplitude / Mixpanel > 데이터 분석가에게 실무 요청 업무 예시 - 대시보드 지표 변화 체크, 대시보드 구축 프로젝트 - 데이터 .. 2024. 2. 21. SQLD 공부 (2) 데이터 모델과 SQL 1. 정규화(Normalization) > 데이터 정합성(정확성과 일관성)을 위해 엔터티를 작은 단위로 분리하는 과정이다. - 단, 정규화를 했다고 조회성능이 향상되는 건 아니다. 처리조건에 따라 저하되는 경우가 있다. 1) 제 1정규형 > 모든 속성은 반드시 하나의 값만 가져야 한다. 유사한 속성이 반복되는 경우도 해당한다. 2) 제 2정규형 > 엔터티의 모든 일반속성은 반드시 모든 주식별자(딘일 or 복합)에 종속되어야 한다. 3) 제 3정규형 > 주식별자가 아닌 모든 속성 간에는 서로 종속될 수 없다. 4) 주의사항 > 적절한 정규화는 성능상 이롭지만, 지나친 정규화는 오히려 성능 저하를 일으킬 수 있다. ex. 여러 번의 JOIN을 해야 하는 경우에 오히려 JOIN한 상태로 두는 것이 좋다. ex.. 2024. 2. 21. 이전 1 2 3 4 5 6 7 ··· 28 다음