DB Session

실행 계획

  • 쿼리 튜닝 경험

  • 커버링 인덱스

Race condition

  • 지점마다의 동기화 문제 관련

  • 옆에 있을 때랑 region이 다를 때랑 다름

  • 데이터베이스 하나가 망가졌을 때 복구 방법

    • 1 : 단순 복제

    • 2 : 4 군데 (주로 센트럴 존)에 복제, 카프카로 설정

대용량 데이터베이스 솔루션

  • 읽어보기

DB 다운사이징

  • mainframe -> oracle

Join

Outer Join

Group By

  • Aggregation

    • MAX, SUM, MIN, AVG

논문 읽어보기

Aprox count distinct

SQL : COUNT하는 2가지 방법

  • COUNT (DISTINCT name)

  • GROUP BY, COUNT()

Materialized view

  • Difference Between View and Materialized View

SQL : Over() function

Nested Select statement

OLTP, OLAP

MuSQL vs Oracle vs Mongo vs PostgreSQL

  • 왜 이 DB를 사용했냐 ?

  • mysql :

    • 백만건 이하 성능 무난

    • 올리기 쉬움

    • OLTP에 최적화 되어 있음

    • 인덱스도 걸기 쉬움

    • 개발 속도 빨라짐

    • 트랜잭셔널 데이터베이스

  • oracle :

    • 올리면 cpu 많이 먹음

  • mongo

    • 쿼리가 부자연스러움. 레포팅에서 사용하기에는 어려움. 집게는 되는데 아쉬움.

  • postgre

    • 통계 분석

UDF (user defined function)

Lock

  • h2 file 이라 몇 만건 안들어감.

  • InnoDB -> Row locking

  • Table Lock, File Rock -> 다이나모 너무 무겁고 튜닝이 어려움

Snowflake

뷰 & 프로시저 & 트리거

샤딩, 클러스터링, 파티셔닝

  • 파티셔닝 : physically

    • 시간대별로 넣음

    • 장점

      • 데이터가 많을 경우 유리

    • 단점

      • 데이터가 적을 경우 시간이 많이 걸림

  • 하둡

    • 서버를 여러 개 연결해서 담음

  • 스팍

    • 캐시 제공. 빨리 끌어옴

  • 데이터 플로우

    • 하둡에 데이터 빨리 넣는거

  • 클러스터링 : logically

카디널리티

Timezone 문제

Last updated