DB Session
실행 계획
쿼리 튜닝 경험
커버링 인덱스
Race condition
지점마다의 동기화 문제 관련
옆에 있을 때랑 region이 다를 때랑 다름
데이터베이스 하나가 망가졌을 때 복구 방법
1 : 단순 복제
2 : 4 군데 (주로 센트럴 존)에 복제, 카프카로 설정
대용량 데이터베이스 솔루션
읽어보기
DB 다운사이징
mainframe -> oracle
Join
옵티마이저를 이용한 조인의 3가지 종류
머지 조인
해시 조인
네스티드 조인
일반 조인
left
right
outer
Outer Join
Group By
Aggregation
MAX, SUM, MIN, AVG
논문 읽어보기
Aprox count distinct
SQL : COUNT하는 2가지 방법
COUNT (DISTINCT name)
GROUP BY, COUNT()
Materialized view
Difference Between View and Materialized View
슬롯 vs storage -> 스토리지가 더 쌈. 그래서 materized view 씀
SQL : Over() function
Nested Select statement
OLTP, OLAP
MuSQL vs Oracle vs Mongo vs PostgreSQL
왜 이 DB를 사용했냐 ?
mysql :
백만건 이하 성능 무난
올리기 쉬움
OLTP에 최적화 되어 있음
인덱스도 걸기 쉬움
개발 속도 빨라짐
트랜잭셔널 데이터베이스
oracle :
올리면 cpu 많이 먹음
mongo
쿼리가 부자연스러움. 레포팅에서 사용하기에는 어려움. 집게는 되는데 아쉬움.
postgre
통계 분석
UDF (user defined function)
Lock
h2 file 이라 몇 만건 안들어감.
InnoDB -> Row locking
Table Lock, File Rock -> 다이나모 너무 무겁고 튜닝이 어려움
Snowflake
뷰 & 프로시저 & 트리거
샤딩, 클러스터링, 파티셔닝
파티셔닝 : physically
시간대별로 넣음
장점
데이터가 많을 경우 유리
단점
데이터가 적을 경우 시간이 많이 걸림
하둡
서버를 여러 개 연결해서 담음
스팍
캐시 제공. 빨리 끌어옴
데이터 플로우
하둡에 데이터 빨리 넣는거
클러스터링 : logically
Timezone 문제
Last updated