Data Lake์ Data Warehouse
Data Lake: ์๋ณธ(raw) ๋ฐ์ดํฐ๋ฅผ ์ ์ฅํ๋ ๊ณต๊ฐ. ํ์, ๊ตฌ์กฐ, ๊ฐ๊ณต ์ฌ๋ถ์ ๊ด๊ณ์์ด ๋ฐ์ดํฐ๋ฅผ ๊ทธ๋๋ก ๋ณด๊ด. โ ์: AWS S3, GCS, Azure Data Lake
Data Warehouse: ๊ฐ๊ณต/์ ์ ๋ ๋ฐ์ดํฐ๋ฅผ ๋ถ์ ๊ฐ๋ฅํ ๊ตฌ์กฐ๋ก ์ ์ฅํ๋ ๊ณต๊ฐ. ์คํค๋ง ๊ธฐ๋ฐ, ์ฟผ๋ฆฌ ๋ฐ ๋ฆฌํฌํ ์ ์ต์ ํ. โ ์: BigQuery, Redshift, Snowflake
ํญ๋ชฉ
Data Lake
Data Warehouse
์ ์ฅ ํํ
๋น์ ํ/๋ฐ์ ํ/์ ํ ๋ชจ๋
์ ํ (Schema-on-write)
๋ชฉ์
์ ์ฅ ๋ฐ ๋ฐฑ์ ์ค์ฌ
๋ถ์ ๋ฐ ์๊ฐํ ์ค์ฌ
ํ์ฅ์ฑ
๋งค์ฐ ๋์ (object storage ๊ธฐ๋ฐ)
์๋์ ์ผ๋ก ๋ฎ์
๋น์ฉ
์ ๋ ด
์๋์ ์ผ๋ก ๋น์
Last updated