안녕하세요! 방장님의 사전 승인을 받고 좋은 밋업 행사가 있어 공유해 드립니다. ![]()
벌써 아홉 번째를 맞이하는 dbt 밋업 소식을 전해드립니다! dbt와 데이터 엔지니어링 생태계에 관심 있으신 분들께 많은 도움이 될 것 같습니다.
자세한 내용과 신청은 아래 링크를 확인해 주세요.
https://www.meetup.com/seoul-dbt-meetup/events/315240680/?eventOrigin=group_upcoming_events
이번 모임의 메인 주제는 요즘 가장 뜨거운 dbt Fusion 입니다. dbt가
7년 만에 엔진을 Rust로 새로 쓰면서 무엇이 바뀌었는지 — "SQL을
렌더링만 하던 dbt"에서 "SQL을 이해하는 dbt"로의 변화, 그리고 "30x
빠르다"는 마케팅을 직접 벤치마크로 검증한 솔직한 결과까지 나눕니다.
발표만 듣고 끝나는 자리가 아닙니다. 현업에서 부딪힌 고민,
마이그레이션 경험, 그리고 “우리 팀은 언제 Fusion으로 가야 할까?”
같은 이야기를 편하게 주고받는 시간으로 채우려 합니다.
dbt Core → Fusion, 직접 돌려보고 정리했습니다 ![]()
dbt가 7년 만에 엔진을 Rust로 새로 썼습니다. 이름이 "Fusion"인 이유부터가 핵심이더군요 — SDF의 SQL 이해 엔진 + dbt의 몸통을 하나로 융합.
가장 큰 변화는 모델을 만드는 단계에 있었습니다:
dbt Core: SQL을 "문자열로 렌더링"만 하고 그냥 던짐 → 타입 오류는 돌려봐야 앎
dbt Fusion: 렌더 후 static analysis로 SQL을 진짜 이해 → warehouse 가기 전에 잡음
그래서 "30x 빠르다"는 마케팅이 궁금해서 노트북에서 직접 벤치를 돌렸습니다:
로컬 개발(parse/compile): ~2x
build: 거의 동률 (warehouse 실행이 지배적이니까)
모델 1.5만 개 콜드 parse: ~12x (core 40초 → fusion 4초)
→ 30x는 “대규모 + 실무 복잡도 + 콜드” 조합의 상한이지, 토이 프로젝트에서 나오는 숫자가 아니었습니다. 그래도 방향성은 정확히 재현됐고요.
곁들여 알게 된 것들:
속도의 뿌리는 Apache Arrow (요즘 Polars·DuckDB·DataFusion이 다 같은 흐름)
라이선스가 ELv2 → Apache 2.0으로 다시 열림 (커뮤니티 신뢰 회복)
VS Code 자동완성·실시간 에러가 사실 Fusion 엔진이 언어 서버로 도는 것
벤더 숫자를 그대로 믿기보다 직접 재현해보는 게 제일 빨랐습니다.
다음 dbt 밋업에서 이 내용 발표 예정입니다 ![]()