공부한 것 꼭꼭 씹어먹기

[ looker ] looker, lookML 이해하기 본문

데이터 분석

[ looker ] looker, lookML 이해하기

젤라솜 2022. 8. 30. 12:04
반응형

 

 

Looker is a tool that helps you explore, share, and visualize your company's data so that you can make better business decisions. 

 

 

 

2020년에 구글에 인수된 looker는 데이터를 가공하고 시각화하는 툴입니다.

구글 빅쿼리와 구글 데이터 스튜디오가 있는데 looker는 왜 필요한 걸까? 하는 의문점과 함께 looker를 공부해 보도록 하겠습니다.

 

 

현재 구글은 looker와 data studio를 통합하려고 베타 테스트 중이라고 합니다. 

아래 페이지에서 양식을 신청하면 테스트 해볼 수 있다고 하네요.

https://cloud.google.com/blog/products/data-analytics/looker-and-data-studio-integrate-for-best-of-both-worlds

 

Looker and Data Studio integrate for best of both worlds | Google Cloud Blog

Get the self-serve speed you need with the certainty of central BI by integrating Looker and Data Studio.

cloud.google.com

 

 

looker라는 툴을 이번에 처음 알게 된 제가 공식 문서와 유튜브 등을 통해 이해한 바로는,

 

- looker

   데이터 시각화(대시보드)와 가공을 하는 툴. lookML로 쓰여진 데이터 모델을 사용하는 front와 같습니다

 

- lookML(Looker Modeling Language)

   데이터베이스와 연결하여 looker에서 사용하기 좋게 구성해 놓는 모델링 언어. 즉 back단에서 쓰입니다.

 

front와 back이라는 표현이 맞는지 모르겠지만 lookML은 looker에서 쓰기 좋게 데이터를 모델링해서 준비해주는 언어 자체를 말하고, looker는 lookML로 만든 데이터 셋을 용도에 맞고 보기 좋게 표현하는 툴이라서 front, back으로 이해를 했습니다. (사실 looker와 lookML을 딱 떨어지게 분리해서 쓰는 것이 아니라 looker 안에 lookML이 포함된 것으로 보면 되겠습니다.)

 

 

 

이제 lookML의 구조를 훑어보겠습니다.

 

lookML의-구조
lookML의-구조

 

 

Field라고 불리는 dimension과 measure이 가장 작은 단위입니다.

dimension은 데이터베이스의 컬럼이라고 생각하면 되고, measure는 그 컬럼별 집계 방법을 의미합니다.

예를 들어 dimension을 'Color'로 선택하고, measure를 'Count Color'로 선택하면 각 색상별 개수가 표출됩니다.

 

이 fields, 즉 dimension과 measure는 view라는 파일에 적혀 있습니다.

view는 데이터 베이스의 테이블과 매칭되는 개념입니다.

 

explore는 view를 이용한 조합(combination)을 말합니다. SQL 쿼리문의 join을 쓰듯 각 테이블의 연결성을 나타냅니다. explore는 a set of pre-joined views for business-user analysis라고 합니다. 데이터베이스에서 join문이 들어간 쿼리를 돌렸을때 표출되는 그 테이블이 explore에 담겼다고 볼 수 있겠습니다.

 

model에는 DB 커넥션 정보와 모든 view들의 정보, explore 정보가 다 담겨있습니다. 

look이라는 것도 있는데 이것은 saved version of explore라고 합니다. explore에 filter, limit, sorting + 차트 정보까지 다 저장된 것을 look이라고 하는 것 같네요.

그리고 이 모든 파일들이 project에 담겨 있습니다. 하나의 프로젝트는 하나의 git repository와 매칭됩니다.

 

 

looker, lookML의 개략적인 이해는 이 정도면 될 것 같습니다!

 

 

 

 

 

 

 

 

 

 

 

반응형
Comments