목록데이터 (4)
공부한 것 꼭꼭 씹어먹기
파이썬 판다스로 csv파일 읽기 최근에 갑자기 파이썬을 쓸 일이 생겼습니다. pandas라는 파이썬 라이브러리도 함께 말이죠. Python용 pandas 라이브러리는 데이터 형식 지정, 탐색적 데이터 분석 수행, 모델링 및 기계 학습에 사용할 데이터 준비에 매우 유용합니다. 그래서 빅데이터 분석 작업에 가장 많이 쓰이는 라이브러리가 pandas입니다. 빅데이터의 소스 데이터로 많이 쓰이는 csv파일은 가장 일반적인 파일 형식 중 하나로 엑셀 스프레드 시트와 같은데요. 쉼표로 구분된 값을 저장하는 csv파일은 데이터 유형과 같은 것에 대해 걱정할 필요 없이 기본적으로 .csv 파일로 작업할 수 있도록 합니다. Python에서 이러한 csv 파일을 사용하기 위해 pandas 라이브러리는 pd.read_csv..
looker 인터페이스 훑어보기 Explore를 클릭하면 3가지의 샘플 데이터가 나오는데요, E-Commerce Training, FAA, Looker Basics는 model이고 각각의 model 이하에 있는 Events, Order items... 등은 각 모델의 explore 입니다. 가장 심플해 보이는 FRUIT BASKET을 선택해 보겠습니다. Fruit Basket이라는 explore에는 Color, Fruit Type, Price 등의 dimension과 Average Price, Count, Total Price 등의 measures가 있습니다. dimension 중 Fruit Type과 Price를 선택하고 measure는 Total Price를 선택하고 Run 버튼을 클릭하면 아래 화면..
Cloud Skills Boost에서 연습하기 이제 looker를 실제로 좀 써봐야 하는데요, looker 홈페이지에 가입해서 demo 신청하고 lesson 듣고 해도 되지만 좀 더 가볍게 체험할 수 있는 방법이 있습니다. 구글 클라우드에서 제공하는 Google Cloud Skills Boost (a.k.a Qwiklabs)홈페이지에 들어갑니다. https://www.cloudskillsboost.google/ Google Cloud Skills Boost Qwiklabs에서는 개발자와 IT 전문가가 클라우드 플랫폼 및 Firebase, Kubernetes와 같은 소프트웨어를 학습하는 데 도움이 되는 실제 Google Cloud 환경을 제공합니다. www.cloudskillsboost.google 우선 ..
Looker is a tool that helps you explore, share, and visualize your company's data so that you can make better business decisions. 2020년에 구글에 인수된 looker는 데이터를 가공하고 시각화하는 툴입니다. 구글 빅쿼리와 구글 데이터 스튜디오가 있는데 looker는 왜 필요한 걸까? 하는 의문점과 함께 looker를 공부해 보도록 하겠습니다. 현재 구글은 looker와 data studio를 통합하려고 베타 테스트 중이라고 합니다. 아래 페이지에서 양식을 신청하면 테스트 해볼 수 있다고 하네요. https://cloud.google.com/blog/products/data-analytics/looke..