구글 클라우드(Google Cloud) AutoML Tables 사용 방법

구글 클라우드(Google Cloud)의 서비스인 AutoML Tables를 간단하게 사용하겠습니다. 머신러닝에 대한 전문 지식이나 코드에 대한 지식이 없어도 쉽게 머신러닝을 사용할 수 있는 서비스입니다. 나만의 데이터로 머신러닝 모델을 훈련시키고, 평가하고, 모델을 배포해서 예측해보겠습니다. 직접 quickstart 가이드대로 따라해보니 2만3천원 정도의 비용이 발생했습니다. (물론 회사가 돈냅니다. 그리고 구글파트너사라 전액 감면 받은듯하네요. 개꿀! 연구할 맛이 나네요.) 

AutoML Tables 사용 비용
  • 구글 클라우드 콘솔에서 인공지능(Artificial Intelligence) > Tables > Datasets를 선택합니다. 
구글 클라우드 콘솔에서 AutoML Tables 찾기
  • NEW DATASET을 클릭합니다. 
  • 본인의 데이터셋을 추가합니다. 빅쿼리에서 import 할 수도 있고, 클라우드 스토리지에서 csv 파일 형태로 가져올 수도 있고, 로컬에서 업로드 할 수도 있습니다. 

  • import가 완료되면 아래와 같이 보입니다. 타겟(Target) 컬럼을 설정합니다. 타켓은 라벨(label)이라고도 불리고 y 값이라고도 불립니다. 머신러닝 모델이 예측할 값입니다. 고객의 나이, 잔고, 교육, 주거, 직업 등등의 정보로 예금을 할 것인지 아닌지를 예측하도록 훈련시킬 것입니다. 

  • 타겟으로 지정되면 아래와 같이 보입니다.

  • Additional parameters 도 클릭해서 둘러봅니다. 
  • 각 feature(훈련에 사용되는 필드들)를 클릭해서 자세한 정보를 볼 수 있습니다.
  • 모델을 훈련시킵니다. 훈련시간은 1시간으로 했습니다. (2만3천원정도 비용이 발생합니다.) 



  • 훈련이 끝나면 EVALUATE 탭에서 모델 평가 지표들을 확인합니다.




  • 온라인 예측(online prediction)을 하기 위해서 모델을 배치(deploy)합니다.


  • AutoML Tables가 자동으로 데이터를 훈련용, 평가용, 테스트용으로 나눕니다. TEST & USE 탭에서 Generate feature importance 체크박스를 누릅니다. 예측을 하는데 어떤 featrue가 중요했는지 수치로 보여줍니다. Predict 버튼을 누릅니다. 우리의 인공지느님모델은 해당 51세인 사람의 데이터로 예측한 결과 99.9% 확률로 예금을 안 할 것이고, 0.1% 확률로 예금을 할 것이라고 말해줍니다.



Comments