구글 프로페셔널 클라우드 아키텍트 자격증 대비 교육자료 (2편) [GOOGLE PROFESSIONAL CLOUD ARCHITECT]
구글 클라우드 자격증 중 하나인 Google Cloud Certified - Professional Cloud Architect 를 취득하였습니다. 공부 자료가 많지 않고 전부 영어로 되어 있어서 클라우드 아키텍트 자격증을 준비하시는 분들께 조금이라도 도움을 드리고자 준비해보았습니다.
관련 내용 :
- Mountkirk Games wants to set up a real-time analytics platform for their new game. The new platform must meet their technical requirements. Which combination of Google technologies will meet all of their requirements?
A. Kubernetes Engine, Cloud Pub/Sub, and Cloud SQL
B. Cloud Dataflow, Cloud Storage, Cloud Pub/Sub, and Big Query
C. Cloud SQL, Cloud Storage, Cloud Pub/Sub, and Cloud Dataflow
D. Cloud Pub/Sub, Compute Engine, Cloud Storage, and Cloud Dataproc
실시간 분석 플랫폼 만들려고 하는데 뭘 쓰까? 라는 문제입니다. 기술 요구사항을 보면 Process incoming data on the fly directly from the game servers, Process data that arrives late because of slow mobile networks. Process files that are regularly uploaded by users' mobile devices 라는 내용이 있습니다. 게임 서버에서 들어오는 데이터를 즉시 처리해야 하고, 모바일 네트워크 속도가 느려서 늦게 오는 데이터도 처리해야 한다. 사용자의 모바일 기기에서 업로드 되는 파일들을 처리해야 한다는 요구사항이 있습니다.
실시간 (realtime, real-time)이란 단어가 나오면 무조건 Pub/Sub, Dataflow 서비스 생각하면 됩니다. Cloud Pub/Sub은 Apache Kafka와 비슷합니다. 데이터를 수집(ingest)하는 서비스라고 이해하면 됩니다. Dataflow는 데이터 프로세스 서비스입니다. 스트림(실시간) 데이터와 일괄(batch) 데이터를 처리합니다. 보통 Pub/Sub과 Dataflow는 같이 많이 쓰입니다. 데이터를 실시간으로 수집하고, 데이터를 실시간으로 처리하고, 마지막으로 BigQuery에 넣어서 실시간으로 분석한다는 식으로 이해하면 됩니다.
게임 유저들의 데이터가 모바일 기기에서 Cloud Pub/Sub으로 실시간으로 들어가고 Dataflow에서 이 데이터들을 실시간으로 처리합니다. 네트워크 속도 때문에 늦게 온 데이터도 처리합니다. 이 데이터는 빅쿼리에 저장되고 분석에 사용됩니다. 사용자들의 모바일 기기에서 전송되는 파일들은 Cloud Storage에 저장하는 게 가장 좋습니다. Cloud Storage ---> Dataflow -> BigQuery 이런식으로도 많이 사용합니다.
그래서 이 모든 것을 만족하는 정답은 바로 B입니다.
잘 이해하셨다면 아래 문제를 쉽게 푸실 수 있습니다.
- MountKirk Games needs to build out their streaming data analytics pipeline to feed from their game backend application. What GCP services in which order will achieve this?
A. Cloud Storage - Cloud Dataflow - BigQuery
B. Cloud Dataproc - Cloud Storage - BigQuery
C. Cloud Pub/Sub - Cloud Dataflow - Cloud Bigtable
D. Cloud Pub/Sub - Cloud Dataflow - BigQuery
스트리밍 데이터(실시간 데이터) 분석 파이프라인을 만드려고 하는데 GCP 서비스 어떤 걸 쓸까? 라는 문제이고 정답은 당연히 D입니다. 참 쉽쥬?
IoT (사물인터넷) 장치들의 데이터를 수집할 때도 Pub/Sub -->Dataflow -->BigQuery 아키텍쳐를 많이 활용합니다.
Comments
Post a Comment