알라딘

헤더배너
상품평점 help

분류

이름:김형준

최근작
2010년 12월 <클라우드 컴퓨팅 구현 기술>

김형준

J2EE 아키텍처와 도메인 모델 분야를 연구하면서 『J2EE 컴포넌트 만들기』, 『자바 파일럿 프로젝트 실무』 등을 집필하였으며 최근 4년 동안은 하둡이나 NoSQL 같은 분산 컴퓨팅, 클라우드 컴퓨팅 분야를 연구하며 실제 서비스에 적용하고 있다. 또한 구글의 데이터 관리 시스템인 Bigtable을 구현하고 있는 오픈 소스 프로젝트인 cloudata(www.cloudata.org) 프로젝트를 진행 중이다. SDS, NHN을 거쳐 지금은 클라우드 기반 검색 전문 업체인 그루터(gruter)에서 클라우드 컴퓨팅 컨설팅 업무를 수행하고 있다.  

대표작
모두보기
저자의 말

<클라우드 컴퓨팅 구현 기술> - 2010년 12월  더보기

구글은 수십만 대 이상의 리눅스 서버를 이용해 전 세계의 모든 웹 데이터를 저장, 분석한 후 검색 서비스를 제공한다. 수십만 대의 서버를 관리하고 운영하려면 엄청난 기술이 필요하다. 수십만 대라면 수원, 성남의 인구수와 비슷한 수치다. 구글은 어떤 기술을 이용해 이런 엄청난 규모의 서버와 데이터를 관리할 수 있을까? 2004년부터 차례대로 구글 내부의 플랫폼 구성을 논문으로 발표하면서 구글의 내부 시스템이 세상에 공개됐다. 대용량 분산 파일 시스템 GFS(Google File System), 분산 병렬 처리 플랫폼(MapReduce), 분산 구조 데이터 저장소(Bigtable), 분산 락 서비스(Chubby), 이기종 간 데이터 타입 처리 플랫폼(Protocol Buffer) 등을 차례대로 발표했다. 이 모든 기술은 분산 컴퓨팅 분야이며, 대규모 분산 환경을 가장 잘 이용하는 회사라고 할 수 있다. 이와 비슷한 시기에 아마존은 온라인 쇼핑 시스템을 운영하면서 구축한 플랫폼과 서비스를 운영하면서 남는 여유 자원을 활용해 EC2(Elastic Cloud Computing), S3(Simple Storage Service) 등을 포함한 AWS(Amazon Web Services)를 서비스하기 시작한다. 이렇게 분산 기술의 발전과 플랫폼 서비스의 발전은 '클라우드 컴퓨팅'이라는 새로운 개념으로 포장돼 발표됐으며, 최근에는 수많은 기업이 도입하고 서비스를 제공하기 위해 노력 중이다. 나도 2006년부터 분산 컴퓨팅 분야의 업무를 시작하면서 구글 플랫폼의 오픈소스 버전이라고 할 수 있는 하둡(http://hadoop.apache.org)을 사용하고, 하둡 기반으로 운영되는 데이터 관리 시스템인 클라우데이터(Cloudata, www.cloudata.org)를 개발했지만 그 당시에는 이런 기술을 분산 컴퓨팅 분야로만 알고 있었다. 2008년 클라우드 컴퓨팅이라는 용어가 나오면서 내가 사용했던 솔루션, 기술들이 클라우드 컴퓨팅을 구현하는 핵심 기술이 됐다. 클라우드 컴퓨팅이 확산되면서 수많은 컨퍼런스에서 발표가 이뤄지고 수많은 문서가 나왔지만 대부분 클라우드 컴퓨팅에 대한 정의와 활용만 설명한다. SaaS의 경우에도 기업에서 SaaS를 어떻게 도입할 것인가에 대한 주제가 많다. 실제 클라우드 컴퓨팅 플랫폼을 만들거나, SaaS 서비스를 만드는 방법에 대한 문서나 서적은 거의 없다. 클라우드 컴퓨팅이라는 용어는 업무에 따라 다양한 정의가 나올 수 있다. 인프라 측면에서 보면 서버 가상화 기술을 이용하는 형태로 나타난다. 미터링, 과금 등과 같은 운영 관리적인 부분도 있다. 프로비져닝 같은 시스템 관리 부분도 있다. 하지만 이런 것들은 부가적인 부분이다. 가장 중요한 것은 실제 업무를 수행하고 데이터를 분석하고 사용자 요청에 비즈니스 로직을 수행하는 애플리케이션에 있다. 애플리케이션이 클라우드적인 특성인 확장성, 유연성, 자기 치료 능력 등을 갖고 있을 때 클라우드 컴퓨팅의 진정한 효과가 나타난다. 이 책에서는 개발자들이 애플리케이션이나 클라우드 컴퓨팅을 구성하는 플랫폼을 개발할 때 어떻게 개발해야 클라우드 컴퓨팅의 속성을 가질 수 있는 시스템을 만들 수 있는지 설명한다. 클라우드 컴퓨팅 관련 기술은 하루가 다르게 발전 중이다. 따라서 이 글에서 제시하는 방법이나 솔루션이 최적의 방안이 될 수는 없다. 하지만 분산된 환경에서 유연한 확장성을 제공하는 기본 아키텍처는 견고하며, 과거에는 EJB, CBD, SOA 등의 이름으로 사용됐다. 이 책에서 제시하는 아키텍처도 과거의 기술과 크게 다르지 않다. 다만 구글에서 오픈한 기술을 최대 활용한 오픈소스를 이용함으로써 과거보다는 쉽고 견고한 시스템을 구축할 수 있게 됐다. 이 책은 클라우드 컴퓨팅 구현 기술이라기보다는 오픈소스를 이용해 확장성, 안정성있는 시스템을 구축하는 방법을 설명한다. 1장에서는 클라우드 컴퓨팅 플랫폼과 이를 기반으로 하는 SaaS 서비스의 아키텍처를 설명한다. SaaS와 클라우드 컴퓨팅은 별개로 생각할 수 있는 개념이지만 구현이나 개발 관점에서는 모두 유사한 기술 요소를 사용하며, 아키텍처 요구 사항도 비슷하다. 따라서 1장에서의 설명은 SaaS와 클라우드에 대한 설명이 혼재하는데, 이것은 개발/구현 관점에서는 매우 비슷하기 때문이다. 또한 SaaS 서비스를 만들려면 아키텍처와 프로그램 모델이 어떻게 돼야 하는지와 서비스에서 사용하는 인프라는 어떤 요소가 필요한지 설명한다. SaaS 서비스 구축에 필요한 이런 요소들은 클라우드 컴퓨팅 플랫폼을 구축하는 데도 그대로 적용될 수 있다. 3장에서 설명하는 쓰리프트(thrift)와 4장의 주키퍼(ZooKeeper), 5장의 하둡을 이용하면 분산 데이터 저장소를 만들 수 있다. 분산 데이터 저장소는 클라우드 플랫폼을 구성하는 주요 컴포넌트 중 하나지만 자체적으로는 데이터를 클라우드 환경에서 서비스해주는 데이터베이스 SaaS 서비스다. 책에서 설명하는 모든 솔루션은 오픈소스다. 오픈소스 중 문서화가 잘돼 있는 것도 있지만 그렇지 않은 경우도 많다. 그리고 오픈소스는 버전업되면서 많은 기능이 바뀌기도 한다. 문서가 없는 것은 소스와 예제를 보거나 다른 블로거의 글을 참고했으므로 잘못된 내용이 있을 수도 있다. 가급적 정확한 내용을 전달하기 위해 노력은 했지만 일부 잘못된 내용이 있을 수 있음을 미리 밝혀둔다. 그리고 버전업돼 기능이 바뀌어도 사용할 수 있게 개념과 동작 원리, 내부 구조 등도 최대한 설명하고자 노력했다. 1장은 클라우드 컴퓨팅의 기본 개념을 설명하는데, 이 부분을 이미 이해하고 있는 독자는 2장부터 시작해도 좋다. 이 책에서 다루지 않는 내용: 클라우드 컴퓨티 관련 기술 중 애플리케이션 개발 관련되지 않은 가상 머신, 네트워크 같은 인프라 기술은 이 책에서 다루지 않는다. 인터넷에서 인용한 글은 최대한 출처를 밝히고자 노력했다. 하지만 다양한 분야의 오픈 소스 솔루션을 소개하다보니 본문에 출처 없이 인용된 글이 있을 수 있다.

가나다별 l l l l l l l l l l l l l l 기타
국내문학상수상자
국내어린이문학상수상자
해외문학상수상자
해외어린이문학상수상자