클라우드 혁명 - 소셜이 개인의 화두라면 클라우드는 기업의 화두이다
찰스 밥콕 지음, 최윤희 옮김, 서정식 감수 / 한빛비즈 / 2011년 4월
평점 :
절판


“야후는 최근 클라우드 형식 데이터베이스인 하둡 내에서 실행하는 소프트웨어의 사례를 제시햇다. 하둡은 한 번에 서버가 최대 4천대 작동하고 서버를 총 2만 5천 대 내장한 클러스터들을 기반으로 운영된다. 하둡은 웹상의 개별 사이트에서 얻은 데이터들을 자세히 살펴본다. 하둡이 없다면 결과물을 분유하는 데 너무도 오랜 시간이 걸려서 그 작업이 완료되기도 전에 새로운 사이트들이 웹상에 나타나고 검색 결과물은 구식이 되고 말 것이다. 하둡의 도움을 받으면 웹상의 색인 작업이 72시간 안에 끝나므로 야후 웹 검색은 웹의 실제 상태에 비해 단 3일만 늦을 뿐이다.”

검색엔진의 일반적인 사업방식이다. 야후의 경우는 오히려 규모가 소소하다. 검색엔진 빙을 위해 마이크로소프가 2010년 9월 시카고에 연 데이터센터를 보자. “센터의 콘크리트 바닥에는 트럭 한대가 세워져 있었고 트럭 뒤에는 서버들로 가득 찬 컨테이너가 실려 있었다. 컨테이너에서 짐을 내리는 대신 전원을 연결하자 2,000여 대의 서버가 즉시 살아났다. 건물의 1층에는 이미 작동중인 컨테이너 11개와 추가 컨테이너 44개분의 여유 곤간이 있었다. 2층의 다소 전통적인 올림마루 형식의 데이터센터 내에서는 벌써부터 하드웨어가 윙윙거리고 있었다. 서버 30만대를 수용하게끔 설계된 이 시설은 마이크로소트프 서버 및 툴 사업부 사장 밥 무글리아의 표현으로 그가 아는 한 세계에서 가장 거대한 데이터센터라고 한다.’

그러나 전체 서버 수로는 구글을 따라갈 수 없다. 공개되지 않았지만 구글의 전체 서버수는 100만대를 넘을 것으로 업계에선 추정한다. 전 세계 12군데에 흩어진 구글의 데이터센터는 ‘정확하면서 빠른 검색’이란 구글의 경쟁력이 어디서 나오는가를 알 수 있게 한다.

구글의 검색이 정확한 것은 전 세계의 모든 웹 페이지를 자체 서버에 백업하기 때문이다. 다른 엔진들도 그렇게 하지만 구글이 더 정확한 것은 업데이트의 주기가 더 빠르기 때문이다. 그럴 수 있는 이유는 서버의 압도적인 물량에 있다. (그렇기 때문에 검색결과에 있어 네이버와 같은 업체는 게임이 되지 않는다. 수십억달러를 투자하기에는 국내시장은 협소하다. 네이버나 다음과 같은 업체는 비즈니스 모델로 볼 때 검색엔진이 아니라 포털로 분류하는 것이 타당하다)

규모 덕분에 정확한 동시에 빨라진다. 전 세계에서 가장 선호되는 엔진인 만큼 트래픽은 상상을 초월한다. 그 트래픽을 감당하면서 빠른 반응속도를 보이는 것 역시 물량 덕분이다.

인상적인 시스템이다. 그러나 “거대한 인터넷 데이터센터가 클라우드의 특징들 가운데 가장 눈에 띄는 특징이기는 하지만 클라우드를 규정하는 결정적 요소는 아니다. 아마도 클라우드의 가장 주목할만한 특징은” 외부인들이 거대한 데이터센터의 자원에 접근할 수 있다는 점이다. 저자는 아마존의 EC2 서비스가 클라우드 컴퓨팅을 대표하는 예로 본다. EC2와 같은 서비스가 기업에 어떤 의미가 있는지 소니의 사례를 보자.

“2009년 6월 25일 마이클 잭슨이 예기치 못한 죽음을 맞이하자 (소니뮤직의) 사이트는 음악구입을 원하는 팬과 그의 죽음을 애도하는 댓글을 남기기 원하는 사람들로 갑자기 넘쳐나 서버가 다운되었다.” 경영진은 당연하게도 이런 사태가 재발하지 않도록 조치를 취하려 했다. 그러나 그러려면 훨씬 더 많은 서버와 저장 공간, 더 넓은 대역폭을 구입해야 하는데 평상시에는 추가로 구축한 인프라는 놀고 있을 수 밖에 없다. 엄청난 낭비가 되는 것이다.

소니뮤직은 사이트를 재설계했다. “트래픽이 필요에 따라 음악을 구입하는 쇼핑객과 단지 정보를 찾는 방문자라는 두 줄기로 나뉘도록 했다. 거래 업무는 소니의 전용 서버에서 관리하고 정보를 찾는 방문자는” 사용량에 따라 요금을 EC2 서버로 돌려지게 했다.

“또 다시 유사한 수요가 발생하는 경우 트래픽이 증가하기 시작하는 즉시 10대의 서버를 추가로 작동시킬 수 있다. 이 같은 신축성은 클라우드 컴퓨팅을 대기업 데이터센터와 구별하는 요소 중 하나이다.”

소니의 사례처럼 클라우드 때문에 ”기업 데이터센터 운영비보다 훨씬 적은 비용으로 안정적인 영업활동을 하거나 일시적인 요구 때문에 컴퓨터 용량을 급히 늘ㄹ여야 하는 사태에 대비하기 위해 기업은 인터넷에 있는 대규모 서버 클러스터에 의지하는 방향으로 바뀔 것이다. 기업의 데이터센터를 최대 업무량 대신에 안정적인 업무량 수준에 맞추어 준비하게 될 것이다. 분기 말 회계나 연말 결산과 같이 드물게 업무 수요가 급증할 경우에는 그 수요를 외부 클라우드로 넘기면 된다.”

클라우드의 자원은 막강한 컴퓨팅 파워만이 아니다. 클라우드에 탑재된 소프트웨어도 이용할 수 있으며 내부 데이터센터를 유지하기 위한 관리인력도 저렴한 비용으로 이용할 수 있다. 그리고 그 비용은 갈수록 떨어진다.

이책의 초반 내용이다. 이책의 후반은 실제 클라우드를 구축할 때의 하드웨어, 소프트웨어적인 기술적인 측면과 시스템 논리를 살펴보며 클라우드를 업무에 어떻게 통합하는가를 자세히 다룬다.

이책의 구성은 클라우드에 대해 전혀 들어보지 못했다 하더라도 이책 한권이면 그 개념이 무엇이고 실제 어떻게 활용되고 있으며 현장에서 어떻게 적용할 수 있는가를 쉽게 알 수 있도록 깔끔하게 정리되어 있다.

그러나 짐작할 수 있듯이 이책의 내용은 테크니컬하다. 책의 내용은 독자적인 IT 부서가 있을 정도의 규모가 되는 기업을 대상으로 하며 그 부서에서 일하는 사람이 독자층으로 상정된다. 그렇기 때문에 책의 내용도 어느 정도 IT 분야의 지식, 기업에서 실제 운용되는 사정을 아는 사람을 대상으로 한다. 클라우드라는 용어 자체가 아직은 특수하기 때문이다.

그러나 IT 분야에 종사하지 않더라도 컴퓨터 분야의 잡지를 읽을 수 있는 정도이고 어느 정도 IT 분야의 트렌드를 이해하고 있다면 읽는데 부담이 없도록 쓰여져 있다. 

 

평점 4.5


댓글(0) 먼댓글(0) 좋아요(2)
좋아요
공유하기 북마크하기찜하기 thankstoThanksTo