구글에서 병렬처리 모델 공개

Posted at 2008/01/17 22:36 // in Research // by Daniel
연구실에서 국가지정 과제의 일환으로 기술정보를 제공하고 있습니다. 교수님이 찾으셔서 올리시는 자료들은 쓸만한 게 많은 것 같습니다.
 
Google Fellows Reveal Parallel Processing Model


아마 한글 번역판 뉴스가 나올 법한데..
"MapReduce: Simplified Data Processing on Large Clusters," 라는 논문을 발표했답니다.

구글은 직접 만들거나 싸게 살 수 있는 PC급의 시스템들을 엄청나게 클러스터링해서 자기들 시스템으로 이용하는 것으로 유명합니다. 예를 들어 10만대를 쓴다면 중간에 유지보수를 위해 꺼지는 컴퓨터도 있을 것이고 고장나거나 네트웍 이상으로 잠시 접근이 불가능해지는 노드들이 있을 겁니다.
이런 환경에서 안정적인 서비스를 어떻게 지원하는지가 구글의 노하우이고 또한 거기에 관련된 논문도 많이 발표하는 걸로 알고있습니다. 대학에 그와 관련된 이슈로 지원도 많이 하구요.

The method, known as MapReduce, lets users break computations into a map and a reduce function, which the runtime system automatically parallelizes across large clusters while navigating machine failures and honing the efficiency of network and disk use in the process.

이 MapReduce 라는 방법을 통해 사용자가 처리할 작업들을 실행중에 병렬화하고 클러스터들에 나눠준다고 합니다. 기계 고장이나 네트웍 사용량, 디스크 사용량을 "검색"하면서 적절하게 말이죠.
Fault tolerance와 병렬 처리, 데이터 분산, 로드 밸런싱등이 라이브러리를 통해 추상화 됩니다. 이런걸 라이브러리만 쓰면 해결되게 했다니 대단합니다.

From : ACM TechNews; Friday, January 11, 2008
크리에이티브 커먼즈 라이센스
Creative Commons License

이 글에는 트랙백을 보낼 수 없습니다