유전체·단백질 구조 등 빅데이터 분석 시간 획기적 절감

   
유전체 분석용 슈퍼컴퓨터 ‘마하(MAHA)
과거 과학적인 연산만을 위한 전통적인 슈퍼컴퓨터가 이제는 특정 산업분야의 용도에 맞게 맞춤형으로 진화되고 있다.

ETRI(한국전자통신연구원, 원장 김흥남)는 유전체 분석을 위한 고성능·저전력 슈퍼컴퓨터인 ‘마하(MAHA : MAny-core Hpc system for bio-Application)’를 설계 및 구축했다고 8일 밝혔다.

‘마하’는 고대 산스크리트어로 영어로는 “great“, 우리말로는 “위대하다”, “뛰어나다”를 의미하는 단어로, 이번에 개발한 슈퍼컴퓨터는 어원 그대로 기존 슈퍼컴퓨터 대비 성능 및 전력 측면에서는 우수한 경쟁력을 확보했다.

ETRI는 미국의 슈퍼컴퓨팅 전문업체인 아프로 인터네셔날과 공동으로 저전력·고성능의 슈퍼컴퓨터를 설계 및 구축했다. 양 기관은 슈퍼컴퓨터의 핵심 경쟁력인 ‘고성능’을 확보하기 위해 32개의 컴퓨터에 인텔의 최신 고성능 중앙처리장치(CPU)인 ‘제온 E5 프로세서’와 엔비디아(NVIDIA)의 고성능 연산처리가속장치(GPGPU)를 장착하여, 약 33,000개의 코어(core)를 지원토록 했다.

이는 CPU가 처리할 작업 일부를 상대적으로 코어수가 많으면서 전력소모량이 적은 GPGPU가 대신 수행토록 함으로써, 성능은 높이되 시스템 규모와 소모전력 등을 최소화하는 효과를 얻기 위함이다. 이를 통해 전력 소모량은 기존 시스템 대비 50%를 줄이되, 이론적인 성능은 최대 53테라플롭스(TFLOPS)까지 구현했다. 이 성능 수치는 10년 전 세계 최고 슈퍼컴퓨터의 속도에 해당한다.

또한 ‘마하’는 자체개발 중에 있는 고속 SSD와 대용량 HDD로 구성된 69테라바이트(TB)의 하이브리드형 고속·대용량 스토리지를 지원함으로써, 무수히 많은 패턴과 조합의 수를 가지고 있는 유전체 및 단백질 구조 분석 등의 대규모 데이터 처리에 적합하도록 설계됐다.

ETRI는 이번에 구축된 ‘마하’ 슈퍼컴퓨터의 일부를 사용한 초기 시험도 성공적으로 수행했다. 일반 대장균에 대한 열 안정성 분석을 대상으로 시행된 시험 결과 CPU만을 사용할 경우 1개월 이상 소요되는 분석 시간을 GPGPU를 동시에 사용하는 ‘마하’를 이용하여 수 시간 내로 단축시켰다. 이는 CPU만을 사용하는 기존 분석 시스템 대비 최대 150배 향상된 성능이다.

이번 ‘마하’ 슈퍼컴퓨터의 구축으로 점차 수요가 폭증하고 있는 바이오, 3D 입체영상 등 신성장 산업분야에서의 빅데이터 정보를 고속으로 저장, 관리 및 분석 할 수 있는 발판을 마련했다. 이를 통해 유전체 분석 서비스 및 이에 기반한 개인 건강검진서비스 제공, 단백질 구조 분석을 통한 신약개발 등의 국내 바이오 산업 발전에 크게 기여할 것으로 전망된다.

최완 ETRI 클라우드컴퓨팅연구부장은 “이번 기술 확보로 그간 불모지나 다름없었던 슈퍼컴퓨터 분야에서 우리나라도 세계 강국과 어깨를 나란히 할 수 있는 계기가 되었다“면서 ”바이오 관련 국내 산업체 누구나가 고성능·저전력의 슈퍼컴퓨터를 쉽게 확보하고 활용할 수 있는 시대가 멀지 않았다“고 말했다.

한편, 이번 기술은 지식경제부가 2011년 3월부터 지원하고 있는 ‘유전체 분석용 슈퍼컴퓨팅 시스템 개발’ 사업의 연구결과물로, ETRI는 ‘마하’의 본격적인 상용화를 위한 후속 연구성과로 올해 말 ‘유전체 분석용 시스템 소프트웨어’를 선보일 계획이다.
 

저작권자 © 디트NEWS24 무단전재 및 재배포 금지