[글로벌 IT기업은 변신중]빅데이터는 '우리가 1등'


빅데이터 1위 꿈꾸는 강자들의 노림수?

[김관용 기자 김수연 기자 김국배 기자] "데이터 창고(Data Warehouse)에서 이를 캐내는(Data Mining) 것을 넘어 깊은 바다에서 석유를 발굴하듯 인터넷에서 빅데이터를 찾아 분석, 활용, 예측하는 것이 기업의 경쟁력이 됐다."

빅데이터 시대를 맞이하면서 IT 기업들의 관심은 온통 빅데이터로 집중돼 있다.글로벌 IT기업들 역시 방대한 정형데이터와 비정형데이터를 아우르는 각종 분석기술과 솔루션을 선보이며 선두를 향한 질주를 시작한 상태다.

IBM, 오라클, EMC, 테라데이타, SAP, SAS는 이미 각자의 분야에서 '1등'이라는 수식어를 가지고 있으면서 빅데이터 시장에서 '선두'를 지향한다는 공통점을 지니고 있다. 이들은 그동안 인수 합병한 기업들의 솔루션을 고도화시키며 빅데이터 시장에서 저마다 1등을 외친다.

각자 지닌 '1등'이라는 수식어 만으로도 충분히 먹거리를 확보한 그들이 빅데이터 시장을 탐내는 이유는 과연 무엇이고 '그들의 리그'에서 진정한 승자의 자리는 과연 누가 차지할 것인가. 빅데이터 시장은 이미 치열한 전쟁터가 됐다.

◆'DB 하면 오라클, 빅데이터도 오라클'

원래 데이터베이스(DB) 기업으로 출발한 오라클은 빅데이터 분야에서 선도적 위치에 있다고 자신한다. DB 분야에 이어 빅데이터 영역에서도 고객에게 경쟁사 대비 차별화되는 가치를 전달한다는 포부다.

실제로 오라클의 빅데이터 포트폴리오는 오라클이 명실상부한 종합 빅데이터 솔루션 기업임을 입증한다.

오라클은 중요 데이터의 관리를 위한 오라클 DB와 DB장비인 엑사데이터, 빅데이터 관리를 위한 빅데이터 어플라이언스, 연관분석을 위한 빅데이터 커넥터 및 어드밴스드 애널리틱스, 실시간 분석을 위한 엑사리틱스의 제품군을 보유하고 있다.

이같은 오라클 빅데이터 솔루션은 오라클이 썬마이크로시스템즈 인수 이후 자사의 소프트웨어와 썬의 하드웨어를 결합해 최적화시킨 '엔지니어드 시스템'의 근간이 되는 제품들이다.

오라클은 올해 초 기존 오라클 DB아키텍처와 빅데이터 솔루션 간에 유연한 연동을 지원하는 기술을 발표하며 전 세계 DB시장 1위라는 위치를 활용해 빅데이터 시장을 본격 공략하고 있다.

오라클은 ▲빅데이터 전용 머신인 오라클 빅데이터 어플라이언스와 온라인 트랜잭션 처리(OLTP)와 데이터웨어하우스(DW) 기능을 제공하는 엑사데이터 ▲기존 DB 데이터와 빅데이터의 유연한 연결을 지원하는 '빅데이터 커넥터'를 제공한다.

또한 ▲어드밴스드 애널리틱스를 통해 DB 내에서의 종합적인 분석을 지원하며, ▲엑사리틱스를 통해서는 메모리 기반의 실시간 분석을 제공한다.

특히 오라클의 빅데이터 솔루션은 빅데이터 관련 기술을 종합한 성격을 띄고 있다. 오라클의 제품군은 빅데이터 솔루션에서 각광받는 하둡과 R, NoSQL 데이터베이스, 관계형 데이터베이스관리시스템(RDBMS)을 패키지 형태로 한번에 제공한다.

하둡은 비정형 데이터 처리 기술, 'R'은 통계적으로 의미있는 분석 정보를 찾아내는 기술, NoSQL은 비정형 및 비관계형 데이터를 위한 대용량 데이터 저장소를 의미한다.

◆IBM "가장 포괄적인 빅데이터 솔루션 벤더"

DB2를 통해 DB시장에서 오라클과 격돌하고 있는 IBM 또한 종합 빅데이터 솔루션을 제공하며 '가장 포괄적인 솔루션을 제공하는 벤더'라고 강조하고 있다.

IBM은 지난 5년 동안 빅데이터 분야에 140억 달러 이상을 투자해 비즈니스 분석 관련 업체 24개를 인수하면서 빅데이터 시장 선점을 준비해 왔다.

IBM의 빅데이터 전략은 ▲IBM 인포스피어 스트림을 통한 빅데이터 포착과 분석 ▲데이터웨어하우스(DW) 솔루션을 이용한 빅데이터 관리 ▲빅데이터 전용 하드웨어 ▲비즈니스 분석과 최적화 컨설팅 등을 포함한 통합 솔루션으로 요약된다.

IBM은 빅데이터 솔루션을 비즈니스 분석 및 최적화(BAO), 분석 소프트웨어, 빅데이터 플랫폼, 스토리지 부문으로 세분화하고 있다.

우선 각 산업별 경험과 전 세계 8천여명 이상의 BAO 관련 컨설턴트의 역량을 기반으로 비즈니스 통찰력을 끌어내기 위한 전략 컨설팅을 제공한다. 또한 빅데이터 소프트웨어를 활용해 기업과 기업내 프로세스가 최상의 성과를 내기에 최적화되도록 지원한다.

이와함께 'SPSS 모델러', 'SPSS 스터티스틱스', '텍스트 마이닝', '코그노스 컨슈머 인사이트' 등의 비즈니스 분석 소프트웨어를 통해 쉬운 활용 방식으로 비즈니스 분석의 활용 범위를 극대화하도록 돕는다. 이 분석 소프트웨어들은 소셜 미디어 데이터 수집과 측정, 분석을 통한 통찰력을 제공하는 역할을 한다.

여기에 IBM은 ▲인포스피어 스트림즈와 ▲인스스피어 인사이츠 ▲IBM 스마트 어날리틱스 시스템(ISAS) ▲IBM 네티자 등의 빅데이터 플랫폼을 제공한다.

인포스피어 빅인사이츠는 방대한 양의 정형 및 비정형 데이터를 관리하고 분석하기 위한 솔루션으로, 오픈 소스인 아파치 하둡(Apache Hadoop) 소프트웨어 프레임워크 상에 구축돼 있다. 인포스피어 스트림즈는 밀리초 이하의 빠른 응답 시간으로 대량의 스트리밍 데이터를 지속적으로 분석할 수 있는 솔루션이다.

ISAS의 경우 고도의 분석 작업에 적합하도록 소프트웨어와 시스템, 스토리지의 각 부문의 균형을 최적화해 구성한 단일 시스템으로, 포괄적이고 유연한 데이터 분석을 자랑한다. 네티자는 DB, 서버, 스토리지, 분석 소프트웨어 등을 통합한 DW로, 페타바이트 단위의 데이터도 빠르게 처리하고 고급분석 기능을 함께 제공한다.

이와 함께 IBM은 빅데이터 전용 스토리지로 SoNAS, XIV, DCS3700, 스토와이즈 V7K 등의 제품을 통해 비즈니스 목표 달성에 맞춤화 된 스토리지 솔루션을 공급하고 있다.

◆스토리지 '강자' EMC, 빅데이터 분야서도 1위 야심

스토리지 전문기업에서 종합 IT인프라 기업으로 거듭나고 있는 EMC가 최근 가장 강조하는 분야 역시 빅데이터다.

전 세계 1위 스토리지 업체인 EMC는 그동안 인수한 그린플럼, 아이실론 등 빅데이터 관련 솔루션 업체의 기술을 활용해 빅데이터 환경에 대응하는 통합 솔루션을 제공하고 있다.

EMC는 지난 2010년 22억5천만 달러에 스케일아웃 방식 NAS 스토리지 업체인 아이실론을 인수한 이후, 빅데이터 전용 제품군인 EMC 아이실론 스케일아웃 NAS와 하드웨어 및 소프트웨어 플랫폼을 출시했다.

EMC 아이실론 스케일아웃 NAS는 하둡분산파일시스템(HDFS: Hadoop Distributed File System)과 통합된 엔터프라이즈 NAS 플랫폼이다. 이 스토리지 시스템은 하둡 지원이 가능한 빅데이터 분석 솔루션인 EMC 그린플럼 HD와 결합돼 기존 오픈소스 기반의 하둡 대비, 성능과 효율성이 뛰어나고 유연한 데이터 스토리지와 분석 지원 환경을 구현할 수 있다.

특히 지난해 5월 EMC는 아이실론 스케일아웃 NAS 하드웨어와 소프트웨어 플랫폼 신제품을 출시했다.

아이실론의 새로운 하드웨어 플랫폼을 통해 SAS(Serial Attached SCSI) + SSD, 혹은 SATA(Serial ATA) 드라이브 + SSD와 같이 드라이브 구성을 각자의 환경에 맞춰 선택할 수 있도록 제공된다. 뿐만 아니라 각각의 드라이브를 하나의 거대한 캐시(cache)와 차세대 쿼드 코어 프로세스와 결합시켜 최고 성능을 구현한다.

또한 소프트웨어 제품인 'OneFS'와 'SyncIQ'는 빅데이터를 간편하게 관리할 수 있도록 지원하며, 아이실론 스케일아웃 NAS 하드웨어의 성능을 극대화한다.

EMC는 더불어 그린플럼의 기술을 활용한 통합 빅데이터 분석 플랫폼인 '그린플럼 데이타 컴퓨팅 어플라이언스(DCA)'를 출시했다.

그린플럼 DCA는 새로운 아키텍처 기반의 DW로, 기업들이 무공유(Shared-nothing) MPP 기반 관계형 DB와 엔터프라이즈급의 아파치 하둡을 결합시킬 수 있도록 했다. 이를 통해 정형 데이터와 비정형 데이터의 상호 연계 처리가 가능해졌으며 정형 및 비정형 데이터를 단일의 통합 플랫폼에서 필요에 따라 확장할 수 있게 됐다.

그린플럼 DCA의 새로운 모듈 방식인 데이터 상호 연계 처리는 각 시스템들이 최고의 성능을 낼 수 있도록 하기 때문에 EMC 빅데이터 솔루션 중 매우 중요하고 강력한 기술이다.

이밖에 EMC는 빅데이터를 활용할 데이터 과학자 양성에 공을 들이고 있다. 이에 따라 현재 데이터 과학자 전문조직인 '데이터 애널리틱스 랩'을 운영중이며, 데이터 과학자 양성, 자격증 프로그램 도입 등의 노력을 기울이고 있다.

◆테라데이타 "DW 기반 빅데이터 솔루션은 우리가 1등"

DW 시장에서 오라클과 팽팽한 신경전을 벌이고 있는 테라데이타도 지난 해 4월 빅데이터 솔루션 기업인 애스터 데이터(Aster Data)를 인수합병하면서 빅데이터 전용 DW시장에서 확고한 리더십을 갖고 있다고 강조한다.

테라데이타는 30여년 동안 DW 시장의 강자로 군림했던 '업력'을 바탕으로 애스터 데이터의 솔루션을 활용해 빅데이터 시장을 공략하고 있다.

DW는 기업에서 생성되는 데이터를 분석해 기업의 의사결정에 도움을 주는 솔루션으로, 분산된 데이터들로부터 필요한 것들을 추출하고 변환·통합해 대용량 저장소에 분석하기 좋은 형태로 저장하는 역할을 한다.

테라데이타는 이같은 DW를 빅데이터 솔루션과 결합해 빅데이터 전용 어플라이언스를 만들었다.

테라데이타가 발표한 빅데이터 전용 '애스터 맵 리듀스 어플라이언스' 제품은 빅데이터 분석 소프트웨어인 테라데이타 애스터와 테라데이타 DW를 결합한 것이다. 테라데이타는 여기에 DW와 애스터 데이터 시스템 간의 고속 데이터 전송을 지원하는 '테라데이타-애스터 어댑터'를 제공한다.

DW를 활용한 테라데이타의 빅데이터 솔루션은 비정형데이터를 정형화시켜 DW에서 분석하는 방식으로, 테라데이타는 이미 링크드인, 엠징가, 마이스페이스, 반스앤노블 등 글로벌 고객사를 확보하며 빅데이터 시장을 선도해 나가고 있다.

◆SAP, 인메모리 어플라이언스 '하나'로 DB시장 1위 도전

기업용 애플리케이션을 기반으로 성장해 온 SAP는 빅데이터 시대, 인메모리 어플라이언스 '하나(HANA)'로 1위 DB업체가 되겠다는 야심찬 포부를 갖고 사업을 전개해 나가고 있다.

목표 달성을 위한 전략 무기인 HANA는 메인 메모리 기반 시스템으로 데이터를 저장·분석하는 인메모리 어플라이언스다.

빅데이터 시대, 전통적인 디스크 기반 시스템으로 데이터를 처리해서는 기업의 실시간 비즈니스를 완벽히 지원할 수 없으며, 자사가 개발한 인메모리 컴퓨팅 기술로 이러한 한계를 극복할 수 있다는 게 SAP가 최근 강조하고 있는 부분.

SAP의 인메모리 컴퓨팅 기술이 집약된 HANA는 디스크가 아닌 메인 메모리에 모든 데이터를 저장하기 때문에 자료 검색·접근 속도가 일반 데이터베이스(DB) 보다 훨씬 빠르며, 전통적인 관계형 DB보다 복잡한 데이터도 원활하게 처리하도록 설계됐다.

특히 HANA는 기업의 비즈니스 트랜잭션 데이터에 대한 실시간 모델링, 다양한 비즈니스 뷰로의 변형이 가능한 분석기반을 제공한다. 또한 소스 데이터에 실시간 데이터 복제기술을 적용, 기간 시스템과 정보 시스템의 실시간 연동을 구현해 낸다. 바로 이러한 점이 디스크 기반의 데이터베이스 기술을 채택하고 있는 데이터웨어하우스(DW) 어플라이언스와 HANA를 구별되게 한다는 설명이다.

SAP는 이러한 강점을 지닌 HANA에 2010년 인수한 사이베이스의 DB인 ASE와 IQ, SQL 애니웨어, 기업 정보관리 솔루션 EIM 등의 강점을 융합한 '리얼타임 데이터 플랫폼'을 구현하는 것을 빅데이터 시대 DB 로드맵으로 삼고 있다.

이를 통해 국내 시장에서는 2013년, 글로벌 시장에서는 2015년에 DB 시장 2위를 달성하고 궁극적으로는 1위 DB 업체로 자리매김하겠다는 전략이다. 목표 달성을 위해 오는 11월, OLAP용 DB HANA를 온라인트랜잭션처리(OLTP)용 DB와 온라인분석처리(OLAP)용 DB가 통합된 형태로 발전시켜 시장에 선보일 예정이다.

◆SAS "하이퍼포먼스·소셜미디어 데이터 분석 시장 1위 고수"

SAS HPA는 SAS 인메모리(In-Memory) 분석, 인데이터베이스(In-Database), 그리드 컴퓨팅(Grid Computing)으로 구성된 플랫폼으로, 이 가운데 SAS 빅데이터 전략의 핵심이 되는 것이 '인메모리 분석'이다.

특허 출원 중인 SAS의 '인메모리 분석'은 대규모 데이터의 분석, 시각화, 예측, 데이터 마이닝 등 고급 통계 분석에 수반되는 모든 작업을 메모리상에서 처리할 수 있도록 해주는 기술이다.

빅데이터를 처리하는 과정에서 발생하는 병목현상을 해결하고 데이터 로딩·분석을 실시간으로 처리한다는 것, SQL 기반의 인메모리 분석과는 달리, 메모리에서 고급 통계 분석이 가능하다는 것이 '인메모리 분석'의 강점이다.

은행, 소매, 보건의료, 보험, 제약, 정부, 통신, 관광서비스 등 다양한 부문에서 SAS의 인메모리 분석을 활용해 마케팅 최적화, 리스크 관리, 성과 관리, 사기 방지 등의 효과를 얻을 수 있다는 게 SAS 측 설명이다.

SAS 빅데이터 전략의 또다른 축을 이루고 있는 것은 'SAS 소셜 미디어 분석(SAS Social Media Analytics)'이다.

'SAS 소셜 미디어 분석'은 기사, 기고 등 전문 사이트와 블로그 같은 소비자 생성 미디어(Consumer-Generated Media, CGM) 사이트를 분석해 회사나 조직, 브랜드에 미치는 영향을 파악 할 수 있도록 해주는 솔루션이다.

빅데이터 시대에 기업들은 비즈니스 인사이트를 얻기 위해 고객의 소리(VOC) 데이터, 웹, 이메일, 블로그, 미디어 등 기업 내·외부의 비정형 데이터를 활용한 분석을 필요로 하고 있으며, 'SAS 소셜 미디어 분석' 솔루션은 이러한 시장의 요구를 겨냥해 개발된 제품이다.

이 솔루션은 소셜 미디어 대화 데이터를 분석하며, 이를 통해 기업 이미지와 브랜드에 대한 평판, 호의적 반응, 부정적 요소 등을 분석한다.

SAS는 인메모리 분석 기술을 근간으로 하는 '하이퍼포먼스 분석', '소셜미디어 분석'으로 빅데이터 시대에 타 업체가 줄 수 없는 비즈니스 인사이트를 고객들에게 제공하겠다는 방침이다.

/특별 취재팀 if@inews24.com








포토뉴스