빅데이터, 결국 분석이다
분석이란 말이 없어도 분석을 이야기하는 것이다
빅데이터가 무엇인가에 대해서는 이야기하는 사람마다 제각각이다. 그러한 정의들을 외우는 것이 CEO의 숙제가 될 이유는 없다. 인터넷 백과사전인 위키디피아는 『기존 데이터베이스 관리도구로 데이터를 수집, 저장, 관리, 분석할 수 있는 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술』이라고 한다.
이 이야기를 자세히 들여다 보면 빅데이터라고 부르면서 데이터를 가리키기도 하고 기술을 가리키기도 한다는 점을 알 수 있다. 이 점이 용어에 대한 혼란을 많이 일으키며 쓸모없는 논쟁도 많았다. 우리는 이 단어가 데이터와 분석 두 가지를 구별 없이 이야기한다는 점만 기억하면 된다. 분석하지 않으려면 데이터는 어차피 가치가 없으니까. 이제부터 빅데이터라고 하면 분석하는 것은 당연히 포함해서 하는 이야기로 생각하자.
빅데이터 정의가 나오는 대목에서 누구든지 이야기 하는 공통된 요소 세 가지가 있다. 데이터의 규모(Volume), 다양성(Variety), 속도(Velocity)이다. 모두 V로 시작하기에 ‘3V’라고도 한다. 3V에 가치(Value)를 더해서 4V라고도 하지만, 가치는 앞의 3V와는 성격이 다르다. 건수가 많고, 종류는 다양하며, 실시간으로 즉시 수집되고 처리되는 것을 빅 데이터라고 이야기하는 것에는 이견이 없어 보인다. 문제는 두 가지. 그 구분점이 없다는 것(데이븐포트 교수는 최근 저서에서 100TB가 넘어야 빅이라 할 수 있다는 견해를 보였지만). 즉, 어디부터 빅이고, 어디까지는 빅이 아닌지는 각자 다른 주장을 하고 있고, 소위 다수설이란 것 자체가 없다. 또 하나는 세 가지가 모두 빅이라야 빅인가, 아니면 어느 한쪽만 빅이라도 빅인가의 문제다. 역시 다수설도 없고, 그리 심각하게 고민하고 가려서 이야기하는 사람도 없다.
결국, 말하는 사람마다 서로 다른 빅을 이야기하고 있는 것이다. 대화도 소통도 가능하지 않은 상황이다. 그럴수록 스스로 중심을 잡고 이해하고 있어야 한다.
'빅 데이터 > 빅 데이터 자료' 카테고리의 다른 글
빅데이터의 가장 큰 효과는 예측에서 온다 (0) | 2016.03.03 |
---|---|
빅데이터와 가치, 그리고 창조 (0) | 2016.03.02 |
빅데이터가 생사를 결정하는 세상 (0) | 2016.02.29 |
디지털 생활의 보편화와 빅데이터 출현 배경 (0) | 2016.02.28 |
빅데이터가 혁신을 가져 올 것이라고? (0) | 2016.02.27 |