ai data 아주 많은 데이터? 큰 데이터? 빅데이터가 정확히 뭐지? | IT 단어장
ai data 아주 많은 데이터? 큰 데이터? 빅데이터가 정확히 뭐지? | IT 단어장
본문
빅데이터, 빅데이터... 말은 많이 들었지만, 빅데이터가 무엇인지 아는 분들은 많지 않을 것 같습니다. 그냥 큰 데이터인가? 데이터를 많이 모아놓은 건가? 라고 생각할 것도 같고요.
이처럼 우리는 빅데이터가 무엇인지, 어떻게 활용되고 있는지 잘 알지 못합니다. 하지만 알고 보면 우리는 빅데이터로 가득한 세상 속에서 살아가고 있답니다. 조만간 재킷 하나 사야지! 라고 생각했을 때 인터넷 브라우저를 켜니 재킷 광고가 뜨고, 유튜브 화면에 들어가기면 해도 관심 있는 분야의 영상이 차르르 뜨는 경험, 다들 해보셨을 텐데요. 검색하지 않아도 내 마음을 알아주는 이런 신기한 일이 가능해진 이유는 바로 빅데이터 때문이죠.
그렇다면 빅데이터란 무엇일까요? 이름 그대로 큰 데이터일까요?
디지털 환경에서 만들어진 모든 데이터, 빅데이터
정답은 ...! 맞기도 하고 아니기도 합니다. 빅데이터는 디지털 환경에서 만들어지는 모든 데이터를 말하는데요. 수치와 문자는 물론이고 영상도 포함됩니다. 동시에 이러한 데이터를 다루는 기술을 말하기도 합니다.
스마트폰과 SNS가 활발하게 사용되면서 어마어마한 데이터들이 쏟아져 나오고 있습니다. 1분 동안 전 세계에서는 2억여 건의 이메일이 발송되고, 410만 번 구글 검색이 되며, 470만 개의 유튜브 동영상이 재생되고 있어요. 단 1분 동안에요. 이런 방대한 양의 데이터를 분석해 새로운 경제적 가치를 만들어 내는 것이 바로 빅데이터입니다.
기존 데이터와 어떻게 다른가요?
여기서, 기존 데이터와 무엇이 다른지 의문이 생긴 분들이 있을 텐데요. 기존 데이터의 양은 테라바이트(TB) 수준이고, 데이터베이스 형태인 정형 데이터로 구성되어 있어 수치만으로 의미 파악이 쉬웠습니다. 반면 빅데이터는 테라바이트(TB)에서 제라바이트(ZB)까지 그 양이 어마어마합니다. 게다가 정형 데이터는 물론 의미 파악이 어려운 비정형 데이터로 구성되어 있습니다.
빅데이터 기술이 날이 갈수록 발전하면서 그동안 의미를 분석하기 힘들었던 비정형 데이터를 분석할 수 있게 되었습니다.
* 테라바이트(TB) : 데이터 양을 나타내는 단위로, 일반적으로 구할 수 있는 저장장치 중 가장 큰 용량 단위이다. 1 TB = 1012 bytes = 1,024GB이다.
* 제타바이트(ZB) : 데이터 양을 나타내는 단위로, 인류가 생산해 낸 데이터의 총합이 2018년을 기준으로 33ZB를 넘겼다. 1 ZB = 1021 bytes 약 1조1,000억GB이다.
빅데이터의 특징인 5V는?
이러한 빅데이터의 특징을 한 단어로 5V라고 정의할 수 있습니다. 초기 빅데이터의 특징은 규모의 Volume, 다양성의 Variety, 속도의 Velocity인데요. 빅데이터를 통한 가치 창출이 중요해지면서 정확성의 Veracity와 가치의 Value가 더해졌습니다.
보다 쉽게 정리하면 빅데이터는 규모가 커야 하며 다양한 데이터를 담고 있습니다. 속도도 빠른 데다 정확해야 하죠. 이처럼 빅데이터는 규모, 다양성, 속도, 정확성, 가치 등으로 특정지을 수 있는 정보 자원인데요. 이를 활용하여 가치를 얻을 수 있어야 의미가 있답니다.
현재 빅데이터는 어떻게 활용되고 있을까요?


빅데이터는 21세기 원유라고도 불립니다. 원유는 정제 과정을 거쳐 석유나 휘발유가 되기도 하지만 플라스틱, 의약품 원료, 섬유류로도 재탄생하는데요. 데이터도 원유처럼 여러 분석 과정을 거치면서 다양하게 활용되고, 전혀 의도하지 않았던 정보도 만들기 때문입니다. 방대한 정보화 사회에서 빅데이터가 앞으로 어떻게 활용될지 궁금해집니다!