복잡하고 방대한 양의 자료를 수집, 분석하여 그 가치를 추출하는 기술을 빅데이터(big data)라고 합니다.빅데이터는 데이터의 수가 많고 규모가 큰 데이터를 의미하는데요.오늘은 이 빅데이터에 대해 이야기하고자 합니다.
빅데이터의 가치
빅데이터는 어떤 가치를 가지고 있을까요?한국 사회에서 빅데이터가 어떻게 활용되고 있는지 살펴보겠습니다. 1. 예측 분석
예측 분석은 대량의 자료를 분석하여 패턴을 찾아내고, 무슨 일이 일어날 확률이나 사람들의 활동을 예측하는 데 활용하고 있습니다.빅데이터 하면 빠지지 않고 등장하는 사례가 몇 가지 있는데요.
대표적인 사례는 ‘구글 독감 트렌드’입니다.빅데이터라는 말이 일반화되기 전인 2008년, 구글에서는 독감 관련 키워드를 검색하는 횟수와 독감에 감염된 사람의 수가 밀접한 관계가 있음을 파악하고 전 세계인이 사용하는 거대한 규모의 구글 검색 데이터를 활용해 독감 유행 수준을 예측할 수 있게 되었습니다.또 다른 예로는 인터넷 검색어를 분석하여 질병에 대한 동향을 예측하기도 하고, 심야시간대 휴대전화 통화량을 분석하여 심야버스 노선을 설계하기도 합니다.또한 사람들의 온라인 쇼핑 이력을 분석하여 상품을 추천해 주기도 합니다. 2. 과학 연구빅 데이터는 과학 연구에도 활용되고 있습니다.측정한 자료를 분석하거나 복잡하고 많은 양의 자료를 입력하거나 가상의 과학 실험 결과를 얻는 데 활용하기도 합니다.과학연구 빅데이터의 예로 사람의 몸 상태, 운동량 등의 자료를 수집하여 건강 관련 서비스를 제공하기도 하고, 연구 자료로 활용하기도 하며, 기상을 측정한 후 분석을 통해 일기예보를 예측하기도 합니다.또한 인공위성, 우주선 등에서 관측한 자료를 분석하여 천문학 연구에 활용하기도 합니다. 3. 기계 학습컴퓨터가 스스로 자료를 수집하고 분석하고 학습함으로써 자율주행, 번역 등 다양한 분야에서 활용되고 있습니다.기계학습 빅데이터의 예로는 도로 상황 자료를 분석해 자율주행을 하거나 전 세계 번역 문서를 활용해 다양한 국가의 언어를 분석하고 번역합니다.빅데이터를 활용하기 시작해 과거에는 불가능했던 기술도 구현하고 있습니다.각종 변화와 결과 예측이 보다 정확해지면서 우리 생활이 좀 더 편리해지고 위험도 예방할 수 있게 되었습니다. 빅데이터의 문제점빅데이터로 인해 우리 생활은 편해졌지만 자료를 수집하고 활용하는 과정에서 여러 문제점이 발생하기도 합니다.빅데이터 활용에 따른 위험이나 어려움은 어떤 것들이 있나요? 1. 프라이버시 침해네이버와 같은 인터넷 검색엔진은 사람들의 검색어를 분석하고 페이스북, 인스타그램과 같은 SNS는 사람의 일상과 인간관계를 수집합니다.또 인터넷 쇼핑몰의 쇼핑 내역이나 휴대전화 통화 내역 등 우리 생활 속 자료를 수집하게 되면 사생활 침해를 당할 위험성이 높아질 수밖에 없습니다. 2. 예측에 의한 처벌빅데이터는 범죄 가능성이 높은 사람을 찾을 때에도 활용되고 있습니다.이는 특정인에 대한 차별이나 처벌로 작용할 수 있으며 인간의 자유 의지를 부정하는 것일 수 있습니다. 3. 자료의 오남용빅데이터는 의사결정 과정에서 잘못 분석되거나 사용될 수 있습니다.보건의료 빅데이터 분석으로 한 의원에서 어떤 질병에 대한 집단감염 발생기관으로 심사를 받게 되었습니다.하지만 역학조사를 진행한 질병관리본부는 이것이 사실무근이라고 밝혔습니다. 빅데이터와 컴퓨팅 기술복잡하고 방대한 양의 데이터를 효율적으로 활용하기 위해서는 다양한 컴퓨팅 기술이 필요합니다.빅데이터에 대해 언급되는 대표적인 특징으로 3V가 있는데요.하나씩 살펴볼까요? 1. 자료 형식의 다양성(Variety)빅데이터는 다양한 형태의 자료로 활용합니다.음악, 동영상, 메시지, SNS, 위치정보, 인터넷 게시물 등 다양한 형태로 활용하고 있는데 이 중에서 필요한 정보를 추출하는 기술이 필요합니다. 2. 대용량 자료를 처리하는 대규모(Volume)보통 자료 처리는 메가바이트(MB), 기가바이트(GB) 단위로 이뤄졌지만 빅데이터는 테라바이트(TB), 페타바이트(PB), 엑사바이트(EB) 단위로 자료를 처리합니다.방대한 자료를 효과적으로 처리하기 위해서는 알고리즘과 소프트웨어의 발달이 중요합니다. 3. 데이터의 고속 생성 속도(Velocity)빅데이터는 인터넷 사용 기록이나 CCTV 등 실시간을 생성하거나 바뀌는 자료를 수집해 처리하기 때문에 일괄 처리 방법보다 실시간으로 신속하게 자료를 수집하고 처리하는 기술이 필요합니다.빅데이터에 대해 이해하셨나요?다음에도 더 알찬 주제로 만나요~ 이상 시큐브 코딩 화성 동탄센터에서 알려드렸습니다 :)빅데이터에 대해 이해하셨나요?다음에도 더 알찬 주제로 만나요~ 이상 시큐브 코딩 화성 동탄센터에서 알려드렸습니다 🙂