데이터 과학을 위한 저작도구

빅데이터는 위기이자 기회
왜 빅데이터는 어려운가?
국내 게임산업
빅데이터는 게임체인져

빅데이터는 위기이자 기회

일반인 뿐만 아니라 전문가도 직관적으로 빅데이터(big data)를 매우 큰 데이터로 받아들인다. 학술적으로나 사업적으로 데이터가 커지면 발생하는 일이 한두가지가 아니라 모두 큰 골치거리로 받아들이고 회피하기 급급하다. 하지만, 이를 기회로 반전시킨 대표적인 기업이 구글이다. 90대 들어 인터넷이 활성화 되면서 데이터도 폭증하면서 생겨난 문제가 동시 다발적으로 생겨났지만, 더불어 고급정보에 대한 갈증도 심해졌다. 이런 위기 상황을 구글은 지금은 일상화된 분산데이터처리 기술을 비즈니스가 가능한 스케일로 문제를 풀어낸 최초의 기업이 되었다. 억만장자(billionaire)를 넘어 일류 최초 조만장자(trillionaire)를 꿈꾸는 아마존 창업자 ¹ 제프 베조스도 지금은 일반화된 협업필터링(collaborative filtering)을 아마존에 성공적으로 안착시켜 수많은 제품 중에서 고민하는 고객에게 원하는 것을 제안해주는 추천시스템을 성공시켰다.

왜 빅데이터는 어려운가?

카네기멜론 대학 쟈넷 윙(Wing) 교수는 이론적 사고(Theoretical Thinking), 실험적 사고(Experimental Thinking)와 더불어 컴퓨팅 사고(Computational Thinking)가 향후 인간의 사고 체제를 지배하는 중추적인 역할을 할 것이라고 주장했다. 산업혁명 이후로 산업, 즉 공장에서 필요한 인력을 육성하고 공급하기 위해서 수학과 공학을 초중등 과정에서 집중적으로 교육하여 수학에 근거한 이론적 사고에 누구나 익숙하지만, 통계가 근간을 이루는 실험적 사고와 이세돌을 격파한 구글 알파고 쇼크로 일반인에게 널리 알려진 인공지능의 근간이 되는 컴퓨팅 사고에 대해서는 일부 전산전공자만 교육을 받아 활용하고 있는 실정이다.

4번째 패러다임

학문적으로는 데이터과학, 일반적으로 통용되는 빅데이터는 통계학과 밀접한 관련이 있다. 수학적 사고 관점에서 통계를 보면 일반인에게 다소 어려운 수학이지만, 수학을 전통으로 하시는 분들이 보면 쉽게 보이는 것도 사실이다. 과거 통계가 통계 팩키지(SAS, SPSS, 미니탭 등)에 데이터를 넣어 돌리고 결과를 해석하는 학문으로 폄하되어온 것도 사실이다. 하지만, 통계는 데이터에 기반해서 귀납적 사고방식을 확률로 표현하는 실험적 사고(Experimental Thinking)의 중추적인 역할을 담당하고 있다.

2차 산업혁명 제조업의 토대가 수학을 기반으로 깔고 물리와 화학을 그 위에 올렸다면, 3차 산업혁명 금융/서비스업 정보화를 넘어, 4차 산업혁명은 추상화(Abstraction)와 자동화(Automation)가 근간을 이루는 컴퓨팅 사고체계가 핵심이다. 수학 전공자가 수학적 사고를 통달하는만큼이나 실험/통계적 사고를 통달하는 것은 쉬운 일이 아니고, 추상화와 자동화를 내재화하여 컴퓨팅 사고를 능숙하게 하는 것도 체계적인 교육과 실무 경험이 필요하다.

개인 입장에서 빅데이터가 중요한 이유는 엑셀로 열수 없을 정도로 커졌고, 분석이 불가능할 정도로 데이터가 복잡해졌고, 실시간으로 처리하기에는 그래픽 사용자 인터페이스(GUI)가 적합하지 않기 때문이 아니라, 이론적 사고, 실험적 사고, 컴퓨팅 사고를 체계적으로 교육받지 못한 상태에서 빅데이터를 통한 가치를 최대한 많이 즉시 창출해야 된다는 사실이다.

이를 게임회사로 확장하면, 과거와 같이 단순히 데이터를 관계형 데이터베이스에 담아 SQL로 뽑아내고 이를 엑셀로 분석하는 방식으로는 데이터를 분석하여 유의미한 정보를 찾아내어 이를 통해 새로운 가치를 창출한다는 모토를 달성하는 것이 가능은 하지만 기업이나 사회에서 기대하는 바를 충족시키기에는 엿부족이다.

국내 게임산업 ²

문화체육관광부와 한국콘텐츠진흥원이 공동으로 발간한 “2016 대한민국 게임백서”에 따르면, 국내 게임시장 규모는 10조를 돌파했고, 웹젠을 포함한 국내 게임업체에 종사하는 종업원 숫자는 10만명을 바라보고 있으며, 작년 수출 금액도 32억달러로 집계되었다. 하지만, 이런 성장의 이면에는 온라인 게임에서 모바일 게임으로 패러다임은 바뀌었으며, 가상현실과 증강현실을 가미한 게임이 먼 얘기가 아니고 눈 앞에 다가왔으며, 인공지능 기술의 발달로 더 이상 한국어가 외국 업체에는 커다란 장벽으로 여겨지지 않게 되어 해외 게임이 대거 수입되고 있다. 이러한 냉혹한 현실에서 바뀌지 않는 사실은 게임유저는 게임을 하고 데이터를 남긴다는 사실이고 시간이 지날수록 더 많은 데이터를 더 다양한 방식으로 남긴다는 점이다.

빅데이터는 게임체인져

게임 자체를 만들고 이를 상업적으로 활용하기 어려운 상황에서는 게임 개발 자체가 경쟁력의 원천이던 시절이 있었다. 하지만, 지금은 우리나라보다 기술수준이 뒤떨어진다고 여겨지던 중국을 비롯한 동남아 국가들도 상당 수준의 게임을 만들어내는 것도 사실이다. 국내 게임 업체들도 자체 게임 개발도 하지만 퍼블리싱도 도입하여 위험분산을 통한 지속적인 성장을 도모하고 있다. 게임 개발에 필요한 데이터 기술과 퍼블리싱을 통해 가치를 창출하는 데이터 관련 기술은 규모와 깊이에서 차이가 크다.

게임 자체 데이터 뿐만 아니라, 페이스북으로 대표되는 소셜 SNS를 통해 유저가 생성해내는 데이터, 자동게임모드로 유저가 아닌 기계가 창출해내는 데이터, 스마트폰과 PC 컴퓨터에서 생성해내는 다양한 위치정보 데이터, 뉴스, 블로그, 잡지, 채팅 등을 통한 텍스트 데이터와 감성이 내재된 데이터, 정상 유저를 가장한 작업장(Gold farm)을 포함한 어뷰저(abuser)가 만들어 내는 데이터 등 수 많은 데이터가 쌓이고 있다.

기업이나 사회에서 기대하는 것

개인이나 기업이나 빅데이터에 대한 준비가 부족한 것은 사실이지만, 데이터 기술 난이도와 이를 통해 창출되는 가치에 대해 4가지 단계로 나눠 로드맵을 통해 현재 위치와 나아갈 방향에 대해 나침판을 제시하고 있다.

이러한 데이터를 바탕으로 무슨 일이 파악하는 것도 쉽지 않다. 하지만, 이를 넘어 게임 및 게임 관련된 현상이 왜 일어났는지 원인을 정확히 파악하고 더 나아가 무슨 일이 일어날지 예측하고 나서 이를 유리한 방향으로 만들 수 있도록 최적화할 수 있다면 상당한 경쟁력이 될 것이다. 이러한 경쟁력을 갖고 있는 대표적인 기업이 구글, 애플, 아마존, 페이스북(Gang of Four) ³ 4인방이다.

결국 지구온난화 못지않게 빅데이터는 심각한 문제지만 이를 이론적 사고, 통계적 사고, 컴퓨팅 사고로 무장한 재능있는 인력을 잘 담아낼 수 있는 게임회사가 데이터를 통해 엄청난 가치를 창출하는 것은 물론이고, 이러한 문제해결능력을 통해 구글, 애플, 아마존, 페이스북 4인방을 넘어서는 것도 어려운 일은 아닐 것이다.

데이터 과학을 위한 저작도구

빅데이터는 위기이자 기회, 게임산업도 예외는 아니다.

빅데이터는 위기이자 기회

왜 빅데이터는 어려운가?

국내 게임산업 2

빅데이터는 게임체인져

국내 게임산업 ²