맺음말

이 책은 하나의 질문에서 시작되었다. AI가 범용기술(General Purpose Technology)로 자리 잡은 2025년, 데이터 과학은 어떻게 변화하고 있는가? 답을 찾기 위해 우리는 세 가지 여정을 함께했다.

이론에서 실전으로, 역사에서 미래로

1부 ‘인공지능’에서는 ChatGPT로 대표되는 생성형 AI가 왜 전기, 증기기관, 컴퓨터와 같은 범용기술인지 확인했다. 역사는 명확한 패턴을 보여주었다. 전기화가 1880년대 발명부터 1920년대 공장 레이아웃 완전 재설계까지 40년이 걸렸듯, AI 혁명도 2022년 ChatGPT 등장부터 조직과 사회의 근본적 재구성까지 10-20년이 소요될 것이다. 현재 우리는 단순 대체 단계에서 점진적 적응 단계로 넘어가는 초기 전환점에 서 있다.

특히 300년 노동 분업 역사가 주는 교훈은 분명했다. 기술은 인간을 대체하는 것이 아니라 더 창의적이고 전략적인 역할로 해방시킨다. 산업혁명이 농업 노동자를 제조업으로, 자동화가 제조업 노동자를 서비스업으로 이동시켰듯, AI 혁명은 지식 노동자를 반복 작업에서 해방시켜 전략과 창의성에 집중하게 만들고 있다. 브린욜프슨의 연구가 보여준 것처럼, AI는 숙련도 낮은 작업자의 생산성을 34% 향상시켜 격차를 줄이고, 펭의 연구는 개발자 작업 속도를 55.8% 가속화함을 입증했다. 이것이 바로 인지혁명의 실체다.

2부 ‘AI 데이터 과학’에서는 이론적 기반을 다졌다. 데이터는 단순한 숫자가 아니라 과학적 관찰, 통계적 변수, 컴퓨팅 비트, 비즈니스 자산이라는 다층적 실체임을 확인했다. 데이터 과학 프레임워크는 1989년 DIKW 피라미드부터 1996년 CRISP-DM, 2020년대 MLOps까지 진화했지만, 핵심 질문은 변하지 않았다. “데이터를 어떻게 가치로 변환하는가?” 그리고 “누가 이를 실행하는가?”

데이터 과학 인력은 1990년대 파편화된 전문가(DBA, 비즈니스 분석가, 통계학자)에서 2010년대 팀 기반 협업(데이터 엔지니어, ML 엔지니어, 데이터 분석가)을 거쳐, 2020년대 AI와 협업하는 데이터 과학자로 진화했다. Positron, Cursor, GitHub Copilot 같은 AI 네이티브 도구는 코딩 시간을 10분의 1로 줄이지만, 문제 정의와 결과 해석 능력의 중요성은 10배 커졌다. 출력 결과물도 변화했다. 1990년대 SAS 보고서 13-26일에서 2010년대 Jupyter 5-10일, 2020년대 Quarto 2-4일, 현재 AI 생성 0.5-1일로 단축되었지만, 무엇을 전달할지 정의하는 능력은 여전히 인간의 몫이다.

3부 ‘사례 분석’에서는 실제 고수요 유통 데이터로 이론을 검증했다. 4가지 사례는 각기 다른 질문을 던졌지만, 공통된 방법론과 도구로 답을 찾았다.

MZ 소비자 쇼핑앱 분석은 “검색에서 발견으로” 패러다임 전환을 보여주었다. 쿠팡의 검색형 최적화(평균 체류 3.2분, 검색→구매 직선형)와 에이블리의 발견형 혁신(평균 체류 11.4분, 탐색→발견→구매 순환형)은 근본적으로 다른 두 비즈니스 모델이다. 체류시간의 의미가 “비효율성 지표”에서 “발견과 참여 지표”로 재정의되고 있음을 확인했다.

학교급식 식재료 조달 분석은 데이터 기반 절약 전략의 위력을 입증했다. 찹쌀 한 품목 분석만으로 채널별 50%, 지역별 45% 가격 격차를 발견하고, 서울 학교가 경기·충청 대형마트로 조달처를 변경하면 22.3% 절감이 가능함을 정량화했다. 공공 조달에서 “조달에서 절약으로” 패러다임 전환의 시작점이다.

농산물 관심도 분석은 디지털 계급사회의 구조를 드러냈다. 정보 엘리트층(14.4%), 이슈 추종층(73.6%), 실용 정보층(12.0%) 3계층의 극명한 격차는 단순한 정보 접근량 차이가 아니라 정보 활용 능력의 차이였다. 이슈 추종층이 가장 많은 매체를 접하고 다양한 농산물에 관심을 보이지만, 정작 깊이 있는 이해나 실질적 행동 변화로는 이어지지 않는 역설적 상황이 “정보 불평등에서 정보 민주화로” 전환의 필요성을 시사했다.

유통채널 전략 분석은 대형마트와 체인슈퍼 간 6배 매출 격차의 본질을 52주 트렌드로 규명했다. 대형마트의 “물량 중심 전략”(1.06배 판매량, 0.87배 단가, 15% 마진)과 체인슈퍼의 “마진 중심 전략”(1.30배 단가, 0.56배 판매량, 26% 마진)은 대체재가 아닌 보완재다. 효율성보다는 전략 선택의 결과임을 데이터로 증명했다.

불변의 원칙, 진화하는 도구

이 책을 관통하는 핵심 통찰은 명확하다. 도구는 점점 더 강력해지고 접근하기 쉬워지지만, 불변하는 것이 있다.

첫째, 데이터 과학의 본질은 변하지 않는다. DIKW 계층 구조(데이터→정보→지식→지혜)는 1989년 애코프가 제시한 이후 36년간 유효하다. 의사결정 보고서 7가지 요소(핵심 요약, 테이블, 시각화, 인사이트, 권장사항, 부록, 타임라인)는 1990년대 SAS든 2020년대 AI든 동일하다. 변하는 것은 “어떻게(How)” 만들 것인가이고, 변하지 않는 것은 “무엇을(What)” 전달할 것인가다.

둘째, 역사는 반복되지 않지만 운율을 맞춘다. 전기화가 보여준 3단계 패턴(단순 대체→점진적 적응→혁신적 재구성)을 AI도 따르고 있다. 전문화의 필연성은 갤브레이스가 1967년 지적했듯 포드 자동차 125명→30만 명 진화에서도, 현재 범용 ChatGPT→특화 AI 도구 분화에서도 동일하게 나타난다. 브레스나한과 트라이텐베르그의 범용기술 이론은 증기기관, 전기, 반도체를 거쳐 AI에서도 반복 검증되고 있다.

셋째, 인간의 역할은 사라지는 것이 아니라 진화한다. 데이비드와 돈의 전기화 연구가 보여준 “생산성 J-커브”는 AI 시대에도 적용된다. 혁신 초기 생산성 감소→무형 자본 투자→폭발적 향상의 패턴은 현재 많은 조직이 “AI를 도입했지만 생산성이 오히려 떨어졌다”고 느끼는 이유를 설명한다. 진정한 생산성 혁명은 AI 도입이 아니라 AI 중심으로 조직과 프로세스를 재구성할 때 온다.

넷째, 데이터는 답을 주지 않는다. 올바른 질문을 하는 사람에게만 인사이트를 선물한다. 쇼핑앱 분석이 “왜 에이블리는 체류시간이 길까?”라는 질문에서 발견형 쇼핑 패러다임을 발견했고, 급식 조달이 “왜 같은 찹쌀인데 가격이 2배 차이 나는가?”라는 질문에서 22.3% 절감 전략을 찾았듯, 데이터 과학의 시작은 항상 올바른 질문이다.

AI 시대, 데이터 과학자의 미래

2025년 현재, 우리는 역사적 전환점에 서 있다. AI는 더 이상 실험실의 프로토타입이 아니라 일상 업무의 필수 도구가 되었다. ChatGPT, Claude, GitHub Copilot은 누구나 접근할 수 있고, Positron과 Cursor는 데이터 과학자의 생산성을 10배 향상시키며, Quarto는 문서 코드화로 재현 가능성을 보장한다.

하지만 AI가 강력해질수록, 인간 데이터 과학자의 고유 역할은 더욱 명확해진다.

문제 정의: AI는 주어진 질문에 답하지만, 무엇을 물어야 하는지는 인간이 정의한다. 쇼핑앱 분석에서 “검색 vs 발견”의 프레임을 설정한 것, 급식 조달에서 “채널별 가격 격차”에 주목한 것, 정보 격차에서 “체류시간 vs 정보깊이”를 대비시킨 것은 모두 인간의 통찰이었다.

맥락 이해: AI는 패턴을 발견하지만, 그 패턴이 비즈니스에 무엇을 의미하는지는 도메인 전문가가 해석한다. 유통채널 분석에서 6배 매출 격차가 “비효율성”이 아니라 “전략 차이”임을 판단한 것은 유통 산업 이해에서 나왔다.

윤리적 판단: AI는 최적화 솔루션을 제안하지만, 그것이 윤리적으로 옳은지, 장기적으로 지속 가능한지 판단하는 것은 인간의 몫이다. 델아쿠아의 “들쭉날쭉한 기술 경계(Jagged Frontier)” 개념이 시사하듯, AI가 잘하는 것과 못하는 것을 구별하고, 인간과 AI 협업 지점을 설계하는 능력이 핵심이다.

스토리텔링: AI는 차트와 통계를 생성하지만, 데이터에 담긴 이야기를 경영진과 실무진에게 설득력 있게 전달하는 것은 여전히 인간의 예술이다. 보고서 구조는 불변이지만, 어떤 인사이트를 강조하고 어떤 권장사항을 제시할지 선택하는 것은 비즈니스 이해와 커뮤니케이션 능력이다.

미래 데이터 과학자는 “코딩하는 사람”에서 “AI와 협업하는 전략가”로 진화할 것이다. Cursor가 코드를 자동 생성하고, Positron이 데이터를 시각화하며, Claude가 보고서를 작성할 때, 인간은 무엇을 만들지 정의하고, 결과를 검증하며, 비즈니스 가치를 창출하는 데 집중한다. 코딩 시간은 10분의 1로 줄지만, 전략적 사고와 도메인 전문성의 가치는 10배 커진다.

여정의 끝, 새로운 시작

이 책은 여기서 끝나지만, 독자들의 여정은 이제 시작이다. 1부에서 배운 범용기술의 역사적 패턴, 2부에서 익힌 데이터 과학 프레임워크와 도구, 3부에서 실습한 4가지 실전 사례는 독자들이 자신만의 데이터 과학 프로젝트를 시작할 수 있는 든든한 기반이다.

앞으로 맞이할 미래는 불확실하지만, 역사가 주는 교훈은 명확하다. 기술 혁명의 승자는 가장 먼저 도입한 사람이 아니라, 가장 잘 활용한 사람이다. 전기화 시대 GE와 웨스팅하우스가 승리한 이유는 전기를 발명해서가 아니라, 전기 중심으로 공장 전체를 재설계했기 때문이다. AI 시대도 마찬가지다. ChatGPT를 단순히 “더 나은 검색엔진”으로 쓰는 사람과, AI와 협업하여 업무 프로세스 자체를 재구성하는 사람의 생산성 격차는 시간이 갈수록 벌어질 것이다.

데이비드와 돈의 연구가 경고했듯, 전기화의 진정한 혁명은 발명 40년 후에야 왔다. AI 혁명도 ChatGPT 등장(2022) 이후 10-20년에 걸쳐 점진적으로 펼쳐질 것이다. 현재 우리는 그 여정의 초입에 서 있다. 조급해할 필요는 없지만, 안주해서도 안 된다. 매일 조금씩 AI를 실무에 통합하고, 작은 성공을 쌓아가며, 동료와 경험을 공유하는 것이 장기전을 이기는 전략이다.

마지막으로, 이 책을 만든 과정 자체가 AI 시대 협업의 표본이었다. Claude Code가 코드를 생성하고, Positron이 데이터를 분석하며, Quarto가 문서를 렌더링했지만, 문제 정의, 프레임워크 설계, 인사이트 해석, 스토리텔링은 모두 인간이 수행했다. 이것이 바로 미래 데이터 과학의 모습이다.

독자들이 이 책에서 배운 이론과 도구, 사례와 통찰을 자신의 현장에 적용하여, 더 나은 의사결정, 더 큰 비즈니스 가치, 더 의미 있는 사회 변화를 만들어내기를 바란다. AI는 강력한 도구이지만, 그 도구를 쥔 사람이 어떤 질문을 던지고 어떤 가치를 추구하는지에 따라 결과는 천차만별이다.

데이터에는 이야기가 담겨 있고, AI는 그 이야기를 들려주는 새로운 언어이다. 이제 독자들이 그 언어로 세상과 대화하며, 데이터 경제 시대를 함께 열어갈 차례다.