class: center, middle, inverse, title-slide # 창업과 인공지능 제품개발 ## ⚔
기계학습과 딥러닝 ### 데이터 과학자 이광춘 ### 2018/10/04 --- class: inverse, middle, center # 패러다임 전환 --- ## 기계와 경쟁을 준비하는 한국인 .center[ <iframe width="560" height="315" src="https://www.youtube.com/embed/PcXLYOMnhd0" frameborder="0" allow="autoplay; encrypted-media" allowfullscreen></iframe> ] --- ## 자동차 클러스터 사례 .center[ <img src="fig/ai-digital-cluster.png" width="87%" /> ] --- ## 가치(Value) 원천 .center[ <img src="fig/ai-lab-korea-science.png" width="77%" /> ] 세계은행(World Bank)과 한국개발연구원(KDI)은 약 2년여 기간의 공동연구를 통해 1960-2005 년간 한국 경제발전 과정에 관한 보고서를 출간했다. 경제성장이 지속되기 위해서는 생산성 증가가 대단히 중요하고, 1960년 이후 한국경제의 성공은 광의의 지식축적에 기인한 것으로 1960-2005년 사이 한국의 실질 1인당GDP의 75%가 광의의 지식축적에 기인한 것으로 분석했다. --- ## 사고체계의 진화 .center[ <img src="fig/ai-lab-ct-4th-paradigm.png" width="50%" /> ] - 수학적 사고(Mathematical Thinking) - 통계적 사고(Experimental Thinking) - 컴퓨팅 사고(Computational Thinking) .footnote[ [Wing, Jeannette M. "Computational thinking." Communications of the ACM 49.3 (2006): 33-35.](https://www.cs.cmu.edu/~15110-s13/Wing06-ct.pdf) ] --- ## 4번째 패러다임 .center[ <img src="fig/ai-lab-4th-paradigm.png" width="100%" /> ] --- class: inverse, middle, center # 시장의 변화 --- ## 수직적 시장 → 인공지능 시장 .center[ <img src="fig/slide-4th-industry-revolution-roadmap.png" width="100%" /> ] - 수직적(Vertical) 시장 → 플랫폼(Platform) 시장 → 인공지능(AI) 마켓으로 --- ## 한국 기업(?) vs. AI기반 기업 .center[ <img src="fig/stat-data-science.png" width="100%" /> ] --- ## 산업역군(?) .center[ <iframe width="400" height="270" src="https://www.youtube.com/embed/t346si4gy_M" frameborder="0" allowfullscreen></iframe> <img src="fig/ai-basic-skills.png" width="37%" /> ] .footnote[ [MATT RICHTEL, "Reading, Writing, Arithmetic, and Lately, Coding"", The New York Time, MAY 10, 2014](http://www.nytimes.com/2014/05/11/us/reading-writing-arithmetic-and-lately-coding.html) ] --- ## 계급을 나누는 기준 - 데이터 .center[ <iframe width="560" height="315" src="https://www.youtube.com/embed/7Xs3auqcX7k" frameborder="0" allow="autoplay; encrypted-media" allowfullscreen></iframe> ] --- “고대에는 ’땅’이 가장 중요했고 땅이 소수에게 집중되자 인간은 귀족과 평민으로 구분됐으며, 근대에는 ’기계’가 중요해지면서 기계가 소수에게 집중되자 인간은 자본가와 노동자 계급으로 구분됐다”. 이제는 데이터가 또 한번 인류를 구분하는 기준이 될 것이다. 향후 데이터가 소수에게 집중되면 단순 계급에 그치는 게 아니라 **데이터**를 가진 종과 그렇지 못한 종으로 분류될 것이이다. - 유발 하라리(Yuval Noah Harari) --- class: inverse, middle, center # 기계학습과 인공지능 사용법 --- ## 데이터와 인공지능 .center[ <img src="fig/maum.png" alt="AI 플랫폼 서비스" alt="100%" /> ] --- ## [얼굴 분석 - Face Analysis](https://itunes.apple.com/kr/app/%EC%96%BC%EA%B5%B4-%EB%B6%84%EC%84%9D-face-analysis/id1290130969?mt=8) .pull-left[ <img src="fig/face-analysis-app.png" alt="얼굴분석" width="65%" /> ] .pull-right[ - **클라우드 APIs** - [나이(Age): MS Face API](http://statkclee.github.io/deep-learning/ms-oxford-age.html) - [정보과학교육연합회-R을 이용한 인공지능 튜토리얼](http://statkclee.github.io/deep-learning/ms-oxford-kcode-tutorial.html) - [감정분석: MS Emotion API](http://statkclee.github.io/deep-learning/ms-oxford-video.html) - [국회의원 사진 - Computer Vision API](http://statkclee.github.io/deep-learning/ms-azure-computer-vision.html) ] .footnote[ [Azure Computer Vision API: Generate image captions with the Computer Vision API](http://blog.revolutionanalytics.com/2018/03/computer-vision-api.html) ] --- ## 오픈소스 → API <br> <br> <br> .center[ <img src="fig/compile-source-call.png" alt="패러다임" width="100%" /> ] .footnote[ [고성능 컴퓨팅(HPC) 컴파일, 설치, 호출](http://statkclee.github.io/hpc/compile-install-call.html) ] --- ## API 호출로 진화 소프트웨어 및 데이터를 포함한 모든 것은 API 호출로 진화하고 있다. .center[ <img src="fig/software-evolution.png" width="90%"> ] .footnote[ [xwMOOC 고성능 컴퓨팅(HPC) - 컴파일, 설치, 호출](https://statkclee.github.io/hpc/compile-install-call.html) ] --- ## 데이터 API - 국회의원 인물정보 - **데이터 API** - [네이버 인물정보](https://statkclee.github.io/ingest-data/naver-people-info.html) - [슈퍼영웅(Super Heores) API ](https://statkclee.github.io/data-product/dp-superhero.html) - **클라우드 API** - [국회의원 사진 - MS 애저 Computer Vision API](https://statkclee.github.io/deep-learning/ms-azure-computer-vision.html) - 크롤링 혹은 API로 얻은 데이터를 다시 클라우드 API에 던져 시각지능 정보(객체 인식, 나레이션, 감정 등)를 처리함. --- #### 데이터 저널리즘 국제노동기구(ILO) API에 접속하여 데이터를 획득하고 이를 기사화하기 좋은 형태로 데이터를 가공하여 "데이터 저널리즘" 형태에 맞춰 기사화. 유튜브에 공개된 대통령 담화문을 동영상 데이터를 마이크로소프트 인공지능 API에 던져 감정정보를 추출하여 대통령의 감성상태를 파악하여 기사화. .pull-left[ ### [데이터 저널리즘](https://statkclee.github.io/data-product/data-journalism-working-pop.html) <img src="fig/data-journalism-population.png" alt="생산가능 인구" width="100%" /> .footnote[ - [데이터 과학을 위한 저작도구](https://statkclee.github.io/ds-authoring/) - [언론에 비친 한국자산관리공사 - Shiny App](https://dl-dashboard.shinyapps.io/kamco/) ] ] .pull-right[ ### [동영상 감정 분석](https://statkclee.github.io/deep-learning/ms-oxford-video.html) <img src="fig/ms-cognitive-video.png" alt="슬픔은 어디에" width="100%" /> .footnote[ [KBS, 인공지능으로 분석한 대통령의 마음 슬픔은 어디에(2016.12.07)](http://news.kbs.co.kr/news/view.do?ncd=3390429) ] ] --- class: middle, center # [이미지 분류 - 케라스(딥러닝)](https://statkclee.github.io/data-product/shiny-image-classification.html) --- class: inverse, middle, center # 기계학습/인공지능 제조법 --- ## 프로그래밍과 기계학습 차이 .center[ <img src="fig/programming_machine_learning_comparison.png" width="80%"> ] .footnote[ [궁극의 주인이 될 알고리즘(Master Algorithm)](https://statkclee.github.io/ai-lab/master-algorithm.html) ] --- ## 기계학습 - 기술부채(Technical Debt) .left[ - 리팩토링(Refactoring): 결과의 변경 없이 코드의 구조를 재조정함 - 단위 테스트 범위 확대 - 더이상 사용되지 않는 코드 삭제 - 의존성 감소 - 엄격한 API 관리 - 체계적인 문서화 ] .right[ <img src="fig/blackberry.jpg" width="40%"> ] .footnote[ [기계학습 - 기술부채(Technical Debt)](http://statkclee.github.io/ml/ml-technical-debt.html) ] --- ## 딥러닝(Deep Learning) .center[ <img src="fig/three-pillars.png" width="90%"> ] .footnote[ [xwMOOC 딥러닝과 `\(H_2 O\)`](http://statkclee.github.io/deep-learning/) ] --- ## 왜 슈퍼컴퓨터를 알아야 하나? .center[ <img src="fig/CPU-Scaling.jpg" width="50%"> ] .footnote[ [xwMOOC 고성능 R 아키텍처](http://statkclee.github.io/parallel-r/r-perf-arch.html) ] --- ## 기계학습 모형 사례 - 지리정보: [택시탑승 위치 예측(서울)](https://statkclee.github.io/model/model_geospatial_taxi.html) - 텍스트: [SMS 단문 스팸 메시지 예측](https://statkclee.github.io/text/nlp-spam-machine-learning.html) - 이미지: - [비행기 vs 자동차 vs 배 - CNN](https://statkclee.github.io/deep-learning/r-keras-cnn.html) - [패션 범주 예측(Fashion MNIST)](https://statkclee.github.io/deep-learning/r-keras-fashion-mnist.html) - 영화추천: [MovieLens 데이터 - 아파치 스파크](https://statkclee.github.io/parallel-r/recommendation-sparklyr.html) - 정사각형(엑셀) 데이터: - [고객 잔존율 분석](https://statkclee.github.io/ml/ml-pm-survival.html) - [지방선거 광역단체장 지지율 예측모형](https://statkclee.github.io/ml/ml-local-election.html) - [적색/백색 포도주 예측](https://statkclee.github.io/model/model-eda-wine.html) --- ## 기계학습/딥러닝 제품 제작 1. 기계학습/딥러닝 개요: [마케팅 반응 예측모형](https://statkclee.github.io/ml/ml-pm-discrete.html) 1. 강인한 회귀모형 시각화: [xwMOOC 모형: 회귀모형 - purrr + trelliscopejs](https://statkclee.github.io/model/model_purrr_trelliscopejs.html) 1. 기계학습 모형개발 자동화 - [데이터 과학: 기초 통계 - 통계 모형(Statistical models)](https://statkclee.github.io/statistics/stat-modeling.html) - [xwMOOC 모형: 기계학습 모형개발 30분 - recipe + `\(H_2 O\)` AutoML](https://statkclee.github.io/model/model-recipe-h2o-automl.html) 1. 기계학습 모형 이해와 해석: [xwMOOC 모형- 모형 이해와 설명](https://statkclee.github.io/model/model-explain.html) 1. 기계학습 모형 배포: [R 병렬 프로그래밍: 배포(deployment) = 기계학습 모형 사용](https://statkclee.github.io/parallel-r/r-restful-production.html) --- ### 기계와 더불어 사는 한국인: **신뢰(Trust)**와 **투명성(Transparency)** - 의료분야: 기계학습 알고리즘과 인공지능의 의사결정이 생과 사를 가를 수 있다. - 사업분야: 기계학습/딥러닝 알고리즘을 이해하고 향상함으로써 시간과 돈을 절약할 수 있다. - 기계학습 알고리즘과 인공지능의 관여 1. 신용대출 1. 가석방 1. 결혼정보회사 1. 난임부부를 위한 난자/정자 매칭 1. 일자리 매칭 1. ... - General Data Protection Regulation (GDPR) "[...] the controller shall provide [...] the following information: the existence of automated decision-making, including profiling, [...] meaningful information about the logic involved, as well as the significance and the envisaged consequences of such processing for the data subject."