class: center, middle, inverse, title-slide # 기계학습과 벤처창업 ## ⚔
인공지능 제품 개발 ### 데이터 과학자 이광춘 ### 2019/10/29 --- class: inverse, middle, center # 패러다임 전환 --- ## 기계와 경쟁을 준비하는 한국인 .center[ <iframe width="560" height="315" src="https://www.youtube.com/embed/N25z8Ewpaus" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe> ] --- ## 가치(Value) 원천 .center[ <img src="fig/ai-lab-korea-science.png" width="77%" /> ] 세계은행(World Bank)과 한국개발연구원(KDI)은 약 2년여 기간의 공동연구를 통해 1960-2005 년간 한국 경제발전 과정에 관한 보고서를 출간했다. 경제성장이 지속되기 위해서는 생산성 증가가 대단히 중요하고, 1960년 이후 한국경제의 성공은 광의의 지식축적에 기인한 것으로 1960-2005년 사이 한국의 실질 1인당GDP의 75%가 광의의 지식축적에 기인한 것으로 분석했다. --- ## 사고체계의 진화 .center[ <img src="fig/ai-lab-ct-4th-paradigm.png" width="70%" /> ] - 수학적 사고(Mathematical Thinking) - 통계적 사고(Experimental Thinking) - 컴퓨팅 사고(Computational Thinking) .footnote[ [Wing, Jeannette M. "Computational thinking." Communications of the ACM 49.3 (2006): 33-35.](https://www.cs.cmu.edu/~15110-s13/Wing06-ct.pdf) ] --- ## 4번째 패러다임 .center[ <img src="fig/ai-lab-4th-paradigm.png" width="100%" /> ] --- ## 자동차 클러스터 사례 .center[ <img src="fig/ai-digital-cluster.png" width="100%" /> ] --- ## 컴퓨터 생성 .pull-left[ #### 물리적 컴퓨터 <img src="fig/computer-mainbody.jpg" width="100%" /> ] .pull-right[ #### 가상 컴퓨터(instance, VM) ```r import boto3 ec2 = boto3.resource('ec2') instances = ec2.create_instances( ImageId='ami-00b6a8a2bd28daf19', MinCount=1, MaxCount=2, InstanceType='t2.micro', KeyName='ec2-keypair' ) ``` t2.micro, t2.small, m5.large ... ] --- ## 수직적 시장 → 인공지능 시장 .center[ <img src="fig/slide-4th-industry-revolution-roadmap.png" width="100%" /> ] - 수직적(Vertical) 시장 → 플랫폼(Platform) 시장 → 인공지능(AI) 마켓으로 --- class: inverse, middle, center # 취업/채용 --- ## 산업역군(?) .center[ <iframe width="400" height="270" src="https://www.youtube.com/embed/t346si4gy_M" frameborder="0" allowfullscreen></iframe> <img src="fig/ai-basic-skills.png" width="37%" /> ] .footnote[ [MATT RICHTEL, "Reading, Writing, Arithmetic, and Lately, Coding"", The New York Time, MAY 10, 2014](http://www.nytimes.com/2014/05/11/us/reading-writing-arithmetic-and-lately-coding.html) ] --- ## 계급을 나누는 기준 - 데이터 .center[ <iframe width="560" height="315" src="https://www.youtube.com/embed/hL9uk4hKyg4" frameborder="0" allow="accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe> ] --- “고대에는 ’땅’이 가장 중요했고 땅이 소수에게 집중되자 인간은 귀족과 평민으로 구분됐으며, 근대에는 ’기계’가 중요해지면서 기계가 소수에게 집중되자 인간은 자본가와 노동자 계급으로 구분됐다”. 이제는 데이터가 또 한번 인류를 구분하는 기준이 될 것이다. 향후 데이터가 소수에게 집중되면 단순 계급에 그치는 게 아니라 **데이터**를 가진 종과 그렇지 못한 종으로 분류될 것이이다. - 유발 하라리(Yuval Noah Harari) --- ## AWS Data Science Meetup - 강의제목: "데이터 과학자의 클라우드 블로그" - 강의일시 - 2019년 9월 5일(목) 19:30 ~ - 강의장소: GS강남타워 역삼동 GS타워 12층 - 강의내용 - 데이터 과학자 vs. 개발자 - 데이터 과학자의 블로그 - Github 블로그 - 데이터 사이언스 블로그: `blogdown`, netlify - AWS 블로그: S3, Route 53 .footnote[ [데이터 과학자의 클라우드 블로그](https://statkclee.github.io/ds-authoring/ds-blog-aws-cloud.html#1) ] --- class: inverse, middle, center # 디지탈(Digital) 경제 --- ## 21세기 원유 데이터 <img src="fig/ds-industry.png" alt="데이터를 산업화" width="67%" /> .footnote[ [4차산업혁명과 대한민국 혁신성장 활로모색 - "데이터 자원과 사이언스와 엔지니어링 그리고 사업화"](https://statkclee.github.io/ds-authoring/ds-4th-ir.html) ] --- ## AI/ML/통계 - 들어가며 .center[ <img src="fig/ai-ml-statistics.png" alt="AI > ML > Statistics" alt="100%" /> ] --- ## 한걸음 더 들어갑니다 - 인공지능(AI) .center[ <img src="fig/maum.png" alt="AI 플랫폼 서비스" alt="100%" /> ] --- ## 소프트웨어 1.0과 2.0 - 소프트웨어 1.0: 사람이 직접 규칙(Rule)을 작성하여 똑똑한 시스템 개발 - 소프트웨어 2.0: 데이터에서 딥러닝 알고리즘을 활용하여 기계가 알고리즘(Algorithm)을 만듦 .center[ <img src="fig/programming_machine_learning_comparison.png" width="80%"> ] .footnote[ [궁극의 주인이 될 알고리즘(Master Algorithm)](https://statkclee.github.io/ai-lab/master-algorithm.html) ] --- ## 컴퓨터: 왜 슈퍼컴퓨터를 알아야 하나? .center[ <img src="fig/CPU-Scaling.jpg" width="50%"> ] .footnote[ [xwMOOC 고성능 R 아키텍처](http://statkclee.github.io/parallel-r/r-perf-arch.html) ] --- ## 컴퓨터: 고성능 컴퓨팅 기초 - 병렬 컴퓨팅 - 동시 실행과 병렬 실행 - 동기실행과 비동기 실행 - 분산 메모리과 공유 메모리 - 프로세스 vs. 쓰레드 - 실무에 병렬처리 적용 방법 - 비동기 프로그래밍 - 공유 메모리 프로그래밍 - 분산 메모리 프로그래밍 - 연쇄 작업(serial farming) .footnote[ [고성능 컴퓨팅(HPC) - 고성능 컴퓨팅 기초](http://statkclee.github.io/hpc/hpc-basic.html) ] --- ## 알고리즘: 딥러닝(Deep Learning) .center[ <img src="fig/three-pillars.png" width="90%"> ] .footnote[ [xwMOOC 딥러닝과 `\(H_2 O\)`](http://statkclee.github.io/deep-learning/) ] --- ## 데이터: 빅데이터 (Big data) .center[ <img src="fig/intree-xy-f.png" alt="정형데이터와 비정형 데이터, 그리고 기계학습" width="90%"> ] .footnote[ - [데이터 가져오기](https://statkclee.github.io/ingest-data/) - [직사각형 데이터](https://statkclee.github.io/data-science/) - [텍스트 데이터](https://statkclee.github.io/text/) - [네트워크 데이터](https://statkclee.github.io/network/) - [지리정보 데이터](https://statkclee.github.io/spatial/) - [이미지 데이터](https://statkclee.github.io/trilobite/) - 오디오/소리 데이터 - ... ] --- ## 복잡성을 이겨내는 소프트웨어 기술 .center[ <img src="fig/software-evolution.png" width="90%"> ] .footnote[ [xwMOOC 고성능 컴퓨팅(HPC) - 컴파일, 설치, 호출](https://statkclee.github.io/hpc/compile-install-call.html) ] --- class: inverse, middle, center # 기계학습 / 제품 개발 --- ## [얼굴 분석 - Face Analysis](https://itunes.apple.com/kr/app/%EC%96%BC%EA%B5%B4-%EB%B6%84%EC%84%9D-face-analysis/id1290130969?mt=8) .pull-left[ <img src="fig/face-analysis-app.png" alt="얼굴분석" width="65%" /> ] .pull-right[ - **클라우드 APIs** - [나이(Age): MS Face API](http://statkclee.github.io/deep-learning/ms-oxford-age.html) - [정보과학교육연합회-R을 이용한 인공지능 튜토리얼](http://statkclee.github.io/deep-learning/ms-oxford-kcode-tutorial.html) - [감정분석: MS Emotion API](http://statkclee.github.io/deep-learning/ms-oxford-video.html) - [국회의원 사진 - Computer Vision API](http://statkclee.github.io/deep-learning/ms-azure-computer-vision.html) ] .footnote[ [Azure Computer Vision API: Generate image captions with the Computer Vision API](http://blog.revolutionanalytics.com/2018/03/computer-vision-api.html) ] --- ## 기계가 인식하는 사물 - [사진속 객체 인식 - 작업흐름](https://statkclee.github.io/sw4ds/sw4ds-keras-image-object.html) - 국문: `~swc/author_carpentry_kr/tutorial/reproducible_finance/shiny` - 영문: `~swc/author_carpentry_kr/tutorial/reproducible_finance/shiny` - [비행기 vs 자동차 vs 배 인식](https://statkclee.github.io/deep-learning/r-keras-cnn.html) .footnote[ [xwMOOC, "이미지 분류 - 케라스(딥러닝)"](https://statkclee.github.io/data-product/shiny-image-classification.html) ] --- ## [API] 클라우드 API 호출 <br> <br> <br> .center[ <img src="fig/compile-source-call.png" alt="패러다임" width="100%" /> ] .footnote[ [고성능 컴퓨팅(HPC) 컴파일, 설치, 호출](http://statkclee.github.io/hpc/compile-install-call.html) ] --- ## [API] 데이터 사이언스와 API 프로그래밍 - 들어가며: 코드 몇줄로 엄청난 생산성!!! - [데이터 과학 – 기초 통계, `tidycensus` 기초](https://statkclee.github.io/statistics/tidycensus-basic.html) - 웹크롤링과 API 비교 - [데이터 과학 – 기초 통계, `kosis`와 `tidycensus` 비교](https://statkclee.github.io/statistics/tidycensus-kosis-comparison.html) - 유료와 무료 - [공간통계를 위한 데이터 사이언스, "지리정보 API - 주소와 위도경도"](https://statkclee.github.io/spatial/geo-info-lonlat.html) - AI 인공지능 - [xwMOOC 딥러닝, "텍스트와 이미지 API"](https://statkclee.github.io/deep-learning/ms-text-image.html) - [구글 클라우드 비젼 API](https://statkclee.github.io/deep-learning/r-google-vision-api.html) - [xwMOOC 딥러닝 - "IBM 왓슨"](https://statkclee.github.io/deep-learning/r-watson.html) - [유튜브 - "알릴레요 vs. 홍카콜라 - 댓글 분류"](https://statkclee.github.io/text/nlp-youtube-comment.html) .footnote[ - [안상선 M로보 대표 "MVP는 경운기 만드는 과정"](https://mirakle.mk.co.kr/view.php?year=2019&no=209240) - [이광춘 (2019-04-04), "'뉴스 데이터'라고 읽고 '텍스트 데이터'로 분석하여 사례 만들기"](https://statkclee.github.io/ds-authoring/ds_kpf.html), 한국언론진흥재단, “2019 뉴스빅데이터 해커톤 개최” ] --- ## [API] 한영 번역 - [데이터 사이언스를 위한 소프트웨어 공학, "파파고 API - 한영번역"](https://statkclee.github.io/sw4ds/sw4ds-api-papago-translation.html) ```python $ curl "https://openapi.naver.com/v1/papago/n2mt" \ -H "Content-Type: application/x-www-form-urlencoded; charset=UTF-8" \ -H "X-Naver-Client-Id: zRsZRLqoDEYE1AufliHS" \ -H "X-Naver-Client-Secret: i5n4wY0ZLi" \ -d "source=ko&target=en&text=만나서 반갑습니다." -v * Connection #0 to host openapi.naver.com left intact {"message":{"@type":"response","@service":"naverservice.nmt.proxy", "@version":"1.0.0","result":{"srcLangType":"ko","tarLangType":"en", "translatedText":"Nice to meet you."}}} ``` --- ## 데이터 저널리즘 .pull-left[ ### [데이터 저널리즘](https://statkclee.github.io/data-product/data-journalism-working-pop.html) <img src="fig/data-journalism-population.png" alt="생산가능 인구" width="100%" /> .footnote[ - [데이터 과학을 위한 저작도구](https://statkclee.github.io/ds-authoring/) - [언론에 비친 한국자산관리공사 - Shiny App](https://dl-dashboard.shinyapps.io/kamco/) ] ] .pull-right[ ### [동영상 감정 분석](https://statkclee.github.io/deep-learning/ms-oxford-video.html) <img src="fig/ms-cognitive-video.png" alt="슬픔은 어디에" width="100%" /> .footnote[ [KBS, 인공지능으로 분석한 대통령의 마음 슬픔은 어디에(2016.12.07)](http://news.kbs.co.kr/news/view.do?ncd=3390429) ] ] --- class: middle, center # [데이터를 제품으로](https://statkclee.github.io/ds-authoring/slides/ds_data_product.html#/) ### [South Korea Nuclear Power Plant(원자력 발전소)](https://dl-dashboard.shinyapps.io/npp_server/) --- class: middle, center # [이미지 분류 - 케라스(딥러닝)](https://statkclee.github.io/data-product/shiny-image-classification.html) --- ## 국회의원 인물정보 - **데이터 API** - [네이버 인물정보](https://statkclee.github.io/ingest-data/naver-people-info.html) - [슈퍼영웅(Super Heores) API ](https://statkclee.github.io/data-product/dp-superhero.html) - **클라우드 API** - [국회의원 사진 - MS 애저 Computer Vision API](https://statkclee.github.io/deep-learning/ms-azure-computer-vision.html) --- ## Document Engineering .center[ <img src="fig/df-pdf-df.png" alt="Dataframe to PDF back to Dataframe" width="100%" /> ] .footnote[ - [영문 이력서: PDF → 데이터프레임](https://statkclee.github.io/author_carpentry_kr/df-pdf-df.html) - [영문 이력서: 데이터프레임 → PDF](https://statkclee.github.io/author_carpentry_kr/df-pdf.html) ]