class: title-slide, left, bottom # R 개발자 관점에서 바라본 지역정보 수집과 분석 전략 ---- ## **krvote 데이터 패키지와 Shiny 대쉬보드, 그리고 인공지능(AI)** ### 이광춘 / 한국 R 사용자회 ### 2022-07-07 --- class: inverse, middle name: aisa-tidyverse-toc # 발표 개요 ---- .pull-left[ 디지털 전환이 급속도로 진행됨에 따라 데이터를 수집하고 처리할 수 없을 정도로 **.warmyellow[데이터가 폭증]**하고 있다. 무어의 법칙에 따라 컴퓨터 하드웨어와 네트워크 분야에서 눈부신 발전을 거듭하고 있고, 소프트웨어 분야도 오픈소스 문화가 정착됨에 따라 빅데이터 문제에 해법을 제시하고 있다. 하지만, 데이터를 통해 가치를 창출하는 **.warmyellow[데이터 과학자]**가 병목의 중심으로 부각되고 있다. 이에 `tidyverse` 패러다임이 이런 문제를 불식시킬 수 있는 은총알(Silver Bullet)로 제시되고 있다. 공공 지역정보 데이터 수집과 분석 전략을 **.warmyellow[`tidyverse` 패러다임]**으로 살펴보고, 특히 기술적으로 데이터 패키지와 대쉬보드, 배포와 서비스 관점을 면밀히 다뤄본다. 공공 지역정보 비정형데이터에 대한 최근 딥러닝 발전도 소개한다. ] .pull-right[ .left[ 1\. [tidyverse 패러다임](#aisa-tidyverse-toc) 2\. [대한민국 공공데이터](#aisa-public-data-toc) 3\. [데이터 패키지 - krvote](#aisa-krvote-toc) 4\. [대쉬보드 - flexdashboard](#aisa-dashboard-toc) 5\. [자동화, AI, 딥러닝](#aisa-ai-toc) ] ] <!--end of right-column--> <!-------------------------- 0. Tidyverse -----------------------------------------> --- name: aisa-tidyverse-toc # 데이터 과학 데이터 사이언스(Data Science)는 데이터를 다루는 과학이다. 따라서 자연법칙을 다루는 자연과학과 맥이 닿아있다. 자연법칙을 측정하여 데이터프레임(`DataFrame`)으로 나타내면 **변수(Variable)**, **관측점(Observation)**, **값(Value)**으로 표현된다. <img src="fig/data-science-overview.png" alt="데이터 사이언스 개요" width="100%" /> .footnote[ [Google Search - "데이터 과학"](https://www.google.com/search?q=%EB%8D%B0%EC%9D%B4%ED%84%B0+%EA%B3%BC%ED%95%99) ] --- name: tidyverse # AI/ML/DL vs 데이터 과학 <br> .center[ <img src="fig/tidyvese_os.png" width="77%" /> ] .footnote[ [한국통계학회 소식지 2019년 10월호 ](https://statkclee.github.io/ds-authoring/ds-stat-tidyverse.html) ] --- name: tidyverse-definition # `tidyverse` <br> .center[ <img src="fig/maso_tidyverse.png" width="77%" /> ] .pull-left[ - 기존 자료구조를 재사용 - 파이프 연산자로 간단한 함수를 조합 - 함수형 프로그래밍을 적극 사용 - 기계가 아닌 인간을 위한 설계 ] .pull-right[ - Reuse existing data structures. - Compose simple functions with the pipe. - Embrace functional programming. - Design for humans. ] --- name: data-science-graph ## Big Data/AI/ML/Data Science <br> .pull-left[ ### Google Trends: 미국 ![](fig/google-trends-comparison-us-1.png) ] .pull-right[ ### Google Trends: 대한민국 ![](fig/google-trends-comparison-kr-1.png) ] .footnote[ [이광춘 (2020-07-21), "기업운영혁신을 위한 데이터 과학: 기업의 활용방안", 포항산업과학연구원(RIST)](https://statkclee.github.io/ds-authoring/ds-rist.html) ] --- name: avengers-problem # 펭귄 어벤저스 .center[ ![](fig/shiny-python.png) ] .footnote[ [펭귄 성별예측모형: 파이썬 + `Shiny`](https://statkclee.github.io/model/tidyverse-penguin-python-shiny.html) ] --- names: avengers-penguin # 펭귄 데이터셋 .center[ ![](fig/penguin-dataset.png) ] .footnote[ - [펭귄 vs 붓꽃 데이터](https://statkclee.github.io/data-science/ds-iris-penguin.html) ] --- name: avengers-architecture # 모형 아키텍쳐 <br> <br> | 앙상블 | Random Forest | XGBoost | |--------|----------------|---------| |![](fig/penguin-arch-ensemble.png)| ![](fig/penguin-arch-rf.png) | ![](fig/penguin-arch-xgb.png) | .footnote[ - [펭귄 성별예측모형: tidymodels](https://statkclee.github.io/model/tidyverse-parsnip-penguin.html) ] --- name: avengers-tuning # 모형 최적화: Hyper Parameter Tuning <br> <br> .center[ ![](fig/xgboost-python.png) ] .footnote[ - [펭귄 성별예측모형: tidymodels - Hyper Parameter](https://statkclee.github.io/model/tidyverse-parsnip-penguin-hyper-parameter.html) ] --- name: avengers-restful # 모형 배포: RESTful API <br> <br> .center[ <img src = "fig/penguin-restful-api.png" width = "100%" /> ] .footnote[ - [펭귄 성별예측모형: tidymodels - RESTful API](https://statkclee.github.io/model/tidyverse-parsnip-penguin-RESTful-api.html) ] --- name: avengers-explainable-ai # 설명가능한 예측모형: Explainable AI .center[ ![](fig/mdp-DALEX.png) ] .footnote[ - [펭귄 성별예측모형: tidymodels - MDP / DALEX](https://statkclee.github.io/model/tidyverse-parsnip-penguin-DALEX.html) ] --- name: avengers-frontend-backed # Shiny Front-End + `tidymodels` Back-End .center[ ![](fig/penguin-shiny-predictive-model.gif) ] .footnote[ - [펭귄 성별예측모형: `tidymodels` - Shiny](https://statkclee.github.io/model/tidyverse-parsnip-penguin-shiny.html) ] --- name: avengers-shiny-python # Shiny Front-End + Python Back-End .center[ ![](fig/shiny-fe-python-be.gif) ] .footnote[ - [펭귄 성별예측모형: 파이썬 - `Shiny`](https://statkclee.github.io/model/tidyverse-penguin-python-shiny.html) ] --- name: avengers-model # 데이터 과학 EDA 환경: R + 파이썬 .center[ <img src= "fig/ds-avengers-model.png" width="77%" /> ] .footnote[ - [데이터 과학 개발 환경: R+파이썬](https://statkclee.github.io/data-science/ds-languages.html) ] <!-------------------------- 1. 데이터 포탈 -----------------------------------------> --- class: inverse, middle name: aisa-public-data-toc # 발표 개요 ---- .pull-left[ 디지털 전환이 급속도로 진행됨에 따라 데이터를 수집하고 처리할 수 없을 정도로 **.warmyellow[데이터가 폭증]**하고 있다. 무어의 법칙에 따라 컴퓨터 하드웨어와 네트워크 분야에서 눈부신 발전을 거듭하고 있고, 소프트웨어 분야도 오픈소스 문화가 정착됨에 따라 빅데이터 문제에 해법을 제시하고 있다. 하지만, 데이터를 통해 가치를 창출하는 **.warmyellow[데이터 과학자]**가 병목의 중심으로 부각되고 있다. 이에 `tidyverse` 패러다임이 이런 문제를 불식시킬 수 있는 은총알(Silver Bullet)로 제시되고 있다. 공공 지역정보 데이터 수집과 분석 전략을 **.warmyellow[`tidyverse` 패러다임]**으로 살펴보고, 특히 기술적으로 데이터 패키지와 대쉬보드, 배포와 서비스 관점을 면밀히 다뤄본다. ] .pull-right[ .left[ 1\. [`tidyverse` 패러다임](#aisa-tidyverse-toc) 2\. **[.warmyellow[대한민국 공공데이터]](#aisa-public-data-toc)** 3\. [데이터 패키지 - `krvote`](#aisa-krvote-toc) 4\. [대쉬보드 - `flexdashboard`](#aisa-dashboard-toc) 5\. [자동화, AI, 딥러닝](#aisa-ai-toc) ] ] <!--end of right-column--> --- name: asia-public-data # 공공데이터 포털
.footnote[ - [김학래, "2022 데이터 인사이트 세미나", 중앙대학교 HIKE 연구실](https://forum.datahub.kr/t/topic/128) ] --- name: asia-public-data-type # 공공데이터 자료 제공 형식
.footnote[ - [김학래, "2022 데이터 인사이트 세미나", 중앙대학교 HIKE 연구실](https://forum.datahub.kr/t/topic/128) ] --- name: asia-public-data-type # 공공데이터 정해진 미래(?) <br> .center[ ![](fig/hike-data-insight.jpg) ] .footnote[ - [김학래, "2022 데이터 인사이트 세미나", 중앙대학교 HIKE 연구실](https://forum.datahub.kr/t/topic/128) ] <!-------------------------- 2. 데이터 패키지 -----------------------------------------> --- class: inverse, middle name: aisa-krvote-toc # 발표 개요 ---- .pull-left[ 디지털 전환이 급속도로 진행됨에 따라 데이터를 수집하고 처리할 수 없을 정도로 **.warmyellow[데이터가 폭증]**하고 있다. 무어의 법칙에 따라 컴퓨터 하드웨어와 네트워크 분야에서 눈부신 발전을 거듭하고 있고, 소프트웨어 분야도 오픈소스 문화가 정착됨에 따라 빅데이터 문제에 해법을 제시하고 있다. 하지만, 데이터를 통해 가치를 창출하는 **.warmyellow[데이터 과학자]**가 병목의 중심으로 부각되고 있다. 이에 `tidyverse` 패러다임이 이런 문제를 불식시킬 수 있는 은총알(Silver Bullet)로 제시되고 있다. 공공 지역정보 데이터 수집과 분석 전략을 **.warmyellow[`tidyverse` 패러다임]**으로 살펴보고, 특히 기술적으로 데이터 패키지와 대쉬보드, 배포와 서비스 관점을 면밀히 다뤄본다. ] .pull-right[ .left[ 1\. [`tidyverse` 패러다임](#aisa-tidyverse-toc) 2\. [대한민국 공공데이터](#aisa-public-data-toc) 3\. **[.warmyellow[데이터 패키지 - `krvote`]](#aisa-krvote-toc)** 4\. [대쉬보드 - `flexdashboard`](#aisa-dashboard-toc) 5\. [자동화, AI, 딥러닝](#aisa-ai-toc) ] ] <!--end of right-column--> --- name: asia-krvote # 패키지 / 라이브러리 제작 이유 .center[ ![](fig/asia-pkg-why.jpg) ] .footnote[ - [Desirée De Leon, Alison Hill, "A Handbook for Teaching and Learning with R and RStudio", 2019-09-11](https://rstudio4edu.github.io/rstudio4edu-book/)] --- name: asia-krvote-process # R 데이터 패키지 .center[ ![](fig/asia-pkg-overview.jpg) ] .footnote[ - [Desirée De Leon, Alison Hill, "A Handbook for Teaching and Learning with R and RStudio", 2019-09-11](https://rstudio4edu.github.io/rstudio4edu-book/)] --- name: asia-krvote-nec # 주요 선거 일정 <br> <br> <br> <!-- Timeline generated in R 4.2.0 by googleVis 0.7.0 package --> <!-- Fri Jun 10 11:12:09 2022 --> <!-- jsHeader --> <script type="text/javascript"> // jsData function gvisDataTimelineID59b41203625d () { var data = new google.visualization.DataTable(); var datajson = [ [ "대통령", "15대", new Date(1997,11,18,0,0,0), new Date(2002,11,18,0,0,0) ], [ "대통령", "16대", new Date(2002,11,19,0,0,0), new Date(2007,11,18,0,0,0) ], [ "대통령", "17대", new Date(2007,11,19,0,0,0), new Date(2012,11,19,0,0,0) ], [ "대통령", "18대", new Date(2012,11,19,0,0,0), new Date(2017,4,9,0,0,0) ], [ "대통령", "19대", new Date(2017,4,10,0,0,0), new Date(2022,4,9,0,0,0) ], [ "대통령", "20대", new Date(2022,4,10,0,0,0), new Date(2027,4,9,0,0,0) ], [ "국회의원", "17대", new Date(2004,4,30,0,0,0), new Date(2008,4,29,0,0,0) ], [ "국회의원", "18대", new Date(2008,4,30,0,0,0), new Date(2012,4,29,0,0,0) ], [ "국회의원", "19대", new Date(2012,4,30,0,0,0), new Date(2016,4,29,0,0,0) ], [ "국회의원", "20대", new Date(2016,4,30,0,0,0), new Date(2020,4,29,0,0,0) ], [ "국회의원", "21대", new Date(2020,4,30,0,0,0), new Date(2024,4,29,0,0,0) ], [ "지방선거", "3회", new Date(2002,6,1,0,0,0), new Date(2006,5,30,0,0,0) ], [ "지방선거", "4회", new Date(2006,6,1,0,0,0), new Date(2010,5,30,0,0,0) ], [ "지방선거", "5회", new Date(2010,6,1,0,0,0), new Date(2014,5,30,0,0,0) ], [ "지방선거", "6회", new Date(2014,6,1,0,0,0), new Date(2018,5,30,0,0,0) ], [ "지방선거", "7회", new Date(2018,6,1,0,0,0), new Date(2022,5,30,0,0,0) ], [ "지방선거", "8회", new Date(2022,6,1,0,0,0), new Date(2026,5,30,0,0,0) ] ]; data.addColumn('string','type'); data.addColumn('string','subtype'); data.addColumn('datetime','start'); data.addColumn('datetime','end'); data.addRows(datajson); return(data); } // jsDrawChart function drawChartTimelineID59b41203625d() { var data = gvisDataTimelineID59b41203625d(); var options = {}; options["width"] = 600; options["height"] = 550; var chart = new google.visualization.Timeline( document.getElementById('TimelineID59b41203625d') ); chart.draw(data,options); } // jsDisplayChart (function() { var pkgs = window.__gvisPackages = window.__gvisPackages || []; var callbacks = window.__gvisCallbacks = window.__gvisCallbacks || []; var chartid = "timeline"; // Manually see if chartid is in pkgs (not all browsers support Array.indexOf) var i, newPackage = true; for (i = 0; newPackage && i < pkgs.length; i++) { if (pkgs[i] === chartid) newPackage = false; } if (newPackage) pkgs.push(chartid); // Add the drawChart function to the global list of callbacks callbacks.push(drawChartTimelineID59b41203625d); })(); function displayChartTimelineID59b41203625d() { var pkgs = window.__gvisPackages = window.__gvisPackages || []; var callbacks = window.__gvisCallbacks = window.__gvisCallbacks || []; window.clearTimeout(window.__gvisLoad); // The timeout is set to 100 because otherwise the container div we are // targeting might not be part of the document yet window.__gvisLoad = setTimeout(function() { var pkgCount = pkgs.length; google.load("visualization", "1", { packages:pkgs, callback: function() { if (pkgCount != pkgs.length) { // Race condition where another setTimeout call snuck in after us; if // that call added a package, we must not shift its callback return; } while (callbacks.length > 0) callbacks.shift()(); } }); }, 100); } // jsFooter </script> <!-- jsChart --> <script type="text/javascript" src="https://www.google.com/jsapi?callback=displayChartTimelineID59b41203625d"></script> <!-- divChart --> <div id="TimelineID59b41203625d" style="width: 600; height: 550;"> </div> .footnote[ - [이광춘, "krvote - 대한민국 선거 데이터 패키지", 2022-06-09](https://ai-carpentry.github.io/krvote/)] --- name: asia-krvote-sources # krvote 원천 데이터 .panelset[ .panel[.panel-name[중앙선관위 - 웹사이트] .center[ <img src="fig/asia-nec-info.jpg" alt="중앙선관위 - 웹사이트" width="80%" /> ] ] .panel[.panel-name[중앙선관위 - 자료실] .center[ <img src="fig/asia-general-files.jpg" alt="중앙선관위 - 자료실" width="70%" /> ] ] .panel[.panel-name[공공데이터포털 - API] .center[ <img src="fig/asia-data-portal-api.jpg" alt="공공데이터포털 - API 명세" width="80%" /> ] ] ] --- name: asia-krvote-workflow # krvote 데이터 전처리 작업 <br> <br> .center[ ![](fig/asia-data-workflow.png) ] .footnote[ - [이광춘, "krvote - 대한민국 선거 데이터 패키지", 2022-06-09](https://ai-carpentry.github.io/krvote/)] --- name: asia-krvote-workflow-after # krvote 데이터 패키지 제작 작업 <br> <br> .center[ ![](fig/asia-data-workflow-pkg.png) ] .footnote[ - [이광춘, "krvote - 대한민국 선거 데이터 패키지", 2022-06-09](https://ai-carpentry.github.io/krvote/)] --- name: asia-krvote-inside # krvote 살펴보기
.footnote[ - [이광춘, "krvote - 대한민국 선거 데이터 패키지", 2022-06-09](https://ai-carpentry.github.io/krvote/)] <!-------------------------- 3. 대쉬보드 -----------------------------------------> --- class: inverse, middle name: aisa-dashboard-toc # 발표 개요 ---- .pull-left[ 디지털 전환이 급속도로 진행됨에 따라 데이터를 수집하고 처리할 수 없을 정도로 **.warmyellow[데이터가 폭증]**하고 있다. 무어의 법칙에 따라 컴퓨터 하드웨어와 네트워크 분야에서 눈부신 발전을 거듭하고 있고, 소프트웨어 분야도 오픈소스 문화가 정착됨에 따라 빅데이터 문제에 해법을 제시하고 있다. 하지만, 데이터를 통해 가치를 창출하는 **.warmyellow[데이터 과학자]**가 병목의 중심으로 부각되고 있다. 이에 `tidyverse` 패러다임이 이런 문제를 불식시킬 수 있는 은총알(Silver Bullet)로 제시되고 있다. 공공 지역정보 데이터 수집과 분석 전략을 **.warmyellow[`tidyverse` 패러다임]**으로 살펴보고, 특히 기술적으로 데이터 패키지와 대쉬보드, 배포와 서비스 관점을 면밀히 다뤄본다. ] .pull-right[ .left[ 1\. [`tidyverse` 패러다임](#aisa-tidyverse-toc) 2\. [대한민국 공공데이터](#aisa-public-data-toc) 3\. [데이터 패키지 - `krvote`](#aisa-krvote-toc) 4\. **[.warmyellow[대쉬보드 - `flexdashboard`]](#aisa-dashboard-toc)** 5\. [자동화, AI, 딥러닝](#aisa-ai-toc) ] ] <!--end of right-column--> --- name: asia-krvote-ohmynews # 뉴스기사 .center[ <img src= "fig/asia-ohmynews.jpeg" width="90%"> ] .footnote[ - [이광춘, "지방선거 시도지사 절반, 5월 12일 결정된다 - 역대 선거 시도지사 정당별 득표율 데이터를 통해 본 6월 1일 지방선거", 2022-03-24, 오마이뉴스](http://omn.kr/1xylg)] --- name: asia-krvote-example class: inverse, middle, center # krvote 유용성 <br> <br> [제19대 대통령 선거 결과](https://aispiration.com/president/president-election-2017.html) --- name: asia-krvote-president class: inverse, middle, center # 대통령선거 대쉬보드 [제20대 대통령 선거 대쉬보드](https://aispiration.com/president/social-dashboard.html) --- name: asia-krvote-local-election class: inverse, middle, center # 지방선거 대쉬보드 [제8대 경기지사 대쉬보드](https://aispiration.com/president/gg-dashboard.html) <!-------------------------- 4. 인공지능 -----------------------------------------> --- class: inverse, middle name: aisa-ai-toc # 발표 개요 ---- .pull-left[ 디지털 전환이 급속도로 진행됨에 따라 데이터를 수집하고 처리할 수 없을 정도로 **.warmyellow[데이터가 폭증]**하고 있다. 무어의 법칙에 따라 컴퓨터 하드웨어와 네트워크 분야에서 눈부신 발전을 거듭하고 있고, 소프트웨어 분야도 오픈소스 문화가 정착됨에 따라 빅데이터 문제에 해법을 제시하고 있다. 하지만, 데이터를 통해 가치를 창출하는 **.warmyellow[데이터 과학자]**가 병목의 중심으로 부각되고 있다. 이에 `tidyverse` 패러다임이 이런 문제를 불식시킬 수 있는 은총알(Silver Bullet)로 제시되고 있다. 공공 지역정보 데이터 수집과 분석 전략을 **.warmyellow[`tidyverse` 패러다임]**으로 살펴보고, 특히 기술적으로 데이터 패키지와 대쉬보드, 배포와 서비스 관점을 면밀히 다뤄본다. 공공 지역정보 비정형데이터에 대한 최근 딥러닝 발전도 소개한다. ] .pull-right[ .left[ 1\. [tidyverse 패러다임](#aisa-tidyverse-toc) 2\. [대한민국 공공데이터](#aisa-public-data-toc) 3\. [데이터 패키지 - krvote](#aisa-krvote-toc) 4\. [대쉬보드 - flexdashboard](#aisa-dashboard-toc) 5\. **[.warmyellow[자동화, AI, 딥러닝]](#aisa-ai-toc)** ] ] <!--end of right-column--> --- name: automation-tax # 세무사 업무 변천과정 <br> <br> <br> .center[ ![세무 업무 변천사](fig/tax-preparation.png) ] .footnote[ [이광춘 (2019-12-04), "자동화(Automation) - ~~로봇~~ 자동화가 빼앗는 일자리 그리고 나", 분당 서현 청소년 수련관 ](https://statkclee.github.io/ds-authoring/ds-bundang-2019.html) ] --- name: automation-productivity-gap # 생산성과 임금 격차 <br>
.footnote[ [Economic Policy Institute, "The Productivity - Pay Gap", July 2019](https://www.epi.org/productivity-pay-gap/) ] --- name: automation-sourcing-strategy # 소싱전략의 변화 <br> <br> .center[ ![소싱 전략의 변화](fig/the-end-of-outsourcing.png) ] .footnote[ 자료출처: Kinetics consulting services / Automation Anywhere ] --- name: automation-apollo # 아폴로 우주선 <br> .center[ ![아폴로 계획에 대한 역할 구분](fig/man-machine-role-allocation.png) ] .footnote[ [Mary (Missy) Cummings (2014), "Man versus Machine or Man + Machine?", Duke University and MIT](https://hal.pratt.duke.edu/sites/hal.pratt.duke.edu/files/u10/IS-29-05-Expert%20Opinion[1]_0.pdf) ] --- name: automation-role-allocation # 인간과 기계 업무분장 <br> .center[ <img src="fig/role-allocation-skill-rules-experties.gif" width = "77%" /> ] .footnote[ [Mary (Missy) Cummings (2017), "Informing Autonomous System Design Through the Lens of Skill-, Rule-, and Knowledge-Based Behaviors", Duke University](https://hal.pratt.duke.edu/sites/hal.pratt.duke.edu/files/u10/IS-29-05-Expert%20Opinion[1]_0.pdf) ] --- name: automation-jobs # Human Supervisory Control <br> <br> .center[ ![human-supervisory-control](fig/human-supervisory-control.png) ] .footnote[ [Mary (Missy) Cummings (2017), "Informing Autonomous System Design Through the Lens of Skill-, Rule-, and Knowledge-Based Behaviors", Duke University](https://hal.pratt.duke.edu/sites/hal.pratt.duke.edu/files/u10/IS-29-05-Expert%20Opinion[1]_0.pdf) ] --- name: automation-paradox # 모라벡의 역설(Moravec’s paradox) <br> .center[ <img src="fig/moravec-paradox.png" width = "87%" /> ] .footnote[ 미국 카네기 멜론 대학 (CMU) 로봇 공학자 한스 모라벡(Hans Moravec)이 1970년대에 ‘it is comparatively easy to make computers exhibit adult level performance on intelligence tests or playing checkers, and difficult or impossible to give them the skills of a one-year-old when it comes to perception and mobility’라는 표현으로 컴퓨터와 인간의 능력 차이를 역설적으로 표현하였다. ] --- name: automation-comparison # 중국어 방 (Chinese room) <br> <br> .pull-left[ ![중국어 방 주장을 모사한 도해](fig/chinese-room-argument.jpg) ] .pull-right[ | 인공지능 | 컴퓨터 | 인간 | |:---------:|:-----------------:|:---------------------:| | 중국어 방 | 하드웨어 | 인간의 외형적인 몸체 | | 영어만 할 줄 아는 사람| 소프트웨어| 인간의 지능 | | 중국어로 된 질문 | 입력(Input) | 인간이 외부에서 접할 수 있는 자극 | | 중국어로 된 답변 | 출력(Output) | 인간이 외부에서 접한 자극에 대한 반응 | | 질문&대답 목록 | 데이터베이스(Database) | 습득된 기억 | ] .footnote[ [중국어 방 역설 (Chinese room argument) - 대체 누가 중국어를 이해하고 있는가?](http://ko.experiments.wikidok.net/wp-d/592f718da44f1a4153e80611/View) ] --- name: dl-timeline # 기계학습 분류 <br> <br> .center[ <img src="fig/machine-learning-classification.png" alt="기계학습 분류" width="100%" /> ] --- name: dl-timeline # 신경망 모형 여정 <br> <br> .center[ <img src="fig/dl-timeline.png" alt="timeline" width="100%" /> ] .footnote[ Liangqu Long, Xiangming Zeng (2022), "Beginning Deep Learning with TensorFlow: Work with Keras, MNIST Data Sets, and Advanced Neural Networks", Apress ] --- name: dl-applicatin # 딥러닝 활용사례 .panelset[ .panel[.panel-name[이미지 데이터] .center[ <img src="fig/dl-image.png" alt="이미지 데이터" width="100%" /> ] ] .panel[.panel-name[텍스트 데이터] .center[ <img src="fig/dl-text.png" alt="텍스트 데이터" width="100%" /> ] ] .panel[.panel-name[정형 데이터] .center[ <img src="fig/dl-csv.png" alt="정형데이터" width="100%" /> ] ] .panel[.panel-name[...] ] ] --- name: human-performance # 딥러닝 알고리즘 성능 - 이미지 <br> <br> <img src="bitstat-asia_files/figure-html/unnamed-chunk-9-1.png" style="display: block; margin: auto;" /> .footnote[ [Image Classification on ImageNet](https://paperswithcode.com/sota/image-classification-on-imagenet) ] --- name: human-performance-nlp # 딥러닝 알고리즘 성능 - 텍스트 <br> <br> <img src="bitstat-asia_files/figure-html/unnamed-chunk-10-1.png" style="display: block; margin: auto;" /> .footnote[ [SQuAD2.0 - The Stanford Question Answering Dataset](https://rajpurkar.github.io/SQuAD-explorer/) ] --- name: deep-learning-vs-software # 소프트웨어 2.0 vs. 딥러닝 모형 <br> <br> .center[ ![](fig/software-versions.png) ] .footnote[ Domingos, Pedro. The master algorithm: How the quest for the ultimate learning machine will remake our world. Basic Books, 2015. ] --- name: hidden-technical-debt # 기계학습(딥러닝) 기여분 <br> <br> .center[ ![](fig/hidden-technical-debt.png) ] .footnote[ Sculley, David, et al. "Hidden technical debt in machine learning systems." Advances in neural information processing systems 28 (2015). ] --- name: deep-learning-end2end # 딥러닝 모형 개발 범위 <br> .center[ <img src = "fig/end2end-deep-learning.png" width = "87%"> ] .footnote[ Eli Stevens, Luca Antiga, and Thomas Viehmann (2020), "Deep Learning with PyTorch", Manning. ] --- name: nlp-transformers # Attention & Transformers <br> <br> .center[ <img src = "fig/transformers-attention.png" width = "100%"> ] .footnote[ [Lilian Weng (June 24, 2018), "Attention? Attention!"](https://lilianweng.github.io/posts/2018-06-24-attention/) ] --- name: nlp-bert-gpt # Attention & Transformers → GPT, BERT <br> .center[ <img src = "fig/transformers-gpt-bert.png" width = "100%"> ] .footnote[ [ratsgo's NLPBOOK](https://ratsgo.github.io/nlpbook/docs/language_model/) ] --- name: nlp-big-picture # 인공지능 엔진 개발 <br> .center[ <img src = "fig/big-picture.png" width = "100%"> ] <!-------------------------- 마무리 -----------------------------------------> --- name: asia-goodbye class: middle, inverse .pull-left[ # **경청해 주셔서 <br>감사합니다.** <br/> ## [한국 R 사용자회](https://r2bit.com/) ] .pull-right[ .right[ <img style="border-radius: 100%;" src="fig/korea_R_logo.png" width="300px"/> ] ]