데이터 과학 (Data Science) - 3월16일

Overview

Teaching: 180 min
Exercises: 0 min
Questions
  • 데이터 과학이란 무언인가?

  • 왜 엑셀 해방운동을 펼치는가?

  • 왜 GUI는 데이터 과학의 미래가 될 수 없는가?

  • 데이터 과학 블로그를 만들기 정말 어렵습니까?

Objectives
  • 데이터 과학을 이해한다.

  • 엑셀(스프레드쉬트)의 장단점을 살펴본다.

  • CLI와 GUI 활용분야를 파악한다.

  • 개인 블로그를 구축한다.

왜 데이터 과학일까?

과학은 다단계 과정이다: 실험을 설계하고 데이터를 수집하게 되면, 실제로 재미난 일이 시작된다. 이번 학습을 통해서 데이터 과학 양대 언어 중 하나인 R과 통합개발환경(IDE) RStudio를 사용해서 이런 과정을 시작하는 방법을 학습할 것이다. 원본 데이터(raw data)로 시작해서 탐색적 데이터 분석을 수행하고 분석결과를 시각화하는 방법을 학습할 것이다. 세월에 따른 국가별 인구 정보를 담고 있는 gapminder.org로부터 나온 데이터셋을 비롯하여 다양한 저장소에서 데이터를 추출하여 데이터를 이해하고, 탐색하고, 추론하고, 모형형화하고, 커뮤니케이션 및 제품과 서비스 개발하는 전체 과정을 Hands-on으로 실습하여 체화해 나간다.

데이터 과학(Data Science)

빅데이터를 넘은 데이터 과학 Tidyverse로 향하다

엑셀 해방운동

Hadley Wickham → 코딩 1

R과 RStudio 소개

재현가능한 과학적 분석을 위한 R - “R과 RStudio 소개”

데이터 과학 블로그(blog)

Key Points

  • 데이터 과학을 이해한다.

  • 스프레드쉬트의 한계를 명확히 한다.

  • 데이터 과학의 현재 위치를 살펴본다.

  • 개인 데이터 과학 블로그를 생성한다.