데이터 과학
기계와의 경쟁을 준비하며…
“The future is here, it’s just not evenly distributed yet.”
- William Gibson
R, RStudio, tidyverse
, 스파크, AWS 와 함께하는 데이터 과학
- 데이터 과학과 R 언어
- 측도와 R 자료구조
- 데이터프레임 스키마(Dataframe Schema)
- 날짜/시간 데이터:
2018-06-23
일부터 금융, 시계열로 이동 - 요인(Factor) - 범주형 자료형
- 결측 데이터(Missing Data)
- 빅데이터 -
tidyverse
스파크 - 데이터 정제(Data Cleaning): 데이터 과학자가 아니라 청소부
- 관계형 데이터베이스(RDBMS)
tidyverse
데이터 사이언스 기본체계- 깔끔한 데이터와 모형 –
broom
- 데이터 과학 개발 환경: R+파이썬, 데이터 과학 툴체인 - 파이썬
- R 팩키지 - 헬로우 월드
- 다양한 데이터
- 정렬(Sort)
xwMOOC 오픈 교재
- 컴퓨팅 사고력(Computational Thinking)
- 데이터 과학
- R 데이터과학
- 시각화
- 데이터 과학– 기초 통계
- 보안 R - TBA
- 다양한 데이터
- 텍스트 - 자연어처리(NLP)
- 네트워크(network)
- 공간통계를 위한 데이터 과학
- 고생대 프로젝트
- 금융(finance)
- 자동차 데이터 분석
- 비즈니스 프로세스(Business Process) - bupar
R 팩키지통계적 사고
- 빅데이터
- 기계학습, 딥러닝, 인공지능
- IoT 오픈 하드웨어(라즈베리 파이)
- 선거와 투표