|
데이터 과학 (Data Science) - 3월16일
|
데이터 과학을 이해한다.
스프레드쉬트의 한계를 명확히 한다.
데이터 과학의 현재 위치를 살펴본다.
개인 데이터 과학 블로그를 생성한다.
|
|
프로그래밍 기초와 마크다운 보고서 - 3월23일
|
초중등 교육과정 코딩을 스펀지처럼 흡수한다.
R 마크다운으로 작성한 보고서와 R로 작성한 소프트웨어를 섞어쓴다.
포맷을 제어하는데 덩어리 선택옵션(chunk options)으로 지정한다.
knitr 팩키지를 사용해서 문서를 PDF를 비롯한 다른 포맷으로 변환시킨다.
|
|
데이터와 커뮤니티 찾기, 도움 청하기, 프로젝트 설정 - 3월30일
|
help() 함수를 사용해서 온라인 도움을 얻는다.
RStudio를 사용해서 일관된 방식으로 프로젝트를 생성하고 관리한다.
원데이터는 읽기 전용으로 처리한다.
자동생성된 출력물은 사용후 버릴 수 있는 것으로 처리한다.
함수 정의와 응용을 분리한다.
|
|
데이터 가져오기(Data Ingestion) - 4월06일
|
|
|
자료구조(Data Structures) - 4월13일
|
read.csv 함수를 사용해서 R에 표형태 데이터를 불러온다.
R의 기본자료형은 실수형, 정수형, 복소수형, 논리형, 문자형이다
R에서 인자를 사용해서 범주를 표현한다.
|
|
데이터프레임과 SQL - 4월20일
|
cbind() 함수를 사용해서 데이터프레임에 칼럼을 추가한다.
rbind() 함수를 사용해서 데이터프레임에 행을 추가한다.
데이터프레임에서 행을 제거한다.
na.omit() 명령문을 사용해서, NA 값을 갖는 행을 데이터프레임에서 제거한다.
levels()과 as.character() 함수를 사용해서 요인을 타맥하고 조작한다.
str(), nrow(), ncol(), dim(), colnames(), rownames(), head(), typeof() 함수를 사용해서 데이터프레임 구조를 파악한다.
read.csv() 함수를 사용해서 CSV 파일을 불러온다.
데이터프레임 length()가 나타내는 것이 무엇인지 이해한다.
|
|
버전제어, 협업, 그리고 저작권과 라이선스 - 4월27일
|
버전 제어는 무한정 ‘실행취소(undo)’하는 것과 같다.
버전 제어는 많은 분들이 병렬로 작업하는 것도 가능하게 한다.
공개 과학 작업은 폐쇄적인 과학 작업보다 더 유용하고 더 많이 인용된다.
|
|
중간고사 - 5월04일(특강)
|
|
|
시각화 (Visualization) - 5월11일
|
ggplot2를 사용해서 그래프를 생성한다.
그래프(graphics)를 계층으로 생각한다:aesthetics, 기하(geometry), 통계(statistics), 척도변환(scale transformation), 그룹(grouping).
정적, 인터랙티브, 애니메이션으로 시각화를 구현한다.
|
|
정규표현식 - 5월18일
|
|
|
데이터 과학 프로그래밍 - 5월25일
|
|
|
함수형 프로그래밍 - 6월01일
|
함수를 왜, 언제, 어떻게 작성하는지 파악한다.
함수를 다양한 관점에서 이해한다.
데이터 과학 심화과정에 등장하는 함수형 프로그래밍 용어에 친숙해진다.
|
|
데이터 과학 제품(논문 등) - 6월08일
|
|
|
데이터 과학 저작 - 6월15일
|
OSMU - One Source Multi Use 원칙을 견지한다.
텍스트, 수식, 그림/표, 통계, 모형을 반영한 글쓰기를 한다.
사람이 글쓰기 잘하는 영역과 기계가 글쓰기 잘 하는 영역을 명확히 한다.
|
|
R 팩키지 - 6월22일
|
데이터 기반 R 팩키지를 개발한다.
함수 기반 R 팩키지를 개발한다.
R 팩키지 개발관련 기반 기술을 이해한다.
|
|
기말고사 - 6월22일
|
|
The following is an overview of a standard Unix filesystem.
The exact hierarchy depends on the platform,
so you may not see exactly the same files/directories on your computer: