데이터 과학 (Data Science) - 3월16일
|
데이터 과학을 이해한다.
스프레드쉬트의 한계를 명확히 한다.
데이터 과학의 현재 위치를 살펴본다.
개인 데이터 과학 블로그를 생성한다.
|
프로그래밍 기초와 마크다운 보고서 - 3월23일
|
초중등 교육과정 코딩을 스펀지처럼 흡수한다.
R 마크다운으로 작성한 보고서와 R로 작성한 소프트웨어를 섞어쓴다.
포맷을 제어하는데 덩어리 선택옵션(chunk options)으로 지정한다.
knitr 팩키지를 사용해서 문서를 PDF를 비롯한 다른 포맷으로 변환시킨다.
|
데이터와 커뮤니티 찾기, 도움 청하기, 프로젝트 설정 - 3월30일
|
help() 함수를 사용해서 온라인 도움을 얻는다.
RStudio를 사용해서 일관된 방식으로 프로젝트를 생성하고 관리한다.
원데이터는 읽기 전용으로 처리한다.
자동생성된 출력물은 사용후 버릴 수 있는 것으로 처리한다.
함수 정의와 응용을 분리한다.
|
데이터 가져오기(Data Ingestion) - 4월06일
|
|
자료구조(Data Structures) - 4월13일
|
read.csv 함수를 사용해서 R에 표형태 데이터를 불러온다.
R의 기본자료형은 실수형, 정수형, 복소수형, 논리형, 문자형이다
R에서 인자를 사용해서 범주를 표현한다.
|
데이터프레임과 SQL - 4월20일
|
cbind() 함수를 사용해서 데이터프레임에 칼럼을 추가한다.
rbind() 함수를 사용해서 데이터프레임에 행을 추가한다.
데이터프레임에서 행을 제거한다.
na.omit() 명령문을 사용해서, NA 값을 갖는 행을 데이터프레임에서 제거한다.
levels() 과 as.character() 함수를 사용해서 요인을 타맥하고 조작한다.
str() , nrow() , ncol() , dim() , colnames() , rownames() , head() , typeof() 함수를 사용해서 데이터프레임 구조를 파악한다.
read.csv() 함수를 사용해서 CSV 파일을 불러온다.
데이터프레임 length() 가 나타내는 것이 무엇인지 이해한다.
|
버전제어, 협업, 그리고 저작권과 라이선스 - 4월27일
|
버전 제어는 무한정 ‘실행취소(undo)’하는 것과 같다.
버전 제어는 많은 분들이 병렬로 작업하는 것도 가능하게 한다.
공개 과학 작업은 폐쇄적인 과학 작업보다 더 유용하고 더 많이 인용된다.
|
중간고사 - 5월04일(특강)
|
|
시각화 (Visualization) - 5월11일
|
ggplot2 를 사용해서 그래프를 생성한다.
그래프(graphics)를 계층으로 생각한다:aesthetics, 기하(geometry), 통계(statistics), 척도변환(scale transformation), 그룹(grouping).
정적, 인터랙티브, 애니메이션으로 시각화를 구현한다.
|
정규표현식 - 5월18일
|
|
데이터 과학 프로그래밍 - 5월25일
|
|
함수형 프로그래밍 - 6월01일
|
함수를 왜, 언제, 어떻게 작성하는지 파악한다.
함수를 다양한 관점에서 이해한다.
데이터 과학 심화과정에 등장하는 함수형 프로그래밍 용어에 친숙해진다.
|
데이터 과학 제품(논문 등) - 6월08일
|
|
데이터 과학 저작 - 6월15일
|
OSMU - One Source Multi Use 원칙을 견지한다.
텍스트, 수식, 그림/표, 통계, 모형을 반영한 글쓰기를 한다.
사람이 글쓰기 잘하는 영역과 기계가 글쓰기 잘 하는 영역을 명확히 한다.
|
R 팩키지 - 6월22일
|
데이터 기반 R 팩키지를 개발한다.
함수 기반 R 팩키지를 개발한다.
R 팩키지 개발관련 기반 기술을 이해한다.
|
기말고사 - 6월22일
|
|
The following is an overview of a standard Unix filesystem.
The exact hierarchy depends on the platform,
so you may not see exactly the same files/directories on your computer: