재현가능한 과학적 분석을 위한 R (Gapminder)
Gapminder 데이터를 사용한 초보자를 위한 R 언어 소개.
자료분석에 활용되는 R을 효과적으로 사용하는데 필요한 모범 활용사례를 소개하고, 모듈 방식으로 코드를 작성하는 방법을 초보 프로그래머에게 교육시키는게 목표다. 많은 과학분야에서 R이 통계분석과 제3자 팩키지 형태로 흔히 사용된다. 소프트웨어 카펜트리에 관심을 갖는 많은 과학자들이 R을 사용하고 있고, 좀더 학습하고자 워크샵에 참석하는 것을 발견했다. 본 학습교재에서 강조하는 것은 워크샵 참여자에게 R 언어 기본기를 함양하고, 과학 컴퓨팅에 대한 모범 활용사례를 전수함에 있다: 분석작업을 모듈 단위로 쪼개고, 작업을 자동화하고, 캡슐화한다.
소프트웨어 카펜트리 워크샵은 프로그래밍 언어 R 기본기를 가르치는데 집중하고, 통계분석을 가르치지 않는다.
다양한 제3자 팩키지가 워크샵을 통해 사용된다. 여기에서 소개되는 팩키지가 필히 가장 최고는 아니고, 포괄적인 것도 아니다. 하지만, 유용하다고 판단되는 팩키지로, 주로 사용편의성에 초점을 맞춰 선택되었다.
전제조건
유닉스 쉘과 Git 워크샵 수업을 수강해야만 된다.
학습주제
한국어(Korean) | 영어(English) |
---|---|
1. R과 RStudio 소개 | 1. Introduction to R and RStudio |
2. RStudio로 프로젝트 관리 | 2. Project management with RStudio |
3. 도움말 찾기 | 3. Seeking help |
4. 자료구조 | 4. Data structures |
5. 데이터프레임과 데이터 읽어오기 | 5. Data frames and reading in data |
6. 데이터 부분집합 만들기 | 6. Subsetting data |
7. 함수 생성하기 | 7. Creating functions |
8. 논문 품질 그래프 생성하기 | 8. Creating publication quality graphics |
9. 벡터화 | 9. Vectorisation |
10. 제어 흐름 | 10. Control flow |
11. 데이터 파일에 저장하기 | 11. Writing data |
12. 분할-적용-병합 전략 | 12. Split-apply-combine |
13. dplyr 팩키지로 데이터프레임 솜씨있게 조작 |
13. Dataframe manipulation with dplyr |
14. tidyr 팩키지로 데이터프레임 솜씨있게 조작 |
14. Dataframe manipulation with tidyr |
15. 요약정리 | 15. Wrapping up |