재현가능한 과학적 분석을 위한 R

Introduction to R for non-programmers using gapminder data.

The goal of this lesson is to teach novice programmers to write modular code and best practices for using R for data analysis. R is commonly used in many scientific disciplines for statistical analysis and its array of third-party packages. We find that many scientists who come to Software Carpentry workshops use R and want to learn more. The emphasis of these materials is to give attendees a strong foundation in the fundamentals of R, and to teach best practices for scientific computing: breaking down analyses into modular units, task automation, and encapsulation.

Note that this workshop will focus on teaching the fundamentals of the programming language R, and will not teach statistical analysis.

The lesson contains more material than can be taught in a day. The instructor notes page has some suggested lesson plans suitable for a one or half day workshop.

A variety of third party packages are used throughout this workshop. These are not necessarily the best, nor are they comprehensive, but they are packages we find useful, and have been chosen primarily for their usability.

Prerequisites

Understand that computers store data and instructions (programs, scripts etc.) in files. Files are organised in directories (folders). Know how to access files not in the working directory by specifying the path.

Schedule

Setup Download files required for the lesson
00:00 1. R과 RStudio 소개 RStudio에서 어떻게 작업하는가?
어떻게 R과 인터랙티브하는가?
작업환경을 어떻게 관리하는가?
팩키지는 어떻게 설치하는가?
00:55 2. RStudio와 함께하는 프로젝트 관리 R에서 프로젝트 관리를 어떻게 할까?
01:25 3. 도움 청하기 R에 대해서 도움을 어떻게 받을 수 있을까요?
01:45 4. 자료구조(Data Structures) R에 데이터를 어떻게 불러올 수 있을까?
R에서 기본 자료구조는 무엇인가?
R에서 범주형 정보를 어떻게 표현하는가?
02:40 5. 데이터프레임 탐색하기 데이터프레임을 어떻게 조작할 수 있을까?
03:10 6. 데이터 부분집합 추출 R에서 데이터 일부를 추출하는 작업을 어떻게 수행할 수 있을까요?
04:00 7. 제어 흐름 R로 데이터 의존적인 선택을 강제하는 방법은 무엇인가?
R로 어떻게 하면 연산작업을 반복할 수 있을까?
05:05 8. ggplot으로 논문 품질 그래프 생성하기 R로 논문 품질 그래프를 어떻게 생성할까요?
06:25 9. 벡터화(Vectorization) 한번에 벡터의 모든 원소에 대해 연산작업을 어떻게 수행할까?
06:50 10. 함수 설명 R에서 신규 함수를 어떻게 저작할 수 있을가?
07:50 11. 데이터를 저장하기 R에서 그래프와 데이터를 어떻게 저장할 수 있을까?
08:10 12. plyr로 데이터프레임을 쪼개고 합치기 어떻게 하면 다른 데이터에 다른 연산작을 수행할 수 있을까요?
09:10 13. dplyr 팩키지로 데이터프레임 솜씨있게 조작 본인이 반복하지 않고 데이터프레임을 어떻게 하면 솜씨있게 조작할 수 있을까?
10:05 14. tidyr 팩키지로 데이터프레임 솜씨있게 조작 데이터프레임 형태(format)을 어떻게 하면 바꿀 수 있을까?
10:50 15. knitr로 보고서 생성하기 소프트웨어와 보고서를 어떻게 통합할 수 있을까?
12:05 16. 좋은 소프트웨어 작성법 다른 분들이 사용할 수 있는 소프트웨어를 어떻게 작성할 수 있을까?
12:20 Finish

The actual schedule may vary slightly depending on the topics and exercises chosen by the instructor.