데이터 카펜트리 – R 1

데이터 카펜트리 목표는 과학기술 연구원들에게 데이터로 작업하는데 필요한 기본적인 개념, 기술, 도구사용법을 전수해서, 연구원들이 더 빠른 시간내, 더 적은 고통으로, 더 많은 것을 수행하게 한다. 다음 학습교재는 Data Carpentry R for data analysis for Ecology을 번역한 것이다.

프로그래밍 경험이 전혀 없는 워크샵 참석자를 대상으로 R 언어에 대한 소개가 되어 있다. 학습분량은 3/4일치에 해당된다. R 구문, RStudio 사용법, CSV 파일 불러오는 방법, 데이터프레임 구조, 요인 처리방법, 행과 열 추가/삭제, 각 수준별 요약 통계량 계산법, 시각화에 대한 매우 간단한 소개로 구성된다.

R 교안 기여자 : Sarah Supp, John Blischak, Gavin Simpson, Tracy Teal, Greg Wilson, Diego Barneche, Stephen Turner, Francois Michonneau

R 교안 유지보수 담당자: Francois Michonneau, Auriel Fournier

R 교안 한국어 번역: 이광춘

학습교안 상태: Teaching

학습교재:

영문 국문
1. Lesson 00 Before we start 1. 00. 시작전
2. Lesson 01 Introduction to R 2. 01. R 소개
3. Lesson 02 Starting with data 3. 02. 데이터를 갖고 출발
4. Lesson 03 Introducing data.frame 4. 03. data.frame 소개
5. Lesson 04 Aggregating and analyzing data with dplyr 5. 04. dplyr로 데이터 집계와 분석
6. Lesson 05 Data visualization with ggplot2 6. 05. ggplot2로 데이터 시각화
7. Lesson 06 R and SQL 7. 06. R 과 SQL

데이터

학습에 사용되는 데이터는 http://dx.doi.org/10.6084/m9.figshare.1314459 사이트에서 다운로드 받아 둔다.

특히, *.csv (콤마 구분값, Comma Separated Value, CSV) 파일을 준비: species.csv, plots.csv, surveys.csv, and combined.csv.

사전 준비물

데이터 카펜트리는 직접 키보드에 손을 올려 실습하는 것으로 워크샵 참석자분들이 직접 본인 컴퓨터(노트북)를 자져와서 효율적인 작업흐름이 되도록 적절한 도구를 설정해서 준비해 와야 된다. 이번 학습과정에 사전 기술과 도구사용법에 대한 지식이 전혀 없다고 가정한다. 하지만, 아래에 기술된 소프트웨어에 대한 사본을 컴퓨터에 준비하는 것은 필요하다. 학습교재를 워크샵에서 최대한 효과적으로 활용하기 위해서 수업 전에 모든 것이 제대로 설치되어 준비되었는지 확인하면 좋다.

R

R is a programming language that is especially powerful for data exploration, visualization, and statistical analysis. To interact with R, we use RStudio. Make sure you have a recent version of R (3.2.2 or higher).

Windows

Install R by downloading and running this .exe file from CRAN. Also, please install the RStudio IDE.

Mac OS X

Install R by downloading and running this .pkg file from CRAN. If you have Snow Leopard, you might run into issues when trying to download the datasets directly from R using the `download.file()` function. If it's the case, you will need to download the data files manually. Don't hesitate to ask the instructor for help if you run into issues. Also, please install the RStudio IDE.

Linux

You can download the binary files for your distribution from CRAN. Or you can use your package manager (e.g. for Debian/Ubuntu run sudo apt-get install r-base and for Fedora run sudo yum install R). This workshop requires a version of R no older than version 3.2.2; the default software repositories for some Linux distributions maybe out of date. It is recommended that you use a more recent version of R by adding the relevant entries to your package manager. See the instructions for your distribution on the CRAN website. Also, please install the RStudio IDE.

트위터: @datacarpentry