1 연세대 데이터 사이언스 입문

2019년 봄학기 연세대학교 데이터 사이언스 입문 교육과정 과제 및 프로젝트 GitHub 저장소를 데이터화 한다. GitHub 저장소를 클릭하면 바로 GitHub 저장소로 이동이 가능한 형태로 DT 코드를 작성한다.

2 GitHub 저장소 구분

프로젝트로 저장소를 구분하기 위해서 이름 칼럼 길이가 3자리 이상인 것만 추출한다.

# A tibble: 5 x 3
  프로젝트명        이름             GiHub                                 
  <chr>             <chr>            <chr>                                 
1 save sea turtles  save sea turtles https://github.com/joynkim525/ds_proj…
2 데이터와 데이트   데이터와 데이트  https://github.com/desaip2468/desaip  
3 잇츠 잇츠(ITs EATs)+… 잇츠 잇츠(ITs EATs)… https://github.com/JaeInK/DataScience…
4 따릉따릉 따릉이   따릉따릉 따릉이  https://github.com/dsyonsei122/bike   
5 장애인 콜택시     장애인 콜택시    <NA>                                  

3 gh 팩키지 1 2

Minimalistic GitHub API client in R 팩키지가 있어 이를 통해서 R에서 관련 저장소의 데이터를 바로 끌어 올 수 있다. 이를 위해서 먼저 GitHub Personal Access Tokens이 필요하다. 이를 usethis::edit_r_environ() 함수를 사용해서 GITHUB_PAT를 설정할 수 있고, Sys.getenv("GITHUB_PAT") 명령어를 통해서 토큰 값을 확인할 수 있다.

{
  "login": "Chae-wonKim",
  "id": 49752099,
  "node_id": "MDQ6VXNlcjQ5NzUyMDk5",
  "avatar_url": "https://avatars0.githubusercontent.com/u/49752099?v=4",
  "gravatar_id": "",
  "url": "https://api.github.com/users/Chae-wonKim",
  "html_url": "https://github.com/Chae-wonKim",
  "followers_url": "https://api.github.com/users/Chae-wonKim/followers",
  "following_url": "https://api.github.com/users/Chae-wonKim/following{/other_user}",
  "gists_url": "https://api.github.com/users/Chae-wonKim/gists{/gist_id}",
  "starred_url": "https://api.github.com/users/Chae-wonKim/starred{/owner}{/repo}",
  "subscriptions_url": "https://api.github.com/users/Chae-wonKim/subscriptions",
  "organizations_url": "https://api.github.com/users/Chae-wonKim/orgs",
  "repos_url": "https://api.github.com/users/Chae-wonKim/repos",
  "events_url": "https://api.github.com/users/Chae-wonKim/events{/privacy}",
  "received_events_url": "https://api.github.com/users/Chae-wonKim/received_events",
  "type": "User",
  "site_admin": false,
  "name": {},
  "company": {},
  "blog": "",
  "location": {},
  "email": {},
  "hireable": {},
  "bio": {},
  "public_repos": 2,
  "public_gists": 0,
  "followers": 0,
  "following": 0,
  "created_at": "2019-04-18T10:45:23Z",
  "updated_at": "2019-06-09T06:40:18Z"
}