2019년 봄학기 연세대학교 데이터 사이언스 입문 교육과정 과제 및 프로젝트 GitHub 저장소를 데이터화 한다. GitHub 저장소를 클릭하면 바로 GitHub 저장소로 이동이 가능한 형태로 DT
코드를 작성한다.
프로젝트로 저장소를 구분하기 위해서 이름 칼럼 길이가 3자리 이상인 것만 추출한다.
# A tibble: 5 x 3
프로젝트명 이름 GiHub
<chr> <chr> <chr>
1 save sea turtles save sea turtles https://github.com/joynkim525/ds_proj…
2 데이터와 데이트 데이터와 데이트 https://github.com/desaip2468/desaip
3 잇츠 잇츠(ITs EATs)+… 잇츠 잇츠(ITs EATs)… https://github.com/JaeInK/DataScience…
4 따릉따릉 따릉이 따릉따릉 따릉이 https://github.com/dsyonsei122/bike
5 장애인 콜택시 장애인 콜택시 <NA>
gh
팩키지 1 2Minimalistic GitHub API client in R 팩키지가 있어 이를 통해서 R에서 관련 저장소의 데이터를 바로 끌어 올 수 있다. 이를 위해서 먼저 GitHub Personal Access Tokens이 필요하다. 이를 usethis::edit_r_environ()
함수를 사용해서 GITHUB_PAT
를 설정할 수 있고, Sys.getenv("GITHUB_PAT")
명령어를 통해서 토큰 값을 확인할 수 있다.
{
"login": "Chae-wonKim",
"id": 49752099,
"node_id": "MDQ6VXNlcjQ5NzUyMDk5",
"avatar_url": "https://avatars0.githubusercontent.com/u/49752099?v=4",
"gravatar_id": "",
"url": "https://api.github.com/users/Chae-wonKim",
"html_url": "https://github.com/Chae-wonKim",
"followers_url": "https://api.github.com/users/Chae-wonKim/followers",
"following_url": "https://api.github.com/users/Chae-wonKim/following{/other_user}",
"gists_url": "https://api.github.com/users/Chae-wonKim/gists{/gist_id}",
"starred_url": "https://api.github.com/users/Chae-wonKim/starred{/owner}{/repo}",
"subscriptions_url": "https://api.github.com/users/Chae-wonKim/subscriptions",
"organizations_url": "https://api.github.com/users/Chae-wonKim/orgs",
"repos_url": "https://api.github.com/users/Chae-wonKim/repos",
"events_url": "https://api.github.com/users/Chae-wonKim/events{/privacy}",
"received_events_url": "https://api.github.com/users/Chae-wonKim/received_events",
"type": "User",
"site_admin": false,
"name": {},
"company": {},
"blog": "",
"location": {},
"email": {},
"hireable": {},
"bio": {},
"public_repos": 2,
"public_gists": 0,
"followers": 0,
"following": 0,
"created_at": "2019-04-18T10:45:23Z",
"updated_at": "2019-06-09T06:40:18Z"
}