1 들어가며 1

연세대학교 2019년 성적제출과 성적확인은 다음 기간을 통해 이뤄진다.

  • 성적제출: 2019. 12. 9.(월) ∼ 12. 29.(일)
  • 성적 확인 및 정정: 2019. 12. 30.(월) ∼ 2020. 1. 3.(금)

2 프로젝트 GitHub - team 11대0

2.1 가져오기 설정

Software Engineering for Data Science, 데이터 공학 과목을 이수한 팀 하나를 선택하여 GitHub 저장소를 가져온다. 데이터공학 프로젝트 (TEAM 11대0)https://www.kickhelpers.com/ 웹사이트에 개발한 데이터 과학 제품을 AWS EC2위에 올려놨다.

fs 팩키지 dir_ls() 함수로 GitHub 저장소에서 클론하여 가져온 디렉토리와 파일을 확인한다.

data/project/team_11/README.md
data/project/team_11/SW4DS_django
data/project/team_11/data_cleaning
data/project/team_11/documentation
data/project/team_11/modelling
data/project/team_11/requirements.txt

2.2 GitHub 저장소 가져오기

GitHub 저장소에서 데이터를 가져올 준비가 모두 완료된 경우 프로젝트 커밋 로그를 데이터프레임으로 변환시켜 데이터 분석 준비를 한다.

git -C /Users/statkclee/swc/ingest-data/data/project/team_11 log --pretty=format:"%cd   %h  %p  %an %s" --date=format:"%Y-%m-%d %H:%M:%S"
# A tibble: 169 x 5
   datetime            commit  parents   author   subject              
   <chr>               <chr>   <list>    <chr>    <chr>                
 1 2019-12-13 19:44:59 1f20346 <chr [1]> dial0116 Delete Intro_PT.md   
 2 2019-12-13 19:44:11 c163759 <chr [1]> dial0116 Update README.md     
 3 2019-12-13 19:43:27 ec21f88 <chr [1]> dial0116 Update Intro_PT.ipynb
 4 2019-12-13 19:42:19 e64f967 <chr [1]> dial0116 Add files via upload 
 5 2019-12-13 19:34:56 158d743 <chr [1]> dial0116 Add files via upload 
 6 2019-12-13 19:27:51 3d7e258 <chr [1]> dial0116 Add files via upload 
 7 2019-12-13 19:20:36 1f37324 <chr [1]> dial0116 Add files via upload 
 8 2019-12-13 19:16:56 83a6fe0 <chr [1]> dial0116 Update README.md     
 9 2019-12-13 19:11:28 d59ebd0 <chr [1]> dial0116 Update README.md     
10 2019-12-13 18:03:23 4ff26e8 <chr [1]> dial0116 Update README.md     
# … with 159 more rows
# A tibble: 169 x 6
   datetime           commit  parents   author   subject             branch
   <chr>              <chr>   <list>    <chr>    <chr>                <int>
 1 2019-12-13 19:44:… 1f20346 <chr [1]> dial0116 Delete Intro_PT.md       1
 2 2019-12-13 19:44:… c163759 <chr [1]> dial0116 Update README.md         1
 3 2019-12-13 19:43:… ec21f88 <chr [1]> dial0116 Update Intro_PT.ip…      1
 4 2019-12-13 19:42:… e64f967 <chr [1]> dial0116 Add files via uplo…      1
 5 2019-12-13 19:34:… 158d743 <chr [1]> dial0116 Add files via uplo…      1
 6 2019-12-13 19:27:… 3d7e258 <chr [1]> dial0116 Add files via uplo…      1
 7 2019-12-13 19:20:… 1f37324 <chr [1]> dial0116 Add files via uplo…      1
 8 2019-12-13 19:16:… 83a6fe0 <chr [1]> dial0116 Update README.md         1
 9 2019-12-13 19:11:… d59ebd0 <chr [1]> dial0116 Update README.md         1
10 2019-12-13 18:03:… 4ff26e8 <chr [1]> dial0116 Update README.md         1
# … with 159 more rows

2.3 기술적 분석

# A tibble: 8 x 2
  author              n
  <chr>           <int>
1 YW mac15           70
2 JoJo               32
3 dial0116           16
4 jiwon12-31         15
5 whoareyouwhoami    13
6 JunghaYun          11
7 JOJO                7
8 Jiwon Park          5