autoX 작업흐름도 1

ggplot2 팩키지 내장된 자동차 연비 데이터, mpg를 사용해서 데이터 품질과 탐색적 데이터 분석 및 회귀모형 보고서를 자동 생성하는 사례를 살펴본다.

  • 데이터(Data): dlookr
    • 데이터 품질: dlookr::diagnose_report()
    • 데이터 변환: dlookr::transformation_report(target = ???)
  • 탐색적 데이터 분석(EDA): dlookr::eda_report(target = ???)
  • 모형: report
    • report::report()

1 데이터 품질

ggplot2::mpg 데이터에는 결측값이나 문제될 것은 특별히 없고 다만 문자형 변수가 있어 이를 범주형 변수로 변환하는 과정만 거치고 이를 data 디렉토리 mpg_quality.pdf 파일로 저장시킨다.

library(tidyverse)
library(dlookr)

ggplot2::mpg %>% 
  mutate_if(is.character, factor) %>% 
  diagnose_report(output_format = "pdf", output_dir="data", output_file="mpg_quality.pdf")

2 데이터 품질 보고서

자동차 연비 데이터 품질 보고서

 

데이터 과학자 이광춘 저작

kwangchun.lee.7@gmail.com