데이터 과학을 위한 저작도구
doit을 이용한 분석 파이프라인 자동화
이번 학습에서 파이썬 doit
라이브러리를 사용해서 분석 파이프라인 자동화를 다룬다. 파이썬 함수, 라이브러리, 딕셔너리에 친숙해야 한다. 추가적으로 파이썬 생성기(generator) 지식이 매우 도움이 될 것이다.
복잡한 데이터 분석은 종종 특정 순서로 수행되어야 되는 일련의 과정이 포함된다. 그리고 다수의 중간 파일 생성도 필요하다. 이런 유형의 파이프라인이 "빌드 도구(build tool)"로 불리는 유형의 소프트웨어 도구를 사용하는 자동화에 적합하다. 이번 학습에서 특정 도구만 다루지만, 많은 주요개념은 다른 빌드도구에도 적용된다. 만약 열렬한 파이썬 사용자가 아니라면, 본인이 주로 사용하는 언어에도 가용한 도구가 분명히 있을 것이다.
가장 대중적인 빌드 도구는 Make
다. Make
와 doit
비교는 Make와 doit 비교을 참조 바란다.