1 도커 교재

도커 컨테이너 기술이 필요한 이유는 재현가능한 데이터 과학 제품 개발을 위해서 반듯이 필요하다. 현재의 상황을 살펴보면 다양한 운영체제가 존재하고 이에 맞춰 정말 다양한 오픈소스를 동원해서 최종 데이터 과학 제품을 제작해야 하는데 매번 이를 source 코드를 가지고 컴파일해서 환경을 구축해서 작업하는 것은 완전히 시간낭비다.

도커와 R 마크다운

2 도커 기본 1

도커 컨테이너를 하나의 컴퓨터로 생각하고 재현가능한 과학연구 혹은 제품개발을 위한 환경을 그대로 가져오는 것을 생각할 수 있다. 이를 위해서 몇가지 기본지식이 필요하다.

먼저 도커는 쉽게 생각해서 하나의 컴퓨터를 새로 장만하는 것으로 볼 수 있는데 주문한 컴퓨터는 특정 목적을 달성하기 위해서 필요로하는 모든 소프트웨어 환경이 완벽하게 구축되어 있다. 도커 허브(docker hub)에는 없는 것이 없다. 따라서 도커 허브에 회원가입하게 되면 필요로 하는 컴퓨터 이미지를 바로 얻을 수 있다.

다음 단계로 필요로 하는 컴퓨팅 환경이 구축된 도커 이미지를 로컬 컴퓨터로 가져오게 되면 다음 단계로 도커 이미지를 컨테이너로 실행시켜 본격적인 작업을 수행하는 것이 필요하다. 도커 컨테이너가 돌아가게 되면 이제 본격적인 데이터 과학 작업을 수행할 수 있게 된다.

도커 기본지식

2.1 도커 설치

Docker Hub은 GitHub과 마찬가지로 도커로 제작한 다양한 이미지를 공유할 수 있게 해준다. 도커 프로그램도 운영체제에 맞춰 아래와 같이 골라 저장하면 된다.

도커를 설치하고 나면, 다음 단계로 제대로 설치되었는지를 docker --version, docker-compose --version 명령어를 통해서 확인한다.

docker --version
Docker version 19.03.5, build 633a0ea
docker-compose --version
docker-compose version 1.25.2, build 698e2846
docker-machine --version

docker system prune -f 명령어를 사용해서 정지된 컨테이너, 사용되지 않는 네트워크, 이미지를 제거할 수 있다.

docker system prune -f

물론 docker system prune -f --volumes을 사용해서 볼륨도 제거할 수 있다.

docker system prune -f --volumes

2.2 도커 헬로 월드 2

도커를 설치한 후 가장 먼저 헬로 월드를 뿌려보자. Hello World! (an example of minimal Dockerization)를 통해서 처음으로 도커 이미지를 가져온다.

docker pull hello-world
Using default tag: latest
latest: Pulling from library/hello-world
Digest: sha256:9572f7cdcee8591948c2963463447a53466950b3fc15a247fcad1917ca215a2f
Status: Image is up to date for hello-world:latest
docker.io/library/hello-world:latest

다음으로 docker images 명령어로 이미지가 제대로 로컬 컴퓨터에 가져왔는지 확인한다. docker images -a 명령어는 이용가능한 모든 도커 이미지가 된다.

docker images hello-world
REPOSITORY          TAG                 IMAGE ID            CREATED             SIZE
hello-world         latest              fce289e99eb9        13 months ago       1.84kB

다음 단계로 이미지를 컨테이너로 실행시켜 보자. --name 옵션을 사용해서 hello-docker로 이름을 준비한다. 즉, hello-world 이미지를 hello-docker 컨테이너를 띄우게 된다.

docker rm $(docker ps -a -q)
docker run --name hello-docker hello-world
02deb710f5d4

Hello from Docker!
This message shows that your installation appears to be working correctly.

To generate this message, Docker took the following steps:
 1. The Docker client contacted the Docker daemon.
 2. The Docker daemon pulled the "hello-world" image from the Docker Hub.
    (amd64)
 3. The Docker daemon created a new container from that image which runs the
    executable that produces the output you are currently reading.
 4. The Docker daemon streamed that output to the Docker client, which sent it
    to your terminal.

To try something more ambitious, you can run an Ubuntu container with:
 $ docker run -it ubuntu bash

Share images, automate workflows, and more with a free Docker ID:
 https://hub.docker.com/

For more examples and ideas, visit:
 https://docs.docker.com/get-started/

도커 컨테이너는 docker ps -l로 도커 컨테이너를 확인할 수 있다.

docker ps -l
CONTAINER ID        IMAGE               COMMAND             CREATED                  STATUS                              PORTS               NAMES
81c307ba5cff        hello-world         "/hello"            Less than a second ago   Exited (0) Less than a second ago                       hello-docker

3 도커 RStudio

도커 RStudio를 The Rocker Project 웹사이트에서 가져온다. 과저 도커 허브에 모든 것이 있었지만, RStudio 에서 많은 기여를 함에 따라 별도 웹사이트에서 준비되어 R과 관련된 데이터 과학 도커 내용만 추려 본다.

docker pull 명령어로 도커 허브에서 RStudio IDE 정보를 가져온다. 이를 위해서 rocker 도커 저장소에서 rstudiodocker pull 명령어로 가져온다.

docker pull rocker/rstudio
Using default tag: latest
latest: Pulling from rocker/rstudio
Digest: sha256:a4197e99330a6c3065649cfd6c01231cbd3f10beba4fb507bfbecc25dec2db44
Status: Image is up to date for rocker/rstudio:latest
docker.io/rocker/rstudio:latest

도커 이미지 rstudio를 가져왔으면 개발환경을 별도로 설치하지 않고도 활용이 가능한데 이를 위해서 docker run 명령어로 RStudio IDE 컨테이너를 올리면 된다. 포트번호는 8787로 리눅스 운영체제에 설치된 RStudio IDE를 8787 포트를 통해서 rstudio 사용자명에 tidyverse 비번을 넣어 데이터 과학 개발환경에 접속한다.

docker run -d -e PASSWORD=tidyverse --rm -p 8787:8787 rocker/rstudio
e081e1804830512f210e9602c94b52ce17d97e61917c452a0a526d59e2b27fcc

웹브라이져를 열고 lcoalhost:8787을 클릭하면 RStudio IDE에 접근할 수 있다. rstudio 사용자명에 rstudio 비번이 기본으로 설정되어 있는데 비번을 tidyverse로 수정한 경우 수정된 비번으로 로그인하면 된다.

RStudio 도커 IDE

docker ps -a 명령어를 사용하면 도커 컨테이너가 떠있는 것을 함께 확인할 수 있다.

docker ps -a
CONTAINER ID        IMAGE               COMMAND             CREATED                  STATUS                     PORTS                    NAMES
e081e1804830        rocker/rstudio      "/init"             Less than a second ago   Up Less than a second      0.0.0.0:8787->8787/tcp   romantic_shtern
81c307ba5cff        hello-world         "/hello"            2 seconds ago            Exited (0) 2 seconds ago                            hello-docker

이제 RStudio IDE 컨테이너를 통해 데이터 과학 개발환경 구축이 완료된 것을 확인했으니, 다음 단계로 컨테이너를 제거한다. 이를 위해서 다음 명령어를 사용하면 된다.

  • docker rm $(docker ps -a -q)
  • docker stop $(docker ps -a -q)
docker stop $(docker ps -a -q)
e081e1804830
81c307ba5cff

4 컨테이너 폴더 연결

도커 이미지에서 컨테이너를 뽑아내게 되면 컨테이너에 담긴 데이터 및 정보는 언제라도 없어질 수 있기 때문에 도커 컨테이너를 호스팅하고 있는 로컬 컴퓨터 폴더와 동기화 시키는 것이 필요하다. 이를 위해서 필요한 것이 -v, --volume 옵션이다. 로컬 컴퓨터 디렉토리와 컨테이너 내부 디렉토리와 동기화시키게 되면 이런 문제를 간단히 해결할 수 있다.

docker run -d -e PASSWORD=tidyverse --rm --name rstudio -p 8787:8787 -v   /Users/statkclee/swc/compendium_301:/home/rstudio/compendium rocker/rstudio
f76cf16613ecd63a0430c431ac96cd4cdb4b4c1b2a5b103ceb2b11c98363aa3b

로컬 컴퓨터에서 동기화시킬 디렉토리는 윈도우 탐색기나 맥 Finder를 통해 간단히 확인할 수 있으나 도커 컨테이너는 상황이 다르다. 먼저 도커 컨테이러를 띄우는 작업을 하고 나서, docker exec 명령어를 사용해서 도커 컨테이너 내부로 들어간다.

  • docker run -d -e PASSWORD=tidyverse --rm --name rstudio -p 8787:8787 rocker/rstudio
  • docker exec -it rstudio /bin/bash

도커 RStudio IDE 디렉토리 동기화

docker exec rstudio ls -al /home/rstudio/compendium
total 1012
drwxr-xr-x 19 root    root       608 Jan 29 14:11 .
drwxr-xr-x  1 rstudio rstudio   4096 Jan 29 15:07 ..
drwxr-xr-x  8 root    root       256 Jan 29 14:38 analysis
drwxr-xr-x  3 root    root        96 Jan  6 04:20 asset
-rw-r--r--  1 root    root    918371 Jan 29 14:11 automation-makefile.html
-rw-r--r--  1 root    root      8938 Jan 29 14:11 automation-makefile.Rmd
-rw-------  1 rstudio rstudio      7 Jan 29 13:31 .bash_history
drwxr-xr-x  3 root    root        96 Jan 29 14:11 data
-rw-r--r--  1 root    root       390 Jan  3 07:32 DESCRIPTION
-rw-r--r--  1 root    root      6148 Jan  8 08:48 .DS_Store
drwxr-xr-x 15 root    root       480 Jan 29 14:24 .git
drwxr-xr-x  2 root    root        64 Jan 29 13:30 kitematic
-rw-r--r--  1 root    root       488 Jan 29 14:11 Makefile
-rw-r--r--  1 root    root        64 Jan 29 14:11 Makefile_helloworld
-rw-r--r--  1 root    root     67771 Jan 29 14:11 make-pipeline.png
drwxr-xr-x  4 root    root       128 Jan 29 14:36 processed
drwxr-xr-x  6 root    root       192 Jan 29 14:11 R
-rw-r--r--  1 root    root        65 Jan  6 02:49 README
drwxr-xr-x 15 root    root       480 Jan 29 13:30 .rstudio

5 \(\LaTeX\) 도커 이미지

rocker/ 도커 이미지 중 \(\LaTeX\) 관련된 이미지가 verse다. 다만, 한글 \(\LaTeX\)이 없다는 것이 문제라… 이를 해결하기 위해서 다음 과정을 거친다. 먼저 도커 컨테이너를 latex이름으로 띄운다. docker network prune

docker stop rstudio
rstudio
docker run -d -e PASSWORD=tidyverse --rm --name latex -p 8787:8787 -v   /Users/statkclee/swc/compendium_301:/home/rstudio/compendium rocker/verse
7c08a65826e5745c03d38ba376f8c19f63c8fce3dd1ba443b4174c97a77c3a8d

그리고 나서, docker exec latex /bin/bash으로 들어간다.

docker exec latex /bin/bash

컨테이너 배쉬쉘에서 fc-list를 사용하면 나눔 폰트가 설치된 것이 확인되지 않는다. sudo apt-get update 명령어에 이어서 나눔 폰트를 설치해준다. 이를 통해서 나눔폰트가 설치된 것을 확인할 수 있다.

$ fc-list | grep "Nanum"
$ sudo apt-get update
$ sudo apt-get install fonts-nanum fonts-nanum-extra fonts-nanum-coding fonts-baekmuk fonts-unfonts-core fonts-unfonts-extra
$ fc-list | grep "Nanum"

/usr/share/fonts/truetype/nanum/NanumSquareRoundB.ttf: NanumSquareRound,나눔스퀘어라운드,NanumSquareRound Bold,나눔스퀘어라운드 Bold:style=Bold,Regular
/usr/share/fonts/truetype/nanum/NanumSquareRoundR.ttf: NanumSquareRound,나눔스퀘어라운드,NanumSquareRound Regular,나눔스퀘어라운드 Regular:style=Regular
/usr/share/fonts/truetype/nanum/NanumSquareB.ttf: NanumSquare,나눔스퀘어,NanumSquare Bold,나눔스퀘어 Bold:style=Bold
/usr/share/fonts/truetype/nanum/NanumGothicLight.ttf: NanumGothic,나눔고딕,NanumGothic Light,나눔고딕 Light:style=Light,Regular
/usr/share/fonts/truetype/nanum/NanumBrush.ttf: Nanum Brush Script,나눔손글씨 붓:style=Regular
/usr/share/fonts/truetype/nanum/NanumBarunGothic.ttf: NanumBarunGothic,나눔바른고딕:style=Regular
/usr/share/fonts/truetype/nanum/NanumBarunGothicUltraLight.ttf: NanumBarunGothic,나눔바른고딕,NanumBarunGothic UltraLight,나눔바른고딕 UltraLight:style=UltraLight
/usr/share/fonts/truetype/nanum/NanumGothic.ttf: NanumGothic,나눔고딕:style=Regular
/usr/share/fonts/truetype/nanum/NanumBarunpenB.ttf: NanumBarunpen,나눔바른펜,NanumBarunpen Bold:style=Bold
/usr/share/fonts/truetype/nanum/NanumGothicCoding.ttf: NanumGothicCoding,나눔고딕코딩:style=Regular
/usr/share/fonts/truetype/nanum/NanumBarunGothicBold.ttf: NanumBarunGothic,나눔바른고딕:style=Bold
/usr/share/fonts/truetype/nanum/NanumPen.ttf: Nanum Pen Script,나눔손글씨 펜:style=Regular
/usr/share/fonts/truetype/nanum/NanumBarunGothicLight.ttf: NanumBarunGothic,나눔바른고딕,NanumBarunGothic Light,나눔바른고딕 Light:style=Light
/usr/share/fonts/truetype/nanum/NanumSquareRoundL.ttf: NanumSquareRound,나눔스퀘어라운드,NanumSquareRound Light,나눔스퀘어라운드 Light:style=Light,Regular
/usr/share/fonts/truetype/nanum/NanumGothicBold.ttf: NanumGothic,나눔고딕:style=Bold
/usr/share/fonts/truetype/nanum/NanumGothicCoding-Bold.ttf: NanumGothicCoding,나눔고딕코딩:style=Bold
/usr/share/fonts/truetype/nanum/NanumSquareEB.ttf: NanumSquare,나눔스퀘어,NanumSquare ExtraBold,나눔스퀘어 ExtraBold:style=ExtraBold
/usr/share/fonts/truetype/nanum/NanumBarunpenR.ttf: NanumBarunpen,나눔바른펜:style=Regular
/usr/share/fonts/truetype/nanum/NanumSquareR.ttf: NanumSquare,나눔스퀘어:style=Regular
/usr/share/fonts/truetype/nanum/NanumMyeongjo.ttf: NanumMyeongjo,나눔명조:style=Regular
/usr/share/fonts/truetype/nanum/NanumSquareL.ttf: NanumSquare,나눔스퀘어,NanumSquare Light,나눔스퀘어 Light:style=Light
/usr/share/fonts/truetype/nanum/NanumMyeongjoBold.ttf: NanumMyeongjo,나눔명조:style=Bold
/usr/share/fonts/truetype/nanum/NanumMyeongjoExtraBold.ttf: NanumMyeongjo,나눔명조,NanumMyeongjoExtraBold,나눔명조 ExtraBold:style=ExtraBold
/usr/share/fonts/truetype/nanum/NanumSquareRoundEB.ttf: NanumSquareRound,나눔스퀘어라운드,NanumSquareRound ExtraBold,나눔스퀘어라운드 ExtraBold:style=ExtraBold,Regular
/usr/share/fonts/truetype/nanum/NanumGothicExtraBold.ttf: NanumGothic,나눔고딕,NanumGothicExtraBold,나눔고딕 ExtraBold:style=ExtraBold

마지막 단계로 localhohst:8787로 접근한 후에 RStudio 콘솔에서 make all 명령어를 실행시키게 되면 .pdf 파일도 한글이 정상적으로 출력되는 것을 확인할 수 있다.

한글이 되는 \(\LaTeX\) R마크다운 환경