윈도우 파일을 맥으로 가져오게 되면 자음과 모음이 분리되는 자소분리가 되는 경우가 있다. 문제의 원인은 맥에서는 표준 정규화 인코딩 방식을 조합형(NFD, Normalization Form Canonical Decomposition)을 사용하는 반면, 윈도우에서는 완성형(NFC, Normalization Form Canonical Composition)을 지원하고 있기 때문이다.
eStat 웹사이트에서 .csv
파일을 맥으로 다운로드 받게 되면 자모가 분리되는 사례를 목격하게 된다.
초등과학5-2각행성의반지름(141쪽).csv
→ 초등과학5-2각행성의반지름(141쪽).csv
library(tidyverse)
<- read_csv("data/초등과학5-2각행성의반지름(141쪽).csv")
planet_radius
planet_radius
brew install convmv
명령어를 통해 convmv
프로그램을 설치한 후에 다음과 같이 실행한다.
-f utf8 -t utf8 --nfc --notest <파일명> convmv
데이터 과학자 이광춘 저작
kwangchun.lee.7@gmail.com