1 자모분리 1

윈도우 파일을 맥으로 가져오게 되면 자음과 모음이 분리되는 자소분리가 되는 경우가 있다. 문제의 원인은 맥에서는 표준 정규화 인코딩 방식을 조합형(NFD, Normalization Form Canonical Decomposition)을 사용하는 반면, 윈도우에서는 완성형(NFC, Normalization Form Canonical Composition)을 지원하고 있기 때문이다.

2 사례

eStat 웹사이트에서 .csv 파일을 맥으로 다운로드 받게 되면 자모가 분리되는 사례를 목격하게 된다.

  • 초등과학5-2각행성의반지름(141쪽).csv초등과학5-2각행성의반지름(141쪽).csv
library(tidyverse)
planet_radius <- read_csv("data/초등과학5-2각행성의반지름(141쪽).csv")

planet_radius

3 수정하는 방법

brew install convmv 명령어를 통해 convmv 프로그램을 설치한 후에 다음과 같이 실행한다.

convmv -f utf8 -t utf8 --nfc --notest <파일명>

4 Automator 사용법

[콜홍]: https://tt.kollhong.com/79?category=674974 참고

 

데이터 과학자 이광춘 저작

kwangchun.lee.7@gmail.com