PDF를 데이터로 보는 올바른 자세 학습목차 PDF 문서 살펴보기 PDF 감옥에서 데이터를 탈출시키다. 기계판독 가능한 PDF 문서에서 표추출 문서(tika) CV 제작 PDF → 워드 - 리브레오피스(LibreOffice) PDF 파일 목차 (Table of Contents) PDF → 워드(.docx) PDF → 웹사이트 이미지 PDF 이미지 PDF 파일 데이터 추출 기계판독 불가능한 PDF 문서에서 표추출 OCR:: 기계판독 가능한 테이블(표) 광학문자인식(OCR, Optical Character Recognition) 라벨(annotation) 데이터 텍스트 탐지(Text Detection) 워드 파일에서 표(table) 추출 1 페이지 두쪽 인쇄 → 다시 원복 디지털 타이포그래피(Digital Typography) 구글 노토(Noto) 글꼴(font) R 마크다운 폰트 문서 style R 마크다운 폰트 CSS 문서 css 태써랙트(Tesseract) 자동차 번호판 인식 검정배경 흰색글자 인식 문자 분리(character segmentation) 애비(Abbyy): Access Abbyy Cloud OCR from R 문자인식(OCR) - tesseract PPT 장표 - OCR tesseract 한국 R 컨퍼런스 - 간지 PDF2HTML hwp → 데이터프레임