[자료구조] NLP - 파이썬
∽̱ 11월15일
Overview
Teaching: 180 min
Exercises: 0 minQuestions
어떻게 기계는 자연어를 이해할까?
정규표현식이 그래도 필요할까?
기계가 문서를 자동처리한다는 의미는 무엇인가?
Objectives
텍스트 데이터를 원하는 방향으로 처리한다.
텍스트를 NLP 기법을 적용하여 분류하고, 예측하고, 원하는 문서형태로 만들어 낸다.
대량의 문서를 작성한 코드로 자동화시킨다.
파이썬 NLP
- 텍스트 데이터 가져오기(ingest)
- 텍스트 데이터 전처리
- 텍스트 데이터 정규화
- 텍스트 데이터 EDA 도구
- 배포
Key Points
NLP 처리에 파이썬 파이프라인을 구축한다.
자동화 가능한 텍스트 자연어 처리 방법론에 친숙해 진다.
텍스트 마이닝 R과 파이썬 NLP 처리 방법론을 비교한다.