학습목표- 한국어 텍스트 데이터를 전처리하는 기본 개념과 실습 방법을 익힌다.- 형태소 분석의 개념과 대표적인 한국어 형태소 분석기(Konlpy)를 익힌다.- NLTK와 KoNLPy 라이브러리를 활용하여 텍스트 데이터의 토큰화와 불용어 제거를 학습한다.- 실습을 통해 단어 빈도를 계산하고 간단한 텍스트 분석을 수행한다. "한국어와 자연어 처리의 첫 만남""규칙과 예외, 그리고 맥락이 어우러진 예술 언어는 인간이 세상과 소통하는 가장 오래된 도구이자, 가장 정교한 시스템입니다. 하지만 그중에서도 한국어는 특별합니다. 세계의 언어학자들은 한국어를 "규칙과 예외, 그리고 맥락이 어우러진 예술"이라고 부르곤 합니다. 왜냐하면 한국어는 단순히 단어와 문장이 아닌, 의미를 담은 구조로 구성되어 있기 때문입니다.“왜..
Python/Text Mining
2025. 1. 17. 17:48
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
반응형