학습목표- Bag of Words의 개념과 원리를 이해한다.- CountVectorizer를 활용해 텍스트 데이터를 벡터화하는 방법을 익힌다.- 벡터화된 데이터를 분석하고 단어 사전과 행렬을 해석할 수 있다.- 실습과 시각화를 통해 텍스트 데이터의 유용한 정보를 추출하고 활용한다.1. Bag of Words ?스파이의 암호 해독 이야기어느 날, 스파이들이 사용하는 암호 메시지를 해독해야 하는 상황에 놓였다고 상상해보자. 메시지는 온갖 단어로 이루어져 있지만 그 안에 숨겨진 패턴을 찾아야 한다. 이때 우리가 사용하는 도구가 바로 "Bag of Words"이다. "Bag of Words"는 단어를 '그냥 모아놓은 주머니'처럼 생각하는 기법으로, 단어가 몇 번 사용되었는지만 세는 아주 단순하면서도 강력한 방법..
Python/Text Mining
2025. 1. 17. 17:50
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
반응형