목록2022/03/25 (1)
Hey Tech
[NLP] TF-IDF 개념 및 계산 방법(+Python 코드)
본 포스팅에서는 TF-IDF 개념 및 계산 방법에 대해 알아봅니다. 📚 목차 1. TF-IDF 개념 2. TF-IDF 계산방법 2.1. TF(Term Frequency) 2.2. DF(Document Frequency) 2.3. IDF(Inverse Document Frequency) 1. TF-IDF 개념 TF-IDF(Term Frequency-Inverse Document Frequency)는 Document Term Matrix(DTM) 내 단어마다 중요도를 고려하여 가중치를 주는 통계적인 단어 표현방법입니다. DTM에 대한 자세한 설명은 이곳을 참고해 주세요. TF-IDF는 단어의 중요도를 고려하기 때문에, 일반적으로 단순히 문서 내 단어의 출현빈도만 고려하는 DTM보다 문서에서 유의미한 정보를 ..
AI & 빅데이터/자연어처리(NLP)
2022. 3. 25. 00:35