목록Ner (1)
CODENAVY
NLP Subtask 알아보기 (1) - Named Entity Recognition (NER)
1. 문제 정의: task가 해결하고자 하는 문제는? 개체명 인식(Named Entity Recognition)은 문서 내에서 사람 이름, 장소명, 기관명, 날짜 등 특정한 의미를 지니는 단어 또는 어구를 개체(entity)로 인식하고, 이러한 개체들의 의미적 범주를 분류하는 것을 목표로 한다. 전형적으로 BIO notation이 사용되는데, 하나의 개체가 두 개 이상의 토큰으로 이루어져 있다고 했을 때, 시작하는 토큰을 B로, 이어지는 토큰을 I로, 그리고 엔티티가 아닌 토큰을 O로 표기하는 것이다. 개체가 한 개의 토큰으로 이루어져 있을 경우, 해당 토큰은 B로 표기한다. Mark Watney visited Mars B-PER I-PER O B-LOC 위 예시 문장에서와 같이, Mark Watney는..
NLP
2022. 2. 21. 10:53