목록nlp (2)
CODENAVY
![](http://i1.daumcdn.net/thumb/C150x150.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/y5IXD/btrtVpcfDBp/9YGa3L1TuKPz3Vvng5VYF0/img.png)
1. 문제 정의: task가 해결하고자 하는 문제는? 개체명 인식(Named Entity Recognition)은 문서 내에서 사람 이름, 장소명, 기관명, 날짜 등 특정한 의미를 지니는 단어 또는 어구를 개체(entity)로 인식하고, 이러한 개체들의 의미적 범주를 분류하는 것을 목표로 한다. 전형적으로 BIO notation이 사용되는데, 하나의 개체가 두 개 이상의 토큰으로 이루어져 있다고 했을 때, 시작하는 토큰을 B로, 이어지는 토큰을 I로, 그리고 엔티티가 아닌 토큰을 O로 표기하는 것이다. 개체가 한 개의 토큰으로 이루어져 있을 경우, 해당 토큰은 B로 표기한다. Mark Watney visited Mars B-PER I-PER O B-LOC 위 예시 문장에서와 같이, Mark Watney는..
* 본 내용은 패스트캠퍼스 김기현 강사님의 '처음부터 시작하는 딥러닝 유치원 Online'을 수강하면서 정리하기 위해 작성한 글입니다. 머신러닝과 딥러닝의 목표: 최종 목표는 결국 x(독립변수), y(종속변수)간의 관계를 제일 잘 설명하는 함수 y = f(x)를 도출하는 것이다. '관계를 제일 잘 설명한다'는 것은 오차를 최소화하는 optimal parameters를 찾는다는 말과 동일한 의미를 가진다. WORKFLOW: 1. 문제 정의 - 신경망을 사용한 함수에 사용할 x(독립변수)는 무엇인지, 그리고 도출할 최종값 y(종속변수)가 무엇인지 정의한다. 2. 데이터 수집 - 풀고자 하는 문제가 무엇인지에 따라 crawling, 실제 데이터 수집 등으로 수집 방법이 상이할 수 있다. - 필요에 따라 구한 ..