5건의 항목
대표적인 sparse retrieval 알고리즘으로 TF-IDF, BM25 가 있다. TF-IDF 의 variation 인 BM25 는 문서 길이 페널티와 단어의 빈도 영향도를 제한한다. 단어 빈도의 영향도를 결정하는 파라미터는 k1 으...
Neuro-Symbolic IR (NS-IR) 은 신경망의 의미적 매칭 능력과 기호 논리의 구조적 해석 능력을 결합한 하이브리드 검색 패러다임이다. 기존 Dense Retrieval이 취약한 부정(Negation), 불리언 로직(Bool...
단어 빈도를 기반으로, 모든 문서에 흔히 나오는 단어에는 페널티를 주어 중요한 단어를 점수화한다. 값이 클수록 그 문서에서 중요한 단어다. 단어와 문서가 많아질수록 결과 행렬은 sparse matrix가 된다.