5건의 항목

개념 노트

BM25

대표적인 sparse retrieval 알고리즘으로 TF-IDF, BM25 가 있다. TF-IDF 의 variation 인 BM25 는 문서 길이 페널티와 단어의 빈도 영향도를 제한한다. 단어 빈도의 영향도를 결정하는 파라미터는 k1 으...

개념 노트

Neuro-Symbolic IR

Neuro-Symbolic IR (NS-IR) 은 신경망의 의미적 매칭 능력과 기호 논리의 구조적 해석 능력을 결합한 하이브리드 검색 패러다임이다. 기존 Dense Retrieval이 취약한 부정(Negation), 불리언 로직(Bool...

개념 노트

TF-IDF(Term Frequency-Inverse Document Frequency)

단어 빈도를 기반으로, 모든 문서에 흔히 나오는 단어에는 페널티를 주어 중요한 단어를 점수화한다. 값이 클수록 그 문서에서 중요한 단어다. 단어와 문서가 많아질수록 결과 행렬은 sparse matrix가 된다.

읽기 노트

@leeDEOTrainingFreeDirect2026

Contribution: Training-free negation-aware retrieval — encoder 고정 상태에서 query embedding을 contrastive loss로 직접 최적화하여 부정/제외 쿼리 처리 Pros:...

개념 노트

NegConstraint

무엇인가: 부정 제약 조건(Negative constraints)을 포함하는 복합 쿼리에 대한 정보 검색(IR) 시스템의 성능을 평가하기 위한 벤치마크 데이터셋. 왜 중요한가: 기존 Dense Retriever가 논리적 부정(“A를 찾되...