2건의 항목

읽기 노트

@fangFewerHallucinationsMore2025

Contribution: fine-tuning/외부 정보 없이 범용 LLM만으로 동작하는 3단계 hallucination 억제 ASR 교정 프레임워크 (Pre-Detection + CoT Subtask + Verification) Pro...

개념 노트

MATH-500

무엇인가: OpenAI가 Let’s Verify Step by Step에서 held-out 평가셋으로 사용한 500개의 수학 문제 서브셋. 왜 중요한가: OpenAI의 “Let’s Verify Step by Step” 연구의 핵심 평가...