AI 환각(Hallucination)의 모든 것: 거짓말 원인과 RAG 해결책
AI가 숨 쉬듯이 거짓말을 하는 이유 (feat. 환각의 해부학)
ChatGPT나 Claude를 실무에 붙이다 보면 등골이 서늘해지는 순간이 옵니다. 완벽해 보이는 문장 속에 교묘하게 섞인 거짓말, 바로 ‘환각(Hallucination)’ 때문이죠. 서비스 신뢰도가 나락으로 가는 건 한순간이니까요.
도대체 AI는 왜 뻔뻔하게 거짓말을 하는지, 그리고 우린 이걸 어떻게 막아야 하는지, 최신 연구를 바탕으로 프롬프트 엔지니어링 관점에서 파헤쳐 보겠습니다.
환각의 두 얼굴
보통 “AI가 헛소리를 한다”고 퉁치지만, 문제를 해결하려면 이 ‘헛소리’를 쪼개서 봐야 합니다. 크게 두 가지로 나눕니다.
① 사실성 환각 (Factuality Hallucination)
현실 세계의 팩트와 다른 소리를 하는 경우입니다.
- 위조: “에펠탑 때문에 파리의 호랑이가 멸종했다”처럼 아예 없는 사실을 창조하는 경우입니다.
- 모순: “전구는 에디슨이 발명했다”처럼 미묘하게 틀린 경우입니다. (엄밀히 말하면 기존 디자인을 개량해 상용화한 것이니까요.)
② 충실성 환각 (Faithfulness Hallucination)
사용자의 지시를 무시하고 제멋대로 구는 경우입니다.
- 지시 불일치: “영어로 번역해줘”라고 했는데 질문에 대한 답을 한국어로 해버리는 경우입니다.
- 맥락 불일치: 주어진 문서 요약만 하라고 했는데, 문서에 없는 외부 지식을 멋대로 끌어와서 섞어버리는 경우입니다.
이 구분이 중요한 이유는 간단합니다. 원인을 알아야 처방을 내리니까요.
거짓말은 언제 배우나?
환각은 모델이 단순히 ‘멍청해서’ 생기는 게 아닙니다. AI의 생애 주기(데이터-학습-추론) 단계별로 거짓말의 원인이 다릅니다.
Step 1. 데이터 (Data): 잘못된 교과서
LLM은 인터넷을 보고 배웁니다. 가짜 뉴스와 편향된 정보까지 그대로 암기하죠. 게다가 2024년 대선 결과를 물어도 학습 데이터가 2023년까지라면, 모델은 과거의 기억을 끄집어내 엉뚱한 사람을 대통령이라 우기게 됩니다. ‘지식의 경계’가 명확하지 않아서 생기는 문제입니다.
Step 2. 학습 (Training): 주입식 교육의 폐해
- SFT (지도 미세 조정): 모르는 건 “모른다”고 답해야 하는데, 우리는 모델에게 “무조건 답을 내놓으라”고 가르칩니다. 결국 모델은 ‘아는 척’하는 법을 배우게 되죠.
- RLHF (강화 학습): 여기서 ‘아첨(Sycophancy)’ 문제가 터집니다. 모델은 진실을 말하기보다, 인간 평가자가 좋아할 만한 답을 내놓는 쪽으로 진화합니다. 팩트보다 ‘따봉’이 더 중요한 셈이죠.
Step 3. 추론 (Inference): 섣부른 자신감
답변을 생성할 때 창의성을 높이려고 무작위성(Temperature)을 높이면, 문맥에 안 맞는 단어를 ‘찍을’ 확률이 높아집니다. 또, 긴 문서를 읽다가 중간 내용을 까먹거나(Lost in the Middle), 자기가 뱉은 첫마디가 맞다고 착각해 끝까지 우기는 ‘과잉 확신’에 빠지기도 합니다.
그래서, 어떻게 잡을까?
완벽한 해결책은 없지만, 유효한 전략은 있습니다.
- RAG (검색 증강 생성): 가장 현실적인 대안입니다. “외워서 풀지 말고, 책 보고 풀어”라고 시키는 거죠. 외부 데이터베이스에서 근거를 찾아 답하게 합니다. 물론, 엉뚱한 책을 가져오면 답도 없긴 합니다.
- 프롬프트 엔지니어링 & CoT: “단계별로 생각해(Chain-of-Thought)”라고 지시해 논리적 비약을 막습니다. 생각의 과정을 강제하면 거짓말할 확률이 확 줄어듭니다.
- 사실성 강화 디코딩: 기술적으로 추론 과정에서 팩트와 관련된 단어의 확률을 높이거나, 검색 결과와 다른 헛소리는 실시간으로 차단하는 방법입니다.
완벽한 AI는 없다
환각은 LLM이 확률적으로 단어를 생성하는 구조인 이상, 100% 없애는 건 불가능할지도 모릅니다. 하지만 ‘왜 틀리는지’ 정확히 진단하고, RAG나 검증 로직 같은 안전장치를 겹겹이 두른다면 비즈니스에서 통제 가능한 수준으로 억제할 수 있습니다.
지금 여러분의 서비스가 겪는 환각은 ‘지식이 부족해서’일까요, 아니면 ‘지시를 무시해서’일까요? 진단부터가 해결의 시작입니다.
