KAIST AI Future Challenge 아이디어 공모전

배경

KAIST 학생정책처·학생생활처·교무처가 공동 주관한 AI Future Challenge 아이디어 공모전에서 「인지면역 AI (Cognitive Immune AI)」로 최우수상 (교학부총장상) 을 받았어요. 이어 열린 교육 혁신의 날에서 같은 주제로 발표할 기회도 얻었구요. 발표 자료는 여기서 볼 수 있어요 (PDF).

「인지면역 AI」를 한 줄로 말하면 — 도울수록 사용자의 사고력이 자라도록 만드는 AI 설계 철학 이에요. 학습 심리학의 두 고전, Bjork의 바람직한 어려움(Desirable Difficulty) 과 McGuire의 예방접종 이론(Inoculation Theory) 에 기대고 있어요. 약한 항원에 미리 노출되면 면역이 자라듯, 작은 인지적 도전이 독립적 사고의 근육을 만든다. 그 비유에서 “인지면역” 이라는 이름이 나왔어요.

발표의 출발점 — 코드를 짜기 전에

이 아이디어는 한 장면에서 시작했어요. 비대면으로 일하던 어느 날, 개발하면서 AI에 지나치게 의존하는 저 자신을 본 순간 이었어요. 답은 받았어요. 그런데 그 코드의 논리는 머리에 남지 않더라구요. 도와주는 도구가 어쩌다 저를 약하게 만들고 있는지, 그 의문에서 발표가 출발했어요.

LLM의 영향, 뇌까지 도달한 첫 증거

저 한 사람의 경험일 수도 있어서 데이터를 찾아봤어요. 2025년 MIT Media Lab의 “Your Brain on ChatGPT: Accumulation of Cognitive Debt” (Kos’myna et al., arXiv:2506.08872) 가 같은 신호를 보고하고 있었어요. 표본 54명, 알파 대역 EEG로 뇌 영역 간 정보 흐름의 강도 를 측정한 결과, AI 보조 글쓰기 집단의 뇌 연결성이 가장 낮았어요. 표본의 한계는 분명히 있지만 — LLM의 영향이 처음으로 뇌까지 도달한 신경학적 증거 라고 봐요.

계산기와는 다르다

“계산기, 검색엔진도 처음엔 그렇지 않았느냐” 는 반문이 따라와요. 맞아요. 계산기는 암산 을, 검색엔진은 기억 을 가져갔어요. 자연스러운 위임이었죠. 그런데 지금의 AI는 암산·기억은 물론, 문제 정의·비판적 판단·창의적 추론까지 가져가요. 사용자에게 남는 인지 작업이 뭔지 — 이건 아직 우리가 답하지 못한 질문이에요.

학습 심리학의 두 토대

그럼 해법은 어떤 원칙 위에 서야 할까. 학습 심리학에 이미 답의 절반이 있더라구요.

Bjork (1994) · 바람직한 어려움. 너무 쉬우면 흘려보내고, 너무 어려우면 포기해요. 그 사이의 적당한 도전 이 학습과 기억을 강화해요.
McGuire (1964) · 예방접종 이론(비유적 차용). 약한 항원에 미리 노출되면 저항력이 자라듯, 작은 인지적 도전 이 사고력을 단련해요.

→ 도전이 곧 면역이에요. 좋은 AI라면 우리를 약간 불편하게 만들 줄 알아야 해요.

기존 도구들의 공통된 한계

비슷한 결의 도구는 이미 있어요. 다만 모두가 한 칸씩 비어 있더라구요.

도구	정체	자동 작동	범용 작업
Khanmigo	답 대신 단계별 질문을 던지는 학습 AI	학습 모드만	교육 한정
Duolingo	게임 방식의 외국어 학습 앱	학습 모드만	언어 한정
Cursor Plan Mode	코드 작성 전 계획부터 세우게 하는 모드	수동으로 켜야	✓
Claude thinking	답하기 전 추론 과정을 보여주는 모드	수동으로 켜야	✓
인지면역 AI (본 제안)	—	평소에 자동	모든 작업

본 제안의 차별점은 단 하나예요 — 범용 AI가 평소 작업 중 자동으로 인지 도전을 삽입한다는 점.

해법 1 · 사용자 맞춤 강도

사용자마다 도전의 적정 강도가 달라요. 그래서 AI가 먼저 사용자 상태를 읽어야 해요. 네 가지 신호를 써요.

AI 부르기 전 직접 쓴 시간 — 얼마나 스스로 시도했는가
받은 답 그대로 쓰는 비율 — AI의 답을 수정 없이 받아쓰는가
같은 힌트 반복 요청 — 같은 종류의 도움을 계속 청하는가
질문이 어려워지는 속도 — 시간이 갈수록 더 어려운 질문을 던지는가

이 네 신호를 RLHF 보상에 “인지 참여” 항 으로 더해서, 힌트와 반론을 적절히 배합해요. 응급·접근성 상황이면 자동으로 곧바로 답하는 모드 로 빠지구요. 네 신호는 서로 교차 검증 되고, 결과물 품질로 한 번 더 확인되니까 신뢰성도 확보돼요.

해법 2 · Nudge 기반 자율성

“자동 작동” 이라는 말이 강제처럼 들릴 수 있어요. 그래서 핵심은 기본값을 뒤집는 거 예요.

도구	기본값	실제 사용
Cursor / Claude thinking	일반 모드	대부분 일반 모드 (켜기 귀찮음)
인지면역 AI	도전 모드	대부분 도전 모드 + 한 번이면 일반 모드로

행동경제학의 기본값 효과 (Default Effect, Thaler · Nudge 2008) 덕분에 사람은 기본값을 거의 바꾸지 않아요. 그래서 기본값이 곧 “자동 작동” 의 실효를 만들고, 동시에 토글 한 번이면 끌 수 있어서 강제는 아니에요. 차이는 단 하나 — 기본값. 그 하나가 강제 없이 자동 작동을 만들어요.

해법 3 · 인지독립률 (CII)

“그래서 사용자가 정말 자랐는가.” 측정할 수 없으면 검증도 못 해요. 그래서 앞의 네 신호를 가중평균 해서 0–100 점수, 즉 인지독립률 (CII, Cognitive Independence Index) 로 환산해요.

CII = 0.30 · log(편집시간)
    + 0.25 · (1 − 수락률)
    + 0.25 · (1 − 힌트반복)
    + 0.20 · Δ복잡도

가중치는 추후 실험으로 보정해요. 비유하자면 AI 사용의 BMI 예요 — 체중과 키로 BMI를 내서 건강을 보듯, AI 사용 패턴으로 사고 독립성 을 보는 거죠. 지금까지 우리는 AI 사용 량 만 측정했어요. CII는 AI 사용의 질 을 측정하는 첫 시도예요.

어떻게 실현하는가

새 모델은 필요 없어요. 기존 LLM 위에 한 층의 미들웨어 를 얹으면 돼요.

구성 요소	구현 방식
그대로 받는 신호 (편집시간 · 수락률)	IDE / 브라우저에서 이벤트로 바로 수집
해석이 필요한 신호 (반복 힌트 · 질문 난이도)	별도 분석 — 비슷한 질문끼리 묶거나, 저비용 LLM으로 평가
CII 계산	4개 신호 가중평균을 사용자 화면에 실시간 표시
인지 참여 보상	모델 재훈련 없이 프롬프트 레이어에서 먼저 검증 → 효과 확인되면 RLHF에 반영
배포	VS Code Extension · Chrome Extension · LLM Wrapper

검증 경로는 사용자를 두 그룹으로 나눠 A/B 테스트를 돌리고, 동일 과제에서 CII 변화량을 비교 하는 거예요.

마무리

「인지면역 AI」는 AI를 인간 대체 도구가 아니라, 인간 성장의 환경으로 재정의해보려는 시도예요. 언젠가는, 좋은 도구의 기준이 바뀌어야 할지도 몰라요. 사용자를 얼마나 잘 대신해주는가 가 아니라, 사용자를 얼마나 성장시키는가 로.

저는 어떤 사람이냐면요...