KAIST 강화학습 개론 · 프로젝트 ·
(한국식 포볼 카롬 당구 해결을 위한 강화학습: 희소한 보상에서의 메타-사전학습된 초기화 기법)
미정
KAIST 강화학습 개론 · 프로젝트 ·
미정
KAIST 소프트웨어 테스팅 자동화 · 프로젝트 ·
미정
KAIST 인공지능 개론 · 과제 3 · 팩맨 경연대회 상 ·
2대2 CTF 팩맨에서 deep RL 대신 hand-inspectable 42차원 선형 평가함수와, zoo-overfitting을 차단하는 held-out 검증 프로토콜로 일반화를 만든 팀이다. 학생 라운드로빈이 unseen distribution이라는 점을 정면에서 다룬 게 핵심이다.
KAIST 인공지능 개론 · 과제 2 ·
적대 다중 에이전트 탐색에서 흔히 한 덩어리로 묶이는 세 효과를 분리해 보인 분석이다. 행동 ordering이 가지치기 효율과 tie-breaking 두 차원으로 갈라진다는 점, 무작위 유령 앞에서 Minimax는 평가함수가 아니라 pessimism cascade로 깨진다는 점, 좁은 맵에서 −1 living penalty가 즉사를 지연된 죽음보다 strictly 높은 값으로 만들어 팩맨이 유령에게 돌진하는 "swift-death preference"가 나타난다는 점이다.
KAIST 인공지능 개론 · 과제 1 ·
DFS·BFS·UCS·A* 구현과 함께, Manhattan 대비 평균 34.4% 적은 노드를 expand하는 admissible 휴리스틱(Blockage Detection + Tarjan articulation Portal + dead-end peeling)을 제안한다. 다만 per-call 전처리 비용 때문에 단일 쿼리 wall-clock은 오히려 늦어진다 — 탐색 품질 vs 평가자 비용 트레이드오프를 깔끔하게 보인 사례다.
UNIST 기계학습 · 파이널 프로젝트 보고서 ·
특성 이상치 검출(클래스 가우시안 확률 p_i)과 라벨 이상치 검출(KNN 라벨 일관성 n_i)을 한 SVM에 통합하는 가중 슬랙 패널티 C_i = C·(p_i + n_i)/2를 제안한다. 곱셈이 아닌 가산 평균이 핵심으로, 한 신호가 무너져도(예: 가우시안이 깨지는 Titanic) 다른 쪽이 받쳐 "weakest link" 문제를 회피한다.
한국데이터베이스학회 학술대회 (KDBC) 2025 ·
라벨 엔트로피로부터 α = 1 − H/log|L|를 산출해, 구조 유사도(Jaccard)와 위치 유사도(Haversine)의 비중을 노드별로 적응 조절하는 라벨 전파를 제안한다. 이웃 라벨이 일치하면 구조가, 어긋나면 위치가 주도하면서 — 구조적으로 연결되어 있지만 지리적으로 떨어진 도시(예: 내슈빌·애틀랜타)를 시각적으로 분리한다.
UNIST 알고리즘 · 최우수논문상 ·
k-means로 도시를 22개 이하 클러스터로 쪼개 Held-Karp가 가능하게 만든 뒤, 클러스터 간/내부 TSP 모두 크기로 Held-Karp/Christofides를 갈라 푸는 4단계 하이브리드 솔버를 제안한다. mona-lisa100k에서 Christofides보다 약 8배 빠르고 비용도 약 2% 낮다. UNIST CSE331 최우수논문상.
UNIST 알고리즘 · 과제 1 ·
12종 정렬을 C++로 구현해 10³~10⁶ 입력에서 벤치마크한 보고서다. 새로 확인한 건 두 가지 — Lomuto Quick은 정렬 입력에서 불균형 재귀로 크래시하므로 중간값-3 피벗이 사실상 필수라는 점, 그리고 멀티스레드 Tim 변형은 스레드 오버헤드가 병합 이득을 상회해 단일 스레드보다 느려진다는 점이다.
ICROS (제어로봇시스템학회) 2024 ·
안장의 회전을 가변저항으로 읽고 STM32F303RE 기반 PID로 조향 모터를 추종하는, 핸들 없는 의자형 실내 모빌리티를 제안한다. 엑셀도 제거하고 발구름 시동으로 대체했다 — 이동 중에는 두 손과 발이 자유롭고, 멈추면 그대로 의자가 된다.
KR 10-2026-0027653 · 출원 2026-02-11