AI Engineer & Full-Stack Developer
AI 모델 서빙부터 풀스택 웹 개발, 인프라 구축까지 — 아이디어를 실제 서비스로 구현하는 엔지니어입니다. 현재 개인 GPU 서버에서 다양한 프로젝트를 운영하고 있습니다.
PyTorch 기반 모델 서빙, Diffusers 파이프라인, LLM 통합
Next.js, FastAPI, React로 엔드투엔드 웹 애플리케이션 개발
Docker, GPU 서버 관리, 셀프 호스팅 인프라 구축 및 운영
현재 운영 중인 서비스들

PyTorch 기반 AI 모델을 FastAPI로 서빙하는 고성능 추론 API 서버입니다. NVIDIA GPU(CUDA)를 활용하여 실시간 모델 추론을 제공하며, RESTful API를 통해 다양한 클라이언트에서 AI 기능을 활용할 수 있습니다.

다양한 LLM 모델과 상호작용할 수 있는 셀프 호스팅 웹 채팅 인터페이스입니다. OpenAI 호환 API를 통해 로컬 모델과 클라우드 모델을 모두 지원하며, 대화 히스토리 관리와 프롬프트 템플릿 기능을 제공합니다.

Next.js App Router와 Prisma ORM을 기반으로 구축한 전사적 자원관리(ERP) 시스템입니다. 재고 관리, 주문 처리, 매출 분석 등 핵심 비즈니스 프로세스를 통합 관리할 수 있으며, 직관적인 대시보드를 제공합니다.
Hugging Face Diffusers 파이프라인을 활용한 AI 기반 이미지 생성 및 편집 도구입니다. Gradio UI를 통해 텍스트-투-이미지, 이미지-투-이미지, 인페인팅 등 다양한 이미지 처리 기능을 직관적으로 사용할 수 있습니다.

Telegram, Slack, Discord 등 다양한 메시징 채널을 통합 관리하는 AI 게이트웨이 대시보드입니다. 로컬 LLM(Ollama)과 클라우드 모델을 연동하여 멀티채널 AI 어시스턴트를 운영하고, 실시간 모니터링과 설정 관리를 제공합니다.

웹 페이지를 서버사이드 프록시로 렌더링하면서, 사용자가 원치 않는 DOM 요소(광고, 메뉴, 배너 등)를 클릭 한 번으로 숨기고 복원할 수 있는 브라우저-in-브라우저 도구입니다. 숨김 규칙은 도메인별로 JSON 파일에 영속 저장되어, 같은 사이트를 다시 방문해도 자동 적용됩니다.

OpenAI STT/TTS와 3D VRM 아바타를 결합한 음성 기반 AI 학습 어시스턴트입니다. RAG 기반 학습 자료 검색, 실시간 음성 대화, 립싱크 3D 캐릭터 렌더링을 제공하며, 사용자가 캐릭터를 커스터마이징할 수 있습니다.

텍스트 프롬프트로 다양한 장르의 음악을 생성하는 AI 모델입니다. 50개 이상의 언어를 지원하며, 가사 기반 작곡, 오디오 편집, 커버 생성, LoRA 파인튜닝 등을 제공합니다. GPU 가속으로 수 초 내에 고품질 음악을 생성할 수 있습니다.

로컬 LLM(Ollama)과 대화하면서 응답을 바이오닉 리딩 형식으로 실시간 확인하고, URL이나 문서(PDF/DOCX/TXT)에서 텍스트를 추출하여 RSVP 속독 모드로 읽을 수 있는 웹 앱입니다. 단어의 앞부분을 굵게 표시하여 뇌가 나머지를 자동 완성하도록 유도하는 바이오닉 리딩 기술을 적용했습니다.

사용자가 닉네임과 손글씨 샘플을 등록하면, AI 모델이 새 손글씨를 분석하여 누구의 필체인지 식별하는 게임입니다. 리더보드와 모델 성능 통계를 제공하며, 관리자 페이지에서 모델 학습과 데이터 관리가 가능합니다.

Claude, GPT-4o, Gemini 등 다양한 AI 모델을 팀원으로 등록하고, 아바타를 커스터마이징하여 프로젝트 단위로 AI 협업을 진행할 수 있는 워크스페이스입니다. Electron 데스크탑 앱과 웹 앱 모두 지원합니다.

수학 문제 이미지나 텍스트를 로컬 VLM(minicpm-v)으로 분석하여 해당하는 2022 수학 교육과정 요소를 자동 식별하고, Three.js 기반 인터랙티브 3D 히트맵으로 시각화합니다. 초등 1학년부터 고등 3학년까지 115개 토픽의 관계와 선수학습 체계를 한눈에 파악할 수 있습니다.

1자리+1자리부터 3자리-3자리까지 10단계로 구성된 아이 수학 학습 앱입니다. 80% 이상 정답 시 자동 레벨업되며, 메모장(캔버스), 모으기/가르기(수 분해), 세로셈 등 학습 보조 도구를 제공합니다. 일일 목표 설정과 학습 기록 추적 기능이 포함되어 있습니다.

공문서 작성 규칙과 형식을 퀴즈로 학습할 수 있는 웹 앱입니다. 예시 공문서를 보면서 빈칸 채우기, 올바른 형식 선택 등 다양한 유형의 문제를 풀며 공문서 작성 능력을 향상시킬 수 있습니다.

공문서 작성 규칙을 학습하고, 작성한 답안을 로컬 LLM(gpt-oss:120b)이 실시간으로 채점하여 상세 피드백을 제공하는 퀴즈 앱입니다. 규칙 기반 채점과 AI 채점을 병행하여 날짜 표기, 항목 기호, 붙임 표기, 금액 표기 등 세부 규칙별 오류를 분석합니다.

아이스크림미디어 개인정보 유출 사고 CS 응대를 위한 AI 자동화 봇입니다. 고객 유형(6가지)을 자동 감지하고, SAVE 모델 기반 감동 응대 전략으로 3건의 CS를 동시에 병렬 처리합니다. 매번 다른 자연스러운 답변을 생성하며, 외부 API 확장이 가능한 프로바이더 구조로 설계되었습니다.

부모가 검색 키워드와 최대 영상 길이를 설정하면 YouTube에서 안전한 영상을 검색하고, 아이가 영상을 시청한 후 Claude AI가 생성한 퀴즈를 풀며 학습합니다. 시청 완료 후 자동으로 학습지(요약, 핵심 단어, 퀴즈 결과)가 생성되며, 부모 대시보드에서 학습 현황을 확인할 수 있습니다.

아이가 캐릭터를 선택하고 미로 속에서 집을 찾아가는 게임입니다. DFS 알고리즘으로 매번 새로운 미로가 생성되며, 장애물과 별 아이템이 배치됩니다. 문제를 풀 때마다 쉬움/어려움을 선택하여 난이도를 조절하고, 제한 시간 안에 도착하는 것이 목표입니다. 터치와 키보드 모두 지원합니다.

카드를 뒤집어 같은 그림의 짝을 찾는 기억력 게임입니다. 솔로 모드에서는 레벨이 올라갈수록 카드 수가 증가하며(4×2 → 8×6) 시간과 시도 횟수를 기록합니다. 2인 모드에서는 번갈아 카드를 뒤집고 매칭 실패 시 턴이 교대되며, 더 많은 짝을 맞춘 플레이어가 승리합니다.
음성 입력을 faster-whisper로 인식하고, 로컬 LLM(gpt-oss:120b)으로 응답을 생성한 뒤, Kokoro TTS로 음성을 합성하는 실시간 AI 아바타입니다. WebSocket 기반 스트리밍으로 자연스러운 대화가 가능하며, 텍스트 입력도 지원합니다. MuseTalk 립싱크 통합 예정.

Remotion으로 마크다운을 슬라이드 영상으로 렌더링하는 프로젝트입니다. 같은 원본 마크다운에서 프레젠터(라이브), 16:9 슬라이드 영상, 9:16 쇼츠를 모두 출력할 수 있습니다. 로컬 LLM(Ollama gemma4)에 프롬프트를 보내 슬라이드 마크다운과 DESIGN.md/THEME.generated.json까지 자동 생성하는 파이프라인이 통합되어 있습니다.

Ollama로 서빙되는 Gemma 4 모델(e2b/e4b/26b/31b)과 직접 대화할 수 있는 Next.js 기반 채팅 인터페이스입니다. 마크다운 렌더링과 GFM(테이블, 체크리스트)을 지원하며, 모델 크기를 즉시 전환해 응답 속도와 품질을 비교할 수 있습니다.
Datalab의 Chandra OCR 2 모델을 GPU 기반으로 셀프 호스팅하는 OCR 서비스입니다. 단순 텍스트 추출이 아니라 레이아웃·표·수식·다국어를 모두 보존하면서 HTML, Markdown, JSON 등 구조화된 형식으로 변환합니다. 이미지·PDF 모두 입력 가능합니다.

영어 단어와 문법 개념의 관계를 인터랙티브 그래프와 3D 공간으로 시각화하는 학습 도구입니다. D3 force layout으로 의미 관계를 표현하고, Three.js로 차원별 분포를 3D로 탐색할 수 있습니다. SQLite로 학습 기록을 영속화합니다.

한국어로 표현하고 싶은 문장을 입력하면 OpenAI 모델이 원어민이 실제로 쓰는 자연스러운 영어 표현으로 교정·확장해주는 학습 도구입니다. 단순 번역이 아니라 상황별 뉘앙스·격식 차이까지 함께 알려줍니다.

교실에서 모둠별로 진행하는 방탈출 게임 플랫폼입니다. 교사가 미션을 만들고 QR로 배포하면, 학생들이 모바일로 단서를 풀어가며 진행도가 실시간으로 표시됩니다. better-sqlite3로 데이터 영속화, qrcode.react로 즉시 QR 생성을 처리합니다.

교사 업무를 종합 지원하는 AI 플랫폼입니다. 생기부 생성·검사, 서술형 채점, 평가계획서 작성, 라이브러리 관리, AI 채팅을 한 곳에서 처리할 수 있습니다. PocketBase 기반 인증과 Vercel AI SDK로 OpenAI 호환 모델을 연동합니다.

교실에서 사용할 인터랙티브 위젯을 Claude API로 코드 생성하고, react-grid-layout으로 자유롭게 배치할 수 있는 워크스페이스입니다. Google OAuth로 인증하며, Prisma + PostgreSQL로 사용자별 워크스페이스를 영속화합니다. esbuild로 위젯 런타임을 자체 빌드합니다.

부모가 녹음한 목소리로 아이에게 동화를 들려주는 보이스북 앱입니다. 책 단위로 페이지를 구성하고, 각 페이지마다 부모 음성을 녹음·재생할 수 있습니다. PocketBase로 책/녹음 데이터를 관리하며 아이가 직접 사용할 수 있도록 인증 없이 공개되어 있습니다.

한글(HWP/HWPX) 문서를 보고 편집할 수 있는 오픈소스 뷰어·에디터 모노레포입니다. 파싱·렌더링은 Rust로 작성된 rhwp 엔진을 WASM으로 빌드해 사용하고, 그 위에 Tauri로 macOS/Windows/Linux 데스크탑 앱을, Next.js로 웹 스튜디오를 얹었습니다. PDF 내보내기·인쇄·파일 연결 등 OS 통합 기능을 지원합니다.

성인 학습자를 위한 AIDA 챗봇 허브입니다. 인터랙티브 PPT, 퀴즈 게임, 워크시트 생성·공유, 모둠 활동 도움 기능을 한 곳에서 제공합니다. Zustand로 클라이언트 상태를 관리하고 Next.js 14 + Tailwind 3로 안정적인 학습 UX를 제공합니다.

블로그 글을 관리하면서 썸네일 이미지까지 한 번에 생성·다운로드할 수 있는 관리자 도구입니다. better-sqlite3로 글 데이터를 로컬 영속화하고, html2canvas-pro로 컴포넌트를 그대로 PNG/JPEG로 캡처합니다. Next.js 16 + React 19 + Tailwind v4로 빌드되었습니다.

BlockNote 리치 텍스트 에디터로 작성한 노트에 Claude API로 자동 요약·태깅·연결을 적용하는 개인 지식 관리 앱입니다. PocketBase로 노트를 영속화하고, Chrome 확장에서 웹 페이지를 즉시 클립할 수 있습니다.

사용자의 글·메일·문서를 로컬 Ollama로만 처리해 개인 위키와 지식 그래프를 자동 구축하는 시스템입니다. 모든 노드는 사람이 읽을 수 있는 마크다운으로 저장되어 git으로 버전 관리할 수 있고, 6시간마다 가벼운 성찰, 매일 03시 깊은 성찰 사이클로 패턴·모순·누락된 관계를 스스로 보충합니다.

Canopy Labs의 Orpheus TTS를 셀프 호스팅한 음성 합성 서비스입니다. Llama-3b 백본 위에서 자연스러운 인토네이션·감정·리듬을 생성하며, 사전 파인튜닝 없이 음성 클로닝(zero-shot)이 가능합니다. 200ms 스트리밍 레이턴시로 실시간 응용에 적합합니다.

아이가 그린 그림을 업로드하고, PocketBase로 작품을 영속화하며, ComfyUI 워크플로로 AI 스타일 변형까지 가능한 가족용 미술 포트폴리오입니다. /pb/* 와 /comfy/* 가 동일 도메인에서 분기되어 단일 SPA로 모든 기능을 사용합니다.
프로젝트에서 활용하는 기술 스택과 숙련도