AI Engineer & Full-Stack Developer
AI 모델 서빙부터 풀스택 웹 개발, 인프라 구축까지 — 아이디어를 실제 서비스로 구현하는 엔지니어입니다. 현재 개인 GPU 서버에서 다양한 프로젝트를 운영하고 있습니다.
PyTorch 기반 모델 서빙, Diffusers 파이프라인, LLM 통합
Next.js, FastAPI, React로 엔드투엔드 웹 애플리케이션 개발
Docker, GPU 서버 관리, 셀프 호스팅 인프라 구축 및 운영
현재 운영 중인 서비스들

PyTorch 기반 AI 모델을 FastAPI로 서빙하는 고성능 추론 API 서버입니다. NVIDIA GPU(CUDA)를 활용하여 실시간 모델 추론을 제공하며, RESTful API를 통해 다양한 클라이언트에서 AI 기능을 활용할 수 있습니다.

다양한 LLM 모델과 상호작용할 수 있는 셀프 호스팅 웹 채팅 인터페이스입니다. OpenAI 호환 API를 통해 로컬 모델과 클라우드 모델을 모두 지원하며, 대화 히스토리 관리와 프롬프트 템플릿 기능을 제공합니다.

Next.js App Router와 Prisma ORM을 기반으로 구축한 전사적 자원관리(ERP) 시스템입니다. 재고 관리, 주문 처리, 매출 분석 등 핵심 비즈니스 프로세스를 통합 관리할 수 있으며, 직관적인 대시보드를 제공합니다.

Hugging Face Diffusers 파이프라인을 활용한 AI 기반 이미지 생성 및 편집 도구입니다. Gradio UI를 통해 텍스트-투-이미지, 이미지-투-이미지, 인페인팅 등 다양한 이미지 처리 기능을 직관적으로 사용할 수 있습니다.

Telegram, Slack, Discord 등 다양한 메시징 채널을 통합 관리하는 AI 게이트웨이 대시보드입니다. 로컬 LLM(Ollama)과 클라우드 모델을 연동하여 멀티채널 AI 어시스턴트를 운영하고, 실시간 모니터링과 설정 관리를 제공합니다.

웹 페이지를 서버사이드 프록시로 렌더링하면서, 사용자가 원치 않는 DOM 요소(광고, 메뉴, 배너 등)를 클릭 한 번으로 숨기고 복원할 수 있는 브라우저-in-브라우저 도구입니다. 숨김 규칙은 도메인별로 JSON 파일에 영속 저장되어, 같은 사이트를 다시 방문해도 자동 적용됩니다.

OpenAI STT/TTS와 3D VRM 아바타를 결합한 음성 기반 AI 학습 어시스턴트입니다. RAG 기반 학습 자료 검색, 실시간 음성 대화, 립싱크 3D 캐릭터 렌더링을 제공하며, 사용자가 캐릭터를 커스터마이징할 수 있습니다.

텍스트 프롬프트로 다양한 장르의 음악을 생성하는 AI 모델입니다. 50개 이상의 언어를 지원하며, 가사 기반 작곡, 오디오 편집, 커버 생성, LoRA 파인튜닝 등을 제공합니다. GPU 가속으로 수 초 내에 고품질 음악을 생성할 수 있습니다.

로컬 LLM(Ollama)과 대화하면서 응답을 바이오닉 리딩 형식으로 실시간 확인하고, URL이나 문서(PDF/DOCX/TXT)에서 텍스트를 추출하여 RSVP 속독 모드로 읽을 수 있는 웹 앱입니다. 단어의 앞부분을 굵게 표시하여 뇌가 나머지를 자동 완성하도록 유도하는 바이오닉 리딩 기술을 적용했습니다.

사용자가 닉네임과 손글씨 샘플을 등록하면, AI 모델이 새 손글씨를 분석하여 누구의 필체인지 식별하는 게임입니다. 리더보드와 모델 성능 통계를 제공하며, 관리자 페이지에서 모델 학습과 데이터 관리가 가능합니다.

Claude, GPT-4o, Gemini 등 다양한 AI 모델을 팀원으로 등록하고, 아바타를 커스터마이징하여 프로젝트 단위로 AI 협업을 진행할 수 있는 워크스페이스입니다. Electron 데스크탑 앱과 웹 앱 모두 지원합니다.

수학 문제 이미지나 텍스트를 로컬 VLM(minicpm-v)으로 분석하여 해당하는 2022 수학 교육과정 요소를 자동 식별하고, Three.js 기반 인터랙티브 3D 히트맵으로 시각화합니다. 초등 1학년부터 고등 3학년까지 115개 토픽의 관계와 선수학습 체계를 한눈에 파악할 수 있습니다.

1자리+1자리부터 3자리-3자리까지 10단계로 구성된 아이 수학 학습 앱입니다. 80% 이상 정답 시 자동 레벨업되며, 메모장(캔버스), 모으기/가르기(수 분해), 세로셈 등 학습 보조 도구를 제공합니다. 일일 목표 설정과 학습 기록 추적 기능이 포함되어 있습니다.

공문서 작성 규칙과 형식을 퀴즈로 학습할 수 있는 웹 앱입니다. 예시 공문서를 보면서 빈칸 채우기, 올바른 형식 선택 등 다양한 유형의 문제를 풀며 공문서 작성 능력을 향상시킬 수 있습니다.

공문서 작성 규칙을 학습하고, 작성한 답안을 로컬 LLM(gpt-oss:120b)이 실시간으로 채점하여 상세 피드백을 제공하는 퀴즈 앱입니다. 규칙 기반 채점과 AI 채점을 병행하여 날짜 표기, 항목 기호, 붙임 표기, 금액 표기 등 세부 규칙별 오류를 분석합니다.

아이스크림미디어 개인정보 유출 사고 CS 응대를 위한 AI 자동화 봇입니다. 고객 유형(6가지)을 자동 감지하고, SAVE 모델 기반 감동 응대 전략으로 3건의 CS를 동시에 병렬 처리합니다. 매번 다른 자연스러운 답변을 생성하며, 외부 API 확장이 가능한 프로바이더 구조로 설계되었습니다.

부모가 검색 키워드와 최대 영상 길이를 설정하면 YouTube에서 안전한 영상을 검색하고, 아이가 영상을 시청한 후 Claude AI가 생성한 퀴즈를 풀며 학습합니다. 시청 완료 후 자동으로 학습지(요약, 핵심 단어, 퀴즈 결과)가 생성되며, 부모 대시보드에서 학습 현황을 확인할 수 있습니다.

아이가 캐릭터를 선택하고 미로 속에서 집을 찾아가는 게임입니다. DFS 알고리즘으로 매번 새로운 미로가 생성되며, 장애물과 별 아이템이 배치됩니다. 문제를 풀 때마다 쉬움/어려움을 선택하여 난이도를 조절하고, 제한 시간 안에 도착하는 것이 목표입니다. 터치와 키보드 모두 지원합니다.

카드를 뒤집어 같은 그림의 짝을 찾는 기억력 게임입니다. 솔로 모드에서는 레벨이 올라갈수록 카드 수가 증가하며(4×2 → 8×6) 시간과 시도 횟수를 기록합니다. 2인 모드에서는 번갈아 카드를 뒤집고 매칭 실패 시 턴이 교대되며, 더 많은 짝을 맞춘 플레이어가 승리합니다.
음성 입력을 faster-whisper로 인식하고, 로컬 LLM(gpt-oss:120b)으로 응답을 생성한 뒤, Kokoro TTS로 음성을 합성하는 실시간 AI 아바타입니다. WebSocket 기반 스트리밍으로 자연스러운 대화가 가능하며, 텍스트 입력도 지원합니다. MuseTalk 립싱크 통합 예정.
프로젝트에서 활용하는 기술 스택과 숙련도