AI Engineer & Full-Stack Developer
AI 모델 서빙부터 풀스택 웹 개발, 인프라 구축까지 — 아이디어를 실제 서비스로 구현하는 엔지니어입니다. 현재 개인 GPU 서버에서 다양한 프로젝트를 운영하고 있습니다.
PyTorch 기반 모델 서빙, Diffusers 파이프라인, LLM 통합
Next.js, FastAPI, React로 엔드투엔드 웹 애플리케이션 개발
Docker, GPU 서버 관리, 셀프 호스팅 인프라 구축 및 운영
현재 운영 중인 서비스들

PyTorch 기반 AI 모델을 FastAPI로 서빙하는 고성능 추론 API 서버입니다. NVIDIA GPU(CUDA)를 활용하여 실시간 모델 추론을 제공하며, RESTful API를 통해 다양한 클라이언트에서 AI 기능을 활용할 수 있습니다.

다양한 LLM 모델과 상호작용할 수 있는 셀프 호스팅 웹 채팅 인터페이스입니다. OpenAI 호환 API를 통해 로컬 모델과 클라우드 모델을 모두 지원하며, 대화 히스토리 관리와 프롬프트 템플릿 기능을 제공합니다.

Next.js App Router와 Prisma ORM을 기반으로 구축한 전사적 자원관리(ERP) 시스템입니다. 재고 관리, 주문 처리, 매출 분석 등 핵심 비즈니스 프로세스를 통합 관리할 수 있으며, 직관적인 대시보드를 제공합니다.

Hugging Face Diffusers 파이프라인을 활용한 AI 기반 이미지 생성 및 편집 도구입니다. Gradio UI를 통해 텍스트-투-이미지, 이미지-투-이미지, 인페인팅 등 다양한 이미지 처리 기능을 직관적으로 사용할 수 있습니다.

Telegram, Slack, Discord 등 다양한 메시징 채널을 통합 관리하는 AI 게이트웨이 대시보드입니다. 로컬 LLM(Ollama)과 클라우드 모델을 연동하여 멀티채널 AI 어시스턴트를 운영하고, 실시간 모니터링과 설정 관리를 제공합니다.

웹 페이지를 서버사이드 프록시로 렌더링하면서, 사용자가 원치 않는 DOM 요소(광고, 메뉴, 배너 등)를 클릭 한 번으로 숨기고 복원할 수 있는 브라우저-in-브라우저 도구입니다. 숨김 규칙은 도메인별로 JSON 파일에 영속 저장되어, 같은 사이트를 다시 방문해도 자동 적용됩니다.

OpenAI STT/TTS와 3D VRM 아바타를 결합한 음성 기반 AI 학습 어시스턴트입니다. RAG 기반 학습 자료 검색, 실시간 음성 대화, 립싱크 3D 캐릭터 렌더링을 제공하며, 사용자가 캐릭터를 커스터마이징할 수 있습니다.

텍스트 프롬프트로 다양한 장르의 음악을 생성하는 AI 모델입니다. 50개 이상의 언어를 지원하며, 가사 기반 작곡, 오디오 편집, 커버 생성, LoRA 파인튜닝 등을 제공합니다. GPU 가속으로 수 초 내에 고품질 음악을 생성할 수 있습니다.
프로젝트에서 활용하는 기술 스택과 숙련도