AI_dude MVP & 출시버전 기획서

🎯 AI_dude 영어회화 MVP 및 시장출시 버전 기획서

1. 프로젝트 개요

AI 2명과 사용자 1명이 자연스럽게 영어로 대화하는 웹앱입니다. AI 2명?이 사용자의 유튜브 시청 기록, 구글 캘린더를 기반으로 ‘먼저’ 말을 걸어주고 대화를 이끌어 가는 컨셉입니다. AI가 2명이기 때문에 사용자가 무슨말을 해야할지 몰라 버벅일때는 다른 AI가 대화를 도와주거나, 사용자를 배제하고 2명의 AI가 서로 대화를 잠시 하면서 사용자를 자연스럽게 대화로 이끌어줍니다.

2. 핵심 기능 (MVP 범위)

기능설명
Google 로그인유튜브 시청기록 접근용 인증
YouTube 시청기록 불러오기최근 영상 제목 3개만 추출
대화 주제 선택영상 중 하나 선택하여 회화 시작
3자 영어 회화 생성 (Claude 기반)Claude Haiku로 AI1, AI2, USER 구성 영어 대화 생성
텍스트 대화 UIGPT 응답을 메신저 형태로 출력
하루 3회 제한트래픽 관리 및 유료 구독 유도 가능성 확인
“프리미엄 안내” 배너결제 없이 배너만 노출 (구독 유도 기반)

3. 핵심 기능 구현 순서도 (개발 단계)

  1. 백엔드 개발 (FastAPI)
  2. Google OAuth 로그인 연동 (유튜브 API)
  3. YouTube API 시청기록 연동
  4. Claude API 다자 대화 구현
  5. 프론트엔드 UI 개발 (Next.js)
  6. 하루 대화 제한 로직 개발
  7. 프리미엄 배너 UI 추가
  8. STT/TTS 음성 지원 추가 (선택)
  9. 모니터링 및 사용자 피드백 반영

4. 기술 전략 요약

항목선택 전략
GPT 모델Claude Haiku + GPT-4o fallback (10%)
STT (음성인식)Google Speech-to-Text 또는 Vosk 무료 버전
TTS (음성생성)PlayHT 또는 Google TTS 무료 버전
프론트엔드Next.js + Tailwind CSS 반응형
앱 확장React Native 앱 전환 가능 구조
백엔드FastAPI or Node.js + REST API
로그인Google OAuth (YouTube API)

5. 구조별 비용 비교

구조월 비용절감률
GPT-4o 전용$36,900
GPT-3.5 전용$29,650약 20% ↓
혼합 최적화 구조 (Claude+무료음성)$700약 98% ↓

6. 예상 수익 모델 (사용자 1만 명)

항목내용
월 고정비용$700
월 수익 추정500명 구독자 가정 ($9.9×500) = $4,950
순익$4,250 이상

7. MVP 이후 시장출시 버전 기능 확장

  • 잠재 고객 확대 (국내+국외)
  • AI 주도형 대화 시작 컨셉 (AI가 먼저 시시때때로 말 걸기)
  • 다수의 AI와 다수의 사용자가 참여하는 그룹 채팅방 기능
  • ✅ 모바일 앱 출시 및 글로벌 스토어 출시

8. 기능 구현을 위한 백엔드·프론트엔드 개요 및 개발 순서

📌 백엔드 구성 개요

  • 언어 및 프레임워크: Python (FastAPI), RESTful API 구조
  • AI 모델 연결: Claude Haiku API, GPT-4o fallback 구성
  • OAuth 인증: Google OAuth 2.0 (유튜브, 캘린더 API 접근)
  • 데이터베이스: PostgreSQL 또는 MongoDB (사용자 및 대화 데이터 저장)
  • 클라우드 서버: Railway 또는 Oracle Cloud (저비용 최적화)

📌 프론트엔드 구성 개요

  • 프레임워크: Next.js (React 기반)
  • 스타일링: Tailwind CSS (반응형 UI)
  • 상태 관리: React Query, Zustand 또는 Redux 활용
  • 음성 입출력(STT/TTS): Google Speech API, Vosk 및 PlayHT 등 무료 API 활용
  • 다국어 지원: i18n 모듈 (해외 고객용)

🔧 상세 개발 순서 (백엔드 → 프론트엔드)

  1. 백엔드 프로젝트 초기 설정
    • FastAPI 환경 세팅 및 Docker 구성
    • 환경변수 및 API 키 관리 (.env)

  2. OAuth 및 Google API 연동
    • Google OAuth2 로그인 구현
    • 유튜브 API: 사용자의 최근 시청 기록 불러오기 구현
    • 구글 캘린더 API: 일정 데이터 불러오기 구현

  3. Claude 및 GPT API 통합 개발
    • Claude Haiku 모델로 AI 다자 대화 엔드포인트 구현
    • GPT-4o fallback 엔드포인트 추가 개발

  4. 백엔드 데이터베이스 연결
    • PostgreSQL 혹은 MongoDB 연결
    • 대화 기록, 사용자 정보 스키마 설계 및 CRUD 구현

  5. 프론트엔드 프로젝트 설정
    • Next.js 초기 구성 및 Tailwind CSS 연동
    • API 호출용 React Query 설정

  6. 사용자 로그인 및 인증 UI 개발
    • Google OAuth 로그인 UI 개발
    • 로그인 상태 유지 (쿠키 or JWT)

  7. 대화 UI 개발 및 백엔드 연동
    • 텍스트 기반 다자 대화 UI 구현
    • Claude 및 GPT 엔드포인트 연동
    • 일일 사용 제한 기능 추가

  8. 프리미엄 배너 및 결제 안내 UI 추가
    • 구독 유도용 안내 배너 디자인 및 노출