AI 2명과 사용자 1명이 자연스럽게 영어로 대화하는 웹앱입니다. AI 2명?이 사용자의 유튜브 시청 기록, 구글 캘린더를 기반으로 ‘먼저’ 말을 걸어주고 대화를 이끌어 가는 컨셉입니다. AI가 2명이기 때문에 사용자가 무슨말을 해야할지 몰라 버벅일때는 다른 AI가 대화를 도와주거나, 사용자를 배제하고 2명의 AI가 서로 대화를 잠시 하면서 사용자를 자연스럽게 대화로 이끌어줍니다.
2. 핵심 기능 (MVP 범위)
기능
설명
Google 로그인
유튜브 시청기록 접근용 인증
YouTube 시청기록 불러오기
최근 영상 제목 3개만 추출
대화 주제 선택
영상 중 하나 선택하여 회화 시작
3자 영어 회화 생성 (Claude 기반)
Claude Haiku로 AI1, AI2, USER 구성 영어 대화 생성
텍스트 대화 UI
GPT 응답을 메신저 형태로 출력
하루 3회 제한
트래픽 관리 및 유료 구독 유도 가능성 확인
“프리미엄 안내” 배너
결제 없이 배너만 노출 (구독 유도 기반)
3. 핵심 기능 구현 순서도 (개발 단계)
백엔드 개발 (FastAPI)
Google OAuth 로그인 연동 (유튜브 API)
YouTube API 시청기록 연동
Claude API 다자 대화 구현
프론트엔드 UI 개발 (Next.js)
하루 대화 제한 로직 개발
프리미엄 배너 UI 추가
STT/TTS 음성 지원 추가 (선택)
모니터링 및 사용자 피드백 반영
4. 기술 전략 요약
항목
선택 전략
GPT 모델
Claude Haiku + GPT-4o fallback (10%)
STT (음성인식)
Google Speech-to-Text 또는 Vosk 무료 버전
TTS (음성생성)
PlayHT 또는 Google TTS 무료 버전
프론트엔드
Next.js + Tailwind CSS 반응형
앱 확장
React Native 앱 전환 가능 구조
백엔드
FastAPI or Node.js + REST API
로그인
Google OAuth (YouTube API)
5. 구조별 비용 비교
구조
월 비용
절감률
GPT-4o 전용
$36,900
–
GPT-3.5 전용
$29,650
약 20% ↓
혼합 최적화 구조 (Claude+무료음성)
$700
약 98% ↓
6. 예상 수익 모델 (사용자 1만 명)
항목
내용
월 고정비용
$700
월 수익 추정
500명 구독자 가정 ($9.9×500) = $4,950
순익
$4,250 이상
7. MVP 이후 시장출시 버전 기능 확장
✅ 잠재 고객 확대 (국내+국외)
✅ AI 주도형 대화 시작 컨셉 (AI가 먼저 시시때때로 말 걸기)
✅ 다수의 AI와 다수의 사용자가 참여하는 그룹 채팅방 기능
✅ 모바일 앱 출시 및 글로벌 스토어 출시
8. 기능 구현을 위한 백엔드·프론트엔드 개요 및 개발 순서
📌 백엔드 구성 개요
언어 및 프레임워크: Python (FastAPI), RESTful API 구조
AI 모델 연결: Claude Haiku API, GPT-4o fallback 구성
OAuth 인증: Google OAuth 2.0 (유튜브, 캘린더 API 접근)
데이터베이스: PostgreSQL 또는 MongoDB (사용자 및 대화 데이터 저장)
클라우드 서버: Railway 또는 Oracle Cloud (저비용 최적화)
📌 프론트엔드 구성 개요
프레임워크: Next.js (React 기반)
스타일링: Tailwind CSS (반응형 UI)
상태 관리: React Query, Zustand 또는 Redux 활용
음성 입출력(STT/TTS): Google Speech API, Vosk 및 PlayHT 등 무료 API 활용