아이디어를 '작동하는 서비스'로. 코드는 AI가, 사람은 의도·검증·방향에 집중하는 단계별 로드맵.
🎯 오늘의 목표
본격적인 개발 전, 팀의 속도를 결정짓는 것은 도구와 환경입니다. 마우스 클릭만으로 협업을 시작할 수 있는 4단계 세팅을 끝냅니다.
(GitHub 저장소) 팀 공용 코드/문서 저장소(폴더 구조) Docs as Code 기반 Markdown 폴더 설계“기초 세팅이 완료되었다면, 이제 우리가 풀고자 하는 '진짜 문제'에 집중할 시간입니다.”
🎯 오늘의 목표
해결할 문제 후보 3개를 도출하고, 사용자가 반복적으로 겪는 고통(Pain Point)을 관찰해 기록합니다.
problem_A.md 문제 후보 A 정의problem_B.md 문제 후보 B 정의problem_C.md 문제 후보 C 정의🎯 오늘의 목표
후보 중 'AI로 풀기에 적합한가?'를 기준으로 최종 문제를 확정하고, 문제와 비전을 문서로 정리합니다.
problem.md 최종 확정 문제 정의vision.md 프로젝트가 그리는 비전🎯 오늘의 목표
사용자가 우리 서비스로 문제를 해결하는 이상적인 시나리오를 쓰고, MVP의 성공 기준을 단 한 문장으로 정의합니다.
scenario.md 이상적 사용자 시나리오success.md MVP 성공 기준 (한 문장)🎯 오늘의 목표
핵심 기능 PRD(제품 요구사항 문서)를 완성하고, 곧바로 프로토타입으로 기술적 실현 가능성을 검증합니다.
prd.md 핵심 기능 제품 요구사항 문서(프로토타입) v0/Cursor Composer로 만든 화면 스케치“설계도가 완성되었습니다. 이제 AI의 도움을 받아 실제로 작동하는 첫 번째 버전을 만들어 보겠습니다.”
🎯 오늘의 목표
단일 LLM + CLI 기반으로 최소 기능을 구현하고, Streamlit/Gradio로 조기에 임시 배포합니다.
trd.md (v1) 기술 요구사항 문서 1판(임시 배포 URL) Streamlit/Gradio + Cloudflare Tunnel🎯 오늘의 목표
단일 흐름이던 V1을 모듈 단위로 확장해 기능을 늘리고, 자동 평가(Harness)를 붙일 준비를 합니다.
(모듈 구조) 확장된 기능 모듈 설계🎯 오늘의 목표
테스트 케이스를 15개 이상(Basic·Edge·Safety)으로 늘리고, LLM-judge와 Tool mock으로 자동화된 평가 체계를 구축합니다.
(테스트 스위트) 15개+ 테스트 케이스 & 자동 평가🎯 오늘의 목표
모델 라우팅(2개 모델)을 도입하고, Pass Rate와 LLM-Judge로 모델별 성능을 비교해 최적 모델을 선택합니다.
(모델 비교 리포트) Pass Rate / LLM-Judge 결과🎯 오늘의 목표
RAG 또는 Fine-tuning으로 도메인에 특화시키고, Domain 특화 Eval로 검증하며, 아키텍처 결정 기록(ADR)을 남깁니다.
ADR 아키텍처 결정 기록🎯 오늘의 목표
Pre-LLM·Post-LLM·Tool Guardrail을 구축하고, 서비스 공개 전 Cloudflare WAF로 악성 트래픽을 막습니다.
(가드레일 구성) Pre/Post/Tool Guardrail + WAF“기술적 구현이 성숙해졌다면, 이제 외부의 시선으로 프로젝트를 객관화할 단계입니다.”
🎯 오늘의 목표
Mermaid로 DFD(데이터 흐름도)와 시퀀스 다이어그램을 만들고, 문서를 참조(Reference)/결정(Decision)으로 이원화합니다.
dfd.md Mermaid 기반 데이터 흐름도🎯 오늘의 목표
중간 데모를 진행하고, 체크리스트로 피드백을 점검하여 PRD/TRD에 반영할 항목을 정리합니다.
feedback.md 중간 데모 피드백 & 반영 계획“피드백은 수용하는 것만큼이나 어떻게 반영하느냐가 중요합니다. 이제 최종 개선에 돌입합니다.”
🎯 오늘의 목표
피드백을 바탕으로 prd.md v2, trd.md v4로 문서를 갱신하고, Git 커밋 기록으로 Changelog를 만듭니다.
prd.md (v2) 갱신된 제품 요구사항trd.md (v4) 갱신된 기술 요구사항CHANGELOG.md AI로 생성한 변경 이력🎯 오늘의 목표
Cloudflare 커스텀 도메인과 HTTPS를 적용하고, README.md를 최신 상태로 정리합니다.
README.md 프로젝트 소개·실행 안내(정식 배포) Cloudflare 커스텀 도메인 + HTTPS🎯 오늘의 목표
최종 Eval을 돌리고, 초기 테스터에게 재검증을 받아 전/후 반응을 비교해 성과를 기록합니다.
final_report.md 전/후 비교 및 성과 기록🎯 오늘의 목표
Problem · Demo · Eval · Iteration 4대 요소를 중심으로 16일의 여정을 발표합니다.
(발표 자료) Problem · Demo · Eval · Iteration 4대 요소“16일간의 여정이 끝났습니다. 이제 당신의 프로젝트는 단순한 코드를 넘어 누군가의 문제를 해결하는 서비스가 되었습니다.”
# 문제 후보 [A] ## 누구의 문제인가 (대상 사용자) - ## 어떤 상황에서 겪는가 - ## 반복적으로 겪는 페인 포인트 (관찰/인터뷰 근거) - - ## 지금은 어떻게 (불편하게) 해결하고 있나 - ## 이 문제가 중요한 이유 -
# 문제 정의 (problem.md) ## 확정된 문제 한 문장 > ## 대상 사용자 - ## 핵심 페인 포인트 - ## AI 적합성 판단 (왜 AI로 풀기 적합한가) - ## 후보 A·B·C 중 이 문제를 고른 이유 - ## 범위 (이번 16일에 다루는 것 / 다루지 않는 것) - 다룬다: - 다루지 않는다:
# 비전 (vision.md) ## 한 줄 비전 > ## 이 서비스가 없을 때 vs 있을 때 - 없을 때: - 있을 때: ## 궁극적으로 사용자에게 주는 가치 - ## 성공했을 때의 모습 -
# 이상적 시나리오 (scenario.md) ## 등장 인물 (사용자) - 이름/역할: - 상황: ## 이상적인 흐름 (Before → 사용 → After) 1. (Before) 사용자는 지금 ____ 때문에 불편하다. 2. 사용자가 우리 서비스에서 ____ 한다. 3. 서비스는 ____ 해준다. 4. (After) 결국 사용자는 ____ 하게 된다. ## 이 시나리오에서 가장 중요한 '결정적 순간' -
# MVP 성공 기준 (success.md) ## 성공 기준 한 문장 > (예: "테스터가 기존 30분 걸리던 작업을 5분 안에 끝낸다.") ## 측정 방법 - 무엇을: - 어떻게 측정: - 목표 수치: ## 성공/실패 판단 시점 -
# PRD - 제품 요구사항 문서 (prd.md) ## 문서 버전 - v1 (DAY 4) / 이후 v2 (DAY 13) ## 한 줄 제품 설명 > ## 핵심 기능 (우선순위 순) 1. [필수] 2. [필수] 3. [선택] ## 각 기능별 사용자 스토리 - (사용자)는 (목적)을 위해 (행동)을 할 수 있다. ## 화면/흐름 개요 - ## 이번 버전에서 하지 않는 것 (Out of Scope) - ## 성공 지표 (success.md 연동) -
# TRD - 기술 요구사항 문서 (trd.md) ## 문서 버전 - v1 (DAY 5) → v4 (DAY 13) ## 시스템 개요 - ## 기술 스택 - LLM/모델: - 프론트/데모: (CLI → Streamlit/Gradio → 정식) - 인프라/배포: (Cloudflare Tunnel → 커스텀 도메인 + HTTPS) ## 주요 모듈 구성 - 모듈 1: - 모듈 2: ## 평가(Eval) 방식 - 테스트 케이스 수: (Basic / Edge / Safety) - 채점 방식: (Pass Rate / LLM-judge) ## 가드레일 - Pre-LLM(입력 검사): - Post-LLM(출력 검증): - Tool Guardrail: - PII 마스킹 / 프롬프트 인젝션 탐지:
# ADR-0001: [결정 제목] ## 상태 - 제안 / 채택 / 폐기 (택1) ## 맥락 (어떤 상황에서 결정이 필요했나) - ## 결정 (무엇을 선택했나) - (예: 도메인 특화를 위해 Fine-tuning 대신 RAG를 채택한다.) ## 이유 (왜 이 선택인가) - ## 고려했지만 택하지 않은 대안 - ## 결과 / 영향 -
# 데이터 흐름도 (dfd.md)
```mermaid
flowchart LR
User([사용자 입력]) --> Pre[입력 검사 / 전처리]
Pre --> LLM[LLM 처리]
LLM --> Post[출력 검증 / 가드레일]
Post --> Result([결과 반환])
LLM -.참고.-> KB[(지식베이스 / RAG)]
```
## 흐름 설명
1. 사용자 입력이 들어온다.
2. 전처리·입력 검사를 거친다.
3. LLM이 (필요 시 RAG로 자료를 참고해) 처리한다.
4. 출력 검증/가드레일을 통과한다.
5. 결과를 사용자에게 돌려준다.
# 중간 데모 피드백 (feedback.md) ## 데모 개요 - 일시 / 대상: ## 체크리스트 점검 결과 - [ ] 페인 포인트가 실제 시연에서 해결되었는가? - [ ] Self-correction loop가 원활히 작동하는가? - [ ] PRD/TRD 갱신이 필요한 항목이 정의되었는가? ## 받은 피드백 | # | 피드백 | 중요도 | 반영 여부 | 반영 문서(PRD/TRD) | |---|--------|--------|-----------|--------------------| | 1 | | | | | | 2 | | | | | ## 다음 Iterate에서 반영할 항목 -
# Changelog ## [v2] - DAY 13 ### Added (추가) - ### Changed (변경) - ### Fixed (수정) - ### 변경 근거 (피드백 연동) - ## [v1] - DAY 5 ### Added - 최소 기능 구현 및 조기 배포
# 프로젝트 이름 ## 한 줄 소개 > ## 해결하는 문제 - ## 데모 / 접속 주소 - ## 주요 기능 - ## 실행 방법 ```bash # 1. 설치 # 2. 실행 ``` ## 기술 스택 - ## 팀 -
# 최종 성과 보고서 (final_report.md) ## 해결한 문제 (요약) - ## 사용자 전/후 반응 비교 | 항목 | Before (DAY 4) | After (DAY 15) | |------|----------------|----------------| | 소요 시간 | | | | 만족도 | | | | 인상적 반응 | | | ## 최종 Eval 결과 - Pass Rate: - 주요 지표: ## 성공 기준 달성 여부 (success.md 대비) - ## 한계와 다음 단계 -