Case Study · Problem → Solution → KPI/ROI
미국 주식의 실시간 주가 분석 프로그램
미국 상장사·ETF(5천+)를 실시간으로 분석·예측하는 내부 도구 (멀티타임프레임: 15m / 1h)
Coverage
미국 주식/ETF 5,000+ 종목
Timeframes
15m · 1h (조절 가능)
Signal Accuracy
90% (평균)
일 평균 수익률(실제)
2% / 1천만원
역할
ML 개발 · 데이터 분석 · UX
기간
2023–2025
팀
1인 설계 · 개발
코드 베이스
Python
#실시간추론
#코사인유사도
#멀티타임프레임
※ 정확도/수익 수치는 과거 결과에 기반. 미래 수익 보장 아님.
TL;DR
내 역할 & 임팩트
- 데이터 제품의 엔드투엔드 UX 설계(수집→분석→실시간 추론→공유)
- KPI/ROI 보드 고정 노출로 의사결정 TTI 10분(i9-13900K 기준)
- 정확도 90%+ 실제 검증, 일 수익률 2% 실거래 기간 기록(2024.11–2025.01)
기술 이력
- * 사용 기술: Python & MySQL
- * ML관련 사용 기술: Regression > LSTM > SVM > Transformer > SVR > XGBoost > Dask > 코사인 유사도 순서로 기술 도입 및 최적화
- * ML 알고리즘 속도 문제를 코사인유사도 및 데이터 조건식 튜닝을 동해 속도 단축 (Regression 대비: 48배, Dask 대비 3-4배)
- * MySQL DB 튜닝을 통해 속도 향상(적용 전 대비 3배): Connection pool, thread 관리
- * CPU 기반의 복합적 수식 계산식을 통한 데이터 전&후처리
문제정의
사용자/맥락
- 미국 주식/ETF 대상 대량 종목·멀티타임프레임 분석의 자동화 필요성
- 신호 검증→실시간 배포→산출물 공유까지 한 화면에서 처리 니즈
니즈/페인
- 15m/1h 타임프레임별 정확도·수익성 KPI 즉시 비교
- 실패 시 원인·영향(ROI)를 함께 노출해 빠른 피드백
- 실시간 데이터의 결측치(Missing Value)·이상치(Outlier) 탐지/처리
핵심 해결 전략
1) “한 화면” 워크플로우
수집→분석→실시간 추론→결과 미리보기를 단일 플로우로.
2) 멀티타임프레임·실시간
15m/1h(조절 가능) 윈도우 처리, 실시간 인퍼런스 스트림 제공.
3) 코사인 유사도 엔진
메인 알고리즘: 코사인 유사도. 제약조건 튜닝으로 평균 정확도 90%+ 달성.
4) 실패복구·리스크
Regime Shift 감지(사건 전/후 분리), 스텝별 로거/토스트, 취소/재시작·롤백.
디자인 근거 → 코드 구조 매핑
수집(Collector)
미국 상장사/ETF 5천+ 종목 시계열 취득(15m/1h).
분석(Analyzer)
코사인 유사도 기반 패턴 매칭·튜닝 지표 산출.
미리보기/UI
실시간 주가 비교 예측 그래프 및 파일 내보내기.
Pandas/Numpy
Requests/Retry
SQLAlchemy
Matplotlib
Torch
scikit-learn
Ray/Joblib
OpenPyXL
Tkinter/CustomTkinter
BeautifulSoup(보조)
urllib3
KPI & ROI 프레임
KPI 정의
- Coverage: 커버된 종목 수(미국 주식/ETF 5,000+)
- Signal Accuracy: 올바른 방향 신호 / 전체 신호 = 90%+
- TTI (Time-to-Insight): 수집→미리보기 = 10분 (Intel i9-13900K)
- Win Rate: 약 95%
- 재현성: 동일 조건 반복 시 지표 변동폭(σ) 없음(과거 데이터 일치성 기반)
ROI 산출 (가정 & 실제)
투자금 1,000만원, 일 수익률 2% 가정.
- 실거래 테스트: 2024.11 ~ 2025.01
- 일 수익 = 10,000,000 × 0.02 = 200,000원
- 40거래일(복리 가정) → 최종 자산 ≈ 22,080,396원, 실제 누적 수익 ≈ 약 12,000,000원
주의: 수수료/슬리피지/세금/체결 실패/환율 변동 미포함. 과거/시뮬레이션 성과는 미래 수익 보장 아님.
ROI 계산기 (데모)
최종 자산
-
누적 수익
-
전략 타임라인
- 사전: 코사인 유사도 + 제약조건 튜닝 → 정확도 90%+, ROI 가정치 유효
- 2025-02: 트럼프 집권 이후 관세 전쟁 등 이슈로 시장 레짐 급변 → 정확도 급감
- 사후: 리스크 규칙에 따라 실거래 중단 / 사업화 전략 폐기
고도화 전략
- DTW/거리 메트릭 혼합 → 정확도 개선
- 단일 기업 분석 수행시, 해당 기업의 히스토리 분석뿐 아닌 전체 기업 히스토리를 통합 분석 → 정확도 개선
후속 제안: 레짐 디텍터, 체인지포인트 감지, 리밸런싱·포지션 사이징 적응화.
핵심 플로우
“데이터 갱신 → 분석 → 공유”
flowchart LR
A[데이터 소스 선택] --> B[수집 실행]
B --> C{성공?}
C -- 아니오 --> B2[재시도/오류 원인 안내]
C -- 예 --> D[분석 파라미터 확인]
D --> E[분석 실행 · 진행률/취소]
E --> F[결과 미리보기]
F --> G[차트/스프레드시트 내보내기]
F --> H[재실행 · 파라미터 튜닝]
주요 화면(요지)
홈 — 워크플로우 허브
- 최근 작업/KPI·ROI 스냅샷
- 원클릭 재실행
분석 — 실시간 신호/미리보기
- 실행/취소/재시도 통합
※ 실제 사내 데이터/결과물은 비식별 더미로 대체.
핸드오프
코드-디자인 연결
/data_collector.py → 미국 종목/ETF 시계열 수집(15m/1h) + 상태 표준 로그
/stock_analyzer.py → 코사인 유사도·튜닝·백테스트·KPI/ROI 산출
/interface.py → 실시간 신호패널 + KPI/ROI 보드 + 실패 복구 플로우
디자인 결정이 코드 모듈과 1:1 매핑되어 유지보수를 단순화.
성과/결과
지표
- Coverage: 5,000+ 종목
- Signal Accuracy: 90%+
- 일 평균 수익률: 2% (1천만원 기준)
사업화 결과
- 2024-05: 백테스트 성과 기반으로 사업화 도전
- 2025-04 트럼프 집권 및 관세 전쟁 직후 정확도 급감 → 전략 폐기
레짐 변화에 취약한 유사도 기반 패턴 전략의 한계 확인.
측정은 로그/트레이드 기록/엑셀 메타데이터 기반으로 자동 리포트(OpenPyXL, Joblib/Ray).