Cribot Insight — 최종 보고서
Cribot Insight — 최종 보고서¶
작성일: 2026-05-14
분석 기간: 2026-05-12 ~ 2026-05-14 (Phase 0-5)
코호트: TGR 톱10 마트, 2026-01-01 ~ 2026-05-13
목차¶
- Executive Summary
- 프로젝트 개요 + 목적
- 시장 분석
- 데이터 자산
- 인사이트 가설 카드
- 타겟 매핑 매트릭스
- 정량 검증 결과
- 타겟 평가 + Top 3 추천
- 영업 전략
- 한계 및 가정
- 다음 단계
1. Executive Summary¶
상세: ../phase6_report/executive_summary.md
Cribot POS 데이터는 NIQ·Circana·BC카드·신한카드·KDX 어디도 커버하지 못하는 한국 독립 마트 SKU 단위 실시간 판매 데이터를 유일하게 보유한다.
Phase 0-5 분석을 통해 다음을 확인하였다:
- 차별화 5 영역: 분 이하 시간 해상도, 행사 ROI 인과, 독립 마트 세그먼트, 거래처-마트 공급망, KDX 즉시 진입
- 25 인사이트 가설: Level 3 전량 통과, reject 0
- Phase 4 정량 검증: 8 카드 중 7장 가설 입증 (1장 측정 방식 재정의 필요)
- Top 3 타겟: A 거래처(15점), B FMCG(14점), C 마트(14점)
- 도달 ARR 추정 (트랙별 3-5년차): 보수 9.6억 / 적극 211억
핵심 검증 수치¶
| 카드 | 가설 | 실측 | 평가 |
|---|---|---|---|
| INS-021 카테고리 매핑 | 64% 추정 | 89.87% | 즉시 출시 수준 |
| INS-002 행사 매칭률 | 35% 기준 | 49.79% | +14.8pp 우수 |
| INS-003 행사 ROI | lift +50~150% | 중앙값 +77.3% | 가설 입증 |
| INS-001 공급망 | 회전율 +30% | 24.6일, 부진 10.7% | 영업 액션 도출 |
| INS-013 점유율 | -10%p 탐지 | 440쌍→1건 압축 | 임계값 실효 |
| INS-020 매출 알람 | 대응 시간 단축 | 4.0%, 월 0.8회 | 적정성 입증 |
| INS-019 영업 카드 | 준비 50% 단축 | 5 메트릭 자동화 | 시연 완료 |
| INS-004 분 단위 | +5~15% lift | -1.1% | 재정의 필요 |
2. 프로젝트 개요 + 목적¶
2.1 프로젝트 목적¶
Cribot이 수집·보유한 POS 원천 데이터에서 시장에 판매 가능한 인사이트 상품을 발굴하고, 잠재 타겟 고객군을 정량적으로 평가하여 사업화 방향을 결정하는 데이터 분석 프로젝트.
구체적 목표:
1. 상용 데이터 제품(NIQ, Circana, BC카드, 신한카드, KDX) 역공학 분석으로 차별화 영역 식별
2. Cribot 데이터 자산 전수 인벤토리 (MySQL + ClickHouse)
3. 인사이트 가설 카드 25장 작성 및 Level 3 검증
4. 6 타겟 × 25 카드 매트릭스로 Phase 4 우선순위 결정
5. 상위 8 카드 실데이터 정량 검증
6. 최종 Top 3 타겟 + 영업 전략 수립
2.2 1차 산출물 (7가지)¶
| 산출물 | 내용 |
|---|---|
| 벤치마크 5건 | NIQ, Circana, BC카드, 신한카드, KDX 역공학 분석 |
| Offering Teardown | 44 항목 평가 (⭐5, ✅1, ⚠️24, ❌14) |
| 데이터 인벤토리 | MySQL 204 테이블, ClickHouse 51M 행 |
| 인사이트 카드 25장 | Level 3, reject 0 |
| 타겟 매트릭스 | 6 타겟 × 25 카드 = 150 셀 |
| 정량 검증 8건 | Phase 4 실측 데이터 + 차트 24개 |
| 최종 보고서 | 본 문서 (Phase 6) |
2.3 Out of Scope¶
- 실제 서비스 아키텍처 구현
- 영업 활동 실행 (고객 접촉)
- 가격 책정 및 영업 계약
- ML/AI 예측 모델 개발
- PII(개인식별정보) 230 컬럼 포함 회원 데이터 분석
2.4 핵심 가설¶
"Cribot POS 데이터는 NIQ·Circana가 제공하지 못하는 한국 독립 마트 채널의 SKU 단위 실시간 판매 인사이트를 제공할 수 있으며, 이를 거래처·FMCG 제조사·마트 운영자에게 B2B SaaS 또는 데이터 상품으로 판매할 수 있다."
3. 시장 분석¶
상세: ../phase0_benchmark/
3.1 벤치마크 5건 요약¶
| # | 대상 | 특징 | Cribot 대비 |
|---|---|---|---|
| 1 | NIQ (Nielsen IQ) | 주 1회 ScanTrack, 점포×SKU | 시간 해상도 1만 배 차이 |
| 2 | Circana | OmniMarket MULO+, 주 1회 | 행사 ROI 직접 데이터 없음 |
| 3 | BC카드 AI 금융빅데이터 | 월 1회 카드 승인 집계 | SKU 단위 없음 |
| 4 | 신한카드 Trendis | 월 1~수회 비정기 | SKU 단위 없음 |
| 5 | KDX (한국데이터거래소) | GS리테일 POS, 카드사 집계 | 독립 마트 SKU 없음 |
자세히: ../phase0_benchmark/benchmarks/
3.2 Offering Teardown 44항목 분포¶
Phase 0에서 5개 벤치마크의 제공 기능 44개 항목을 ⭐/✅/⚠️/❌ 4단계로 평가한 결과:
| 심볼 | 의미 | 건수 |
|---|---|---|
| ⭐ | Cribot 고유 우위 (Feasibility 포함 5건) | 5 |
| ✅ | 타사 동등 제공 | 1 |
| ⚠️ | 부분 제공 또는 조건부 | 24 |
| ❌ | 구조적 제공 불가 | 14 |
핵심: ⭐ 5건 모두 "타사가 구조적으로 재현 불가"한 영역 — 수집 아키텍처(NATS JetStream 10초) + 운영 맥락 데이터(행사·입고·거래처) 동시 보유가 이유.
자세히: ../phase0_benchmark/offering_teardown.md
3.3 차별화 5 영역¶
| # | 영역 | Type | 핵심 근거 |
|---|---|---|---|
| 1 | 분 이하 시간 해상도 POS | A (분석 품질) | NIQ 주 1회 대비 10초 단위 수집 |
| 2 | 점포 운영 맥락 인과 분석 | A (분석 품질) | 행사+입고+판매 3축 JOIN, 타사 불가 |
| 3 | 한국 독립 마트 세그먼트 | B (채널 공백) | TGR/HYP/AEND/STP 유일 공급자 |
| 4 | 거래처-마트 공급망 연결 | A (분석 품질) | 납품사 관점 공급망 가시성 |
| 5 | KDX 즉시 진입 경로 | C (이용 가능 서비스) | 법인 등록 후 인바운드 수요 |
자세히: ../phase0_benchmark/differentiation.md
3.4 경쟁 포지셔닝¶
Cribot의 핵심 포지셔닝: "GS25·이마트·카드 결제 데이터가 보이지 않는 한국 독립 마트 채널의 SKU 판매를 유일하게 공급한다" (Positioning 후보 C)
이는 실측으로 검증 가능 — KDX에 현재 TGR/HYP/AEND/STP 계열 중소형 마트 내부 SKU 판매 원천 데이터 공급자 없음 (Phase 0 05_kdx.md 확인).
4. 데이터 자산¶
상세: ../phase1_inventory/
4.1 MySQL cribot (MariaDB 10.10.3)¶
| 항목 | 수치 |
|---|---|
| 총 테이블 수 | 204 |
| 핵심 마스터 테이블 | 8개 (mc_mart, mc_barcode, mc_market_agent 등) |
| 총 마트 (mc_mart) | 120개 |
| 거래처 (mc_market_agent) | 67,000+ |
| 입고 데이터 (mc_inbound) | 3,326,411행, 14년치 (2012-07-02~) |
| 행사 데이터 (mc_product_event_mostraw) | 4,681,466행, 마트 281개 |
| PII 컬럼 | 230개 (분석 out-of-scope) |
핵심 마스터 8개:
1. mc_mart — 점포 메타 (120개, 2020~)
2. mc_barcode — 상품 바코드 마스터 (2021~)
3. mc_product_mostraw — 상품 마스터 (2021~)
4. mc_market_agent — 거래처 마스터 (2022~)
5. mc_pos_category — POS 카테고리 매핑 (2026~)
6. mc_inbound — 입고 내역 (2012~)
7. mc_product_event_mostraw — 행사 등록 (2021~)
8. ims_order_mostraw — 발주 이력 (2025~)
자세히: ../phase1_inventory/tables_catalog.md
4.2 ClickHouse pos_analytics.sales¶
| 항목 | 수치 |
|---|---|
| 총 행 수 (raw) | 51,114,317 |
| MySQL 기준 정상 행 수 | 35,824,595 |
| 중복 행 (이슈) | 15,289,722 (29.9%) |
| 2026년 판매 행 수 | 50,361,604 (109개 마트) |
| 2025년 판매 행 수 | 752,713 (2개 마트) |
| srl 중복 건수 | 15,777,067개 srl |
주의: ClickHouse MergeTree 엔진 사용으로 중복 INSERT가 영구 보존됨. Phase 4 분석에서는
DISTINCT morder_srl우회 쿼리 사용.
자세히: ../phase1_inventory/clickhouse_inventory.md
4.3 POS 4종 커버리지¶
| POS | 마트 수 | 점유율 | DISTINCT 판매건 (2026~) | 평균 단가 |
|---|---|---|---|---|
| TGR (투게더포스) | 92 | 76.7% | 30,961,603 | 5,709원 |
| AEND (에이앤드포스) | 10 | 8.3% | 1,618,625 | 6,578원 |
| HYP (하이포스) | 6 | 5.0% | 1,057,075 | 6,254원 |
| STP | 2 | 1.7% | 435,201 | 4,355원 |
| UNKNOWN | 5 | — | 512,033 | 5,615원 |
TGR이 마트 수 기준 88% (92/104 카테고리 등록 마트), Phase 4 코호트 선정 기준.
자세히: ../phase1_inventory/data_quality.md
4.4 카테고리 표준 매핑¶
| 단계 | 매핑률 | 기준 |
|---|---|---|
| Phase 1 추정 | 64% | ClickHouse 원시 카테고리 샘플 |
| Phase 2 보정 | 56.7% | reject 기준 재평가 |
| Phase 4 실측 (TGR 톱10) | 89.87% | 표준 14개 → 73개 원시 매핑 |
표준 14개 카테고리 (16 분류 중 유효 14개): 농산물, 수산물, 축산물, 정육, 냉동식품, 가공식품, 음료, 과자/스낵, 유제품, 세제/생활용품, 주방용품, 위생용품, 기타식품, 비식품류
자세히: ../phase1_inventory/category_normalization.md
5. 인사이트 가설 카드¶
상세: ../phase2_cards/
5.1 25 카드 개요¶
Phase 2에서 25장의 인사이트 가설 카드를 작성하였으며, 모두 Level 3 (정량 검증 준비 완료) 기준을 통과하였다.
| 항목 | 수치 |
|---|---|
| 총 카드 수 | 25 |
| Level 3 통과 | 25 (100%) |
| Reject | 0 |
| 신규 발굴 | 10장 |
| cribot-admin 기존 승급 | 15장 |
5.2 도메인 분포¶
| 도메인 | 카드 수 | 주요 카드 |
|---|---|---|
| 상품 | 5 | INS-008, 009, 010, 018, 024 |
| 거래처 | 4 | INS-001, 013, 019, 023 |
| 마트 | 4 | INS-006, 007, 016, 020 |
| 품질 | 3 | INS-014, 015, 022 |
| 고객 | 2 | INS-011, 017 |
| 시간 | 2 | INS-004, 012 |
| 행사 | 2 | INS-002, 003 |
| 지역 | 1 | INS-005 |
| 카테고리 | 1 | INS-021 |
| 가격 | 1 | INS-025 |
5.3 Reject 기준 4건 (25/25 통과)¶
| 기준 | 설명 |
|---|---|
| R1. 데이터 부재 | 분석에 필요한 테이블/컬럼이 없는 경우 |
| R2. PII 노출 | 개인식별정보 230 컬럼 포함 → out-of-scope |
| R3. 시계열 부족 | 1개월 미만 데이터로 측정 불가 |
| R4. 중복 가설 | 이미 존재하는 카드와 동일한 내용 |
5.4 대표 카드 (Phase 4 검증 선정 이유)¶
INS-001 거래처×마트×상품 공급망 통합 (도메인: 거래처, 신뢰도: high)
- 가설: 거래처별 납품 상품의 점포 단위 판매 현황을 입고 데이터와 JOIN하여 공급망 가시성 제공
- Phase 3 선정: A 타겟(거래처) V=5 × F=5 = 25 (최고점)
INS-021 표준 카테고리 매크로 트렌드 (도메인: 카테고리, 신뢰도: medium)
- 가설: 원시 73개 POS 카테고리 → 표준 16개로 매핑하여 매크로 트렌드 분석
- Phase 3 선정: D 타겟(정부/시장조사) 핵심 카드
자세히: ../phase2_cards/_index.md
6. 타겟 매핑 매트릭스¶
상세: ../phase3_matrix/
6.1 6 타겟군 정의¶
| ID | 타겟 | 정의 |
|---|---|---|
| A | 거래처 영업 | cribot-admin 기존 납품업체, 자사 SKU 판매 현황 추적 |
| B | FMCG 제조사 | 카테고리 매니저, 독립 마트 채널 침투율·행사 ROI 측정 |
| C | 마트 운영자 | cribot-admin 기존 마트, 행사 운영·매출 알람 |
| D | 정부/시장조사 | 통계청·시장조사기관, 독립 마트 매크로 트렌드 |
| E | 학계·연구 | 식품유통 연구, SKU 단위 실증 패널 데이터 |
| F | KDX 바우처 | 인바운드 데이터바우처 구매 수요 |
6.2 매트릭스 150 셀 요약¶
25 카드 × 6 타겟 = 150 셀을 가치(V, 1-5) × 실현성(F, 1-5)으로 평가.
타겟별 평균 V×F 점수:
| 타겟 | 평균 V×F | Phase 3 순위 |
|---|---|---|
| C. 마트 운영자 | 15.3 | 1위 |
| A. 거래처 영업 | 13.2 | 2위 |
| B. FMCG 제조사 | 11.1 | 3위 |
| D. 정부/시장조사 | ~8.5 | 4위 |
| E. 학계·연구 | ~8.0 | 5위 |
| F. KDX 바우처 | ~6.0 | 6위 |
6.3 Top 8 선정 (Phase 4 검증 대상)¶
Phase 3 매트릭스에서 상위 점수 + 사용자 선택으로 8장 선정:
| 카드 | 1차 선정 이유 |
|---|---|
| INS-001 | A 타겟 최고점 V×F=25, 공급망 차별화 핵심 |
| INS-002 | C 타겟 핵심, 행사 운영 진단 |
| INS-003 | B+A 타겟, 행사 ROI 정량화 |
| INS-004 | 시간 해상도 차별화 영역 1.1 검증 |
| INS-013 | A 타겟, 점유율 알림 시스템 |
| INS-019 | A 타겟, 영업 카드 자동화 |
| INS-020 | C 타겟, 매출 알람 |
| INS-021 | D+B 타겟, 카테고리 매핑 즉시 출시 |
자세히: ../phase3_matrix/top_picks.md
7. 정량 검증 결과¶
상세: ../phase4_validation/
7.1 코호트 정의¶
| 항목 | 값 |
|---|---|
| POS | TGR (투게더포스) |
| 마트 | 톱10 (M001~M010), 규모 기준 선정 |
| 기간 | 2026-01-01 ~ 2026-05-13 (약 5개월) |
| 총 매출 | 693.7억원 |
| 분석 도구 | Python (sales_query.py), ClickHouse DISTINCT 우회 |
7.2 가설 vs 실측 결과표¶
| 카드 | Phase 2 가설 | Phase 4 실측 | 평가 |
|---|---|---|---|
| INS-021 | 매핑률 64% | 89.87% (+25.9pp) | 즉시 출시 수준 |
| INS-002 | 매칭률 35% | 49.79% (+14.8pp) | 우수 |
| INS-003 | lift +50~150% | 중앙값 +77.3% | 입증 |
| INS-001 | 회전율 +30% | 24.6일, 부진 SKU 10.7% | 영업 액션 도출 |
| INS-013 | -10%p 탐지 | 440쌍 → 1건 | 임계값 실효 |
| INS-020 | 대응 시간 단축 | 14건/347쌍, 월 0.8회 | 적정성 입증 |
| INS-019 | 준비 50% 단축 | 5 메트릭 자동화 | 시연 완료 |
| INS-004 | +5~15% lift | -1.1% (자정 이슈) | 재정의 필요 |
종합: 8 카드 중 7장 가설 입증 또는 대폭 상회. INS-004는 측정 실패가 아닌 데이터 파이프라인 설계 이슈 발견.
7.3 카드별 상세 결과¶
INS-021 — 표준 카테고리 매크로 트렌드¶
원시 73개 POS 카테고리를 표준 14개로 매핑한 결과 89.87% 매핑률 달성 (Phase 2 추정 64% 대비 +25.9pp). 5개월 693.7억원 규모 거래 분석.
| 항목 | 수치 |
|---|---|
| 원시 카테고리 수 | 73개 |
| 표준 매핑 카테고리 | 14개 |
| 표준 매핑률 | 89.87% |
| 기타 비율 | 1.69% |
| 미분류 비율 | 7.49% |
| 분석제외 비율 | 0.95% |
→ 정부/시장조사(D 타겟)·학계(E 타겟) 매크로 트렌드 리포트 즉시 출시 가능 수준
자세히: ../phase4_validation/INS-021/report.md
INS-002 — 행사 운영 진단¶
전체 행사 99,424건 중 49,508건 매칭 (49.79%). 미매칭 87.5%가 "입고있으나 판매없음" — 진열·가격 운영 문제 가능성.
| 항목 | 수치 |
|---|---|
| 전체 행사 수 | 99,424건 |
| 매칭된 행사 | 49,508건 |
| 매칭률 | 49.79% |
| 마트별 최저 | 43.2% (M008) |
| 마트별 최고 | 69.1% (M003) |
| 미매칭 중 "입고있으나 판매없음" | 28,948건 (87.5%) |
| 미매칭 중 "입고 없음" | 4,122건 (12.5%) |
→ 마트 운영자(C 타겟)에 즉시 가치 — 행사 효율 진단 카드로 영업 가능
자세히: ../phase4_validation/INS-002/report.md
INS-003 — 행사 ROI lift 측정¶
측정 가능 행사 2,429건 (전체 92,888건의 2.61%)에서 lift 중앙값 +77.3% 확인. 57.3%가 +50% 이상 lift.
| 항목 | 수치 |
|---|---|
| 전체 행사 수 | 92,888건 |
| 측정 가능 행사 | 2,429건 (2.61%) |
| lift 평균 | +453.4% (이상치 영향) |
| lift 중앙값 | +77.3% |
| +50% 이상 | 57.3% |
| +150% 이상 | 35.3% |
| 음수 lift | 24.1% |
→ B2B FMCG 제조사(B 타겟) + 거래처(A 타겟) 행사 기획 ROI 근거 제공. 측정 가능 비율(2.61%)은 2025년 데이터 보유 마트 포함 시 대폭 개선 가능.
자세히: ../phase4_validation/INS-003/report.md
INS-001 — 거래처×마트×상품 공급망 통합¶
입고 656,072행 + 판매 6,403,711행 매칭으로 64,580쌍의 회전율 산출. 평균 24.6일, 60일+ 부진 SKU 10.7% (684개 거래처 중 401개 분석).
부진 거래처 톱5 (60일+ SKU 수 기준):
1. (주)강서잡화: 277건
2. (주)한국연(가공_중복): 273건
3. 마트1]한국연: 251건
4. 마트1]대상(청정원): 191건
5. 씨제이대한통운(주): 186건
→ A 타겟 즉시 영업 대상 선별 — 부진 SKU 60일+ 거래처 5곳이 첫 고객 후보
자세히: ../phase4_validation/INS-001/report.md
INS-013 — 거래처 점유율 변동 대응¶
440 거래처×마트 쌍 분석 결과 -10%p 초과 하락 단 1건 (-17.1%p, 마트8 야채부1). +10%p 초과 상승 8건.
→ 440쌍 수작업 모니터링을 1건으로 압축 — A 타겟 영업 생산성 440배 향상
자세히: ../phase4_validation/INS-013/report.md
INS-019 — 거래처 인사이트 영업 카드 자동화¶
정육거래처 대상 4분면 카드(매출×회전 기준 자동 분류) + 5 메트릭 자동 생성 시연 완료.
자동화 메트릭 5종: 마트별 판매 TOP5 / SKU TOP5 (판매량·성장률) / 성장률 트렌드 (이상 탐지) / 점유율 변화 알림 (INS-013 연동) / 마트별 성장률 알림 (-20% 자동)
자세히: ../phase4_validation/INS-019/report.md
INS-020 — 오늘 매출 알람·대응¶
-20% 임계값으로 347쌍 분석 → 14건 알람 (4.0%). 마트당 월 평균 0.8회 (≈ 2.0건/마트/3개월).
| 항목 | 수치 |
|---|---|
| 비교 쌍 | 347쌍 |
| -20% 알람 | 14건 (4.0%) |
| 마트당 월 평균 | 0.8회 |
| 최대 하락 | -42.9% |
| 최대 상승 | +133.4% |
→ C 타겟 마트 운영자 매출 이상 조기 탐지 가치 확인
자세히: ../phase4_validation/INS-020/report.md
INS-004 — 분 단위 매출 변동 추적¶
행사 직후 60분 lift -1.1%. 데이터 파이프라인 이슈 발견: 행사 start_date 자정 기준 설정 + 새벽 1시 POS 배치 매출 집중.
| 항목 | 수치 |
|---|---|
| 피크 시간 | 새벽 1시 (2.0억/시간) |
| 최저 시간 | 오전 9시 (0원) |
| 행사 후 60분 lift | -1.1% ⚠️ |
→ 측정 실패가 아닌 데이터 파이프라인 설계 이슈 — 운영팀 보고 + 측정 방식 재정의 필요
자세히: ../phase4_validation/INS-004/report.md
8. 타겟 평가 + Top 3 추천¶
상세: ../phase5_evaluation/
8.1 4축 평가 체계¶
| 축 | 의미 | 1점 | 5점 |
|---|---|---|---|
| M (Market Size) | 잠재 시장 규모 | <100 고객 | >10K 고객 |
| W (Willingness to Pay) | 지불 의향 | <100만원/년 | >2억원/년 |
| E (Entry Ease) | 진입 용이성 | 2년+ | <1개월 |
| D (Data Readiness) | 데이터 충족도 | 추가 수집 필요 | 즉시 출시 |
8.2 6 타겟 평가 점수표¶
| 순위 | 타겟 | M | W | E | D | 합계 | Phase 3 V×F avg | Phase 4 갱신 |
|---|---|---|---|---|---|---|---|---|
| 1 | A. 거래처 영업 | 3 | 3 | 5 | 4 | 15 | 13.2 | INS-001+013+019 입증 |
| 2 | B. FMCG 제조사 | 3 | 5 | 2 | 4 | 14 | 11.1 | INS-003+021 입증 |
| 2 | C. 마트 운영자 | 2 | 2 | 5 | 5 | 14 | 15.3 | INS-002+020 입증 |
| 4 | D. 정부/시장조사 | 2 | 4 | 2 | 5 | 13 | 8.5 | INS-021 89.87% |
| 5 | F. KDX 바우처 | 3 | 2 | 4 | 3 | 12 | 6.0 | 간접 적합 |
| 6 | E. 학계·연구 | 2 | 2 | 3 | 4 | 11 | 8.0 | INS-021 강력 |
8.3 Phase 3 → Phase 5 순위 변화¶
| 타겟 | Phase 3 순위 | Phase 5 순위 | 변동 | 핵심 이유 |
|---|---|---|---|---|
| A. 거래처 영업 | 2위 (V×F 13.2) | 1위 (15) | ▲ 1 | Phase 4 E=5+D=4 강점 확인 |
| B. FMCG 제조사 | 3위 (11.1) | 2위 (14) | ▲ 1 | INS-003+021 실측으로 D=4 상향 |
| C. 마트 운영자 | 1위 (15.3) | 2위 (14) | ▼ 1 | W=2 낮은 단가로 B와 동점 |
| D. 정부/시장조사 | 4위 (~8.5) | 4위 (13) | ↔ | D=5로 대폭 상향 but E=2 제약 |
자세히: ../phase5_evaluation/target_evaluation_matrix.md
9. 영업 전략¶
상세: ../phase5_evaluation/top3_recommendations.md
9.1 Top 1 — A. 거래처 영업 (15점)¶
진입 채널: cribot-admin 기존 거래처 upsell (67K 거래처 중 영업 활성 5K-10K 우선)
영업 사이클: 1-3개월
첫 타겟 고객: 부진 SKU 60일+ 상위 거래처
- (주)강서잡화 (277건), 오뚜기 관련 (273+251건), 대상청정원 (191건), CJ (186건)
핵심 메시지: "자사 SKU 회전율 자동 추적 + 점유율 변동 알림 (440→1건 압축) + 영업 회의 자동 카드 = 매출 +8-12%"
추정 ARR: 거래처당 연 500-3,000만원 × 100-500 거래처 = 5억-150억 (5년)
Phase 4 검증 근거: INS-001 (회전 24.6일), INS-013 (440쌍→1알람), INS-019 (5 메트릭 자동화)
위험 요소:
- cribot-admin 거래처 채널 활성화 여부 확인 필요
- 마트 vs 거래처 양쪽 → 거래 비밀 노출 우려
- 점유율 데이터 공유 시 마트 본사 동의 필요 가능
9.2 Top 2 — B. FMCG 제조사 (14점)¶
진입 채널: 직접 영업 (외부 신규 고객 — 가장 어려운 채널)
영업 사이클: 6-12개월
첫 타겟 고객: 한국 톱20 FMCG (CJ제일제당, 농심, 롯데웰푸드, 오뚜기, 동원, 매일유업 등)
핵심 메시지: "한국 독립 마트 채널 + 점포×일 lift 측정 = NIQ 주 단위 한계 보완. lift 중앙값 +77.3% 입증. 독립 마트 88개 마트 커버"
추정 ARR: 1개당 연 5천만-3억원 × 5-15 고객 = 2.5억-45억 (3년)
Phase 4 검증 근거: INS-003 (lift +77.3%), INS-021 (89.87%), INS-024 (신상품 침투)
위험 요소:
- NIQ/Circana 기존 계약 경합
- 의사결정 사이클 6-12개월
- 마트 표본 작음 (TGR 톱10 → 전체 92개 확장 필요)
- 영업 인력 필요
9.3 Top 3 — C. 마트 운영자 (14점)¶
진입 채널: cribot-admin upsell (기존 마트 120개)
영업 사이클: <1개월 (UI 추가)
첫 타겟 고객: TGR 톱10 마트 (M001~M010) — Phase 4 코호트와 동일
핵심 메시지: "행사 매칭 49.79% 진단 + 매출 알람 -20% (월 0.8회) + 마트 진단 자동화 = 운영 효율 +5-10%"
추정 ARR: 마트당 월 10-50만원 → 연 120-600만원 × 50-100 마트 = 0.6억-6억
Phase 4 검증 근거: INS-002 (매칭 49.79%), INS-020 (-20% 알람 4%), INS-006/007
위험 요소:
- 점주 데이터 활용 역량 → UI 단순화 필요
- 단가 작음 (Top 3 중 가장 작음)
- cribot-admin 통합 vs 별도 모듈 결정 필요
9.4 별도 트랙 — D. 정부/시장조사 (13점)¶
진입 채널: KDX 데이터바우처 + 공공 입찰 + 직접 영업
영업 사이클: 1-2년
첫 타겟: 한국갤럽, 마크로밀엠브레인 → 통계청
핵심 메시지: "한국 독립 마트 채널 매크로 트렌드 — 표준 16개 매핑률 89.87%, 정부 통계 보완 자료로 즉시 출시 가능"
추정 ARR: 1개당 연 5천만-2억원 × 3-5 기관 = 1.5억-10억
가치: 브랜드 효과 큼 (정부 채택 시 cribot 신뢰도 상승), INS-021 즉시 출시 가능
9.5 통합 ARR 추정 (트랙별 도달 시점)¶
| 트랙 | 보수적 ARR | 적극적 ARR | 도달 시점 |
|---|---|---|---|
| A 거래처 | 5억 | 150억 | 5년 |
| B 제조사 | 2.5억 | 45억 | 3년 |
| C 마트 | 0.6억 | 6억 | 5년 (가정) |
| D 정부/시장조사 | 1.5억 | 10억 | 5년 (가정) |
| 합계 | 9.6억 | 211억 | - |
주: ARR(Annual Recurring Revenue)은 정의상 연간 매출입니다. 본 표 수치는 각 트랙이 영업 사이클을 거쳐 도달 가능한 연간 매출의 상하한이며, 5년 누적 매출이 아닙니다. 도달 시점은 각 트랙 9.1~9.4 본문 명시 기준이며, C/D는 본문 미명시로 5년을 가정합니다. 1년차 실제 합계는 약 1~15억 수준으로 추정됩니다 (영업 사이클 + 점진적 고객 확보 반영).
10. 한계 및 가정¶
상세: ../appendix/data_quality_summary.md
본 보고서는 기술 검증 + 추정 보고서이며, 시장 검증은 아직 수행되지 않았다. 본 섹션은 데이터 품질 한계(10.1-10.3), 시장 검증의 한계(10.4), ARR 추정의 가정(10.5), 그리고 이를 입증하기 위한 PoC 필요성과 Go/No-Go 기준(10.6)을 명시한다. 본 보고서를 영업 입찰 자료, 투자 결정의 단독 근거로 사용하는 것은 권장되지 않는다.
Phase 1~4에 걸쳐 6건의 데이터 품질 이슈를 발견하였다.
10.1 이슈 목록¶
| # | 발견 단계 | 이슈 | 영향 | 카드 |
|---|---|---|---|---|
| 1 | Phase 1 | ClickHouse 중복 INSERT 29.9% (15.3M 행) | 집계 정확도 저하 | 전체 |
| 2 | Phase 4 INS-003 | mc_product_event_mostraw 중복행 | lift 이상값 (+453% 평균) | INS-002, 003 |
| 3 | Phase 4 INS-004 | 행사 start_date 자정 기준 설정 | 실제 행사 시작 불일치, INS-004 측정 불가 | INS-004 |
| 4 | Phase 4 INS-001 | 거래처명 비정규화 (오뚜기 2개 항목 등) | 동일 거래처 중복 집계 | INS-001, 013 |
| 5 | Phase 4 INS-004 | 새벽 1시 매출 집중 (POS 배치 결산 의심) | 시간대 분석 전체 왜곡 | INS-004, 012 |
| 6 | Phase 4 (쿼리) | ClickHouse 청크 EOF 오류 (간헐적) | 대용량 쿼리 실패 | 전체 |
10.2 우선순위 로드맵¶
즉시 (0-1개월):
- #3 행사 start_date → start_time 컬럼 추가 또는 영업 기준 재정의
- #6 ClickHouse EOF → 쿼리 배치 크기 조정 + 재시도 로직
단기 (1-3개월):
- #1 ClickHouse 중복 → ReplacingMergeTree 마이그레이션 검토
- #2 mc_product_event_mostraw → 중복 행 정리 스크립트
중기 (3-6개월):
- #4 거래처명 정규화 → 표준화 작업 + 매핑 테이블 구축
- #5 새벽 1시 패턴 → POS 전송 타임스탬프 감사 + 일 마감 기준 재확인
10.3 영향 범위 요약¶
현재 분석에서 #1(ClickHouse 중복)은 DISTINCT morder_srl 우회로 해결. #3(자정 기준)은 INS-004 재정의로 해결 가능. 나머지 이슈는 분석 해석에 주의 필요하나 Phase 4 핵심 결과(INS-021, INS-002, INS-003, INS-001)에는 영향 제한적.
10.4 시장 검증의 한계¶
| 항목 | 상태 | 비고 |
|---|---|---|
| 데이터에서 인사이트 추출 가능? | ✓ 입증 | Phase 4 8 카드 중 7개 |
| 인사이트의 기술적 정확도? | ✓ 입증 | 매핑 89.87%, lift +77.3% 등 |
| 고객이 살 의향? | ✗ 미검증 | PoC 0건, 고객 인터뷰 0건 |
| 단가 수용성? | ✗ 미검증 | 시범 판매 0건 |
| 영업 사이클 실제 길이? | ✗ 미검증 | 9.1-9.4의 1-12개월은 추정만 |
| 마트 데이터 외부 공유 동의? | ✗ 미검증 | 마트와 계약서 재협상 필요. 동의 없으면 A/B 트랙 진행 불가 |
| 거래처가 cribot-admin 현재 사용 중? | △ 미확인 | "9.1 cribot-admin 67K 거래처 upsell" 전제. 활성 사용자 모수 미측정 |
Phase 4가 "데이터에서 X를 측정할 수 있다"를 증명했을 뿐, "고객 Y가 X에 돈을 낼 것이다"는 증명한 적이 없다. 본 보고서는 "가능성 보고서"이지 "시장 검증 보고서"가 아니다.
10.5 ARR 추정의 가정¶
9.5 표의 ARR 추정은 다음 가정의 곱셈이다. 가정이 깨지면 추정도 깨진다.
| 트랙 | 핵심 가정 | 가정의 약점 |
|---|---|---|
| A 적극 150억 | 5년 후 500 거래처 × 연 3,000만원 | 한국 중소 거래처가 SaaS BI 도구에 연 3,000만원 지불 사례 매우 드뭄. HubSpot/Salesforce 한국 중소 가입자 평균 연 100-500만원 |
| B 적극 45억 | 3년 후 5-15 FMCG × 연 3억 | NIQ 표준 + 보완재 위치에서 연 3억 단가 어려움. NIQ Retail Measurement 일반 단가의 50-80% 수준이 현실적 |
| C 적극 6억 | 5년 후 50-100 마트 × 월 50만원 | 한국 독립 마트 점주의 BI 도구 지불 의향 + 데이터 리터러시 모두 미검증. 점주 PC 사용 빈도조차 미측정 |
| D 적극 10억 | 5년 후 3-5 기관 × 연 2억 | KDX 데이터바우처 평균 1-3천만원, 연 2억은 상위 사례. 공공 입찰은 대기업 컨소시엄 주도로 작은 회사 단독 수주 어려움 |
현실적 시나리오별 ARR 추정:
| 시나리오 | 5년차 ARR | 확률 추정 |
|---|---|---|
| Best path (적극) | 211억 | 20-30% |
| Mid path | 50-80억 | 30-40% |
| Conservative (보수) | 9.6억 | 30-40% |
| Down path (대부분 트랙 폐기) | 1-3억 | 10-20% |
1년차 보수 추정 (영업 사이클 + 점진적 고객 확보 반영):
- A: 0-1억 (거래처 5-20개 진입)
- B: 0억 (영업 사이클 6-12개월로 첫 계약 미확정)
- C: 0-0.5억 (마트 5-10개)
- D: 0.5-2억 (1-2 기관)
- 1년차 합계: 0.5-3.5억 (9.5 표의 보수 9.6억 × 5-35%)
10.6 PoC 필요성 + Go/No-Go 기준¶
본 보고서의 가정을 입증하기 위해 다음 PoC가 필요하다. 시스템 구축 신규 프로젝트 착수 전 PoC 결과 반영을 권장.
PoC 1: A 거래처 트랙 (4-8주)
- 1 거래처 무료 제공 (INS-001 회전율 + INS-013 알람 + INS-019 5메트릭 카드)
- 검증: 거래처가 영업 회의에 카드를 활용하는가? 단가 30/50/100만원 중 얼마면 지불 의사 있는가?
- Go 기준: 1 거래처 유료 전환 시 5 거래처 확장 시도
- No-Go 기준: 1 거래처도 유료 전환 안 됨 → A 트랙 단가 재산정 또는 폐기
PoC 2: C 마트 트랙 (4-8주)
- 1 마트 무료 제공 (INS-002 행사 매칭 + INS-020 매출 알람 + INS-006 카테고리 진단)
- 검증: 점주가 주간 1회 이상 사용하는가? 매출/운영 개선 사례 발생? 월 10/30/50만원 지불 의향?
- Go 기준: 1 마트 유료 전환 시 10 마트 확장 시도
- No-Go 기준: 점주 사용 빈도 주 1회 미만 또는 0 마트 유료 전환 → C 트랙 폐기
PoC 3: B FMCG 콜드 미팅 시도 (8-12주)
- 톱20 FMCG에 콜드 미팅 요청 + Phase 4 INS-003 데모 리포트 1건 무료 제공
- 검증: 미팅 응답률, "관심 있다" 응답 수, NIQ 외 추가 지출 의향
- Go 기준: 5곳 시도 중 2곳 이상 미팅 응답 + 1곳 이상 PoC 계약
- No-Go 기준: 5곳 시도 중 0곳 미팅 응답 → B 트랙 폐기
PoC 비용: 인력 1-2명 × 2-3개월 + 무료 제공 운영비. 시스템 구축(별도 프로젝트 5-10명 × 3-6개월) 대비 약 1/10 비용.
의사결정 흐름:
PoC 3건 (2-3개월)
↓
PoC 결과
├─ 유료 전환 1건 이상 → 시스템 구축 신규 프로젝트 본격화
│ (검증된 트랙부터 우선 진입)
└─ 유료 전환 0건 → 트랙별 No-Go 평가
├─ 인사이트 재정의 + 단가 재산정 + 추가 PoC
└─ 사업 모델 피벗 (컨설팅 모델 등)
11. 다음 단계¶
의사결정 권고 — 최종 결정은 사용자(cribot 경영진) 소관
11.1 즉시 실행 (0-3개월, 사용자 결정 필요)¶
| # | 액션 | 타겟 | 필요 자원 |
|---|---|---|---|
| 1 | A 거래처 영업 시작 | 부진 SKU 톱5 거래처 | 영업 담당자 + cribot-admin 채널 |
| 2 | C 마트 upsell — 행사 진단 + 알람 UI | 마트 120개 (TGR 톱10 우선) | 개발자 1명, 1-2주 |
| 3 | D 즉시 출시 — INS-021 리포트 | KDX 등록 + 공공 입찰 | KDX 법인 등록 절차 |
11.2 중기 파이프라인 (3-6개월)¶
| # | 액션 | 타겟 | 필요 자원 |
|---|---|---|---|
| 4 | B FMCG 영업 채널 활성화 | 한국 톱20 FMCG | 영업 인력 확보 |
| 5 | KDX 등록 완료 | F 인바운드 수요 | 법무·사업 부서 |
| 6 | INS-004 측정 방식 재정의 | 행사 즉시 반응 | 개발팀 (start_time 컬럼) |
11.3 다음 별도 프로젝트 (Out of Scope — 새 프로젝트로)¶
- 실제 서비스 아키텍처: 데이터 상품 API 설계·구현
- 가격책정·영업 계약: B2B 계약서, 가격 모델 확정
- ML 예측 모델: 수요 예측, 재고 최적화 모델
- INS-003 코호트 조정: 2025 데이터 보유 마트 포함 (baseline 2.61% → 개선)
11.4 데이터 품질 후속 조치¶
- ClickHouse 중복 INSERT 문제 → 운영팀 chsync 점검 요청
- 행사 데이터 중복 → 정기 정리 스크립트 자동화
- 거래처명 정규화 → 마스터 데이터 정리 프로젝트
결론¶
Cribot Insight Phase 0-5 분석을 통해 다음을 확인하였다:
-
차별화 실재: NIQ·Circana가 구조적으로 재현 불가한 5개 영역 확인. 특히 독립 마트 SKU 원천 데이터는 한국 데이터 시장 전체에서 Cribot이 유일한 공급자.
-
가설 입증: 25개 인사이트 가설 중 Phase 4 검증 8건 → 7건 입증. INS-021 89.87% (추정 대비 +25.9pp), INS-002 49.79% (+14.8pp), INS-003 lift +77.3%.
-
명확한 타겟: A 거래처 (15점, 즉시 upsell) > B FMCG (14점, 6-12개월) = C 마트 (14점, 즉시 upsell) 순서로 추천. D 정부는 별도 트랙으로 INS-021 즉시 출시 가능.
-
경제성: 도달 ARR(3-5년차) 보수 9.6억 / 적극 211억 — cribot-admin 기존 채널(A+C) 활용 시 3개월 내 첫 매출 가능.
최종 권고: A 거래처 + C 마트 즉시 upsell 시작, 동시에 D 정부 트랙용 INS-021 리포트 KDX 등록 진행. B FMCG는 영업 인력 확보 후 본격화.
Cribot Insight Phase 6 최종 보고서 — 2026-05-14
산출물 전체 인덱스: appendix/artifact_index.md