Cribot Insight — 최종 보고서

작성일: 2026-05-14  |  분석 기간: 2026-05-12 ~ 2026-05-14  |  코호트: TGR 톱10 마트, 2026-01-01 ~ 2026-05-13
Phase 0-6 완료25 인사이트 카드8 정량 검증도달 ARR 9.6억~211억

Cribot Insight — 최종 보고서

작성일: 2026-05-14
분석 기간: 2026-05-12 ~ 2026-05-14 (Phase 0-5)
코호트: TGR 톱10 마트, 2026-01-01 ~ 2026-05-13


목차

  1. Executive Summary
  2. 프로젝트 개요 + 목적
  3. 시장 분석
  4. 데이터 자산
  5. 인사이트 가설 카드
  6. 타겟 매핑 매트릭스
  7. 정량 검증 결과
  8. 타겟 평가 + Top 3 추천
  9. 영업 전략
  10. 한계 및 가정
  11. 다음 단계

1. Executive Summary

상세: ../phase6_report/executive_summary.md

Cribot POS 데이터는 NIQ·Circana·BC카드·신한카드·KDX 어디도 커버하지 못하는 한국 독립 마트 SKU 단위 실시간 판매 데이터를 유일하게 보유한다.

Phase 0-5 분석을 통해 다음을 확인하였다:

핵심 검증 수치

카드 가설 실측 평가
INS-021 카테고리 매핑 64% 추정 89.87% 즉시 출시 수준
INS-002 행사 매칭률 35% 기준 49.79% +14.8pp 우수
INS-003 행사 ROI lift +50~150% 중앙값 +77.3% 가설 입증
INS-001 공급망 회전율 +30% 24.6일, 부진 10.7% 영업 액션 도출
INS-013 점유율 -10%p 탐지 440쌍→1건 압축 임계값 실효
INS-020 매출 알람 대응 시간 단축 4.0%, 월 0.8회 적정성 입증
INS-019 영업 카드 준비 50% 단축 5 메트릭 자동화 시연 완료
INS-004 분 단위 +5~15% lift -1.1% 재정의 필요

2. 프로젝트 개요 + 목적

2.1 프로젝트 목적

Cribot이 수집·보유한 POS 원천 데이터에서 시장에 판매 가능한 인사이트 상품을 발굴하고, 잠재 타겟 고객군을 정량적으로 평가하여 사업화 방향을 결정하는 데이터 분석 프로젝트.

구체적 목표:
1. 상용 데이터 제품(NIQ, Circana, BC카드, 신한카드, KDX) 역공학 분석으로 차별화 영역 식별
2. Cribot 데이터 자산 전수 인벤토리 (MySQL + ClickHouse)
3. 인사이트 가설 카드 25장 작성 및 Level 3 검증
4. 6 타겟 × 25 카드 매트릭스로 Phase 4 우선순위 결정
5. 상위 8 카드 실데이터 정량 검증
6. 최종 Top 3 타겟 + 영업 전략 수립

2.2 1차 산출물 (7가지)

산출물 내용
벤치마크 5건 NIQ, Circana, BC카드, 신한카드, KDX 역공학 분석
Offering Teardown 44 항목 평가 (⭐5, ✅1, ⚠️24, ❌14)
데이터 인벤토리 MySQL 204 테이블, ClickHouse 51M 행
인사이트 카드 25장 Level 3, reject 0
타겟 매트릭스 6 타겟 × 25 카드 = 150 셀
정량 검증 8건 Phase 4 실측 데이터 + 차트 24개
최종 보고서 본 문서 (Phase 6)

2.3 Out of Scope

2.4 핵심 가설

"Cribot POS 데이터는 NIQ·Circana가 제공하지 못하는 한국 독립 마트 채널의 SKU 단위 실시간 판매 인사이트를 제공할 수 있으며, 이를 거래처·FMCG 제조사·마트 운영자에게 B2B SaaS 또는 데이터 상품으로 판매할 수 있다."


3. 시장 분석

상세: ../phase0_benchmark/

3.1 벤치마크 5건 요약

# 대상 특징 Cribot 대비
1 NIQ (Nielsen IQ) 주 1회 ScanTrack, 점포×SKU 시간 해상도 1만 배 차이
2 Circana OmniMarket MULO+, 주 1회 행사 ROI 직접 데이터 없음
3 BC카드 AI 금융빅데이터 월 1회 카드 승인 집계 SKU 단위 없음
4 신한카드 Trendis 월 1~수회 비정기 SKU 단위 없음
5 KDX (한국데이터거래소) GS리테일 POS, 카드사 집계 독립 마트 SKU 없음

자세히: ../phase0_benchmark/benchmarks/

3.2 Offering Teardown 44항목 분포

Phase 0에서 5개 벤치마크의 제공 기능 44개 항목을 ⭐/✅/⚠️/❌ 4단계로 평가한 결과:

심볼 의미 건수
Cribot 고유 우위 (Feasibility 포함 5건) 5
타사 동등 제공 1
⚠️ 부분 제공 또는 조건부 24
구조적 제공 불가 14

핵심: ⭐ 5건 모두 "타사가 구조적으로 재현 불가"한 영역 — 수집 아키텍처(NATS JetStream 10초) + 운영 맥락 데이터(행사·입고·거래처) 동시 보유가 이유.

자세히: ../phase0_benchmark/offering_teardown.md

3.3 차별화 5 영역

# 영역 Type 핵심 근거
1 분 이하 시간 해상도 POS A (분석 품질) NIQ 주 1회 대비 10초 단위 수집
2 점포 운영 맥락 인과 분석 A (분석 품질) 행사+입고+판매 3축 JOIN, 타사 불가
3 한국 독립 마트 세그먼트 B (채널 공백) TGR/HYP/AEND/STP 유일 공급자
4 거래처-마트 공급망 연결 A (분석 품질) 납품사 관점 공급망 가시성
5 KDX 즉시 진입 경로 C (이용 가능 서비스) 법인 등록 후 인바운드 수요

자세히: ../phase0_benchmark/differentiation.md

3.4 경쟁 포지셔닝

Cribot의 핵심 포지셔닝: "GS25·이마트·카드 결제 데이터가 보이지 않는 한국 독립 마트 채널의 SKU 판매를 유일하게 공급한다" (Positioning 후보 C)

이는 실측으로 검증 가능 — KDX에 현재 TGR/HYP/AEND/STP 계열 중소형 마트 내부 SKU 판매 원천 데이터 공급자 없음 (Phase 0 05_kdx.md 확인).


4. 데이터 자산

상세: ../phase1_inventory/

4.1 MySQL cribot (MariaDB 10.10.3)

항목 수치
총 테이블 수 204
핵심 마스터 테이블 8개 (mc_mart, mc_barcode, mc_market_agent 등)
총 마트 (mc_mart) 120개
거래처 (mc_market_agent) 67,000+
입고 데이터 (mc_inbound) 3,326,411행, 14년치 (2012-07-02~)
행사 데이터 (mc_product_event_mostraw) 4,681,466행, 마트 281개
PII 컬럼 230개 (분석 out-of-scope)

핵심 마스터 8개:
1. mc_mart — 점포 메타 (120개, 2020~)
2. mc_barcode — 상품 바코드 마스터 (2021~)
3. mc_product_mostraw — 상품 마스터 (2021~)
4. mc_market_agent — 거래처 마스터 (2022~)
5. mc_pos_category — POS 카테고리 매핑 (2026~)
6. mc_inbound — 입고 내역 (2012~)
7. mc_product_event_mostraw — 행사 등록 (2021~)
8. ims_order_mostraw — 발주 이력 (2025~)

자세히: ../phase1_inventory/tables_catalog.md

4.2 ClickHouse pos_analytics.sales

항목 수치
총 행 수 (raw) 51,114,317
MySQL 기준 정상 행 수 35,824,595
중복 행 (이슈) 15,289,722 (29.9%)
2026년 판매 행 수 50,361,604 (109개 마트)
2025년 판매 행 수 752,713 (2개 마트)
srl 중복 건수 15,777,067개 srl

주의: ClickHouse MergeTree 엔진 사용으로 중복 INSERT가 영구 보존됨. Phase 4 분석에서는 DISTINCT morder_srl 우회 쿼리 사용.

자세히: ../phase1_inventory/clickhouse_inventory.md

4.3 POS 4종 커버리지

POS 마트 수 점유율 DISTINCT 판매건 (2026~) 평균 단가
TGR (투게더포스) 92 76.7% 30,961,603 5,709원
AEND (에이앤드포스) 10 8.3% 1,618,625 6,578원
HYP (하이포스) 6 5.0% 1,057,075 6,254원
STP 2 1.7% 435,201 4,355원
UNKNOWN 5 512,033 5,615원

TGR이 마트 수 기준 88% (92/104 카테고리 등록 마트), Phase 4 코호트 선정 기준.

자세히: ../phase1_inventory/data_quality.md

4.4 카테고리 표준 매핑

단계 매핑률 기준
Phase 1 추정 64% ClickHouse 원시 카테고리 샘플
Phase 2 보정 56.7% reject 기준 재평가
Phase 4 실측 (TGR 톱10) 89.87% 표준 14개 → 73개 원시 매핑

표준 14개 카테고리 (16 분류 중 유효 14개): 농산물, 수산물, 축산물, 정육, 냉동식품, 가공식품, 음료, 과자/스낵, 유제품, 세제/생활용품, 주방용품, 위생용품, 기타식품, 비식품류

자세히: ../phase1_inventory/category_normalization.md


5. 인사이트 가설 카드

상세: ../phase2_cards/

5.1 25 카드 개요

Phase 2에서 25장의 인사이트 가설 카드를 작성하였으며, 모두 Level 3 (정량 검증 준비 완료) 기준을 통과하였다.

항목 수치
총 카드 수 25
Level 3 통과 25 (100%)
Reject 0
신규 발굴 10장
cribot-admin 기존 승급 15장

5.2 도메인 분포

도메인 카드 수 주요 카드
상품 5 INS-008, 009, 010, 018, 024
거래처 4 INS-001, 013, 019, 023
마트 4 INS-006, 007, 016, 020
품질 3 INS-014, 015, 022
고객 2 INS-011, 017
시간 2 INS-004, 012
행사 2 INS-002, 003
지역 1 INS-005
카테고리 1 INS-021
가격 1 INS-025

5.3 Reject 기준 4건 (25/25 통과)

기준 설명
R1. 데이터 부재 분석에 필요한 테이블/컬럼이 없는 경우
R2. PII 노출 개인식별정보 230 컬럼 포함 → out-of-scope
R3. 시계열 부족 1개월 미만 데이터로 측정 불가
R4. 중복 가설 이미 존재하는 카드와 동일한 내용

5.4 대표 카드 (Phase 4 검증 선정 이유)

INS-001 거래처×마트×상품 공급망 통합 (도메인: 거래처, 신뢰도: high)
- 가설: 거래처별 납품 상품의 점포 단위 판매 현황을 입고 데이터와 JOIN하여 공급망 가시성 제공
- Phase 3 선정: A 타겟(거래처) V=5 × F=5 = 25 (최고점)

INS-021 표준 카테고리 매크로 트렌드 (도메인: 카테고리, 신뢰도: medium)
- 가설: 원시 73개 POS 카테고리 → 표준 16개로 매핑하여 매크로 트렌드 분석
- Phase 3 선정: D 타겟(정부/시장조사) 핵심 카드

자세히: ../phase2_cards/_index.md


6. 타겟 매핑 매트릭스

상세: ../phase3_matrix/

6.1 6 타겟군 정의

ID 타겟 정의
A 거래처 영업 cribot-admin 기존 납품업체, 자사 SKU 판매 현황 추적
B FMCG 제조사 카테고리 매니저, 독립 마트 채널 침투율·행사 ROI 측정
C 마트 운영자 cribot-admin 기존 마트, 행사 운영·매출 알람
D 정부/시장조사 통계청·시장조사기관, 독립 마트 매크로 트렌드
E 학계·연구 식품유통 연구, SKU 단위 실증 패널 데이터
F KDX 바우처 인바운드 데이터바우처 구매 수요

6.2 매트릭스 150 셀 요약

25 카드 × 6 타겟 = 150 셀을 가치(V, 1-5) × 실현성(F, 1-5)으로 평가.

타겟별 평균 V×F 점수:

타겟 평균 V×F Phase 3 순위
C. 마트 운영자 15.3 1위
A. 거래처 영업 13.2 2위
B. FMCG 제조사 11.1 3위
D. 정부/시장조사 ~8.5 4위
E. 학계·연구 ~8.0 5위
F. KDX 바우처 ~6.0 6위

6.3 Top 8 선정 (Phase 4 검증 대상)

Phase 3 매트릭스에서 상위 점수 + 사용자 선택으로 8장 선정:

카드 1차 선정 이유
INS-001 A 타겟 최고점 V×F=25, 공급망 차별화 핵심
INS-002 C 타겟 핵심, 행사 운영 진단
INS-003 B+A 타겟, 행사 ROI 정량화
INS-004 시간 해상도 차별화 영역 1.1 검증
INS-013 A 타겟, 점유율 알림 시스템
INS-019 A 타겟, 영업 카드 자동화
INS-020 C 타겟, 매출 알람
INS-021 D+B 타겟, 카테고리 매핑 즉시 출시

자세히: ../phase3_matrix/top_picks.md


7. 정량 검증 결과

상세: ../phase4_validation/

7.1 코호트 정의

항목
POS TGR (투게더포스)
마트 톱10 (M001~M010), 규모 기준 선정
기간 2026-01-01 ~ 2026-05-13 (약 5개월)
총 매출 693.7억원
분석 도구 Python (sales_query.py), ClickHouse DISTINCT 우회

7.2 가설 vs 실측 결과표

카드 Phase 2 가설 Phase 4 실측 평가
INS-021 매핑률 64% 89.87% (+25.9pp) 즉시 출시 수준
INS-002 매칭률 35% 49.79% (+14.8pp) 우수
INS-003 lift +50~150% 중앙값 +77.3% 입증
INS-001 회전율 +30% 24.6일, 부진 SKU 10.7% 영업 액션 도출
INS-013 -10%p 탐지 440쌍 → 1건 임계값 실효
INS-020 대응 시간 단축 14건/347쌍, 월 0.8회 적정성 입증
INS-019 준비 50% 단축 5 메트릭 자동화 시연 완료
INS-004 +5~15% lift -1.1% (자정 이슈) 재정의 필요

종합: 8 카드 중 7장 가설 입증 또는 대폭 상회. INS-004는 측정 실패가 아닌 데이터 파이프라인 설계 이슈 발견.

7.3 카드별 상세 결과

INS-021 — 표준 카테고리 매크로 트렌드

원시 73개 POS 카테고리를 표준 14개로 매핑한 결과 89.87% 매핑률 달성 (Phase 2 추정 64% 대비 +25.9pp). 5개월 693.7억원 규모 거래 분석.

INS-021_01_category_distribution

INS-021_02_monthly_trend

INS-021_03_growth_top3

항목 수치
원시 카테고리 수 73개
표준 매핑 카테고리 14개
표준 매핑률 89.87%
기타 비율 1.69%
미분류 비율 7.49%
분석제외 비율 0.95%

정부/시장조사(D 타겟)·학계(E 타겟) 매크로 트렌드 리포트 즉시 출시 가능 수준

자세히: ../phase4_validation/INS-021/report.md

INS-002 — 행사 운영 진단

전체 행사 99,424건 중 49,508건 매칭 (49.79%). 미매칭 87.5%가 "입고있으나 판매없음" — 진열·가격 운영 문제 가능성.

INS-002_01_mart_matching_rate

INS-002_02_unmatched_reasons

INS-002_03_matching_over_time

항목 수치
전체 행사 수 99,424건
매칭된 행사 49,508건
매칭률 49.79%
마트별 최저 43.2% (M008)
마트별 최고 69.1% (M003)
미매칭 중 "입고있으나 판매없음" 28,948건 (87.5%)
미매칭 중 "입고 없음" 4,122건 (12.5%)

마트 운영자(C 타겟)에 즉시 가치 — 행사 효율 진단 카드로 영업 가능

자세히: ../phase4_validation/INS-002/report.md

INS-003 — 행사 ROI lift 측정

측정 가능 행사 2,429건 (전체 92,888건의 2.61%)에서 lift 중앙값 +77.3% 확인. 57.3%가 +50% 이상 lift.

INS-003_01_category_lift_distribution

INS-003_02_lift_top10_vs_bot10

INS-003_03_lift_distribution

항목 수치
전체 행사 수 92,888건
측정 가능 행사 2,429건 (2.61%)
lift 평균 +453.4% (이상치 영향)
lift 중앙값 +77.3%
+50% 이상 57.3%
+150% 이상 35.3%
음수 lift 24.1%

B2B FMCG 제조사(B 타겟) + 거래처(A 타겟) 행사 기획 ROI 근거 제공. 측정 가능 비율(2.61%)은 2025년 데이터 보유 마트 포함 시 대폭 개선 가능.

자세히: ../phase4_validation/INS-003/report.md

INS-001 — 거래처×마트×상품 공급망 통합

입고 656,072행 + 판매 6,403,711행 매칭으로 64,580쌍의 회전율 산출. 평균 24.6일, 60일+ 부진 SKU 10.7% (684개 거래처 중 401개 분석).

INS-001_01_supplier_rotation_dist

INS-001_02_supplier_mart_heatmap

INS-001_03_dead_skus_by_supplier

부진 거래처 톱5 (60일+ SKU 수 기준):
1. (주)강서잡화: 277건
2. (주)한국연(가공_중복): 273건
3. 마트1]한국연: 251건
4. 마트1]대상(청정원): 191건
5. 씨제이대한통운(주): 186건

A 타겟 즉시 영업 대상 선별 — 부진 SKU 60일+ 거래처 5곳이 첫 고객 후보

자세히: ../phase4_validation/INS-001/report.md

INS-013 — 거래처 점유율 변동 대응

440 거래처×마트 쌍 분석 결과 -10%p 초과 하락 단 1건 (-17.1%p, 마트8 야채부1). +10%p 초과 상승 8건.

INS-013_01_supplier_share_top10

INS-013_02_share_change_distribution

INS-013_03_top_losers_winners

440쌍 수작업 모니터링을 1건으로 압축 — A 타겟 영업 생산성 440배 향상

자세히: ../phase4_validation/INS-013/report.md

INS-019 — 거래처 인사이트 영업 카드 자동화

정육거래처 대상 4분면 카드(매출×회전 기준 자동 분류) + 5 메트릭 자동 생성 시연 완료.

INS-019_01_supplier_kpi_card

INS-019_02_supplier_monthly_trend

INS-019_03_actionable_alerts

자동화 메트릭 5종: 마트별 판매 TOP5 / SKU TOP5 (판매량·성장률) / 성장률 트렌드 (이상 탐지) / 점유율 변화 알림 (INS-013 연동) / 마트별 성장률 알림 (-20% 자동)

자세히: ../phase4_validation/INS-019/report.md

INS-020 — 오늘 매출 알람·대응

-20% 임계값으로 347쌍 분석 → 14건 알람 (4.0%). 마트당 월 평균 0.8회 (≈ 2.0건/마트/3개월).

INS-020_01_daily_vs_lastweek

INS-020_02_alert_frequency

INS-020_03_alert_simulation

항목 수치
비교 쌍 347쌍
-20% 알람 14건 (4.0%)
마트당 월 평균 0.8회
최대 하락 -42.9%
최대 상승 +133.4%

C 타겟 마트 운영자 매출 이상 조기 탐지 가치 확인

자세히: ../phase4_validation/INS-020/report.md

INS-004 — 분 단위 매출 변동 추적

행사 직후 60분 lift -1.1%. 데이터 파이프라인 이슈 발견: 행사 start_date 자정 기준 설정 + 새벽 1시 POS 배치 매출 집중.

INS-004_01_hourly_pattern

INS-004_02_event_study

INS-004_03_minute_variance

항목 수치
피크 시간 새벽 1시 (2.0억/시간)
최저 시간 오전 9시 (0원)
행사 후 60분 lift -1.1% ⚠️

측정 실패가 아닌 데이터 파이프라인 설계 이슈 — 운영팀 보고 + 측정 방식 재정의 필요

자세히: ../phase4_validation/INS-004/report.md


8. 타겟 평가 + Top 3 추천

상세: ../phase5_evaluation/

8.1 4축 평가 체계

의미 1점 5점
M (Market Size) 잠재 시장 규모 <100 고객 >10K 고객
W (Willingness to Pay) 지불 의향 <100만원/년 >2억원/년
E (Entry Ease) 진입 용이성 2년+ <1개월
D (Data Readiness) 데이터 충족도 추가 수집 필요 즉시 출시

8.2 6 타겟 평가 점수표

순위 타겟 M W E D 합계 Phase 3 V×F avg Phase 4 갱신
1 A. 거래처 영업 3 3 5 4 15 13.2 INS-001+013+019 입증
2 B. FMCG 제조사 3 5 2 4 14 11.1 INS-003+021 입증
2 C. 마트 운영자 2 2 5 5 14 15.3 INS-002+020 입증
4 D. 정부/시장조사 2 4 2 5 13 8.5 INS-021 89.87%
5 F. KDX 바우처 3 2 4 3 12 6.0 간접 적합
6 E. 학계·연구 2 2 3 4 11 8.0 INS-021 강력

8.3 Phase 3 → Phase 5 순위 변화

타겟 Phase 3 순위 Phase 5 순위 변동 핵심 이유
A. 거래처 영업 2위 (V×F 13.2) 1위 (15) ▲ 1 Phase 4 E=5+D=4 강점 확인
B. FMCG 제조사 3위 (11.1) 2위 (14) ▲ 1 INS-003+021 실측으로 D=4 상향
C. 마트 운영자 1위 (15.3) 2위 (14) ▼ 1 W=2 낮은 단가로 B와 동점
D. 정부/시장조사 4위 (~8.5) 4위 (13) D=5로 대폭 상향 but E=2 제약

자세히: ../phase5_evaluation/target_evaluation_matrix.md


9. 영업 전략

상세: ../phase5_evaluation/top3_recommendations.md

9.1 Top 1 — A. 거래처 영업 (15점)

진입 채널: cribot-admin 기존 거래처 upsell (67K 거래처 중 영업 활성 5K-10K 우선)

영업 사이클: 1-3개월

첫 타겟 고객: 부진 SKU 60일+ 상위 거래처
- (주)강서잡화 (277건), 오뚜기 관련 (273+251건), 대상청정원 (191건), CJ (186건)

핵심 메시지: "자사 SKU 회전율 자동 추적 + 점유율 변동 알림 (440→1건 압축) + 영업 회의 자동 카드 = 매출 +8-12%"

추정 ARR: 거래처당 연 500-3,000만원 × 100-500 거래처 = 5억-150억 (5년)

Phase 4 검증 근거: INS-001 (회전 24.6일), INS-013 (440쌍→1알람), INS-019 (5 메트릭 자동화)

위험 요소:
- cribot-admin 거래처 채널 활성화 여부 확인 필요
- 마트 vs 거래처 양쪽 → 거래 비밀 노출 우려
- 점유율 데이터 공유 시 마트 본사 동의 필요 가능

9.2 Top 2 — B. FMCG 제조사 (14점)

진입 채널: 직접 영업 (외부 신규 고객 — 가장 어려운 채널)

영업 사이클: 6-12개월

첫 타겟 고객: 한국 톱20 FMCG (CJ제일제당, 농심, 롯데웰푸드, 오뚜기, 동원, 매일유업 등)

핵심 메시지: "한국 독립 마트 채널 + 점포×일 lift 측정 = NIQ 주 단위 한계 보완. lift 중앙값 +77.3% 입증. 독립 마트 88개 마트 커버"

추정 ARR: 1개당 연 5천만-3억원 × 5-15 고객 = 2.5억-45억 (3년)

Phase 4 검증 근거: INS-003 (lift +77.3%), INS-021 (89.87%), INS-024 (신상품 침투)

위험 요소:
- NIQ/Circana 기존 계약 경합
- 의사결정 사이클 6-12개월
- 마트 표본 작음 (TGR 톱10 → 전체 92개 확장 필요)
- 영업 인력 필요

9.3 Top 3 — C. 마트 운영자 (14점)

진입 채널: cribot-admin upsell (기존 마트 120개)

영업 사이클: <1개월 (UI 추가)

첫 타겟 고객: TGR 톱10 마트 (M001~M010) — Phase 4 코호트와 동일

핵심 메시지: "행사 매칭 49.79% 진단 + 매출 알람 -20% (월 0.8회) + 마트 진단 자동화 = 운영 효율 +5-10%"

추정 ARR: 마트당 월 10-50만원 → 연 120-600만원 × 50-100 마트 = 0.6억-6억

Phase 4 검증 근거: INS-002 (매칭 49.79%), INS-020 (-20% 알람 4%), INS-006/007

위험 요소:
- 점주 데이터 활용 역량 → UI 단순화 필요
- 단가 작음 (Top 3 중 가장 작음)
- cribot-admin 통합 vs 별도 모듈 결정 필요

9.4 별도 트랙 — D. 정부/시장조사 (13점)

진입 채널: KDX 데이터바우처 + 공공 입찰 + 직접 영업

영업 사이클: 1-2년

첫 타겟: 한국갤럽, 마크로밀엠브레인 → 통계청

핵심 메시지: "한국 독립 마트 채널 매크로 트렌드 — 표준 16개 매핑률 89.87%, 정부 통계 보완 자료로 즉시 출시 가능"

추정 ARR: 1개당 연 5천만-2억원 × 3-5 기관 = 1.5억-10억

가치: 브랜드 효과 큼 (정부 채택 시 cribot 신뢰도 상승), INS-021 즉시 출시 가능

9.5 통합 ARR 추정 (트랙별 도달 시점)

트랙 보수적 ARR 적극적 ARR 도달 시점
A 거래처 5억 150억 5년
B 제조사 2.5억 45억 3년
C 마트 0.6억 6억 5년 (가정)
D 정부/시장조사 1.5억 10억 5년 (가정)
합계 9.6억 211억 -

: ARR(Annual Recurring Revenue)은 정의상 연간 매출입니다. 본 표 수치는 각 트랙이 영업 사이클을 거쳐 도달 가능한 연간 매출의 상하한이며, 5년 누적 매출이 아닙니다. 도달 시점은 각 트랙 9.1~9.4 본문 명시 기준이며, C/D는 본문 미명시로 5년을 가정합니다. 1년차 실제 합계는 약 1~15억 수준으로 추정됩니다 (영업 사이클 + 점진적 고객 확보 반영).


10. 한계 및 가정

상세: ../appendix/data_quality_summary.md

본 보고서는 기술 검증 + 추정 보고서이며, 시장 검증은 아직 수행되지 않았다. 본 섹션은 데이터 품질 한계(10.1-10.3), 시장 검증의 한계(10.4), ARR 추정의 가정(10.5), 그리고 이를 입증하기 위한 PoC 필요성과 Go/No-Go 기준(10.6)을 명시한다. 본 보고서를 영업 입찰 자료, 투자 결정의 단독 근거로 사용하는 것은 권장되지 않는다.

Phase 1~4에 걸쳐 6건의 데이터 품질 이슈를 발견하였다.

10.1 이슈 목록

# 발견 단계 이슈 영향 카드
1 Phase 1 ClickHouse 중복 INSERT 29.9% (15.3M 행) 집계 정확도 저하 전체
2 Phase 4 INS-003 mc_product_event_mostraw 중복행 lift 이상값 (+453% 평균) INS-002, 003
3 Phase 4 INS-004 행사 start_date 자정 기준 설정 실제 행사 시작 불일치, INS-004 측정 불가 INS-004
4 Phase 4 INS-001 거래처명 비정규화 (오뚜기 2개 항목 등) 동일 거래처 중복 집계 INS-001, 013
5 Phase 4 INS-004 새벽 1시 매출 집중 (POS 배치 결산 의심) 시간대 분석 전체 왜곡 INS-004, 012
6 Phase 4 (쿼리) ClickHouse 청크 EOF 오류 (간헐적) 대용량 쿼리 실패 전체

10.2 우선순위 로드맵

즉시 (0-1개월):
- #3 행사 start_date → start_time 컬럼 추가 또는 영업 기준 재정의
- #6 ClickHouse EOF → 쿼리 배치 크기 조정 + 재시도 로직

단기 (1-3개월):
- #1 ClickHouse 중복 → ReplacingMergeTree 마이그레이션 검토
- #2 mc_product_event_mostraw → 중복 행 정리 스크립트

중기 (3-6개월):
- #4 거래처명 정규화 → 표준화 작업 + 매핑 테이블 구축
- #5 새벽 1시 패턴 → POS 전송 타임스탬프 감사 + 일 마감 기준 재확인

10.3 영향 범위 요약

현재 분석에서 #1(ClickHouse 중복)은 DISTINCT morder_srl 우회로 해결. #3(자정 기준)은 INS-004 재정의로 해결 가능. 나머지 이슈는 분석 해석에 주의 필요하나 Phase 4 핵심 결과(INS-021, INS-002, INS-003, INS-001)에는 영향 제한적.

10.4 시장 검증의 한계

항목 상태 비고
데이터에서 인사이트 추출 가능? ✓ 입증 Phase 4 8 카드 중 7개
인사이트의 기술적 정확도? ✓ 입증 매핑 89.87%, lift +77.3% 등
고객이 살 의향? ✗ 미검증 PoC 0건, 고객 인터뷰 0건
단가 수용성? ✗ 미검증 시범 판매 0건
영업 사이클 실제 길이? ✗ 미검증 9.1-9.4의 1-12개월은 추정만
마트 데이터 외부 공유 동의? ✗ 미검증 마트와 계약서 재협상 필요. 동의 없으면 A/B 트랙 진행 불가
거래처가 cribot-admin 현재 사용 중? △ 미확인 "9.1 cribot-admin 67K 거래처 upsell" 전제. 활성 사용자 모수 미측정

Phase 4가 "데이터에서 X를 측정할 수 있다"를 증명했을 뿐, "고객 Y가 X에 돈을 낼 것이다"는 증명한 적이 없다. 본 보고서는 "가능성 보고서"이지 "시장 검증 보고서"가 아니다.

10.5 ARR 추정의 가정

9.5 표의 ARR 추정은 다음 가정의 곱셈이다. 가정이 깨지면 추정도 깨진다.

트랙 핵심 가정 가정의 약점
A 적극 150억 5년 후 500 거래처 × 연 3,000만원 한국 중소 거래처가 SaaS BI 도구에 연 3,000만원 지불 사례 매우 드뭄. HubSpot/Salesforce 한국 중소 가입자 평균 연 100-500만원
B 적극 45억 3년 후 5-15 FMCG × 연 3억 NIQ 표준 + 보완재 위치에서 연 3억 단가 어려움. NIQ Retail Measurement 일반 단가의 50-80% 수준이 현실적
C 적극 6억 5년 후 50-100 마트 × 월 50만원 한국 독립 마트 점주의 BI 도구 지불 의향 + 데이터 리터러시 모두 미검증. 점주 PC 사용 빈도조차 미측정
D 적극 10억 5년 후 3-5 기관 × 연 2억 KDX 데이터바우처 평균 1-3천만원, 연 2억은 상위 사례. 공공 입찰은 대기업 컨소시엄 주도로 작은 회사 단독 수주 어려움

현실적 시나리오별 ARR 추정:

시나리오 5년차 ARR 확률 추정
Best path (적극) 211억 20-30%
Mid path 50-80억 30-40%
Conservative (보수) 9.6억 30-40%
Down path (대부분 트랙 폐기) 1-3억 10-20%

1년차 보수 추정 (영업 사이클 + 점진적 고객 확보 반영):
- A: 0-1억 (거래처 5-20개 진입)
- B: 0억 (영업 사이클 6-12개월로 첫 계약 미확정)
- C: 0-0.5억 (마트 5-10개)
- D: 0.5-2억 (1-2 기관)
- 1년차 합계: 0.5-3.5억 (9.5 표의 보수 9.6억 × 5-35%)

10.6 PoC 필요성 + Go/No-Go 기준

본 보고서의 가정을 입증하기 위해 다음 PoC가 필요하다. 시스템 구축 신규 프로젝트 착수 전 PoC 결과 반영을 권장.

PoC 1: A 거래처 트랙 (4-8주)
- 1 거래처 무료 제공 (INS-001 회전율 + INS-013 알람 + INS-019 5메트릭 카드)
- 검증: 거래처가 영업 회의에 카드를 활용하는가? 단가 30/50/100만원 중 얼마면 지불 의사 있는가?
- Go 기준: 1 거래처 유료 전환 시 5 거래처 확장 시도
- No-Go 기준: 1 거래처도 유료 전환 안 됨 → A 트랙 단가 재산정 또는 폐기

PoC 2: C 마트 트랙 (4-8주)
- 1 마트 무료 제공 (INS-002 행사 매칭 + INS-020 매출 알람 + INS-006 카테고리 진단)
- 검증: 점주가 주간 1회 이상 사용하는가? 매출/운영 개선 사례 발생? 월 10/30/50만원 지불 의향?
- Go 기준: 1 마트 유료 전환 시 10 마트 확장 시도
- No-Go 기준: 점주 사용 빈도 주 1회 미만 또는 0 마트 유료 전환 → C 트랙 폐기

PoC 3: B FMCG 콜드 미팅 시도 (8-12주)
- 톱20 FMCG에 콜드 미팅 요청 + Phase 4 INS-003 데모 리포트 1건 무료 제공
- 검증: 미팅 응답률, "관심 있다" 응답 수, NIQ 외 추가 지출 의향
- Go 기준: 5곳 시도 중 2곳 이상 미팅 응답 + 1곳 이상 PoC 계약
- No-Go 기준: 5곳 시도 중 0곳 미팅 응답 → B 트랙 폐기

PoC 비용: 인력 1-2명 × 2-3개월 + 무료 제공 운영비. 시스템 구축(별도 프로젝트 5-10명 × 3-6개월) 대비 약 1/10 비용.

의사결정 흐름:

PoC 3건 (2-3개월)
   ↓
PoC 결과
   ├─ 유료 전환 1건 이상 → 시스템 구축 신규 프로젝트 본격화
   │                       (검증된 트랙부터 우선 진입)
   └─ 유료 전환 0건 → 트랙별 No-Go 평가
                      ├─ 인사이트 재정의 + 단가 재산정 + 추가 PoC
                      └─ 사업 모델 피벗 (컨설팅 모델 등)

11. 다음 단계

의사결정 권고 — 최종 결정은 사용자(cribot 경영진) 소관

11.1 즉시 실행 (0-3개월, 사용자 결정 필요)

# 액션 타겟 필요 자원
1 A 거래처 영업 시작 부진 SKU 톱5 거래처 영업 담당자 + cribot-admin 채널
2 C 마트 upsell — 행사 진단 + 알람 UI 마트 120개 (TGR 톱10 우선) 개발자 1명, 1-2주
3 D 즉시 출시 — INS-021 리포트 KDX 등록 + 공공 입찰 KDX 법인 등록 절차

11.2 중기 파이프라인 (3-6개월)

# 액션 타겟 필요 자원
4 B FMCG 영업 채널 활성화 한국 톱20 FMCG 영업 인력 확보
5 KDX 등록 완료 F 인바운드 수요 법무·사업 부서
6 INS-004 측정 방식 재정의 행사 즉시 반응 개발팀 (start_time 컬럼)

11.3 다음 별도 프로젝트 (Out of Scope — 새 프로젝트로)

11.4 데이터 품질 후속 조치

  1. ClickHouse 중복 INSERT 문제 → 운영팀 chsync 점검 요청
  2. 행사 데이터 중복 → 정기 정리 스크립트 자동화
  3. 거래처명 정규화 → 마스터 데이터 정리 프로젝트

결론

Cribot Insight Phase 0-5 분석을 통해 다음을 확인하였다:

  1. 차별화 실재: NIQ·Circana가 구조적으로 재현 불가한 5개 영역 확인. 특히 독립 마트 SKU 원천 데이터는 한국 데이터 시장 전체에서 Cribot이 유일한 공급자.

  2. 가설 입증: 25개 인사이트 가설 중 Phase 4 검증 8건 → 7건 입증. INS-021 89.87% (추정 대비 +25.9pp), INS-002 49.79% (+14.8pp), INS-003 lift +77.3%.

  3. 명확한 타겟: A 거래처 (15점, 즉시 upsell) > B FMCG (14점, 6-12개월) = C 마트 (14점, 즉시 upsell) 순서로 추천. D 정부는 별도 트랙으로 INS-021 즉시 출시 가능.

  4. 경제성: 도달 ARR(3-5년차) 보수 9.6억 / 적극 211억 — cribot-admin 기존 채널(A+C) 활용 시 3개월 내 첫 매출 가능.

최종 권고: A 거래처 + C 마트 즉시 upsell 시작, 동시에 D 정부 트랙용 INS-021 리포트 KDX 등록 진행. B FMCG는 영업 인력 확보 후 본격화.


Cribot Insight Phase 6 최종 보고서 — 2026-05-14
산출물 전체 인덱스: appendix/artifact_index.md