Cribot Insight — 최종 보고서

작성일: 2026-05-14 | 분석 기간: 2026-05-12 ~ 2026-05-14 | 코호트: TGR 톱10 마트, 2026-01-01 ~ 2026-05-13

Phase 0-6 완료25 인사이트 카드8 정량 검증도달 ARR 9.6억~211억

Cribot Insight — 최종 보고서¶

작성일: 2026-05-14
분석 기간: 2026-05-12 ~ 2026-05-14 (Phase 0-5)
코호트: TGR 톱10 마트, 2026-01-01 ~ 2026-05-13

목차¶

Executive Summary
프로젝트 개요 + 목적
시장 분석
데이터 자산
인사이트 가설 카드
타겟 매핑 매트릭스
정량 검증 결과
타겟 평가 + Top 3 추천
영업 전략
한계 및 가정
다음 단계

1. Executive Summary¶

상세: ../phase6_report/executive_summary.md

Cribot POS 데이터는 NIQ·Circana·BC카드·신한카드·KDX 어디도 커버하지 못하는 한국 독립 마트 SKU 단위 실시간 판매 데이터를 유일하게 보유한다.

Phase 0-5 분석을 통해 다음을 확인하였다:

차별화 5 영역: 분 이하 시간 해상도, 행사 ROI 인과, 독립 마트 세그먼트, 거래처-마트 공급망, KDX 즉시 진입
25 인사이트 가설: Level 3 전량 통과, reject 0
Phase 4 정량 검증: 8 카드 중 7장 가설 입증 (1장 측정 방식 재정의 필요)
Top 3 타겟: A 거래처(15점), B FMCG(14점), C 마트(14점)
도달 ARR 추정 (트랙별 3-5년차): 보수 9.6억 / 적극 211억

핵심 검증 수치¶

카드	가설	실측	평가
INS-021 카테고리 매핑	64% 추정	89.87%	즉시 출시 수준
INS-002 행사 매칭률	35% 기준	49.79%	+14.8pp 우수
INS-003 행사 ROI	lift +50~150%	중앙값 +77.3%	가설 입증
INS-001 공급망	회전율 +30%	24.6일, 부진 10.7%	영업 액션 도출
INS-013 점유율	-10%p 탐지	440쌍→1건 압축	임계값 실효
INS-020 매출 알람	대응 시간 단축	4.0%, 월 0.8회	적정성 입증
INS-019 영업 카드	준비 50% 단축	5 메트릭 자동화	시연 완료
INS-004 분 단위	+5~15% lift	-1.1%	재정의 필요

2. 프로젝트 개요 + 목적¶

2.1 프로젝트 목적¶

Cribot이 수집·보유한 POS 원천 데이터에서 시장에 판매 가능한 인사이트 상품을 발굴하고, 잠재 타겟 고객군을 정량적으로 평가하여 사업화 방향을 결정하는 데이터 분석 프로젝트.

구체적 목표:
1. 상용 데이터 제품(NIQ, Circana, BC카드, 신한카드, KDX) 역공학 분석으로 차별화 영역 식별
2. Cribot 데이터 자산 전수 인벤토리 (MySQL + ClickHouse)
3. 인사이트 가설 카드 25장 작성 및 Level 3 검증
4. 6 타겟 × 25 카드 매트릭스로 Phase 4 우선순위 결정
5. 상위 8 카드 실데이터 정량 검증
6. 최종 Top 3 타겟 + 영업 전략 수립

2.2 1차 산출물 (7가지)¶

산출물	내용
벤치마크 5건	NIQ, Circana, BC카드, 신한카드, KDX 역공학 분석
Offering Teardown	44 항목 평가 (⭐5, ✅1, ⚠️24, ❌14)
데이터 인벤토리	MySQL 204 테이블, ClickHouse 51M 행
인사이트 카드 25장	Level 3, reject 0
타겟 매트릭스	6 타겟 × 25 카드 = 150 셀
정량 검증 8건	Phase 4 실측 데이터 + 차트 24개
최종 보고서	본 문서 (Phase 6)

2.3 Out of Scope¶

실제 서비스 아키텍처 구현
영업 활동 실행 (고객 접촉)
가격 책정 및 영업 계약
ML/AI 예측 모델 개발
PII(개인식별정보) 230 컬럼 포함 회원 데이터 분석

2.4 핵심 가설¶

"Cribot POS 데이터는 NIQ·Circana가 제공하지 못하는 한국 독립 마트 채널의 SKU 단위 실시간 판매 인사이트를 제공할 수 있으며, 이를 거래처·FMCG 제조사·마트 운영자에게 B2B SaaS 또는 데이터 상품으로 판매할 수 있다."

3. 시장 분석¶

상세: ../phase0_benchmark/

3.1 벤치마크 5건 요약¶

#	대상	특징	Cribot 대비
1	NIQ (Nielsen IQ)	주 1회 ScanTrack, 점포×SKU	시간 해상도 1만 배 차이
2	Circana	OmniMarket MULO+, 주 1회	행사 ROI 직접 데이터 없음
3	BC카드 AI 금융빅데이터	월 1회 카드 승인 집계	SKU 단위 없음
4	신한카드 Trendis	월 1~수회 비정기	SKU 단위 없음
5	KDX (한국데이터거래소)	GS리테일 POS, 카드사 집계	독립 마트 SKU 없음

자세히: ../phase0_benchmark/benchmarks/

3.2 Offering Teardown 44항목 분포¶

Phase 0에서 5개 벤치마크의 제공 기능 44개 항목을 ⭐/✅/⚠️/❌ 4단계로 평가한 결과:

심볼	의미	건수
⭐	Cribot 고유 우위 (Feasibility 포함 5건)	5
✅	타사 동등 제공	1
⚠️	부분 제공 또는 조건부	24
❌	구조적 제공 불가	14

핵심: ⭐ 5건 모두 "타사가 구조적으로 재현 불가"한 영역 — 수집 아키텍처(NATS JetStream 10초) + 운영 맥락 데이터(행사·입고·거래처) 동시 보유가 이유.

자세히: ../phase0_benchmark/offering_teardown.md

3.3 차별화 5 영역¶

#	영역	Type	핵심 근거
1	분 이하 시간 해상도 POS	A (분석 품질)	NIQ 주 1회 대비 10초 단위 수집
2	점포 운영 맥락 인과 분석	A (분석 품질)	행사+입고+판매 3축 JOIN, 타사 불가
3	한국 독립 마트 세그먼트	B (채널 공백)	TGR/HYP/AEND/STP 유일 공급자
4	거래처-마트 공급망 연결	A (분석 품질)	납품사 관점 공급망 가시성
5	KDX 즉시 진입 경로	C (이용 가능 서비스)	법인 등록 후 인바운드 수요

자세히: ../phase0_benchmark/differentiation.md

3.4 경쟁 포지셔닝¶

Cribot의 핵심 포지셔닝: "GS25·이마트·카드 결제 데이터가 보이지 않는 한국 독립 마트 채널의 SKU 판매를 유일하게 공급한다" (Positioning 후보 C)

이는 실측으로 검증 가능 — KDX에 현재 TGR/HYP/AEND/STP 계열 중소형 마트 내부 SKU 판매 원천 데이터 공급자 없음 (Phase 0 05_kdx.md 확인).

4. 데이터 자산¶

상세: ../phase1_inventory/

4.1 MySQL cribot (MariaDB 10.10.3)¶

항목	수치
총 테이블 수	204
핵심 마스터 테이블	8개 (mc_mart, mc_barcode, mc_market_agent 등)
총 마트 (mc_mart)	120개
거래처 (mc_market_agent)	67,000+
입고 데이터 (mc_inbound)	3,326,411행, 14년치 (2012-07-02~)
행사 데이터 (mc_product_event_mostraw)	4,681,466행, 마트 281개
PII 컬럼	230개 (분석 out-of-scope)

핵심 마스터 8개:
1. mc_mart — 점포 메타 (120개, 2020~)
2. mc_barcode — 상품 바코드 마스터 (2021~)
3. mc_product_mostraw — 상품 마스터 (2021~)
4. mc_market_agent — 거래처 마스터 (2022~)
5. mc_pos_category — POS 카테고리 매핑 (2026~)
6. mc_inbound — 입고 내역 (2012~)
7. mc_product_event_mostraw — 행사 등록 (2021~)
8. ims_order_mostraw — 발주 이력 (2025~)

자세히: ../phase1_inventory/tables_catalog.md

4.2 ClickHouse pos_analytics.sales¶

항목	수치
총 행 수 (raw)	51,114,317
MySQL 기준 정상 행 수	35,824,595
중복 행 (이슈)	15,289,722 (29.9%)
2026년 판매 행 수	50,361,604 (109개 마트)
2025년 판매 행 수	752,713 (2개 마트)
srl 중복 건수	15,777,067개 srl

주의: ClickHouse MergeTree 엔진 사용으로 중복 INSERT가 영구 보존됨. Phase 4 분석에서는 DISTINCT morder_srl 우회 쿼리 사용.

자세히: ../phase1_inventory/clickhouse_inventory.md

4.3 POS 4종 커버리지¶

POS	마트 수	점유율	DISTINCT 판매건 (2026~)	평균 단가
TGR (투게더포스)	92	76.7%	30,961,603	5,709원
AEND (에이앤드포스)	10	8.3%	1,618,625	6,578원
HYP (하이포스)	6	5.0%	1,057,075	6,254원
STP	2	1.7%	435,201	4,355원
UNKNOWN	5	—	512,033	5,615원

TGR이 마트 수 기준 88% (92/104 카테고리 등록 마트), Phase 4 코호트 선정 기준.

자세히: ../phase1_inventory/data_quality.md

4.4 카테고리 표준 매핑¶

단계	매핑률	기준
Phase 1 추정	64%	ClickHouse 원시 카테고리 샘플
Phase 2 보정	56.7%	reject 기준 재평가
Phase 4 실측 (TGR 톱10)	89.87%	표준 14개 → 73개 원시 매핑

표준 14개 카테고리 (16 분류 중 유효 14개): 농산물, 수산물, 축산물, 정육, 냉동식품, 가공식품, 음료, 과자/스낵, 유제품, 세제/생활용품, 주방용품, 위생용품, 기타식품, 비식품류

자세히: ../phase1_inventory/category_normalization.md

5. 인사이트 가설 카드¶

상세: ../phase2_cards/

5.1 25 카드 개요¶

Phase 2에서 25장의 인사이트 가설 카드를 작성하였으며, 모두 Level 3 (정량 검증 준비 완료) 기준을 통과하였다.

항목	수치
총 카드 수	25
Level 3 통과	25 (100%)
Reject	0
신규 발굴	10장
cribot-admin 기존 승급	15장

5.2 도메인 분포¶

도메인	카드 수	주요 카드
상품	5	INS-008, 009, 010, 018, 024
거래처	4	INS-001, 013, 019, 023
마트	4	INS-006, 007, 016, 020
품질	3	INS-014, 015, 022
고객	2	INS-011, 017
시간	2	INS-004, 012
행사	2	INS-002, 003
지역	1	INS-005
카테고리	1	INS-021
가격	1	INS-025

5.3 Reject 기준 4건 (25/25 통과)¶

기준	설명
R1. 데이터 부재	분석에 필요한 테이블/컬럼이 없는 경우
R2. PII 노출	개인식별정보 230 컬럼 포함 → out-of-scope
R3. 시계열 부족	1개월 미만 데이터로 측정 불가
R4. 중복 가설	이미 존재하는 카드와 동일한 내용

5.4 대표 카드 (Phase 4 검증 선정 이유)¶

INS-001 거래처×마트×상품 공급망 통합 (도메인: 거래처, 신뢰도: high)
- 가설: 거래처별 납품 상품의 점포 단위 판매 현황을 입고 데이터와 JOIN하여 공급망 가시성 제공
- Phase 3 선정: A 타겟(거래처) V=5 × F=5 = 25 (최고점)

INS-021 표준 카테고리 매크로 트렌드 (도메인: 카테고리, 신뢰도: medium)
- 가설: 원시 73개 POS 카테고리 → 표준 16개로 매핑하여 매크로 트렌드 분석
- Phase 3 선정: D 타겟(정부/시장조사) 핵심 카드

자세히: ../phase2_cards/_index.md

6. 타겟 매핑 매트릭스¶

상세: ../phase3_matrix/

6.1 6 타겟군 정의¶

ID	타겟	정의
A	거래처 영업	cribot-admin 기존 납품업체, 자사 SKU 판매 현황 추적
B	FMCG 제조사	카테고리 매니저, 독립 마트 채널 침투율·행사 ROI 측정
C	마트 운영자	cribot-admin 기존 마트, 행사 운영·매출 알람
D	정부/시장조사	통계청·시장조사기관, 독립 마트 매크로 트렌드
E	학계·연구	식품유통 연구, SKU 단위 실증 패널 데이터
F	KDX 바우처	인바운드 데이터바우처 구매 수요

6.2 매트릭스 150 셀 요약¶

25 카드 × 6 타겟 = 150 셀을 가치(V, 1-5) × 실현성(F, 1-5)으로 평가.

타겟별 평균 V×F 점수:

타겟	평균 V×F	Phase 3 순위
C. 마트 운영자	15.3	1위
A. 거래처 영업	13.2	2위
B. FMCG 제조사	11.1	3위
D. 정부/시장조사	~8.5	4위
E. 학계·연구	~8.0	5위
F. KDX 바우처	~6.0	6위

6.3 Top 8 선정 (Phase 4 검증 대상)¶

Phase 3 매트릭스에서 상위 점수 + 사용자 선택으로 8장 선정:

카드	1차 선정 이유
INS-001	A 타겟 최고점 V×F=25, 공급망 차별화 핵심
INS-002	C 타겟 핵심, 행사 운영 진단
INS-003	B+A 타겟, 행사 ROI 정량화
INS-004	시간 해상도 차별화 영역 1.1 검증
INS-013	A 타겟, 점유율 알림 시스템
INS-019	A 타겟, 영업 카드 자동화
INS-020	C 타겟, 매출 알람
INS-021	D+B 타겟, 카테고리 매핑 즉시 출시

자세히: ../phase3_matrix/top_picks.md

7. 정량 검증 결과¶

상세: ../phase4_validation/

7.1 코호트 정의¶

항목	값
POS	TGR (투게더포스)
마트	톱10 (M001~M010), 규모 기준 선정
기간	2026-01-01 ~ 2026-05-13 (약 5개월)
총 매출	693.7억원
분석 도구	Python (sales_query.py), ClickHouse DISTINCT 우회

7.2 가설 vs 실측 결과표¶

카드	Phase 2 가설	Phase 4 실측	평가
INS-021	매핑률 64%	89.87% (+25.9pp)	즉시 출시 수준
INS-002	매칭률 35%	49.79% (+14.8pp)	우수
INS-003	lift +50~150%	중앙값 +77.3%	입증
INS-001	회전율 +30%	24.6일, 부진 SKU 10.7%	영업 액션 도출
INS-013	-10%p 탐지	440쌍 → 1건	임계값 실효
INS-020	대응 시간 단축	14건/347쌍, 월 0.8회	적정성 입증
INS-019	준비 50% 단축	5 메트릭 자동화	시연 완료
INS-004	+5~15% lift	-1.1% (자정 이슈)	재정의 필요

종합: 8 카드 중 7장 가설 입증 또는 대폭 상회. INS-004는 측정 실패가 아닌 데이터 파이프라인 설계 이슈 발견.

7.3 카드별 상세 결과¶

INS-021 — 표준 카테고리 매크로 트렌드¶

원시 73개 POS 카테고리를 표준 14개로 매핑한 결과 89.87% 매핑률 달성 (Phase 2 추정 64% 대비 +25.9pp). 5개월 693.7억원 규모 거래 분석.

INS-021_01_category_distribution

INS-021_02_monthly_trend

INS-021_03_growth_top3

항목	수치
원시 카테고리 수	73개
표준 매핑 카테고리	14개
표준 매핑률	89.87%
기타 비율	1.69%
미분류 비율	7.49%
분석제외 비율	0.95%

→ 정부/시장조사(D 타겟)·학계(E 타겟) 매크로 트렌드 리포트 즉시 출시 가능 수준

자세히: ../phase4_validation/INS-021/report.md

INS-002 — 행사 운영 진단¶

전체 행사 99,424건 중 49,508건 매칭 (49.79%). 미매칭 87.5%가 "입고있으나 판매없음" — 진열·가격 운영 문제 가능성.

INS-002_01_mart_matching_rate

INS-002_02_unmatched_reasons

INS-002_03_matching_over_time

항목	수치
전체 행사 수	99,424건
매칭된 행사	49,508건
매칭률	49.79%
마트별 최저	43.2% (M008)
마트별 최고	69.1% (M003)
미매칭 중 "입고있으나 판매없음"	28,948건 (87.5%)
미매칭 중 "입고 없음"	4,122건 (12.5%)

→ 마트 운영자(C 타겟)에 즉시 가치 — 행사 효율 진단 카드로 영업 가능

자세히: ../phase4_validation/INS-002/report.md

INS-003 — 행사 ROI lift 측정¶

측정 가능 행사 2,429건 (전체 92,888건의 2.61%)에서 lift 중앙값 +77.3% 확인. 57.3%가 +50% 이상 lift.

INS-003_01_category_lift_distribution

INS-003_02_lift_top10_vs_bot10

INS-003_03_lift_distribution

항목	수치
전체 행사 수	92,888건
측정 가능 행사	2,429건 (2.61%)
lift 평균	+453.4% (이상치 영향)
lift 중앙값	+77.3%
+50% 이상	57.3%
+150% 이상	35.3%
음수 lift	24.1%

→ B2B FMCG 제조사(B 타겟) + 거래처(A 타겟) 행사 기획 ROI 근거 제공. 측정 가능 비율(2.61%)은 2025년 데이터 보유 마트 포함 시 대폭 개선 가능.

자세히: ../phase4_validation/INS-003/report.md

INS-001 — 거래처×마트×상품 공급망 통합¶

입고 656,072행 + 판매 6,403,711행 매칭으로 64,580쌍의 회전율 산출. 평균 24.6일, 60일+ 부진 SKU 10.7% (684개 거래처 중 401개 분석).

INS-001_01_supplier_rotation_dist

INS-001_02_supplier_mart_heatmap

INS-001_03_dead_skus_by_supplier

부진 거래처 톱5 (60일+ SKU 수 기준):
1. (주)강서잡화: 277건
2. (주)한국연(가공_중복): 273건
3. 마트1]한국연: 251건
4. 마트1]대상(청정원): 191건
5. 씨제이대한통운(주): 186건

→ A 타겟 즉시 영업 대상 선별 — 부진 SKU 60일+ 거래처 5곳이 첫 고객 후보

자세히: ../phase4_validation/INS-001/report.md

INS-013 — 거래처 점유율 변동 대응¶

440 거래처×마트 쌍 분석 결과 -10%p 초과 하락 단 1건 (-17.1%p, 마트8 야채부1). +10%p 초과 상승 8건.

INS-013_01_supplier_share_top10

INS-013_02_share_change_distribution

INS-013_03_top_losers_winners

→ 440쌍 수작업 모니터링을 1건으로 압축 — A 타겟 영업 생산성 440배 향상

자세히: ../phase4_validation/INS-013/report.md

INS-019 — 거래처 인사이트 영업 카드 자동화¶

정육거래처 대상 4분면 카드(매출×회전 기준 자동 분류) + 5 메트릭 자동 생성 시연 완료.

INS-019_01_supplier_kpi_card

INS-019_02_supplier_monthly_trend

INS-019_03_actionable_alerts

자동화 메트릭 5종: 마트별 판매 TOP5 / SKU TOP5 (판매량·성장률) / 성장률 트렌드 (이상 탐지) / 점유율 변화 알림 (INS-013 연동) / 마트별 성장률 알림 (-20% 자동)

자세히: ../phase4_validation/INS-019/report.md

INS-020 — 오늘 매출 알람·대응¶

-20% 임계값으로 347쌍 분석 → 14건 알람 (4.0%). 마트당 월 평균 0.8회 (≈ 2.0건/마트/3개월).

INS-020_01_daily_vs_lastweek

INS-020_02_alert_frequency

INS-020_03_alert_simulation

항목	수치
비교 쌍	347쌍
-20% 알람	14건 (4.0%)
마트당 월 평균	0.8회
최대 하락	-42.9%
최대 상승	+133.4%

→ C 타겟 마트 운영자 매출 이상 조기 탐지 가치 확인

자세히: ../phase4_validation/INS-020/report.md

INS-004 — 분 단위 매출 변동 추적¶

행사 직후 60분 lift -1.1%. 데이터 파이프라인 이슈 발견: 행사 start_date 자정 기준 설정 + 새벽 1시 POS 배치 매출 집중.

INS-004_01_hourly_pattern

INS-004_02_event_study

INS-004_03_minute_variance

항목	수치
피크 시간	새벽 1시 (2.0억/시간)
최저 시간	오전 9시 (0원)
행사 후 60분 lift	-1.1% ⚠️

→ 측정 실패가 아닌 데이터 파이프라인 설계 이슈 — 운영팀 보고 + 측정 방식 재정의 필요

자세히: ../phase4_validation/INS-004/report.md

8. 타겟 평가 + Top 3 추천¶

상세: ../phase5_evaluation/

8.1 4축 평가 체계¶

축	의미	1점	5점
M (Market Size)	잠재 시장 규모	<100 고객	>10K 고객
W (Willingness to Pay)	지불 의향	<100만원/년	>2억원/년
E (Entry Ease)	진입 용이성	2년+	<1개월
D (Data Readiness)	데이터 충족도	추가 수집 필요	즉시 출시

8.2 6 타겟 평가 점수표¶

순위	타겟	M	W	E	D	합계	Phase 3 V×F avg	Phase 4 갱신
1	A. 거래처 영업	3	3	5	4	15	13.2	INS-001+013+019 입증
2	B. FMCG 제조사	3	5	2	4	14	11.1	INS-003+021 입증
2	C. 마트 운영자	2	2	5	5	14	15.3	INS-002+020 입증
4	D. 정부/시장조사	2	4	2	5	13	8.5	INS-021 89.87%
5	F. KDX 바우처	3	2	4	3	12	6.0	간접 적합
6	E. 학계·연구	2	2	3	4	11	8.0	INS-021 강력

8.3 Phase 3 → Phase 5 순위 변화¶

타겟	Phase 3 순위	Phase 5 순위	변동	핵심 이유
A. 거래처 영업	2위 (V×F 13.2)	1위 (15)	▲ 1	Phase 4 E=5+D=4 강점 확인
B. FMCG 제조사	3위 (11.1)	2위 (14)	▲ 1	INS-003+021 실측으로 D=4 상향
C. 마트 운영자	1위 (15.3)	2위 (14)	▼ 1	W=2 낮은 단가로 B와 동점
D. 정부/시장조사	4위 (~8.5)	4위 (13)	↔	D=5로 대폭 상향 but E=2 제약

자세히: ../phase5_evaluation/target_evaluation_matrix.md

9. 영업 전략¶

상세: ../phase5_evaluation/top3_recommendations.md

9.1 Top 1 — A. 거래처 영업 (15점)¶

진입 채널: cribot-admin 기존 거래처 upsell (67K 거래처 중 영업 활성 5K-10K 우선)

영업 사이클: 1-3개월

첫 타겟 고객: 부진 SKU 60일+ 상위 거래처
- (주)강서잡화 (277건), 오뚜기 관련 (273+251건), 대상청정원 (191건), CJ (186건)

핵심 메시지: "자사 SKU 회전율 자동 추적 + 점유율 변동 알림 (440→1건 압축) + 영업 회의 자동 카드 = 매출 +8-12%"

추정 ARR: 거래처당 연 500-3,000만원 × 100-500 거래처 = 5억-150억 (5년)

Phase 4 검증 근거: INS-001 (회전 24.6일), INS-013 (440쌍→1알람), INS-019 (5 메트릭 자동화)

위험 요소:
- cribot-admin 거래처 채널 활성화 여부 확인 필요
- 마트 vs 거래처 양쪽 → 거래 비밀 노출 우려
- 점유율 데이터 공유 시 마트 본사 동의 필요 가능

9.2 Top 2 — B. FMCG 제조사 (14점)¶

진입 채널: 직접 영업 (외부 신규 고객 — 가장 어려운 채널)

영업 사이클: 6-12개월

첫 타겟 고객: 한국 톱20 FMCG (CJ제일제당, 농심, 롯데웰푸드, 오뚜기, 동원, 매일유업 등)

핵심 메시지: "한국 독립 마트 채널 + 점포×일 lift 측정 = NIQ 주 단위 한계 보완. lift 중앙값 +77.3% 입증. 독립 마트 88개 마트 커버"

추정 ARR: 1개당 연 5천만-3억원 × 5-15 고객 = 2.5억-45억 (3년)

Phase 4 검증 근거: INS-003 (lift +77.3%), INS-021 (89.87%), INS-024 (신상품 침투)

위험 요소:
- NIQ/Circana 기존 계약 경합
- 의사결정 사이클 6-12개월
- 마트 표본 작음 (TGR 톱10 → 전체 92개 확장 필요)
- 영업 인력 필요

9.3 Top 3 — C. 마트 운영자 (14점)¶

진입 채널: cribot-admin upsell (기존 마트 120개)

영업 사이클: <1개월 (UI 추가)

첫 타겟 고객: TGR 톱10 마트 (M001~M010) — Phase 4 코호트와 동일

핵심 메시지: "행사 매칭 49.79% 진단 + 매출 알람 -20% (월 0.8회) + 마트 진단 자동화 = 운영 효율 +5-10%"

추정 ARR: 마트당 월 10-50만원 → 연 120-600만원 × 50-100 마트 = 0.6억-6억

Phase 4 검증 근거: INS-002 (매칭 49.79%), INS-020 (-20% 알람 4%), INS-006/007

위험 요소:
- 점주 데이터 활용 역량 → UI 단순화 필요
- 단가 작음 (Top 3 중 가장 작음)
- cribot-admin 통합 vs 별도 모듈 결정 필요

9.4 별도 트랙 — D. 정부/시장조사 (13점)¶

진입 채널: KDX 데이터바우처 + 공공 입찰 + 직접 영업

영업 사이클: 1-2년

첫 타겟: 한국갤럽, 마크로밀엠브레인 → 통계청

핵심 메시지: "한국 독립 마트 채널 매크로 트렌드 — 표준 16개 매핑률 89.87%, 정부 통계 보완 자료로 즉시 출시 가능"

추정 ARR: 1개당 연 5천만-2억원 × 3-5 기관 = 1.5억-10억

가치: 브랜드 효과 큼 (정부 채택 시 cribot 신뢰도 상승), INS-021 즉시 출시 가능

9.5 통합 ARR 추정 (트랙별 도달 시점)¶

트랙	보수적 ARR	적극적 ARR	도달 시점
A 거래처	5억	150억	5년
B 제조사	2.5억	45억	3년
C 마트	0.6억	6억	5년 (가정)
D 정부/시장조사	1.5억	10억	5년 (가정)
합계	9.6억	211억	-

주: ARR(Annual Recurring Revenue)은 정의상 연간 매출입니다. 본 표 수치는 각 트랙이 영업 사이클을 거쳐 도달 가능한 연간 매출의 상하한이며, 5년 누적 매출이 아닙니다. 도달 시점은 각 트랙 9.1~9.4 본문 명시 기준이며, C/D는 본문 미명시로 5년을 가정합니다. 1년차 실제 합계는 약 1~15억 수준으로 추정됩니다 (영업 사이클 + 점진적 고객 확보 반영).

10. 한계 및 가정¶

상세: ../appendix/data_quality_summary.md

본 보고서는 기술 검증 + 추정 보고서이며, 시장 검증은 아직 수행되지 않았다. 본 섹션은 데이터 품질 한계(10.1-10.3), 시장 검증의 한계(10.4), ARR 추정의 가정(10.5), 그리고 이를 입증하기 위한 PoC 필요성과 Go/No-Go 기준(10.6)을 명시한다. 본 보고서를 영업 입찰 자료, 투자 결정의 단독 근거로 사용하는 것은 권장되지 않는다.

Phase 1~4에 걸쳐 6건의 데이터 품질 이슈를 발견하였다.

10.1 이슈 목록¶

#	발견 단계	이슈	영향	카드
1	Phase 1	ClickHouse 중복 INSERT 29.9% (15.3M 행)	집계 정확도 저하	전체
2	Phase 4 INS-003	mc_product_event_mostraw 중복행	lift 이상값 (+453% 평균)	INS-002, 003
3	Phase 4 INS-004	행사 start_date 자정 기준 설정	실제 행사 시작 불일치, INS-004 측정 불가	INS-004
4	Phase 4 INS-001	거래처명 비정규화 (오뚜기 2개 항목 등)	동일 거래처 중복 집계	INS-001, 013
5	Phase 4 INS-004	새벽 1시 매출 집중 (POS 배치 결산 의심)	시간대 분석 전체 왜곡	INS-004, 012
6	Phase 4 (쿼리)	ClickHouse 청크 EOF 오류 (간헐적)	대용량 쿼리 실패	전체

10.2 우선순위 로드맵¶

즉시 (0-1개월):
- #3 행사 start_date → start_time 컬럼 추가 또는 영업 기준 재정의
- #6 ClickHouse EOF → 쿼리 배치 크기 조정 + 재시도 로직

단기 (1-3개월):
- #1 ClickHouse 중복 → ReplacingMergeTree 마이그레이션 검토
- #2 mc_product_event_mostraw → 중복 행 정리 스크립트

중기 (3-6개월):
- #4 거래처명 정규화 → 표준화 작업 + 매핑 테이블 구축
- #5 새벽 1시 패턴 → POS 전송 타임스탬프 감사 + 일 마감 기준 재확인

10.3 영향 범위 요약¶

현재 분석에서 #1(ClickHouse 중복)은 DISTINCT morder_srl 우회로 해결. #3(자정 기준)은 INS-004 재정의로 해결 가능. 나머지 이슈는 분석 해석에 주의 필요하나 Phase 4 핵심 결과(INS-021, INS-002, INS-003, INS-001)에는 영향 제한적.

10.4 시장 검증의 한계¶

항목	상태	비고
데이터에서 인사이트 추출 가능?	✓ 입증	Phase 4 8 카드 중 7개
인사이트의 기술적 정확도?	✓ 입증	매핑 89.87%, lift +77.3% 등
고객이 살 의향?	✗ 미검증	PoC 0건, 고객 인터뷰 0건
단가 수용성?	✗ 미검증	시범 판매 0건
영업 사이클 실제 길이?	✗ 미검증	9.1-9.4의 1-12개월은 추정만
마트 데이터 외부 공유 동의?	✗ 미검증	마트와 계약서 재협상 필요. 동의 없으면 A/B 트랙 진행 불가
거래처가 cribot-admin 현재 사용 중?	△ 미확인	"9.1 cribot-admin 67K 거래처 upsell" 전제. 활성 사용자 모수 미측정

Phase 4가 "데이터에서 X를 측정할 수 있다"를 증명했을 뿐, "고객 Y가 X에 돈을 낼 것이다"는 증명한 적이 없다. 본 보고서는 "가능성 보고서"이지 "시장 검증 보고서"가 아니다.

10.5 ARR 추정의 가정¶

9.5 표의 ARR 추정은 다음 가정의 곱셈이다. 가정이 깨지면 추정도 깨진다.

트랙	핵심 가정	가정의 약점
A 적극 150억	5년 후 500 거래처 × 연 3,000만원	한국 중소 거래처가 SaaS BI 도구에 연 3,000만원 지불 사례 매우 드뭄. HubSpot/Salesforce 한국 중소 가입자 평균 연 100-500만원
B 적극 45억	3년 후 5-15 FMCG × 연 3억	NIQ 표준 + 보완재 위치에서 연 3억 단가 어려움. NIQ Retail Measurement 일반 단가의 50-80% 수준이 현실적
C 적극 6억	5년 후 50-100 마트 × 월 50만원	한국 독립 마트 점주의 BI 도구 지불 의향 + 데이터 리터러시 모두 미검증. 점주 PC 사용 빈도조차 미측정
D 적극 10억	5년 후 3-5 기관 × 연 2억	KDX 데이터바우처 평균 1-3천만원, 연 2억은 상위 사례. 공공 입찰은 대기업 컨소시엄 주도로 작은 회사 단독 수주 어려움

현실적 시나리오별 ARR 추정:

시나리오	5년차 ARR	확률 추정
Best path (적극)	211억	20-30%
Mid path	50-80억	30-40%
Conservative (보수)	9.6억	30-40%
Down path (대부분 트랙 폐기)	1-3억	10-20%

1년차 보수 추정 (영업 사이클 + 점진적 고객 확보 반영):
- A: 0-1억 (거래처 5-20개 진입)
- B: 0억 (영업 사이클 6-12개월로 첫 계약 미확정)
- C: 0-0.5억 (마트 5-10개)
- D: 0.5-2억 (1-2 기관)
- 1년차 합계: 0.5-3.5억 (9.5 표의 보수 9.6억 × 5-35%)

10.6 PoC 필요성 + Go/No-Go 기준¶

본 보고서의 가정을 입증하기 위해 다음 PoC가 필요하다. 시스템 구축 신규 프로젝트 착수 전 PoC 결과 반영을 권장.

PoC 1: A 거래처 트랙 (4-8주)
- 1 거래처 무료 제공 (INS-001 회전율 + INS-013 알람 + INS-019 5메트릭 카드)
- 검증: 거래처가 영업 회의에 카드를 활용하는가? 단가 30/50/100만원 중 얼마면 지불 의사 있는가?
- Go 기준: 1 거래처 유료 전환 시 5 거래처 확장 시도
- No-Go 기준: 1 거래처도 유료 전환 안 됨 → A 트랙 단가 재산정 또는 폐기

PoC 2: C 마트 트랙 (4-8주)
- 1 마트 무료 제공 (INS-002 행사 매칭 + INS-020 매출 알람 + INS-006 카테고리 진단)
- 검증: 점주가 주간 1회 이상 사용하는가? 매출/운영 개선 사례 발생? 월 10/30/50만원 지불 의향?
- Go 기준: 1 마트 유료 전환 시 10 마트 확장 시도
- No-Go 기준: 점주 사용 빈도 주 1회 미만 또는 0 마트 유료 전환 → C 트랙 폐기

PoC 3: B FMCG 콜드 미팅 시도 (8-12주)
- 톱20 FMCG에 콜드 미팅 요청 + Phase 4 INS-003 데모 리포트 1건 무료 제공
- 검증: 미팅 응답률, "관심 있다" 응답 수, NIQ 외 추가 지출 의향
- Go 기준: 5곳 시도 중 2곳 이상 미팅 응답 + 1곳 이상 PoC 계약
- No-Go 기준: 5곳 시도 중 0곳 미팅 응답 → B 트랙 폐기

PoC 비용: 인력 1-2명 × 2-3개월 + 무료 제공 운영비. 시스템 구축(별도 프로젝트 5-10명 × 3-6개월) 대비 약 1/10 비용.

의사결정 흐름:

PoC 3건 (2-3개월)
   ↓
PoC 결과
   ├─ 유료 전환 1건 이상 → 시스템 구축 신규 프로젝트 본격화
   │                       (검증된 트랙부터 우선 진입)
   └─ 유료 전환 0건 → 트랙별 No-Go 평가
                      ├─ 인사이트 재정의 + 단가 재산정 + 추가 PoC
                      └─ 사업 모델 피벗 (컨설팅 모델 등)

11. 다음 단계¶

의사결정 권고 — 최종 결정은 사용자(cribot 경영진) 소관

11.1 즉시 실행 (0-3개월, 사용자 결정 필요)¶

#	액션	타겟	필요 자원
1	A 거래처 영업 시작	부진 SKU 톱5 거래처	영업 담당자 + cribot-admin 채널
2	C 마트 upsell — 행사 진단 + 알람 UI	마트 120개 (TGR 톱10 우선)	개발자 1명, 1-2주
3	D 즉시 출시 — INS-021 리포트	KDX 등록 + 공공 입찰	KDX 법인 등록 절차

11.2 중기 파이프라인 (3-6개월)¶

#	액션	타겟	필요 자원
4	B FMCG 영업 채널 활성화	한국 톱20 FMCG	영업 인력 확보
5	KDX 등록 완료	F 인바운드 수요	법무·사업 부서
6	INS-004 측정 방식 재정의	행사 즉시 반응	개발팀 (start_time 컬럼)

11.3 다음 별도 프로젝트 (Out of Scope — 새 프로젝트로)¶

실제 서비스 아키텍처: 데이터 상품 API 설계·구현
가격책정·영업 계약: B2B 계약서, 가격 모델 확정
ML 예측 모델: 수요 예측, 재고 최적화 모델
INS-003 코호트 조정: 2025 데이터 보유 마트 포함 (baseline 2.61% → 개선)

11.4 데이터 품질 후속 조치¶

ClickHouse 중복 INSERT 문제 → 운영팀 chsync 점검 요청
행사 데이터 중복 → 정기 정리 스크립트 자동화
거래처명 정규화 → 마스터 데이터 정리 프로젝트

결론¶

Cribot Insight Phase 0-5 분석을 통해 다음을 확인하였다:

차별화 실재: NIQ·Circana가 구조적으로 재현 불가한 5개 영역 확인. 특히 독립 마트 SKU 원천 데이터는 한국 데이터 시장 전체에서 Cribot이 유일한 공급자.
가설 입증: 25개 인사이트 가설 중 Phase 4 검증 8건 → 7건 입증. INS-021 89.87% (추정 대비 +25.9pp), INS-002 49.79% (+14.8pp), INS-003 lift +77.3%.
명확한 타겟: A 거래처 (15점, 즉시 upsell) > B FMCG (14점, 6-12개월) = C 마트 (14점, 즉시 upsell) 순서로 추천. D 정부는 별도 트랙으로 INS-021 즉시 출시 가능.
경제성: 도달 ARR(3-5년차) 보수 9.6억 / 적극 211억 — cribot-admin 기존 채널(A+C) 활용 시 3개월 내 첫 매출 가능.

최종 권고: A 거래처 + C 마트 즉시 upsell 시작, 동시에 D 정부 트랙용 INS-021 리포트 KDX 등록 진행. B FMCG는 영업 인력 확보 후 본격화.

Cribot Insight Phase 6 최종 보고서 — 2026-05-14
산출물 전체 인덱스: appendix/artifact_index.md