본문으로 건너뛰기

#007 법고을·판례 DB 접근 실사

항목내용
회차7/10
개시일2026-04-20
TierA (기술·법적 복합, Phase 1 Pack 1 RAG 선행)
진행 상태✅ 완료 · 수렴 · ADR 0006 발행 (2026-04-20)
참여자 수5인 (Chair · P1 · P8 · P12 · P13 신규 · P7 원격)
예상 산출물판례 DB 접근 경로 결정 · 라이선스 예산 · 내재화 스펙 · 승소 판단 활용 원칙 · ADR 0006
선행 ADR0001~0005

Executive Summary (경영진 1분 독해)

  1. Phase 1 Pack 1 RAG 파이프라인 (ADR 0005 §1 블록 9·11)이 "공개 판례" 를 컨텍스트로 쓰려면 소스 확정 필요. 현재 ADR 0005 는 "국가법령정보 Open API + 법고을/엘박스 라이선스 병행" 언급만.
  2. 선택 3갈래: (A) 공공 접근 (법고을 공식 협약·국가법령정보 API) · (B) 민간 라이선스 (엘박스·로앤비) · (C) 혼합
  3. 승소 판단 전략 활용 은 Anti-Goal #2 "법률 조언 AI" 경계와 충돌 가능 — 기술 구현 이전에 허용 범위 먼저 확정.

§1. 참여자 (Participants)

기존 풀 재소환 (4인)

P1. 송무 변호사

  • 이번 회의 역할: 판례 인용 실무·승소 판단 현장·재판부별 관행. "어떤 판례 DB 가 변호사 실사용에 필수인지" 판정.
  • 관심사: (1) Mata v. Avianca 같은 인용 오류 방어 (2) 대법원·하급심 커버리지 (3) 엘박스 vs 로앤비 체감 차이.

P8. 리걸테크 도메인 전문가

  • 이번 회의 역할: 라이선스 협상 전략·민간 DB 비용 구조·저작권법·부정경쟁방지법 경계.
  • 관심사: (1) 공공누리 vs 민간 2차 저작물 구분 (2) 재배포·임베딩·벡터 저장권 조항 (3) 경쟁 리걸테크 라이선스 관행.

P12. AI 아키텍트

  • 이번 회의 역할: 내재화 기술 스펙 (Vector Search 인덱싱·임베딩·증분 업데이트·비용). ADR 0005 파이프라인 정합.
  • 관심사: (1) 판례 DB 임베딩 크기 (2) 증분 인덱싱 전략 (3) RAG 컨텍스트 조립 시 공공 vs 내부 기억 우선순위.

원격 자문 (1인)

P7. 보안/컴플라이언스 DPO

  • 이번 회의 역할: 판결문 재식별 리스크·개인정보 보호·변호사법 제26조 적용 범위 원격 자문.

신규 소환 (1인)

P13. 공공데이터·법원행정처 협력 전문가

  • 직업·소속: 공공데이터 컨설팅 812년. 법원행정처·법제처·개인정보위·KISA 자문 레퍼런스. 최근 35년 공공 API 협약·민관 데이터 파트너십 다수.
  • 경력: 공공누리 라이선스 분쟁 사례·대법원 오픈데이터 워킹그룹 참여·KISA 공공데이터 위원회 자문·행정심판 데이터 구축 프로젝트.
  • 전문 분야:
    • 공공 API 공식 협약 (MOU·이용 약관·재배포 조항)
    • 공공누리 1·2·3·4 유형 실무 해석
    • 크롤링의 법적 경계 (저작권법 제24조의2 데이터 마이닝 예외)
    • 대법원·법원도서관·법무부·국가법령정보센터 창구 담당자 네트워크
    • 민간 리걸테크 (엘박스·로앤비·인텔리콘) 라이선스 구조
  • 이번 회의 역할: 법고을 공식 벌크 접근 가능성 실사 + 민간 라이선스 협상 전략 + 공공누리 재배포 경계.
  • 성향: 실무·관계 기반. "협상 가능 범위" 와 "결재 라인" 언어로 판단.
  • 강점: 공공 DB 담당자 직접 컨택 경험. 민관 협력 선례 축적.
  • 맹점: AI·기술 디테일은 P12 에 위임. 순수 기술 내재화 설계에는 관여 낮음.
  • 이 안건의 관심사: (1) 법고을 벌크 API 공식 협약 가능성 (2) 민간 라이선스 계약 조항 (임베딩·벡터·재협상) (3) 공공-민간 혼합 전략.
  • 잠재적 편향: 공식 협약 선호 (민간 라이선스에 보수적). 정부 사업 연계 제안 경향.

Chair

의사결정·ADR 0006 서명 (Chair 부재 시 Claude 대리 중재).

이번 회의 불참여

  • P2·P3·P4·P5·P6·P9·P10·P11·P14·P15·P16·P17: 각자 전문 회의에서 등판.

§2. 회의 아젠다 (Agenda)

상위 안건

Phase 1 Pack 1 RAG 파이프라인의 "공개 판례 소스" 확정. ADR 0005 §1 블록 9 (컨텍스트 조립) · 블록 11 (실재성 검증) 의 판례·조문 데이터 공급처 결정.

전제 (ADR 0001~0005)

  • Firebase AI Logic (Gemini) → 소버린 AI 전환 대비 (대체 provider 금지)
  • Vector Search 단일 인덱스 + docType namespace 논리 분리 (publicCasetenantId=PUBLIC)
  • Anti-Goal #2 "법률 조언 AI ✗" — 판단·권유·대리 금지, 초안·요약·검색 OK
  • 비식별화 4단 + 재식별 스캐너 (판결문 자체 비실명본이어도 조합 재식별 리스크)
  • Citation Precision 0.95+ hard gate (Phase 0) → 실재성 3단 검증 (사건번호·조문·체크리스트)

논의할 4축

Q1. 공공 접근 경로 실사

  • 법고을 (법원도서관) 공식 벌크 API 제공 여부 (2026-04 현재)
  • 대법원 종합법률정보 (glaw.scourt.go.kr) 스크래핑 법적 경계
  • 국가법령정보센터 (law.go.kr) Open API 스펙·쿼터·법령/판례 커버리지
  • 공식 협약 가능성 (대법원·법원도서관 MOU·법원행정처 연계)
  • 공공누리 1~4 유형별 재배포·상업 이용·임베딩 벡터 저장권

Q2. 민간 라이선스 평가

  • 엘박스·로앤비·인텔리콘 월 라이선스 비용 (예상 월 300~800만원, P12 R1)
  • 계약 조항 체크:
    • 임베딩 벡터 생성·저장 허용 여부
    • 계약 해지 시 벡터 폐기 의무
    • 재협상 주기·가격 인상 방어
    • 사무소 tenant 간 격리 보장
  • 저작권법 제7조 (판결문 저작권 없음) · 2차 저작물 (편집·요지·키워드 민간 가공) 경계

Q3. 내재화 기술 스펙

  • 판례 규모: 대법원 3040만 건 · 하급심 비실명 공개분 150200만 건
  • Vector Search 인덱스 비용 (P12 R1: 월 $1,200~1,500)
  • 증분 인덱싱 (월 1회 · 법원 공개 주기 맞춤)
  • RAG 컨텍스트 조립 시 "내 사무소 기억" vs "공공 판례" 우선순위·뱃지 분리 (ADR 0005 §1 블록 9)
  • 소버린 AI 전환 시 재임베딩 비용 (100만 문서 $1,200, P12 R1)

Q4. 승소 판단 전략 활용 (Anti-Goal 경계)

  • 허용 범위:
    • 유사 판례 검색·요약 (정보 제공)
    • 쟁점 추출·참조조문 매칭
    • 과거 판례 승소율 통계 (객관 정보)
  • 금지 범위:
    • "이 사건 이길지 말지" AI 판단 (변호사법 제109조 저촉)
    • 의뢰인 직접 노출 (Anti-Goal #3)
    • 승소 확률 수치 제시 (AI 과장·법률 조언)
  • UX 경계: 변호사 검토 전 외부 송출 차단
  • 전략 보고서 (weight 3) 와 승소 판단의 구분

진행 계획

  • Tier A, 2~3회차
  • R1: 5인 병렬 발산
  • R2: (필요 시) 라이선스 협상 전략·Anti-Goal 경계 크로스 토크
  • R3: 수렴·ADR 0006 발행

예상 산출물

  • 판례 DB 접근 경로 결정 (공공/민간/혼합)
  • 민간 라이선스 예산·조항 체크리스트
  • 내재화 기술 스펙 (인덱스 크기·비용·증분 전략)
  • 승소 판단 활용 원칙 (허용/금지 매트릭스)
  • ADR 0006

§3. 회의 내용 (Proceedings)

§3.1 Round 1 — 독립 발산 (완료, 2026-04-20)

한 줄 요약 (5인)

역할핵심 입장
P1 변호사법고을 사용 분기 12회·대법원 포털 월 1020회·엘박스 개인 개업 70% de-facto 표준. 지불 한계 월 10만. 내재화 = Killer (별도 구독 불요). Pack 1 핵심 50~80건 · 500건이면 95% 커버 · 업데이트 월 1회. pin-cite + 해시 검증 배지 UX. 승소 확률 수치 강한 거부. 허용: 유사 판례 통계·쟁점·반대 주장. 금지: "승소 확률 65%"·"소송 하지 마세요". 기능명 strategyReport 유지·카피 "사건 전략 브리핑".
P8 도메인법고을 공식 벌크 미공개 확정. 크롤링 3중 리스크 (저작권·부정경쟁·업무방해) — Phase 0 금지. 공공누리 1유형 임베딩 허용·2유형 금지·3·4유형 회색. 연 라이선스: 엘박스 3,0006,000만·로앤비 5,000만1억+·인텔리콘 협상. 계약 조항 10개 체크: 임베딩 권리·해지 폐기·재협상·가격 인상 상한·tenant 격리·종속 분산. Pack 5개 총 3만 7천건. 공공+민간 혼합 전략. UX 치환: "승소 확률" → "유사 판례 승소 분포".
P12 AI 아키텍트규모별 월 비용: 3.5만 ~$280 · 15만 ~$1,050 · 100만 ~$3,500. 과잉 투자 경고: Phase 1 천장 15만, 50만+ Phase 2 로 미루기. RAG K 분배 사무소 3 + 공공 5 + 법령 2. 3-part 분리 임베딩 Phase 0 A/B (저장 3배 vs recall 20~30% ↑). 민간 라이선스 3조건 non-negotiable: 증분 API·벡터 생성권·해지 폐기 자동화. 승소 판단 코드 차단: predictWinProbability ESLint 금지·predictionMode: false 하드코딩.
P13 공공데이터 전문가 (신규)법고을 공식 벌크 미공개 재확인. 공식 협약 9~12개월·성공률 50% 이하. 로앤비·엘박스도 공식 MOU 아닌 기증·공공 수집 조합. 협약 필요 서류: ISMS-P·DPIA·재배포 금지 서약. 엘박스 시리즈 B 직후 = 협상 타이밍 양호. Chair 우선 실행 3: (1) 법원행정처 사법정보화실 공식 문의 즉시 발송 (2) 엘박스 임베딩 허용 부속 합의 4월 내 체결 (3) AI 전문 변호사 자문 500만~1천만.
P7 컴플라이언스 (원격)총평: ADR 0001~0005 균형 잡힘. Q1 재식별 + Q4 변호사법 보수 강화 필요. 공공 판례 k≥10 (법률 도메인). 민간 DB 계약 함정 5건: 위탁 vs 제3자 제공·재배포 해석·임베딩 권리·해지 파기·종속 분산. 변호사법 제109조 절대선 — "승소 확률 65%" 법정형 7년 이하. Phase 0 착수 전 법적 검토 5건 필수. AI 기본법 2026.1 시행 대응.

발언 핵심 정리 (전문 축약)

P1 변호사 — 10년 개인 사무소 실무
  • 법고을 분기 1~2회 (도서관 방문·IP 제약, 일상 도구 아님)
  • 대법원 종합법률정보 월 10~20회 (단건 조회만, 벡터 검색·다운로드 없음)
  • 국가법령정보 API — 법령 95점·판례 요지만 40점
  • 케이스노트 70점 (UX·Elasticsearch 쓸만·지속성 불안)
  • 엘박스 de-facto 표준 (월 58만원, 하급심 커버리지 압도적). 로앤비 1525만 (대형·기관), 인텔리콘 10~20만 (AI 선도)
  • 개인 사무소 월 10만 이하 지불 한계
  • 내재화 = "별도 구독 안 해도 됨" Killer. 단 엘박스 수준 하급심 커버리지 필수
  • Pack 1 대여금: leading case 5080 · 참조 300500 · 500이면 95% 커버
  • 업데이트 월 1회 충분 (전원합의체 즉시 푸시)
  • UX: 판결문 원클릭 오픈·pin-cite·해시 검증 배지·인용 복붙 각주
  • "승소 확률" 강한 거부 — 변호사법 109·31조 저촉·"왜 졌냐" 분쟁
  • 허용: 유사 판례 승소율 통계·쟁점·참조조문·반대 가능성 주장 (특히 유용)
  • 금지: 수치·권유·단정·의뢰인 노출
  • Mata v. Avianca 공포: 사건번호 hallucination·판지 왜곡·폐기 판례. 100% 검증 배지 필요
  • 기능명 strategyReport 유지 · 마케팅 카피 "사건 전략 브리핑" (간접 표현)
P8 도메인 — 라이선스·저작권·경쟁

법고을 공식 벌크 미공개 (2026-04). 법원행정처 "사법정보 개방 3차 계획 2024" 언급만·실제 X. 로앤비는 2000년대 초 한국법제연구원 협력·엘박스는 공공수집+기증+OCR — 신규 진입자 동일 경로 불가.

스크래핑 3중 리스크:

  • 저작권법 §7-3호: 판결문 자체 저작권 없음 ✅
  • 저작권법 §6 편집저작물: 요지·참조조문·키워드 편집저작권 발생
  • 부정경쟁방지법 §2-1(파)목: "상당한 투자·노력 성과" 2023 이후 판례 강화 ❌
  • 결론: Phase 0 전면 금지

공공누리 4유형 매트릭스:

  • 1유형 (출처): 상용 ✅·임베딩 허용 우세
  • 2유형 (상업 금지): 상용 SaaS ❌
  • 3·4유형 (변경 금지): 임베딩 = 변형 해석 시 ❌

국가법령정보 API: 1유형, B2B SaaS 사용 가능. 이용약관 §5 "대량 다운로드 후 재배포 금지" 주의 (우리는 재배포 X, 벡터 저장만 → 안전).

라이선스 계약 조항 체크 10개 (핵심 5):

  1. 임베딩 벡터 2차 저작권 귀속 (을 귀속 필수)
  2. 가격 인상 상한 (연 CPI +3% or 5% 이내)
  3. 재협상 주기 3년 (자동갱신 아닌)
  4. 경쟁사 차단 조항 없음 (과도 CAPEX)
  5. 데이터 최신성 SLA ("판결 확정 후 30일 이내 반영")
  6. tenant 격리 면책 (책임 을 부담)
  7. API 다운타임 배상 (월 99.5% 미만 50% 감액)
  8. 재배포 범위 (원문 ✗, 요약·메타 ✅)
  9. 분쟁 관할 서울중앙 (중재 ✗)
  10. 해지 시 벡터 폐기 자동화 (46억 float 리스크)

협상 전략:

  • 엘박스 시리즈 B 직후: 스타트업 할인 20~30% 요구 가능
  • 3사 교차 견적 → 엘박스 본계약 1년 단기 → 로앤비 견적 받아 2년차 재협상
  • 3년차 내재화 병행 → 의존도 50% 이하

Pack 별 판례 수 재추정 (2026):

  • Pack 1 대여금 5,500 · Pack 2 이혼 10,200 · Pack 3 부동산 7,900 · Pack 4 상속 6,200 · Pack 5 계약 7,300
  • 합계 약 37,000건 (민사 전반 10~15만, 민간 DB 200만은 98% 불필요)

해외 사례:

  • Westlaw CoCounsel: 연 수천 달러/변호사
  • LexisNexis+AI: 파운데이션 모델 자체 소유
  • Casetext → Thomson Reuters 2023 6.5억 달러 인수

UX 치환 규칙:

  • "승소 확률" → "유사 판례 승소 분포"
  • "AI 추천 전략" → "참고 판례 기반 초안"
  • "이길 가능성" → "쟁점별 인용률 통계"
P12 AI 아키텍트 — 기술 스펙

규모별 월 비용:

시나리오문서초기 임베딩저장Vector Search쿼리월 총
Pack 1 MVP3.5만$1003GB$100~150$130~$280
민사 전반15만$40012GB$400~500$520~$1,050
포괄100만$3,00080GB$2,000$1,300~$3,500

권고: Phase 1 천장 15만. 100만+ 은 Phase 2 소버린 전환 시점까지 연기.

증분 파이프라인 eng-day:

  • 대법원 월 1회: Cloud Scheduler → Cloud Run Job → embedding → Vector upsert (초기 6·운영 0.5/월)
  • 하급심 분기: Manual + 공개 알림 (초기 4·운영 1/분기)
  • 민간 증분 API (?since=timestamp): 필수 (초기 8·운영 0.5/월)
  • 최근 3년 × 1.5 가중치 rerank (2)
  • Phase 0 총 20 eng-day

RAG K 분배:

top-K 10:
docType=memory tenantId=myTid K=3 ("내 사무소 자료")
docType=publicCase tenantId=PUBLIC K=5 ("대법원 판례"/"하급심")
docType=statute tenantId=PUBLIC K=2 ("법령")

UI 뱃지 3종 분리 non-negotiable (hallucination 책임 전가 방지).

3-part 분리 임베딩: 요지·판결이유·주문 → 1 문서당 3 벡터. 저장 3배·recall 20~30% ↑ 기대. Phase 0 Pack 1 1,000건 A/B 로 검증.

민간 라이선스 3조건 non-negotiable:

  • 증분 API (전체 dump 비현실)
  • 벡터 생성권 명시
  • 계약 해지 시 벡터 폐기 자동화 (tenantId=PUBLIC_VENDOR_X namespace 일괄 삭제)

품질 리스크: 민간 증분 API 지연/누락 시 공공 fallback 자동 라우팅features.rag.publicVendorFallback 1-click 롤백.

승소 판단 코드 차단:

// 금지 (ESLint 룰)
function predictWinProbability(case): number // BANNED
function estimateWinChance(...): ... // BANNED
  • executeAiAction 래퍼 predictionMode: false 하드코딩
  • prompt 에 "확률 예측"·"이길 것" 단어 감지 시 500

허용 (결정론 집계, weight 0):

1. case metadata outcome: "won"|"lost"|"settled"|"unknown"
2. RAG top-10 유사 판례
3. 결정론 카운트
4. UI: "유사 판례 10건 중 원고 승소 8건 · 일부 승소 1건 · 패소 1건"
5. 원본 판례 링크 필수
P13 공공데이터 전문가 (신규)

법고을 공식 벌크 미공개 (2026-04 재확인). 검색 포털만 공개, 로그인·CAPTCHA·IP 제한. 공식 협약 경로:

  • 법원도서관 편찬과 → 조사심의관실
  • 법원행정처 사법정보화실 + 공보관실
  • 필요 서류: 사업계획서·보안 체계·이용 목적서·ISMS-P·DPIA·재배포 금지 서약
  • 9~12개월·성공률 50% 이하
  • 성사 시 조건: 비식별화·폐쇄망·연 감사·이용료 (공식 요율 없음, 연 수천만원 추정)

협약 실패 시 대안:

  • 대법원 종합법률정보 공개 판결 전문 8~15만 건 공식 수집
  • 민간 라이선스
  • 로스쿨 공동 연구 MOU (연 5천만~1억 + 논문 공저)

공공누리 유형: 법고을 판례 유형 미표기 (기본 비공개) — 확인 필요.

국가법령정보 DRF API:

  • 발급 12일, 일 쿼터 5천2만
  • 법령 99%+·판례 전문 2~5%
  • 공공누리 1유형 다수

민간 라이선스 협상:

  • 엘박스: 시리즈 B 후 = 협상 양호. 월 300~800만 (타협 500만 내외). 필수 부속 합의: 임베딩 허용·해지 폐기·재협상 24개월·SLA 99.5%+
  • 로앤비: Phase 2 재검토
  • 인텔리콘: B2C 채널 약, 표준 계약서 없어 지연
  • 교차 견적: 3사 동시 RFP → 엘박스 본계약 + 로앤비 보조

크롤링: 저작권법 §24의2 (정보분석 예외) 도 "통상 이용 저해 시" 제외 → Phase 0~2 전면 배제.

Chair 우선 실행 3 (이번 주 내):

  1. 법원행정처 사법정보화실 공식 문의 공문 발송 (9~12개월 시계, 당장 착수)
  2. 엘박스 스타터 "임베딩 허용 부속 합의" 포함 4월 내 체결
  3. AI·데이터 전문 변호사 자문 500만~1천만 (공공누리·부정경쟁·크롤링 3건 의견서)

가장 큰 리스크: "엘박스 계약서 임베딩·재배포 조항 덜 읽고 서명" → Phase 2 재구축 강제.

P7 컴플라이언스 (원격)

재식별 리스크 Q1 (법률 도메인 보수 강화):

  • 판결문 비실명 = 개인정보법 가명정보 수준 미보장
  • 사건번호+법원+선고일+금액+지명 조합 = 원사건 역검색 일상
  • RAG 결과가 특정 사건 복원 시 개보법 §18 + §28의5 재식별 금지 위반 → 법정형 5년 이하 or 5천만원 이하
  • 방어:
    • 전처리 (사건번호 해시·금액 로그 스케일·지명 시·도 광역·날짜 월)
    • k≥10 (공공 5 권고보다 보수)
    • 자동 스캐너 + 월 1% 샘플 수동 검토
    • 감사 로그 90일 (§39의14)

민간 라이선스 계약 함정 5:

  • 위탁 vs 제3자 제공 구분 (DPA 명시)
  • 재배포 금지 조항 해석 (검색 결과 "간접 재배포" 오해)
  • 임베딩 벡터 권리 (2차 저작물 해석 방어)
  • 해지 시 벡터 파기 증빙 (§21)
  • 종속 분산 (Phase 0 2개 제공자 병렬)

변호사법 제109조 절대선:

  • "법률사무 업으로 취급" = 유죄 (대법 2007도9321)
  • 수치 확률·권유·단정·의뢰인 직접 노출 → 저촉
  • 법정형 7년 이하 or 5천만원 이하

허용/금지 매트릭스:

허용금지
통계"유사 사례 10건 중 7건 원고 일부 승소""승소 확률 65%"
주장"원고측 쟁점 3가지 초안""이 사건은 어렵습니다"
반대"피고 반박 가능 주장 2가지""소송 포기 권유"
대상변호사만의뢰인 직접 노출

필수 구현 5:

  1. 고정 워터마크 "AI 초안·변호사 검토 필수·법적 판단 아님"
  2. DocSignGate 외부 송출 차단
  3. 수치 금지 린트 (\d+%·"확률"·"가능성" 정규식 차단)
  4. 포털 격리 (Server Action 필드 스트리핑)
  5. 감사 로그 3년 보존 (§109 형사책임 기간)

2026.3 예정 대한변협 "AI 법률서비스 가이드라인" — 초안 공개 즉시 검토 TF.

DPIA 3트랙 (Phase 1 말 18M):

  • Track A 내부 사무소 기억 (Tier 1, 예정)
  • Track B 공공 판례 내재화 (신규)
  • Track C 민간 라이선스 DB (신규)

Phase 0 착수 전 법적 검토 5건 (순서 고정):

  1. 공공누리 유형 확인 (법고을·대법원·법원행정처)
  2. 민간 DB 계약 외부 자문
  3. 변호사법 §109·AI 가이드라인 외부 자문 (승소 구현 경계 서면 의견서 — 면책 자료)
  4. 크롤링 금지 정책 문서화·엔지니어 교육
  5. 재식별 스캐너 공공 대응 강화 (k≥10 공공 한정)

놓친 리스크:

  • AI 기본법 2026.1 "고영향 AI" 지정 가능성
  • 개보법 2026 개정 자동화 결정 대응권 강화 (§37의2)

§3.2 Round 2 — 생략 (2026-04-20)

합의 22개·충돌 4개·대부분 자연 절충 → R2 생략, R3 자율 수렴.

§3.3 Round 3 — 수렴·결정 (완료, 2026-04-20)

ADR 0006 발행 근거 — 아래 §4 참조.


§4. 결과 (Outcomes)

§4.1 충돌 지점 (R1 → R3 자율 절충)

  • C1 재식별 k 값: ADR 0005 "k=5 기본·고위험 k=10 조건부" vs P7 "공공 판례 k≥10" → 공공 판례 한정 k≥10 추가 절충
  • C2 민간 라이선스 예상 비용: P8 연 3,0006,000만 · P13 월 300800만 (연 3,6009,600만) · P12 월 300800만 → 연 3,600~6,000만 레인지 합의
  • C3 판례 규모: P1 현장 50~500 · P8 37,000 · P12 Phase 0 3.5만 · Phase 1 15만 → Phase 0 Pack 1 3.5만 (rerank 상위 500 가중치) 절충
  • C4 승소 판단 깊이: 전원 "확률 수치 금지" 합의 · P7 3년 감사 로그 보수안 수용

§4.2 합의된 지점 (22개)

  • ✅ 법고을 공식 벌크 2026-04 미공개 (P8·P13 확인)
  • ✅ 크롤링 Phase 0~2 전면 배제 (3중 법적 리스크)
  • ✅ 공공누리 1유형 상용 임베딩 허용 · 3·4유형 회색·Phase 0 제외
  • ✅ 국가법령정보 DRF API 즉시 발급 (법령 99%·판례 요지 2~5%)
  • 엘박스 Phase 0 스타터 (월 300~500만) + 임베딩 허용 부속 합의
  • 법고을 공식 협약 즉시 문의 (9~12개월·성공률 50% 이하·병행)
  • 3사 교차 견적 전략 (엘박스 1년 단기 → 2년차 재협상)
  • ✅ 민간 계약 조항 체크리스트 10개
  • ✅ 해지 시 벡터 폐기 자동화 (tenantId=PUBLIC_VENDOR_X 네임스페이스 일괄)
  • ✅ 증분 API 필수 (전체 dump 비현실) + 공공 fallback 자동 라우팅
  • ✅ Pack 1 Phase 0 3만 5천건 (rerank 상위 500 가중치)
  • ✅ Phase 1 천장 15만 (50만+ 은 Phase 2+)
  • ✅ RAG K 분배: 사무소 3 + 공공 판례 5 + 법령 2
  • ✅ UI 뱃지 3종 분리 (내 사무소·대법원/하급심·법령)
  • ✅ 3-part 분리 임베딩 Phase 0 Pack 1 1,000건 A/B (recall 20%+ 시 본격)
  • ✅ 승소 판단: 통계·쟁점·반대 허용·수치·권유·단정·의뢰인 노출 금지
  • ✅ UX 치환 ("승소 확률" → "유사 판례 승소 분포")
  • ✅ 코드 레벨 차단 (predictWinProbability ESLint·predictionMode: false 하드코딩·수치 정규식 린트)
  • ✅ 의뢰인 포털 승소 필드 스트리핑 (Server Action)
  • ✅ 기능명 strategyReport 유지 + 카피 "사건 전략 브리핑"
  • ✅ 감사 로그 3년 보존 (§109 형사책임 기간)
  • Phase 0 착수 전 법적 검토 5건 필수 (공공누리·민간 계약·변호사법·크롤링·재식별)

§4.3 최종 결정 (R3 수렴, 2026-04-20)

ADR 0006 발행 (상세는 문서 링크 참조):

  1. 판례 DB 접근 경로: 공공(국가법령정보·대법원 종합법률정보 공개 판결 전문) + 민간(엘박스 Phase 0 → 본계약 Phase 1) + 법고을 공식 협약 병행 시도
  2. Phase 0 착수 전 법적 검토 5건 필수 (P7 제안 수용)
  3. 승소 판단 구현 규칙 (허용/금지 매트릭스·코드 차단·UX 치환)
  4. 판례 규모 Phase 별: Phase 0 3.5만 · Phase 1 15만 · Phase 2 50만~100만 검토
  5. 재식별 방어 강화: ADR 0005 k=5 기본 유지 + 공공 판례 한정 k≥10 추가
  6. RAG 컨텍스트 K 분배·UI 뱃지 3종
  7. 3-part 분리 임베딩 Phase 0 A/B → Phase 1 본격 조건
  8. 증분 인덱싱 파이프라인 (Cloud Scheduler·Cloud Run)
  9. Chair 우선 실행 3 (법원행정처 공문·엘박스 부속 합의·변호사 자문 500만~1천만)
  10. Phase 1 말 DPIA 3트랙 (내부·공공·민간)

§4.4 ADR 0006 발행

ADR 0006 Accepted — 2026-04-20. 판례 DB 접근·승소 판단 구현 통합.

§4.5 Minority Report

  • P7 "공공 판례 k≥10 전면 적용" — 현재 고위험 문서 한정으로 완화 수용. Phase 2 DPIA 시 재평가.
  • P13 "법원행정처 공식 협약 성공률 50% 이하" — 병행 시도하되 결과 기대 없이 민간 중심 운영.
  • P8 "로앤비 Phase 2 재검토" — Phase 1 는 엘박스 단일, Phase 2 에서 로앤비 보조 계약 검토.

§4.6 후속 안건

이번 주 내 즉시 실행 (P13 Chair 우선 실행 3):

  1. 법원행정처 사법정보화실 공식 문의 공문 발송
  2. 엘박스 스타터 "임베딩 허용 부속 합의" 4월 내 체결
  3. AI·데이터 전문 변호사 자문 500만~1천만 (3건 서면 의견서)

Phase 0 착수 전 (4주):

  • 공공누리 유형 확인 (법고을·대법원·법원행정처)
  • 국가법령정보 DRF API 키 발급
  • 변호사법 §109 외부 법률자문 서면 확보
  • 크롤링 금지 정책 엔지니어 교육
  • 재식별 스캐너 공공 대응 강화 구현

예정 회의:

  • #008 법원 API·화상 재판 + 업계 파트너십 (Phase 2 중반 준비)
  • #009 AX 교육·변화 관리 (Phase 1 후반)

진행 기록

회차상태일자산출
R1 (5인 병렬 발산)✅ 완료2026-04-205인 + P13 신규. 22개 합의·4개 충돌 자연 절충
R2 (크로스 토크)⏸ 생략2026-04-20합의 두터움, Chair 자율 위임 중 Claude 중재
R3 (수렴·ADR)✅ 완료2026-04-20공공+민간 혼합 3단 로드맵. ADR 0006 Accepted

참고 문서