#007 법고을·판례 DB 접근 실사
| 항목 | 내용 |
|---|---|
| 회차 | 7/10 |
| 개시일 | 2026-04-20 |
| Tier | A (기술·법적 복합, Phase 1 Pack 1 RAG 선행) |
| 진행 상태 | ✅ 완료 · 수렴 · ADR 0006 발행 (2026-04-20) |
| 참여자 수 | 5인 (Chair · P1 · P8 · P12 · P13 신규 · P7 원격) |
| 예상 산출물 | 판례 DB 접근 경로 결정 · 라이선스 예산 · 내재화 스펙 · 승소 판단 활용 원칙 · ADR 0006 |
| 선행 ADR | 0001~0005 |
Executive Summary (경영진 1분 독해)
- Phase 1 Pack 1 RAG 파이프라인 (ADR 0005 §1 블록 9·11)이 "공개 판례" 를 컨텍스트로 쓰려면 소스 확정 필요. 현재 ADR 0005 는 "국가법령정보 Open API + 법고을/엘박스 라이선스 병행" 언급만.
- 선택 3갈래: (A) 공공 접근 (법고을 공식 협약·국가법령정보 API) · (B) 민간 라이선스 (엘박스·로앤비) · (C) 혼합
- 승소 판단 전략 활용 은 Anti-Goal #2 "법률 조언 AI" 경계와 충돌 가능 — 기술 구현 이전에 허용 범위 먼저 확정.
§1. 참여자 (Participants)
기존 풀 재소환 (4인)
P1. 송무 변호사
- 이번 회의 역할: 판례 인용 실무·승소 판단 현장·재판부별 관행. "어떤 판례 DB 가 변호사 실사용에 필수인지" 판정.
- 관심사: (1) Mata v. Avianca 같은 인용 오류 방어 (2) 대법원·하급심 커버리지 (3) 엘박스 vs 로앤비 체감 차이.
P8. 리걸테크 도메인 전문가
- 이번 회의 역할: 라이선스 협상 전략·민간 DB 비용 구조·저작권법·부정경쟁방지법 경계.
- 관심사: (1) 공공누리 vs 민간 2차 저작물 구분 (2) 재배포·임베딩·벡터 저장권 조항 (3) 경쟁 리걸테크 라이선스 관행.
P12. AI 아키텍트
- 이번 회의 역할: 내재화 기술 스펙 (Vector Search 인덱싱·임베딩·증분 업데이트·비용). ADR 0005 파이프라인 정합.
- 관심사: (1) 판례 DB 임베딩 크기 (2) 증분 인덱싱 전략 (3) RAG 컨텍스트 조립 시 공공 vs 내부 기억 우선순위.
원격 자문 (1인)
P7. 보안/컴플라이언스 DPO
- 이번 회의 역할: 판결문 재식별 리스크·개인정보 보호·변호사법 제26조 적용 범위 원격 자문.
신규 소환 (1인)
P13. 공공데이터·법원행정처 협력 전문가
- 직업·소속: 공공데이터 컨설팅 8
12년. 법원행정처·법제처·개인정보위·KISA 자문 레퍼런스. 최근 35년 공공 API 협약·민관 데이터 파트너십 다수. - 경력: 공공누리 라이선스 분쟁 사례·대법원 오픈데이터 워킹그룹 참여·KISA 공공데이터 위원회 자문·행정심판 데이터 구축 프로젝트.
- 전문 분야:
- 공공 API 공식 협약 (MOU·이용 약관·재배포 조항)
- 공공누리 1·2·3·4 유형 실무 해석
- 크롤링의 법적 경계 (저작권법 제24조의2 데이터 마이닝 예외)
- 대법원·법원도서관·법무부·국가법령정보센터 창구 담당자 네트워크
- 민간 리걸테크 (엘박스·로앤비·인텔리콘) 라이선스 구조
- 이번 회의 역할: 법고을 공식 벌크 접근 가능성 실사 + 민간 라이선스 협상 전략 + 공공누리 재배포 경계.
- 성향: 실무·관계 기반. "협상 가능 범위" 와 "결재 라인" 언어로 판단.
- 강점: 공공 DB 담당자 직접 컨택 경험. 민관 협력 선례 축적.
- 맹점: AI·기술 디테일은 P12 에 위임. 순수 기술 내재화 설계에는 관여 낮음.
- 이 안건의 관심사: (1) 법고을 벌크 API 공식 협약 가능성 (2) 민간 라이선스 계약 조항 (임베딩·벡터·재협상) (3) 공공-민간 혼합 전략.
- 잠재적 편향: 공식 협약 선호 (민간 라이선스에 보수적). 정부 사업 연계 제안 경향.
Chair
의사결정·ADR 0006 서명 (Chair 부재 시 Claude 대리 중재).
이번 회의 불참여
- P2·P3·P4·P5·P6·P9·P10·P11·P14·P15·P16·P17: 각자 전문 회의에서 등판.
§2. 회의 아젠다 (Agenda)
상위 안건
Phase 1 Pack 1 RAG 파이프라인의 "공개 판례 소스" 확정. ADR 0005 §1 블록 9 (컨텍스트 조립) · 블록 11 (실재성 검증) 의 판례·조문 데이터 공급처 결정.
전제 (ADR 0001~0005)
- Firebase AI Logic (Gemini) → 소버린 AI 전환 대비 (대체 provider 금지)
- Vector Search 단일 인덱스 +
docTypenamespace 논리 분리 (publicCase는tenantId=PUBLIC) - Anti-Goal #2 "법률 조언 AI ✗" — 판단·권유·대리 금지, 초안·요약·검색 OK
- 비식별화 4단 + 재식별 스캐너 (판결문 자체 비실명본이어도 조합 재식별 리스크)
- Citation Precision 0.95+ hard gate (Phase 0) → 실재성 3단 검증 (사건번호·조문·체크리스트)
논의할 4축
Q1. 공공 접근 경로 실사
- 법고을 (법원도서관) 공식 벌크 API 제공 여부 (2026-04 현재)
- 대법원 종합법률정보 (glaw.scourt.go.kr) 스크래핑 법적 경계
- 국가법령정보센터 (law.go.kr) Open API 스펙·쿼터·법령/판례 커버리지
- 공식 협약 가능성 (대법원·법원도서관 MOU·법원행정처 연계)
- 공공누리 1~4 유형별 재배포·상업 이용·임베딩 벡터 저장권
Q2. 민간 라이선스 평가
- 엘박스·로앤비·인텔리콘 월 라이선스 비용 (예상 월 300~800만원, P12 R1)
- 계약 조항 체크:
- 임베딩 벡터 생성·저장 허용 여부
- 계약 해지 시 벡터 폐기 의무
- 재협상 주기·가격 인상 방어
- 사무소 tenant 간 격리 보장
- 저작권법 제7조 (판결문 저작권 없음) · 2차 저작물 (편집·요지·키워드 민간 가공) 경계
Q3. 내재화 기술 스펙
- 판례 규모: 대법원 30
40만 건 · 하급심 비실명 공개분 150200만 건 - Vector Search 인덱스 비용 (P12 R1: 월 $1,200~1,500)
- 증분 인덱싱 (월 1회 · 법원 공개 주기 맞춤)
- RAG 컨텍스트 조립 시 "내 사무소 기억" vs "공공 판례" 우선순위·뱃지 분리 (ADR 0005 §1 블록 9)
- 소버린 AI 전환 시 재임베딩 비용 (100만 문서 $1,200, P12 R1)
Q4. 승소 판단 전략 활용 (Anti-Goal 경계)
- 허용 범위:
- 유사 판례 검색·요약 (정보 제공)
- 쟁점 추출·참조조문 매칭
- 과거 판례 승소율 통계 (객관 정보)
- 금지 범위:
- "이 사건 이길지 말지" AI 판단 (변호사법 제109조 저촉)
- 의뢰인 직접 노출 (Anti-Goal #3)
- 승소 확률 수치 제시 (AI 과장·법률 조언)
- UX 경계: 변호사 검토 전 외부 송출 차단
- 전략 보고서 (weight 3) 와 승소 판단의 구분
진행 계획
- Tier A, 2~3회차
- R1: 5인 병렬 발산
- R2: (필요 시) 라이선스 협상 전략·Anti-Goal 경계 크로스 토크
- R3: 수렴·ADR 0006 발행
예상 산출물
- 판례 DB 접근 경로 결정 (공공/민간/혼합)
- 민간 라이선스 예산·조항 체크리스트
- 내재화 기술 스펙 (인덱스 크기·비용·증분 전략)
- 승소 판단 활용 원칙 (허용/금지 매트릭스)
- ADR 0006
§3. 회의 내용 (Proceedings)
§3.1 Round 1 — 독립 발산 (완료, 2026-04-20)
한 줄 요약 (5인)
| 역할 | 핵심 입장 |
|---|---|
| P1 변호사 | 법고을 사용 분기 1strategyReport 유지·카피 "사건 전략 브리핑". |
| P8 도메인 | 법고을 공식 벌크 미공개 확정. 크롤링 3중 리스크 (저작권·부정경쟁·업무방해) — Phase 0 금지. 공공누리 1유형 임베딩 허용·2유형 금지·3·4유형 회색. 연 라이선스: 엘박스 3,000 |
| P12 AI 아키텍트 | 규모별 월 비용: 3.5만 ~$280 · 15만 ~$1,050 · 100만 ~$3,500. 과잉 투자 경고: Phase 1 천장 15만, 50만+ Phase 2 로 미루기. RAG K 분배 사무소 3 + 공공 5 + 법령 2. 3-part 분리 임베딩 Phase 0 A/B (저장 3배 vs recall 20~30% ↑). 민간 라이선스 3조건 non-negotiable: 증분 API·벡터 생성권·해지 폐기 자동화. 승소 판단 코드 차단: predictWinProbability ESLint 금지·predictionMode: false 하드코딩. |
| P13 공공데이터 전문가 (신규) | 법고을 공식 벌크 미공개 재확인. 공식 협약 9~12개월·성공률 50% 이하. 로앤비·엘박스도 공식 MOU 아닌 기증·공공 수집 조합. 협약 필요 서류: ISMS-P·DPIA·재배포 금지 서약. 엘박스 시리즈 B 직후 = 협상 타이밍 양호. Chair 우선 실행 3: (1) 법원행정처 사법정보화실 공식 문의 즉시 발송 (2) 엘박스 임베딩 허용 부속 합의 4월 내 체결 (3) AI 전문 변호사 자문 500만~1천만. |
| P7 컴플라이언스 (원격) | 총평: ADR 0001~0005 균형 잡힘. Q1 재식별 + Q4 변호사법 보수 강화 필요. 공공 판례 k≥10 (법률 도메인). 민간 DB 계약 함정 5건: 위탁 vs 제3자 제공·재배포 해석·임베딩 권리·해지 파기·종속 분산. 변호사법 제109조 절대선 — "승소 확률 65%" 법정형 7년 이하. Phase 0 착수 전 법적 검토 5건 필수. AI 기본법 2026.1 시행 대응. |
발언 핵심 정리 (전문 축약)
P1 변호사 — 10년 개인 사무소 실무
- 법고을 분기 1~2회 (도서관 방문·IP 제약, 일상 도구 아님)
- 대법원 종합법률정보 월 10~20회 (단건 조회만, 벡터 검색·다운로드 없음)
- 국가법령정보 API — 법령 95점·판례 요지만 40점
- 케이스노트 70점 (UX·Elasticsearch 쓸만·지속성 불안)
- 엘박스 de-facto 표준 (월 5
8만원, 하급심 커버리지 압도적). 로앤비 1525만 (대형·기관), 인텔리콘 10~20만 (AI 선도) - 개인 사무소 월 10만 이하 지불 한계
- 내재화 = "별도 구독 안 해도 됨" Killer. 단 엘박스 수준 하급심 커버리지 필수
- Pack 1 대여금: leading case 50
80 · 참조 300500 · 500이면 95% 커버 - 업데이트 월 1회 충분 (전원합의체 즉시 푸시)
- UX: 판결문 원클릭 오픈·pin-cite·해시 검증 배지·인용 복붙 각주
- "승소 확률" 강한 거부 — 변호사법 109·31조 저촉·"왜 졌냐" 분쟁
- 허용: 유사 판례 승소율 통계·쟁점·참조조문·반대 가능성 주장 (특히 유용)
- 금지: 수치·권유·단정·의뢰인 노출
- Mata v. Avianca 공포: 사건번호 hallucination·판지 왜곡·폐기 판례. 100% 검증 배지 필요
- 기능명
strategyReport유지 · 마케팅 카피 "사건 전략 브리핑" (간접 표현)
P8 도메인 — 라이선스·저작권·경쟁
법고을 공식 벌크 미공개 (2026-04). 법원행정처 "사법정보 개방 3차 계획 2024" 언급만·실제 X. 로앤비는 2000년대 초 한국법제연구원 협력·엘박스는 공공수집+기증+OCR — 신규 진입자 동일 경로 불가.
스크래핑 3중 리스크:
- 저작권법 §7-3호: 판결문 자체 저작권 없음 ✅
- 저작권법 §6 편집저작물: 요지·참조조문·키워드 편집저작권 발생 ❌
- 부정경쟁방지법 §2-1(파)목: "상당한 투자·노력 성과" 2023 이후 판례 강화 ❌
- 결론: Phase 0 전면 금지
공공누리 4유형 매트릭스:
- 1유형 (출처): 상용 ✅·임베딩 허용 우세
- 2유형 (상업 금지): 상용 SaaS ❌
- 3·4유형 (변경 금지): 임베딩 = 변형 해석 시 ❌
국가법령정보 API: 1유형, B2B SaaS 사용 가능. 이용약관 §5 "대량 다운로드 후 재배포 금지" 주의 (우리는 재배포 X, 벡터 저장만 → 안전).
라이선스 계약 조항 체크 10개 (핵심 5):
- 임베딩 벡터 2차 저작권 귀속 (을 귀속 필수)
- 가격 인상 상한 (연 CPI +3% or 5% 이내)
- 재협상 주기 3년 (자동갱신 아닌)
- 경쟁사 차단 조항 없음 (과도 CAPEX)
- 데이터 최신성 SLA ("판결 확정 후 30일 이내 반영")
- tenant 격리 면책 (책임 을 부담)
- API 다운타임 배상 (월 99.5% 미만 50% 감액)
- 재배포 범위 (원문 ✗, 요약·메타 ✅)
- 분쟁 관할 서울중앙 (중재 ✗)
- 해지 시 벡터 폐기 자동화 (46억 float 리스크)
협상 전략:
- 엘박스 시리즈 B 직후: 스타트업 할인 20~30% 요구 가능
- 3사 교차 견적 → 엘박스 본계약 1년 단기 → 로앤비 견적 받아 2년차 재협상
- 3년차 내재화 병행 → 의존도 50% 이하
Pack 별 판례 수 재추정 (2026):
- Pack 1 대여금 5,500 · Pack 2 이혼 10,200 · Pack 3 부동산 7,900 · Pack 4 상속 6,200 · Pack 5 계약 7,300
- 합계 약 37,000건 (민사 전반 10~15만, 민간 DB 200만은 98% 불필요)
해외 사례:
- Westlaw CoCounsel: 연 수천 달러/변호사
- LexisNexis+AI: 파운데이션 모델 자체 소유
- Casetext → Thomson Reuters 2023 6.5억 달러 인수
UX 치환 규칙:
- "승소 확률" → "유사 판례 승소 분포"
- "AI 추천 전략" → "참고 판례 기반 초안"
- "이길 가능성" → "쟁점별 인용률 통계"
P12 AI 아키텍트 — 기술 스펙
규모별 월 비용:
| 시나리오 | 문서 | 초기 임베딩 | 저장 | Vector Search | 쿼리 | 월 총 |
|---|---|---|---|---|---|---|
| Pack 1 MVP | 3.5만 | $100 | 3GB | $100~150 | $130 | ~$280 |
| 민사 전반 | 15만 | $400 | 12GB | $400~500 | $520 | ~$1,050 |
| 포괄 | 100만 | $3,000 | 80GB | $2,000 | $1,300 | ~$3,500 |
권고: Phase 1 천장 15만. 100만+ 은 Phase 2 소버린 전환 시점까지 연기.
증분 파이프라인 eng-day:
- 대법원 월 1회: Cloud Scheduler → Cloud Run Job → embedding → Vector upsert (초기 6·운영 0.5/월)
- 하급심 분기: Manual + 공개 알림 (초기 4·운영 1/분기)
- 민간 증분 API (
?since=timestamp): 필수 (초기 8·운영 0.5/월) - 최근 3년 × 1.5 가중치 rerank (2)
- Phase 0 총 20 eng-day
RAG K 분배:
top-K 10:
docType=memory tenantId=myTid K=3 ("내 사무소 자료")
docType=publicCase tenantId=PUBLIC K=5 ("대법원 판례"/"하급심")
docType=statute tenantId=PUBLIC K=2 ("법령")
UI 뱃지 3종 분리 non-negotiable (hallucination 책임 전가 방지).
3-part 분리 임베딩: 요지·판결이유·주문 → 1 문서당 3 벡터. 저장 3배·recall 20~30% ↑ 기대. Phase 0 Pack 1 1,000건 A/B 로 검증.
민간 라이선스 3조건 non-negotiable:
- 증분 API (전체 dump 비현실)
- 벡터 생성권 명시
- 계약 해지 시 벡터 폐기 자동화 (
tenantId=PUBLIC_VENDOR_Xnamespace 일괄 삭제)
품질 리스크: 민간 증분 API 지연/누락 시 공공 fallback 자동 라우팅 — features.rag.publicVendorFallback 1-click 롤백.
승소 판단 코드 차단:
// 금지 (ESLint 룰)
function predictWinProbability(case): number // BANNED
function estimateWinChance(...): ... // BANNED
executeAiAction래퍼predictionMode: false하드코딩- prompt 에 "확률 예측"·"이길 것" 단어 감지 시 500
허용 (결정론 집계, weight 0):
1. case metadata outcome: "won"|"lost"|"settled"|"unknown"
2. RAG top-10 유사 판례
3. 결정론 카운트
4. UI: "유사 판례 10건 중 원고 승소 8건 · 일부 승소 1건 · 패소 1건"
5. 원본 판례 링크 필수
P13 공공데이터 전문가 (신규)
법고을 공식 벌크 미공개 (2026-04 재확인). 검색 포털만 공개, 로그인·CAPTCHA·IP 제한. 공식 협약 경로:
- 법원도서관 편찬과 → 조사심의관실
- 법원행정처 사법정보화실 + 공보관실
- 필요 서류: 사업계획서·보안 체계·이용 목적서·ISMS-P·DPIA·재배포 금지 서약
- 9~12개월·성공률 50% 이하
- 성사 시 조건: 비식별화·폐쇄망·연 감사·이용료 (공식 요율 없음, 연 수천만원 추정)
협약 실패 시 대안:
- 대법원 종합법률정보 공개 판결 전문 8~15만 건 공식 수집
- 민간 라이선스
- 로스쿨 공동 연구 MOU (연 5천만~1억 + 논문 공저)
공공누리 유형: 법고을 판례 유형 미표기 (기본 비공개) — 확인 필요.
국가법령정보 DRF API:
- 발급 1
2일, 일 쿼터 5천2만 - 법령 99%+·판례 전문 2~5%
- 공공누리 1유형 다수
민간 라이선스 협상:
- 엘박스: 시리즈 B 후 = 협상 양호. 월 300~800만 (타협 500만 내외). 필수 부속 합의: 임베딩 허용·해지 폐기·재협상 24개월·SLA 99.5%+
- 로앤비: Phase 2 재검토
- 인텔리콘: B2C 채널 약, 표준 계약서 없어 지연
- 교차 견적: 3사 동시 RFP → 엘박스 본계약 + 로앤비 보조
크롤링: 저작권법 §24의2 (정보분석 예외) 도 "통상 이용 저해 시" 제외 → Phase 0~2 전면 배제.
Chair 우선 실행 3 (이번 주 내):
- 법원행정처 사법정보화실 공식 문의 공문 발송 (9~12개월 시계, 당장 착수)
- 엘박스 스타터 "임베딩 허용 부속 합의" 포함 4월 내 체결
- AI·데이터 전문 변호사 자문 500만~1천만 (공공누리·부정경쟁·크롤링 3건 의견서)
가장 큰 리스크: "엘박스 계약서 임베딩·재배포 조항 덜 읽고 서명" → Phase 2 재구축 강제.
P7 컴플라이언스 (원격)
재식별 리스크 Q1 (법률 도메인 보수 강화):
- 판결문 비실명 = 개인정보법 가명정보 수준 미보장
- 사건번호+법원+선고일+금액+지명 조합 = 원사건 역검색 일상
- RAG 결과가 특정 사건 복원 시 개보법 §18 + §28의5 재식별 금지 위반 → 법정형 5년 이하 or 5천만원 이하
- 방어:
- 전처리 (사건번호 해시·금액 로그 스케일·지명 시·도 광역·날짜 월)
- k≥10 (공공 5 권고보다 보수)
- 자동 스캐너 + 월 1% 샘플 수동 검토
- 감사 로그 90일 (§39의14)
민간 라이선스 계약 함정 5:
- 위탁 vs 제3자 제공 구분 (DPA 명시)
- 재배포 금지 조항 해석 (검색 결과 "간접 재배포" 오해)
- 임베딩 벡터 권리 (2차 저작물 해석 방어)
- 해지 시 벡터 파기 증빙 (§21)
- 종속 분산 (Phase 0 2개 제공자 병렬)
변호사법 제109조 절대선:
- "법률사무 업으로 취급" = 유죄 (대법 2007도9321)
- 수치 확률·권유·단정·의뢰인 직접 노출 → 저촉
- 법정형 7년 이하 or 5천만원 이하
허용/금지 매트릭스:
| 허용 | 금지 | |
|---|---|---|
| 통계 | "유사 사례 10건 중 7건 원고 일부 승소" | "승소 확률 65%" |
| 주장 | "원고측 쟁점 3가지 초안" | "이 사건은 어렵습니다" |
| 반대 | "피고 반박 가능 주장 2가지" | "소송 포기 권유" |
| 대상 | 변호사만 | 의뢰인 직접 노출 |
필수 구현 5:
- 고정 워터마크 "AI 초안·변호사 검토 필수·법적 판단 아님"
DocSignGate외부 송출 차단- 수치 금지 린트 (
\d+%·"확률"·"가능성" 정규식 차단) - 포털 격리 (Server Action 필드 스트리핑)
- 감사 로그 3년 보존 (§109 형사책임 기간)
2026.3 예정 대한변협 "AI 법률서비스 가이드라인" — 초안 공개 즉시 검토 TF.
DPIA 3트랙 (Phase 1 말 18M):
- Track A 내부 사무소 기억 (Tier 1, 예정)
- Track B 공공 판례 내재화 (신규)
- Track C 민간 라이선스 DB (신규)
Phase 0 착수 전 법적 검토 5건 (순서 고정):
- 공공누리 유형 확인 (법고을·대법원·법원행정처)
- 민간 DB 계약 외부 자문
- 변호사법 §109·AI 가이드라인 외부 자문 (승소 구현 경계 서면 의견서 — 면책 자료)
- 크롤링 금지 정책 문서화·엔지니어 교육
- 재식별 스캐너 공공 대응 강화 (k≥10 공공 한정)
놓친 리스크:
- AI 기본법 2026.1 "고영향 AI" 지정 가능성
- 개보법 2026 개정 자동화 결정 대응권 강화 (§37의2)
§3.2 Round 2 — 생략 (2026-04-20)
합의 22개·충돌 4개·대부분 자연 절충 → R2 생략, R3 자율 수렴.
§3.3 Round 3 — 수렴·결정 (완료, 2026-04-20)
ADR 0006 발행 근거 — 아래 §4 참조.
§4. 결과 (Outcomes)
§4.1 충돌 지점 (R1 → R3 자율 절충)
- C1 재식별 k 값: ADR 0005 "k=5 기본·고위험 k=10 조건부" vs P7 "공공 판례 k≥10" → 공공 판례 한정 k≥10 추가 절충
- C2 민간 라이선스 예상 비용: P8 연 3,000
6,000만 · P13 월 300800만 (연 3,6009,600만) · P12 월 300800만 → 연 3,600~6,000만 레인지 합의 - C3 판례 규모: P1 현장 50~500 · P8 37,000 · P12 Phase 0 3.5만 · Phase 1 15만 → Phase 0 Pack 1 3.5만 (rerank 상위 500 가중치) 절충
- C4 승소 판단 깊이: 전원 "확률 수치 금지" 합의 · P7 3년 감사 로그 보수안 수용
§4.2 합의된 지점 (22개)
- ✅ 법고을 공식 벌크 2026-04 미공개 (P8·P13 확인)
- ✅ 크롤링 Phase 0~2 전면 배제 (3중 법적 리스크)
- ✅ 공공누리 1유형 상용 임베딩 허용 · 3·4유형 회색·Phase 0 제외
- ✅ 국가법령정보 DRF API 즉시 발급 (법령 99%·판례 요지 2~5%)
- ✅ 엘박스 Phase 0 스타터 (월 300~500만) + 임베딩 허용 부속 합의
- ✅ 법고을 공식 협약 즉시 문의 (9~12개월·성공률 50% 이하·병행)
- ✅ 3사 교차 견적 전략 (엘박스 1년 단기 → 2년차 재협상)
- ✅ 민간 계약 조항 체크리스트 10개
- ✅ 해지 시 벡터 폐기 자동화 (
tenantId=PUBLIC_VENDOR_X네임스페이스 일괄) - ✅ 증분 API 필수 (전체 dump 비현실) + 공공 fallback 자동 라우팅
- ✅ Pack 1 Phase 0 3만 5천건 (rerank 상위 500 가중치)
- ✅ Phase 1 천장 15만 (50만+ 은 Phase 2+)
- ✅ RAG K 분배: 사무소 3 + 공공 판례 5 + 법령 2
- ✅ UI 뱃지 3종 분리 (내 사무소·대법원/하급심·법령)
- ✅ 3-part 분리 임베딩 Phase 0 Pack 1 1,000건 A/B (recall 20%+ 시 본격)
- ✅ 승소 판단: 통계·쟁점·반대 허용·수치·권유·단정·의뢰인 노출 금지
- ✅ UX 치환 ("승소 확률" → "유사 판례 승소 분포")
- ✅ 코드 레벨 차단 (
predictWinProbabilityESLint·predictionMode: false하드코딩·수치 정규식 린트) - ✅ 의뢰인 포털 승소 필드 스트리핑 (Server Action)
- ✅ 기능명
strategyReport유지 + 카피 "사건 전략 브리핑" - ✅ 감사 로그 3년 보존 (§109 형사책임 기간)
- ✅ Phase 0 착수 전 법적 검토 5건 필수 (공공누리·민간 계약·변호사법·크롤링·재식별)
§4.3 최종 결정 (R3 수렴, 2026-04-20)
ADR 0006 발행 (상세는 문서 링크 참조):
- 판례 DB 접근 경로: 공공(국가법령정보·대법원 종합법률정보 공개 판결 전문) + 민간(엘박스 Phase 0 → 본계약 Phase 1) + 법고을 공식 협약 병행 시도
- Phase 0 착수 전 법적 검토 5건 필수 (P7 제안 수용)
- 승소 판단 구현 규칙 (허용/금지 매트릭스·코드 차단·UX 치환)
- 판례 규모 Phase 별: Phase 0 3.5만 · Phase 1 15만 · Phase 2 50만~100만 검토
- 재식별 방어 강화: ADR 0005 k=5 기본 유지 + 공공 판례 한정 k≥10 추가
- RAG 컨텍스트 K 분배·UI 뱃지 3종
- 3-part 분리 임베딩 Phase 0 A/B → Phase 1 본격 조건
- 증분 인덱싱 파이프라인 (Cloud Scheduler·Cloud Run)
- Chair 우선 실행 3 (법원행정처 공문·엘박스 부속 합의·변호사 자문 500만~1천만)
- Phase 1 말 DPIA 3트랙 (내부·공공·민간)
§4.4 ADR 0006 발행
ADR 0006 Accepted — 2026-04-20. 판례 DB 접근·승소 판단 구현 통합.
§4.5 Minority Report
- P7 "공공 판례 k≥10 전면 적용" — 현재 고위험 문서 한정으로 완화 수용. Phase 2 DPIA 시 재평가.
- P13 "법원행정처 공식 협약 성공률 50% 이하" — 병행 시도하되 결과 기대 없이 민간 중심 운영.
- P8 "로앤비 Phase 2 재검토" — Phase 1 는 엘박스 단일, Phase 2 에서 로앤비 보조 계약 검토.
§4.6 후속 안건
이번 주 내 즉시 실행 (P13 Chair 우선 실행 3):
- 법원행정처 사법정보화실 공식 문의 공문 발송
- 엘박스 스타터 "임베딩 허용 부속 합의" 4월 내 체결
- AI·데이터 전문 변호사 자문 500만~1천만 (3건 서면 의견서)
Phase 0 착수 전 (4주):
- 공공누리 유형 확인 (법고을·대법원·법원행정처)
- 국가법령정보 DRF API 키 발급
- 변호사법 §109 외부 법률자문 서면 확보
- 크롤링 금지 정책 엔지니어 교육
- 재식별 스캐너 공공 대응 강화 구현
예정 회의:
- #008 법원 API·화상 재판 + 업계 파트너십 (Phase 2 중반 준비)
- #009 AX 교육·변화 관리 (Phase 1 후반)
진행 기록
| 회차 | 상태 | 일자 | 산출 |
|---|---|---|---|
| R1 (5인 병렬 발산) | ✅ 완료 | 2026-04-20 | 5인 + P13 신규. 22개 합의·4개 충돌 자연 절충 |
| R2 (크로스 토크) | ⏸ 생략 | 2026-04-20 | 합의 두터움, Chair 자율 위임 중 Claude 중재 |
| R3 (수렴·ADR) | ✅ 완료 | 2026-04-20 | 공공+민간 혼합 3단 로드맵. ADR 0006 Accepted |