Brain Crew Tech 블로그를 시작합니다
Brain Crew의 응용 AI 엔지니어링 기록을 공유하는 공식 기술블로그입니다.
Brain Crew Culture를 시작합니다
Brain Crew의 팀 문화와 일하는 방식을 공유하는 공간입니다.
SEISMIC: Learned Sparse Retrieval을 위한 효율적 역색인 구조
SIGIR 2024 논문 리뷰 — LSR 벡터의 Concentration of Importance를 활용하여 기존 대비 100배 이상 빠른 근사 검색을 달성하는 SEISMIC 알고...
The Effect of Dynamic Date Injection Methods on LLM Temporal Reasoning across Deictic Expression Granularities
LLM은 "어제", "다음 주"와 같은 상대적 시간 표현을 해석할 때 현재 날짜를 알 수 없어 날짜 주입이 필수입니다. 320회의 실험 결과, **한국어 형식(`2025년 3월 1...
Docker Log Monitor vs Sentry 비교 분석
Docker Log Monitor는 설치가 간단하고 비용이 들지 않으며 코드 수정 없이 즉시 사용 가능한 반면, Sentry는 풍부한 에러 컨텍스트와 분석 도구를 제공하지만 SDK...
Docker Log Monitor 적용 가이드라인
EC2 환경에서 Docker 컨테이너 로그를 실시간 모니터링하고 에러 발생 시 Slack으로 알림을 보내는 경량 모니터링 시스템 구축 경험을 공유합니다. Sentry 같은 무거운 ...
Which tabular format RAG Process understands very well?
RAG 파이프라인에서 테이블 데이터의 포맷이 검색 성능에 미치는 영향을 실험한 결과, Markdown Key-Value 형식이 가장 높은 Recall을 보였으며, TOON 포맷은 ...
메모랜덤 flow에 사용된 문서영역별 Clustering 성능평가
GS Caltex 메모랜덤-연구노트 매칭 프로젝트에서 PyMuPDF 기반 파서, Titan Embed V2 임베딩, ChromaDB 벡터 검색, Claude Sonnet 4.5 L...
근사 최근접 탐색(ANN) 오차와 데이터 분포 밀도의 관계 고찰
RAG 시스템에서 n_results는 단순히 '반환할 결과 개수'가 아닌 '검색 반경(search radius)'을 의미합니다. ANN 알고리즘의 근사 특성으로 인해 작은 n_re...