Posts
총 13개의 글
Brain Crew Tech 블로그를 시작합니다
Brain Crew의 응용 AI 엔지니어링 기록을 공유하는 공식 기술블로그입니다.
Brain Crew Culture를 시작합니다
Brain Crew의 팀 문화와 일하는 방식을 공유하는 공간입니다.
SEISMIC: Learned Sparse Retrieval을 위한 효율적 역색인 구조
SIGIR 2024 논문 리뷰 — LSR 벡터의 Concentration of Importance를 활용하여 기존 대비 100배 이상 빠른 근사 검색을 달성하는 SEISMIC 알고리즘
The Effect of Dynamic Date Injection Methods on LLM Temporal Reasoning across Deictic Expression Granularities
LLM은 "어제", "다음 주"와 같은 상대적 시간 표현을 해석할 때 현재 날짜를 알 수 없어 날짜 주입이 필수입니다. 320회의 실험 결과, **한국어 형식(`2025년 3월 19일`) + User Prompt 조합**이 Simple/Structured 모두에서 95
Docker Log Monitor vs Sentry 비교 분석
Docker Log Monitor는 설치가 간단하고 비용이 들지 않으며 코드 수정 없이 즉시 사용 가능한 반면, Sentry는 풍부한 에러 컨텍스트와 분석 도구를 제공하지만 SDK 통합과 비용이 필요합니다. LG Electronics Agent 프로젝트의 경우, 이미
Docker Log Monitor 적용 가이드라인
EC2 환경에서 Docker 컨테이너 로그를 실시간 모니터링하고 에러 발생 시 Slack으로 알림을 보내는 경량 모니터링 시스템 구축 경험을 공유합니다. Sentry 같은 무거운 솔루션 대신, Python 기반의 간단한 스크립트로 실시간 로그 감지, 중복 알림 방지,
Which tabular format RAG Process understands very well?
RAG 파이프라인에서 테이블 데이터의 포맷이 검색 성능에 미치는 영향을 실험한 결과, Markdown Key-Value 형식이 가장 높은 Recall을 보였으며, TOON 포맷은 토큰 효율성 측면에서 가장 우수했습니다. AIHub의 표 정보 질의응답 데이터 50개를 7
메모랜덤 flow에 사용된 문서영역별 Clustering 성능평가
GS Caltex 메모랜덤-연구노트 매칭 프로젝트에서 PyMuPDF 기반 파서, Titan Embed V2 임베딩, ChromaDB 벡터 검색, Claude Sonnet 4.5 LLM 판정을 결합한 파이프라인을 구축했습니다. 137개 연구노트 중 82.5%가 메모랜덤과
근사 최근접 탐색(ANN) 오차와 데이터 분포 밀도의 관계 고찰
RAG 시스템에서 n_results는 단순히 '반환할 결과 개수'가 아닌 '검색 반경(search radius)'을 의미합니다. ANN 알고리즘의 근사 특성으로 인해 작은 n_results 값은 진짜 근접 벡터를 놓칠 수 있으며, 특히 고밀도 데이터 분포와 추상적 쿼리
IBK캐피탈 AI 여신 승인신청서 자동화 시스템 구축기
완전폐쇄망(On-Prem) 환경에서 RAG 기반 승인신청서 자동 생성 시스템을 구축하며 겪은 기술적 도전과 해결 과정을 공유합니다.
LG Electronics 라이프로그 AI 어시스턴트 구축기: 그래프 검색으로 일상을 탐색하다
사용자의 일상 활동 데이터를 그래프 기반으로 검색하는 AI 어시스턴트를 구축하며, Context를 85% 줄이면서도 92% 정확도를 달성한 과정을 공유합니다.
MLflow 기술 검토(RAG 성능 실험 테스트베드 기능)
MLflow는 전통적인 ML과 LLM 애플리케이션의 전체 생명주기를 관리할 수 있는 오픈소스 통합 플랫폼입니다. LangGraph 기반 RAG Agent 개발 시 Tracking으로 하이퍼파라미터와 메트릭을 관리하고, Tracing으로 복잡한 LLM 호출 흐름을 추적하
LLM이 가장 잘 이해하는 Table Format에 대한 평가실험
재무제표 데이터를 LLM에 전달할 때 데이터 포맷에 따라 성능과 비용이 크게 달라집니다. 11가지 포맷을 비교한 결과, TSV(tab-separated) 포맷이 정확도 100%, 최소 토큰 사용(7,192개), 최단 응답시간(8.24초)으로 모든 지표에서 최고 성능을