본문 바로가기

분류 전체보기195

DevOps부터 AgentOps까지: 2026 AI 운영 5계층 완전 분석 (AIOps·MLOps·LLMOps 차이) 핵심 요약2026년 "AI 운영(AI Ops)"은 단일 개념이 아니라 DevOps → MLOps → LLMOps → AIOps → AgentOps로 이어지는 5개 계층의 묶음입니다. 서로 경쟁하는 게 아니라 쌓아 올리는 레이어죠. 이 글에서는 다섯 영역의 정확한 차이, 2026년에 일어나고 있는 통합(convergence), 그리고 자가치유 인프라·AI-SRE 같은 실질적 변화를 수치와 함께 정리합니다."AI Ops 도입하자"는 말, 요즘 회의에서 자주 나옵니다. 그런데 막상 파고들면 같은 단어를 두고 서로 다른 그림을 그리고 있는 경우가 많습니다. 어떤 사람은 로그 보고 장애 예측하는 시스템을 떠올리고, 어떤 사람은 vLLM에 띄운 모델 서빙 모니터링을 생각하고, 또 누군가는 학습 파이프라인 자동화를 .. 2026. 5. 27.
폐쇄망 한국어 RAG 모델 라인업 총정리! V100 vs Mac Mini M4 Pro + 라이선스 함정 핵심 요약폐쇄망에서 한국어 FAQ RAG를 만들 때, 모델 선택의 진짜 병목은 성능이 아니라 하드웨어 호환성과 상업 라이선스입니다. V100×3(96GB)은 GGUF/GPTQ만 가능하고, 한국어 최강이라는 EXAONE은 라이선스가 비상업(NC)이라 사내 서비스에 못 씁니다. 결론부터 말하면 양쪽 환경 모두 Qwen3 + BGE-M3 + BGE-reranker-v2-m3 조합이 가장 안전한 출발점입니다.사내 폐쇄망(에어갭) 환경에 한국어 FAQ용 RAG 시스템을 올리려고 모델 라인업을 정리하다가, 생각보다 함정이 많아서 기록을 남깁니다. 처음에는 "한국어 벤치마크 1등 모델 골라서 양자화해서 올리면 되겠지" 싶었는데, 실제로는 GPU 아키텍처가 발목을 잡고, 그걸 통과해도 라이선스가 다시 한 번 발목을 잡.. 2026. 5. 26.
Cloudflare cf-cache-status DYNAMIC 해결! WordPress HTML 캐시 HIT 만들기 (무료 플랜) 한 줄 요약Cloudflare 뒤에 WordPress를 두었는데 cf-cache-status: DYNAMIC이 떠서 HTML 캐시 적중률이 0%라면, WordPress가 보내는 no-cache 헤더를 Cloudflare가 그대로 존중하고 있기 때문입니다. 캐시 규칙으로 원본 헤더를 무시하고 강제 캐시하면 페이지 응답이 실측 기준 348ms → 154ms(약 2.3배)로 빨라집니다. 무료 플랜에서 가능합니다.증상: 모든 페이지가 DYNAMIC, 캐시 적중률 0%응답 헤더를 까보면 이렇게 나옵니다.curl -sI https://www.example.com/ | grep -i cf-cache-statuscf-cache-status: DYNAMICCloudflare가 분명히 앞단에 붙어 있는데도, HTML 요청.. 2026. 5. 26.
Open Notebook 완전 정복: 폐쇄망에서 NotebookLM 대체하기 (Docker·Ollama·BGE-M3) 이 글 한 줄 요약Open Notebook은 MIT 라이선스 오픈소스 NotebookLM 대체재로, Docker Compose 2컨테이너로 띄우고 Ollama + 임베딩 모델을 붙이면 외부 API 없이 사내 문서 RAG를 굴릴 수 있습니다. 다만 한국어 UI 미지원, 완전 air-gap은 이미지·모델 사전 반출이 필요하다는 두 가지 현실을 먼저 알고 들어가야 합니다.NotebookLM 써보신 분이라면 한 번쯤 이런 생각 하셨을 거예요. "이거 진짜 편한데... 회사 문서를 구글 서버에 올릴 수는 없잖아?" 저도 똑같았습니다. 사내 폐쇄망(인터넷이 끊긴 망) 환경에서 LLM 스택을 운영하다 보니, NotebookLM 같은 "문서 기반 노트북"을 자체 호스팅으로 가져오는 게 한동안 숙제였거든요.그래서 오픈소.. 2026. 5. 26.
MCP(Model Context Protocol)란? AI 에이전트 연동 표준 아키텍처 완벽 정리 핵심 요약MCP(Model Context Protocol)는 LLM과 외부 도구·데이터를 연결하는 방식을 표준화한 오픈 프로토콜입니다. 2024년 11월 앤트로픽이 공개했고, 2025년 12월부터는 리눅스 재단이 거버넌스를 맡고 있습니다. Host-Client-Server 3계층 구조와 JSON-RPC 2.0 기반으로, "N×M 통합 지옥"을 "N+M"으로 줄여줍니다. 흔히 "AI 세계의 USB-C"라고 불립니다.들어가며 — 왜 또 새로운 프로토콜인가사내에서 LLM 스택을 운영하다 보면 반복적으로 부딪히는 벽이 있습니다. "모델은 멀쩡한데, 모델을 사내 DB·위키·티켓 시스템에 어떻게 붙이지?"라는 문제죠. 코딩 어시스턴트 하나 붙이려고 커넥터를 짜고, 자동매매 데이터 붙이려고 또 커넥터를 짜고… 도구가.. 2026. 5. 25.
아이폰 영상으로 유튜브 만들기 총정리! 맥 전송부터 편집·내보내기 설정까지 핵심 요약아이폰에 쌓인 영상을 유튜브 영상으로 만드는 전체 흐름은 전송 → 편집 → 내보내기 3단계입니다. 핵심은 "원본 화질을 끝까지 지키는 것"이에요. 케이블로 원본 그대로 옮기고, 맥 환경에 맞는 편집 도구를 고른 뒤, 유튜브에 맞는 코덱·비트레이트로 내보내면 됩니다. 아래에서 단계별로 정리했어요.아이폰으로 찍은 영상이 사진 앱에 한가득 쌓여 있는데, 막상 유튜브에 올리려니 어디서부터 손대야 할지 막막하셨죠. 저도 처음엔 "그냥 아이폰에서 바로 올리면 되지 않나" 싶었는데, 컷 편집과 자막을 붙이려니 결국 맥으로 옮겨서 작업하는 게 답이더라고요.다행히 맥(특히 애플 실리콘 맥)은 영상 편집에 정말 좋은 환경입니다. 아이폰이 찍는 HEVC·4K 영상을 무리 없이 다루거든요. 이 글에서는 전송 단계의 .. 2026. 5. 25.
반응형

▲ TOP