LLM14 [폐쇄망에서 살아남기 EP.00] 인터넷 없는 서버에서 ChatGPT급 AI를 만듭니다 — 시리즈 예고 🔒 폐쇄망에서 살아남기 — 시리즈 예고✅ 인터넷 없는 서버에서 ChatGPT급 AI 서비스를 만드는 전체 과정✅ vLLM + Ollama + LiteLLM + OpenWebUI, 18편 완전 실전 가이드✅ 복사-붙여넣기로 바로 따라할 수 있는 모든 명령어와 설정 파일 시리즈 첫 글 📋 시리즈 목차 EP.01 폐쇄망에서 LLM을 돌려야 하는 이유 → 작성예정회사에서 ChatGPT 쓰고 싶다... "보안 규정상 외부 클라우드 AI 서비스 사용 불가." 공공기관, 금융권, 군, 대기업… 망분리 환경에서 일해본 분이라면 다들 한 번쯤 겪어본 장면일 거예요.그런데 가만히 생각해보면, 틀린 말은 아니에요. 업무 데이터를 외부 서버로 보내는 건 진짜 위험하니까요. 문제는 "안 된다"에서 끝나버리는 것이었어요. ".. 2026. 4. 15. OpenWebUI RAG 설정 최적화 완벽 가이드 — bge-m3 vs nomic-embed-text vs qwen3-embedding 비교 📌 이 글에서 다루는 내용OpenWebUI RAG 검색 품질이 왜 별로인지, 어떤 설정을 바꿔야 하는지 — bge-m3 / nomic-embed-text / qwen3-embedding 임베딩 모델 실전 비교와 Chunk Size, Hybrid Search, Reranker까지 한 번에 정리합니다.로컬 LLM 셋업하고 RAG 연결까지 됐는데, 막상 문서 기반으로 질문하면 엉뚱한 답이 나오는 경험 다들 있으실 거예요. 저도 처음엔 "모델이 멍청한 건가?" 싶었는데, 알고 보니 임베딩 모델 선택이랑 청킹 설정이 문제인 경우가 대부분이었어요. 이 글에서는 OpenWebUI 기준으로 RAG 품질을 실질적으로 끌어올리는 방법을 단계별로 정리해봤습니다.🔍 RAG 품질이 낮은 진짜 이유RAG(Retrieval-A.. 2026. 4. 10. AI 에이전트 아키텍처 완벽 가이드 — 2026년 멀티에이전트 시대의 설계 패턴 📌 이 글에서 다루는 내용챗봇과 에이전트의 결정적 차이 → 7가지 핵심 설계 패턴(ReAct, Reflection, Tool Use, Planning, Multi-Agent, Sequential, HITL) → 멀티에이전트 아키텍처의 실전 구조 → A2A 프로토콜 → 엔터프라이즈 에이전트 3계층 아키텍처 → 프레임워크 비교 → 시작 가이드까지.🤖 챗봇 vs AI 에이전트: 근본적 차이"AI 에이전트"라는 단어가 2025~2026년 가장 많이 소비된 기술 용어 중 하나입니다. 그런데 많은 조직이 기존 챗봇에 에이전트라는 라벨을 붙이고 있어요. 둘의 차이를 명확히 해야 합니다.챗봇은 반응(Reactive)합니다. 사용자가 질문하면 대답하고, 대화가 끝나면 아무것도 하지 않아요. 반면 AI 에이전트는 능동.. 2026. 4. 7. LLM vs AI Agent, 뭐가 다를까? 초보자를 위한 완벽 가이드 🤖 LLM vs AI Agent뭐가 다를까?똑똑한 두뇌 vs 알아서 일하는 비서 — 초보자를 위한 완벽 가이드📑 목차LLM이란 무엇인가AI Agent란 무엇인가핵심 차이 5가지비유로 이해하기 — 식당 편AI Agent는 어떻게 작동하는가실제 사례로 보는 차이LLM에서 Agent까지, 자율성의 스펙트럼2026년, 왜 Agent가 대세인가정리 및 마무리요즘 AI 뉴스를 보면 LLM과 AI Agent라는 단어가 거의 매일 등장합니다. ChatGPT가 세상을 놀라게 한 게 엊그제 같은데, 이제는 "Agent"가 대세라고 하죠. 그런데 정작 이 둘이 어떻게 다른지 명확하게 설명할 수 있는 사람은 많지 않습니다.이 글에서는 IT 비전공자도 이해할 수 있도록 LLM과 AI Agent의 차이를 비유, 구조도, 실제.. 2026. 4. 7. LLM 모델 핵심 용어 총정리 — 양자화, MoE, FP16, MTP 뜻과 원리 LLM 모델 핵심 용어 총정리양자화 · MoE · FP16 · MTP — 비전공자도 이해할 수 있게"DeepSeek-V3는 671B MoE 모델로 FP8 학습을 적용했고 MTP로 추론 속도를 1.8배 높였다" — 이 문장이 한 번에 읽힌다면 이 글은 필요 없습니다. 아직 뭔 소리인지 모르겠다면, 이 글 하나로 해결됩니다.목차기본 개념 — 파라미터와 토큰숫자의 정밀도 — FP32, FP16, BF16, INT8, INT4양자화 (Quantization)MoE (Mixture of Experts)MTP (Multi-Token Prediction)기타 자주 보이는 용어한 장 정리 — 요약 테이블1 기본 개념 — 파라미터와 토큰🧠 파라미터 (Parameter)AI 모델이 학습한 "기억"의 최소 단위입니다. 숫.. 2026. 4. 6. Building an Internal LLM Server — Ollama vs vLLM, RAG Integration & LDAP Auth A comprehensive guide to building an internal LLM server in air-gapped environments. Covers Ollama vs vLLM comparison, RAG pipeline setup, LDAP authentication, and a phased deployment roadmap.Many organizations are actively adopting cloud-based LLMs like GPT-4 and Claude, but what if your network is completely disconnected from the internet? In air-gapped (network-isolated) environments, externa.. 2026. 3. 31. 이전 1 2 3 다음 반응형