Tech159 [폐쇄망에서 살아남기 EP.00] 인터넷 없는 서버에서 ChatGPT급 AI를 만듭니다 — 시리즈 예고 🔒 폐쇄망에서 살아남기 — 시리즈 예고✅ 인터넷 없는 서버에서 ChatGPT급 AI 서비스를 만드는 전체 과정✅ vLLM + Ollama + LiteLLM + OpenWebUI, 18편 완전 실전 가이드✅ 복사-붙여넣기로 바로 따라할 수 있는 모든 명령어와 설정 파일 시리즈 첫 글 📋 시리즈 목차 EP.01 폐쇄망에서 LLM을 돌려야 하는 이유 → 작성예정회사에서 ChatGPT 쓰고 싶다... "보안 규정상 외부 클라우드 AI 서비스 사용 불가." 공공기관, 금융권, 군, 대기업… 망분리 환경에서 일해본 분이라면 다들 한 번쯤 겪어본 장면일 거예요.그런데 가만히 생각해보면, 틀린 말은 아니에요. 업무 데이터를 외부 서버로 보내는 건 진짜 위험하니까요. 문제는 "안 된다"에서 끝나버리는 것이었어요. ".. 2026. 4. 15. 원고만 넣으면 영상 완성! AI 영상 자동 제작 플랫폼 10개 심층 비교 핵심 요약원고만 입력하면 AI가 나레이션+영상을 자동 생성하는 플랫폼 10개를 요금제·기능·한국어 지원 기준으로 심층 비교했다. 유튜브+숏폼 제작 목적으로 한국어 콘텐츠를 만든다면 Vrew(가성비·편집)·Typecast(나레이션 품질)·InVideo AI(숏폼 멀티포맷)·HeyGen(아바타) 4곳이 최종 후보이며, 2개 플랫폼 조합 전략이 가장 효과적이다.플랫폼 유형 분류 — 다 같은 게 아니다"텍스트→영상 자동 변환"이라는 공통 기능을 갖추고 있지만, 이 플랫폼들은 성격이 크게 다르다. 어떤 영상을 만들고 싶은지에 따라 선택지가 달라지기 때문에, 먼저 4가지 유형을 이해하는 것이 중요하다.4가지 플랫폼 유형아바타 중심 — HeyGen, Synthesia, DeepBrain AI: AI 사람(아바타)이 .. 2026. 4. 14. 한국어 TTS 서비스 11종 심층 비교 — 타입캐스트 vs 수퍼톤 vs 클로바 vs ElevenLabs 핵심 요약원고만 입력하면 AI가 나레이션+영상을 자동 생성하는 플랫폼 10개를 요금제·기능·한국어 지원 기준으로 심층 비교했다. 유튜브+숏폼 제작 목적으로 한국어 콘텐츠를 만든다면 Vrew(가성비·편집)·Typecast(나레이션 품질)·InVideo AI(숏폼 멀티포맷)·HeyGen(아바타) 4곳이 최종 후보이며, 2개 플랫폼 조합 전략이 가장 효과적이다.플랫폼 유형 분류 — 다 같은 게 아니다"텍스트→영상 자동 변환"이라는 공통 기능을 갖추고 있지만, 이 플랫폼들은 성격이 크게 다르다. 어떤 영상을 만들고 싶은지에 따라 선택지가 달라지기 때문에, 먼저 4가지 유형을 이해하는 것이 중요하다.4가지 플랫폼 유형아바타 중심 — HeyGen, Synthesia, DeepBrain AI: AI 사람(아바타)이 .. 2026. 4. 14. 맥미니 M4로 홈서버 + AI 로컬 LLM 구축하기 — 모델별 선택 가이드 (2026) 이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.핵심 요약맥미니 M4는 초저전력(대기 4~7W), 통합 메모리 아키텍처, 89만원이라는 가격으로 홈서버 + AI 로컬 추론 서버의 최적 선택지가 되고 있다. M4 Pro 64GB로 실제 운영 중인 경험을 바탕으로 모델별 선택 기준과 구축 방법을 정리한다.왜 맥미니가 AI 서버로 주목받는가2026년 현재, DDR5 메모리 가격이 반년 만에 3~4배 폭등하면서 조립 PC의 가성비가 크게 흔들리고 있다. 32GB RAM을 맞추려면 램 값만 수십만 원인 상황에서, 맥미니의 통합 메모리 아키텍처는 이 가격 폭등의 영향을 받지 않는다.Apple Silicon은 CPU, GPU, RAM이 하나의 칩에 통합되어 있다. 일반 PC에서 .. 2026. 4. 14. 2026 로컬 LLM 한국어 성능 심층 비교 — EXAONE vs Qwen 3.5 vs Gemma 4(RAG·에이전트 기준) 🤖 2025 로컬 LLM 한국어 성능 심층 비교 요약RAG·에이전트 용도로 EXAONE 3.5/4.0 vs Qwen 2.5/3 vs Gemma 3 등 로컬 실행 가능한 주요 모델을 벤치마크·실용성 양면에서 비교합니다.Mac Apple Silicon(Ollama) + NVIDIA GPU(vLLM) 혼합 환경 기준으로 모델 크기별 최적 선택지를 제시합니다.🗺️ 들어가며 — 2025년 로컬 LLM 한국어 지형도한국어 로컬 LLM 생태계는 2025년을 기점으로 뚜렷한 양강 구도로 재편되고 있습니다. 순수 한국어 품질을 최우선으로 하는 EXAONE 계열과, 에이전트·도구 호출 생태계의 성숙도에서 앞서는 Qwen 계열의 경쟁이 핵심입니다. Gemma 3는 멀티모달과 양자화 효율에서 빠르게 치고 올라오고 있고요... 2026. 4. 12. Google AI Edge Gallery 완전 정복 — LiteRT-LM·Gemma 4·Agent Skills 기술 심층 분석 (2026) 🔥 핵심 요약 — Google AI Edge Gallery (2026.04 최신)구글이 만든 오픈소스 온디바이스 AI 앱. 클라우드 없이 스마트폰에서 Gemma 4·Llama 3.2·Phi-4-mini 등을 직접 실행. LiteRT-LM 독자 추론 엔진 + NPU 가속으로 Snapdragon 8 Gen 3 기준 최대 5,837 tok/s 프리필 달성. Apache 2.0 오픈소스 / Android + iOS 크로스플랫폼.최근 사내 홈 AI 서버 스터디를 준비하면서 "온디바이스 LLM 트렌드"를 같이 다뤄야 할 것 같아서 Google AI Edge Gallery를 깊게 파봤습니다. Ollama나 vLLM처럼 서버 기반이 아니라 스마트폰 자체에서 추론을 돌리는 건데, 생각보다 기술 스택이 상당히 정교하게 .. 2026. 4. 10. 이전 1 2 3 4 ··· 27 다음 반응형