본문 바로가기
Tech/AI & LLM

IT 직무자가 매일 쓰는 업무 AI 스택 — 도구 비교부터 자동화 레이어까지

by Hoft 2026. 5. 23.
핵심 요약

IT 직무자가 2026년 5월 기준으로 실무에 쓰는 업무 AI 스택을 정리한다. ChatGPT·Claude·Gemini·Copilot 4종의 강점/약점 비교, 시나리오별 도구 선택 기준, 그리고 일반인용 가이드에서 빠지는 핵심 레이어 — Apps Script·n8n·MCP 같은 자동화 계층을 함께 다룬다.

왜 'IT 직무자용' AI 스택을 따로 정리해야 하는가

회사 동료들로부터 "AI 어떻게 쓰는지 좀 알려달라"는 요청을 자주 받는다. 일반 직장인용 가이드는 대부분 "ChatGPT에 이메일 써달라고 하세요" 수준에서 끝난다. 그런데 IT 직무에 있는 사람은 입장이 좀 다르다.

(1) 도구 비교를 빠르게 끝내고 본인 워크플로에 맞는 한두 개를 고정해야 하고, (2) 단순 채팅 UI 이상의 자동화 레이어까지 함께 봐야 한다. 이메일 한 통을 Claude로 쓰는 건 출발점일 뿐, 진짜 효율은 Gmail 받은편지함이 자동 분류되고, Slack 알림이 요약되며, Jira 티켓이 LLM으로 미리 분류되는 지점에서 나온다.

이 글은 그 두 층을 한 번에 정리한 메모다. 동료들에게 링크 한 번 던지면 끝나는 레퍼런스를 목표로 썼다.

2026년 5월 기준 업무 AI 지형도

2026년 1분기를 거치면서 시장은 4개 진영의 안정적인 경쟁 구도로 자리잡았다. 각 모델의 최신 라인업과 IT 직무자 관점 평가는 다음과 같다.

도구 최신 라인업 강점 약점 가격 (개인)
ChatGPT GPT-5.2 (Instant/Thinking/Pro 3티어) 멀티모달, 이미지 생성, 음성, 플러그인 생태계 장문 일관성, 한국어 비즈니스 톤은 Claude 대비 약간 떨어짐 Plus 약 $20/월
Claude 텍스트·코드 Claude 4.5/4.7 시리즈 코딩(SWE-bench 77%+), 보고서 톤, 1M 컨텍스트(Sonnet) 이미지 생성 없음, 음성 약함 Pro 약 $20/월
Gemini Gemini 3 시리즈 Workspace 네이티브, 1M 컨텍스트, 영상 분석 한국 기업 보안 정책상 도입 거부감 AI Pro $20/월
Copilot 한국 표준 M365 Copilot (GPT-5 기반) Excel·Outlook·Teams 내장, 사내 데이터 그라운딩 가격 부담, 토큰 한도 빠듯 Pro 29,000원/월
💡 IT 직무자 관점 1차 결론

두 개를 묶어 쓰는 게 정답이다. 텍스트·코드 주력으로 Claude를 깔고, 회사가 M365 라이선스를 보유했다면 Copilot을 보조로. M365가 아니면 Gemini를 그 자리에 끼우면 된다. ChatGPT는 이미지·음성이 필요한 시점에만.

업무 시나리오별 도구 선택

도구 4종을 다 띄워놓는 건 비효율적이다. 시나리오별 최적 선택을 명확히 해두면 매번 고민할 필요가 없어진다.

1. 이메일 초안 — Claude

한국어 비즈니스 톤이 가장 자연스럽다. 톤 미세조정("좀 더 부드럽게", "단호하지만 무례하지 않게") 지시에 대한 반응 폭이 넓다. 같은 프롬프트로 GPT-5.2와 Claude 4.5에 동시에 던져보면 차이가 명확하다.

2. 보고서·기획서 골격 — Claude → ChatGPT 다듬기

긴 문맥과 논리 구조는 Claude가 단단하다. 1차 초안 완성 후 ChatGPT에 "약점 비판해줘"로 던지면 두 모델의 관점 차이가 보고서의 사각지대를 잡아준다.

3. 엑셀 — Copilot(보유 시) / ChatGPT

M365 환경이라면 Copilot이 압도적. 시트 데이터를 직접 참조한다. 라이선스가 없다면 ChatGPT에 데이터 구조만 텍스트로 설명하고 함수·매크로를 받는 방식이 무료에서 가장 효율적이다.

4. 회의·인터뷰 녹취 분석 — Gemini

1M 컨텍스트와 영상/음성 멀티모달이 결합되면서 1시간짜리 회의 녹화를 통째로 분석할 수 있다. Claude는 텍스트로 변환된 이후에 더 잘 다룬다. Workspace에 녹취가 쌓이는 환경이라면 Gemini가 자연스럽다.

5. 코드 리뷰·리팩토링 — Claude Code

SWE-bench 77%대 점수가 의미하는 건 단순 자동완성이 아니라 멀티파일 컨텍스트에서 변경을 제안할 수 있다는 뜻이다. 사내 격리망에서는 사내 LLM(vLLM·Ollama 기반) + Continue.dev 조합으로 비슷한 경험을 만들 수 있다.

6. 이미지·슬라이드 시안 — ChatGPT(이미지) / Copilot(PPT)

ChatGPT의 이미지 생성으로 컨셉 시안을 만들고, Copilot으로 PPT 초안 골격을 잡는 방식이 빠르다.

자동화 레이어 — 일반 가이드가 다루지 않는 부분

IT 직무자라면 채팅 UI를 띄우고 매번 복사·붙여넣기 하는 단계에 머무르면 안 된다. 다음 세 가지 레이어 중 최소 하나는 익혀두는 게 1년 안에 격차를 만든다.

레이어 1: Google Apps Script — 가장 진입장벽 낮음

Gmail·Sheets·Drive를 JavaScript로 다룬다. UrlFetchApp으로 Gemini나 Claude API를 호출해 메일 분류·요약을 자동화할 수 있다.

function classifyInbox() {
  const apiKey = PropertiesService
    .getScriptProperties().getProperty('GEMINI_KEY');
  const threads = GmailApp.getInboxThreads(0, 20);

  threads.forEach(thread => {
    const subject = thread.getFirstMessageSubject();
    const snippet = thread.getMessages()[0].getPlainBody().slice(0, 500);

    const prompt = `다음 메일을 [업무/광고/개인/뉴스레터] 중 하나로 분류:
제목: ${subject}
본문: ${snippet}
출력: 분류명만`;

    const category = callGemini(prompt, apiKey).trim();
    const label = GmailApp.getUserLabelByName(category)
      || GmailApp.createLabel(category);
    thread.addLabel(label);
  });
}

운영 비용이 거의 0에 가깝다. 일 100건 분류해도 Gemini Flash 기준 월 몇십원 수준이다.

레이어 2: n8n — 노코드 워크플로

여러 서비스(Slack, Notion, Jira, GitHub, Gmail) 사이의 흐름을 비주얼로 설계한다. 셀프호스팅이 가능해서 사내 격리망에서도 운영 가능하다. 트리거 → LLM 호출 → 결과 라우팅 패턴이 5분 만에 만들어진다.

예: "Jira에 새 티켓이 생성되면 → Claude로 우선순위·담당자 후보를 추정 → Slack 채널에 요약 전송".

레이어 3: MCP (Model Context Protocol)

Claude Code, Cursor, VS Code 확장 등이 외부 도구·데이터에 표준화된 방식으로 접근하는 프로토콜이다. 자체 MCP 서버를 띄우면 사내 DB·이슈 트래커·문서 저장소를 IDE 안의 LLM이 직접 조회한다. 작년에 비해 안정성이 크게 올라왔고, 단순 자동완성을 넘어 '내 워크플로를 아는 에이전트'에 가까워졌다.

💡 도입 우선순위

Apps Script → n8n → MCP 순서가 무난하다. Apps Script는 Google 계정만 있으면 30분이면 첫 자동화가 돌고, n8n은 도커 한 줄로 띄울 수 있다. MCP는 IDE 친화적인 환경이 갖춰진 다음 단계.

Before / After — 실제로 줄어든 시간

스택을 정착시킨 뒤 개인 워크플로 변화를 측정해봤다. 정확한 수치라기보다는 체감의 정량화에 가깝지만, 비슷한 결과가 동료들에게도 나타났다.

업무 Before After 주요 도구
주간 보고서 작성 약 4시간 약 1.5시간 Claude + Copilot
받은편지함 정리 60분/일 15분/일 Apps Script + Gemini
회의 후속 정리 40분/회 10분/회 Gemini (영상 분석)
엑셀 함수·피벗 15분/건 검색 2분/건 Copilot / ChatGPT
코드 리뷰 1차 30분/PR 10분/PR Claude Code

주의해야 할 것들

  • 사내 정보 유출 리스크: 무료 티어는 학습 데이터로 활용될 수 있다. 회사 코드·고객 데이터는 절대 그대로 던지지 않는다. 사내 LLM이 있다면 그쪽을 우선 사용.
  • 환각(Hallucination) 검증: 숫자·인용·법률·계약 조항은 반드시 원문 대조. 글쓰기·구조화는 신뢰도 높지만 사실 단언은 별개.
  • API 키 관리: Apps Script든 n8n이든 키는 환경변수·암호화 저장. 깃에 push하지 않는다.
  • 토큰 비용 모니터링: 자동화 루프는 자칫 무한 호출이 발생한다. 일일 사용량 알림과 상한선을 반드시 설정.
마무리

업무 AI는 더 이상 "쓸까 말까"의 문제가 아니다. 두 개의 도구를 시나리오별로 분리하고, 자동화 레이어 한 층을 얹는 것 — 이게 2026년 IT 직무자의 기본 셋업이라고 본다. 일주일에 두세 시간이 회복되면 그 시간을 다시 학습에 투입할 수 있고, 격차는 그렇게 누적된다.

본 글에 언급된 모델 라인업·가격은 2026년 5월 기준이며, 향후 변경될 수 있습니다. 사내 도구 도입 전에는 반드시 회사의 보안 정책과 라이선스 정책을 확인하시기 바랍니다.

 

반응형

▲ TOP