본문 바로가기
Tech/AI & LLM

제미나이 API 무료티어 완전정리 + 발급부터 첫 호출까지 실전 가이드

by Hoft 2026. 6. 17.
728x90
320x100
이 글 3줄 요약

① 제미나이 API 무료 티어는 2026년 현재도 존재한다. 신용카드 없이 AI Studio에서 키 발급 후 바로 사용 가능. 단, 2026년 4월 1일부터 무료 대상은 Flash·Flash-Lite 계열로 좁혀졌고 Pro 계열은 유료로 전환됐다.

② "단가 무료"와 "실제 호출 가능 횟수"는 별개다. Flash·Flash-Lite·임베딩은 무료지만, 무료 티어는 입력 데이터가 모델 학습에 쓰인다.

③ 아래에서 키 발급 → 첫 호출(curl·Python·OpenAI 호환) → Rate Limit 확인까지 스크린샷 자리와 함께 단계별로 정리했다.

"제미나이 API 무료로 쓸 수 있나요?" 검색하면 블로그마다 숫자가 제각각이다. 어떤 글은 하루 1,500회라고 하고, 어떤 글은 250회라고 하고, 또 어떤 글은 "Pro 무료는 폐지됐다"고 한다. 어느 쪽이 맞는지 헷갈려서, 결국 구글 공식 가격 페이지와 요율(rate limits) 문서를 직접 열어 교차 확인했다.

결론부터 말하면 정보가 엇갈리는 데는 분명한 이유가 있었다. 구글이 무료 티어 한도를 비교적 짧은 기간에 여러 번 바꿨기 때문이다. 2025년 12월에 무료 할당량을 크게 줄였고, 2026년 4월 1일에는 Pro 계열을 유료 전용으로 돌리면서 Flash 무료 한도까지 한 차례 더 깎았다(하루 250회까지 내려간 시기). 그러다 5월 초 Flash-Lite 정식 출시와 함께 Flash 한도를 다시 하루 1,500회 수준으로 올렸다. 블로그마다 숫자가 다른 건 각 글이 "어느 시점"을 캡처했느냐의 차이다. 그래서 이 글에서는 (1) 2026년 6월 기준으로 무엇이 진짜 무료인지 정리하고, (2) 키 발급부터 첫 호출까지 직접 따라 할 수 있는 실전 절차를 스크린샷 자리와 함께 담았다.

1. 결론 — 무료 티어, 지금도 있다

구글 공식 안내에 따르면 신규 계정은 자동으로 Free Tier에서 시작한다. 신용카드 등록 없이 Google AI Studio에서 API 키를 만들어 실제 트래픽을 보낼 수 있고, 별도의 만료 기한도 없다.

다만 2026년 4월 1일 정책 변경 이후의 핵심을 먼저 못 박아두자. 무료 티어는 이제 Flash·Flash-Lite 계열만 해당한다. 최상위 Pro 모델(Gemini 3.1 Pro 등)은 무료에서 빠졌다. 그리고 "무료"는 두 축으로 나눠서 봐야 혼란이 없다.

  • 축 ① 토큰 단가가 무료인가 — 공식 가격 페이지에서 모델별로 "Free of charge"인지 확인.
  • 축 ② 실제로 몇 번 호출할 수 있나 — 요율(RPM/RPD) 한도. 구글이 공식 요율 문서에 모델별로 공개하고 있지만, 위에서 봤듯 값이 자주 바뀐다.

블로그마다 숫자가 다른 건 대부분 ②번 축(일일 호출 한도)이 시점마다 조정됐기 때문이다. 단가가 무료여도 일일 한도가 줄거나 0이 되면 사실상 못 쓰는 상태가 된다.

2. 무료로 쓸 수 있는 모델 (2026년 6월 기준)

공식 가격 페이지를 모델별로 훑어 "Free Tier = Free of charge"인 것과 "유료 전용"인 것을 갈라 정리했다. 4월 1일 개편 이후 기준이다.

모델 무료 티어 용도 / 비고
Gemini 3 Flash 무료 현재 무료 티어 권장 기본값. 2.5 Flash를 대체
Gemini 2.5 Flash 무료 안정 버전. 여전히 무난한 기본값(하루 약 1,500회)
Gemini 3.1 Flash-Lite 무료 고볼륨·저비용. 분류·추출·라우팅. 5월 정식 출시
Gemini 2.5 Flash-Lite 무료 가장 가벼운 모델
Gemini Embedding 무료 RAG 임베딩용. 무료 한도가 매우 넉넉(분당 토큰 큼)
Gemma (오픈 모델) 무료 유료 티어 자체가 없음(전면 무료)
Gemini 3.5 Flash 불가 2026년 5월 I/O 공개 최신 플래그십 Flash지만 API는 유료 전용($1.50/$9·1M). 무료 티어 기본은 Gemini 3 Flash
Gemini 3.1 Pro 불가 유료 전용(Not available). 4월 1일부터 무료 제외
Gemini 2.5 Pro 사실상 불가 Pro 계열 유료 전환. 무료엔 트라이얼 수준(약 5 RPM·하루 50회) 흔적만 남아 사실상 막힘
이미지·영상·음악 생성
(Nano Banana / Veo / Lyria)
불가 거의 전부 유료 전용
💡 정리

텍스트·임베딩 작업은 Flash / Flash-Lite 계열로 무료가 충분하다. 반면 이미지·영상·음악 생성과 Pro 계열(3.1 Pro·2.5 Pro), 그리고 최신 3.5 Flash는 무료 티어에서 막혀 있다. 입문·프로토타이핑·저볼륨 자동화라면 Gemini 3 Flash 또는 2.5 Flash로 시작하는 데 부족함이 없다.

3. 무료 티어의 함정 5가지 (꼭 알고 시작하자)

① 한도가 자주 바뀐다 (가장 먼저 알 것)

앞서 말한 대로 구글은 무료 한도를 예고 없이 조정해 왔다. 2025년 12월 대폭 축소 → 2026년 4월 1일 Pro 유료화 + Flash 한도 축소(하루 250회) → 5월 초 Flash 한도 복원(하루 1,500회)으로 반년 사이 세 번이나 출렁였다. 따라서 "이 블로그에 적힌 숫자"를 영구 사양으로 믿지 말고, 운영에 들어가기 전 반드시 본인 콘솔에서 현재 값을 확인하는 습관이 필요하다.

② 입력 데이터가 모델 학습에 쓰인다

가장 중요한 부분이다. 공식 가격표의 모든 무료 티어 행에는 "제품 개선에 사용됨(Used to improve our products: Yes)"이라고 적혀 있다. 즉 무료 티어로 보낸 프롬프트와 응답을 구글이 학습에 활용할 수 있다. 사내 문서나 민감한 데이터를 무료 티어에 넣으면 안 되는 이유다. 학습 제외를 보장받으려면 유료 티어로 전환해야 한다(유료는 "No"로 표기된다).

③ 한도는 API 키가 아니라 "프로젝트" 단위

요율 한도는 키별이 아니라 Google Cloud 프로젝트별로 적용된다. 같은 프로젝트 안에서 키를 여러 개 만들어도 할당량은 한 풀(pool)에서 공유된다. 일일 한도(RPD)는 태평양 시간 자정에 리셋된다(한국 시간 기준 대략 오후 4~5시).

④ 빌링을 켜면 그 프로젝트의 무료 티어가 사라질 수 있다

한 프로젝트에 결제를 연결하는 순간 그 프로젝트에서는 무료 할당량에 들어갈 호출까지 첫 토큰부터 과금되는 사례가 보고된다. 또한 빌링을 켜면 구글의 의무 지출 상한(Tier 1 기준 월 약 $250)에 묶여, 상한 소진 시 요청이 일시 중단될 수 있다. 무료 테스트와 유료 운영을 병행할 거라면 프로젝트를 분리하는 게 안전하다. (시점·계정에 따라 다를 수 있으니 본인 콘솔에서 확인 권장)

⑤ 지역 제한

EU·EEA·영국·스위스 등 일부 지역은 무료 티어의 상업적 사용에 제약이 있다. 한국은 일반적으로 지원 대상이다.

4. [실전] API 키 발급하기

여기서부터는 직접 따라 하는 부분이다. 스크린샷 자리를 표시해 뒀으니, 실제 화면을 캡처해 해당 위치에 넣으면 된다.

1Google AI Studio 접속

aistudio.google.com에 접속해 구글 계정으로 로그인한다. 처음이면 약관 동의 화면이 한 번 뜬다.

2'Get API key' 메뉴 진입

좌측(또는 우측 상단) 메뉴에서 Get API key를 클릭한다. API 키 관리 페이지로 이동한다.

3'Create API key' 클릭 → 프로젝트 선택

Create API key를 누르면 어떤 Google Cloud 프로젝트에 키를 만들지 묻는다. 기존 프로젝트를 고르거나 새 프로젝트를 만든다. 무료로만 쓸 거라면 빌링이 연결되지 않은 프로젝트를 고르는 게 핵심이다(함정 ④ 참고).

4키 생성 완료 → 복사 & 보관

몇 초 뒤 AIza...로 시작하는 키가 생성된다. 복사 버튼으로 복사해 안전한 곳에 보관한다. 이 키는 비밀번호와 같으니 깃허브 등에 그대로 올리면 안 된다.

🔐 키 보관 팁

코드에 키를 직접 적지 말고 환경변수로 관리하자. 터미널에서 export GEMINI_API_KEY="발급받은키" (윈도우 PowerShell은 $env:GEMINI_API_KEY="...")로 등록하면 아래 예제를 그대로 쓸 수 있다.

5. [실전] 첫 호출 — 3가지 방법

아래 예제는 무료로 쓸 수 있는 gemini-2.5-flash를 기준으로 한다. 더 최신 무료 모델을 쓰고 싶다면 모델명만 현재 권장값(예: Gemini 3 Flash 계열)으로 바꾸면 된다.

방법 A. curl (설치 없이 가장 빠름)

터미널만 있으면 된다. 키를 환경변수에 넣었다는 전제다.

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.5-flash:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{ "text": "제미나이 API를 한 문장으로 소개해줘." }]
    }]
  }'

방법 B. Python (google-genai SDK)

실제 프로젝트라면 공식 파이썬 SDK가 편하다. 먼저 설치한다.

pip install google-genai

그다음 아래 코드를 실행한다.

from google import genai

# 환경변수 GEMINI_API_KEY 를 자동으로 읽는다
client = genai.Client()

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="제미나이 API 무료 티어의 장점 3가지를 알려줘."
)

print(response.text)

방법 C. OpenAI 호환 엔드포인트 (기존 코드 재활용)

이미 OpenAI SDK 기반으로 짜둔 코드가 있다면, base_url만 바꿔서 제미나이로 붙일 수 있다. LiteLLM, OpenWebUI 같은 도구와 연동할 때 특히 유용하다.

from openai import OpenAI

client = OpenAI(
    api_key="발급받은_제미나이_키",
    base_url="https://generativelanguage.googleapis.com/v1beta/openai/"
)

resp = client.chat.completions.create(
    model="gemini-2.5-flash",
    messages=[{"role": "user", "content": "안녕!"}]
)
print(resp.choices[0].message.content)

6. [실전] 내 Rate Limit 확인 & 429 대응

본인 한도 확인하기

구글은 모델별 요율 한도를 공식 문서(ai.google.dev/gemini-api/docs/rate-limits)에 공개하고 있다. 다만 값이 자주 바뀌므로, 내 계정에 실제 적용된 한도는 AI Studio의 사용량/한도 화면에서 직접 확인하는 게 가장 정확하다. 참고로 2026년 6월 기준 무료 티어의 대략적인 모습은 다음과 같다(공식 표기·변동성 큼).

모델 RPM(분당) RPD(하루) TPM(분당 토큰)
Gemini 3 Flash / 2.5 Flash 약 10~15 약 1,500 약 25만~100만
Flash-Lite (3.1 / 2.5) 약 15~30 약 1,000~1,500 약 100만
Gemini 2.5 Pro (사실상 트라이얼) 약 5 약 50 제한적

429 에러가 떴다면

한도를 초과하면 429 RESOURCE_EXHAUSTED 에러가 난다. RPM·TPM·RPD 셋 중 하나라도 넘으면 발생하므로, 재시도 로직을 넣어두는 게 안전하다. 지수 백오프(exponential backoff) 예시는 다음과 같다.

import time
from google import genai
from google.genai import errors

client = genai.Client()

def ask(prompt, retries=5):
    delay = 1
    for i in range(retries):
        try:
            return client.models.generate_content(
                model="gemini-2.5-flash",
                contents=prompt
            ).text
        except errors.APIError as e:
            if e.code == 429 and i < retries - 1:
                time.sleep(delay)   # 1s → 2s → 4s → 8s ...
                delay *= 2
            else:
                raise

print(ask("백오프 재시도 테스트"))
💡 무료 한도를 아끼는 팁

단순 분류·추출·요약은 가장 가벼운 Flash-Lite로 돌리고, 복잡한 추론이 필요한 단계에서만 상위 Flash를 호출하는 식으로 모델을 나누면 한도를 훨씬 오래 쓸 수 있다. 또한 키를 더 만들어도 같은 프로젝트면 한도가 늘지 않으니, 한도가 더 필요하면 별도 프로젝트를 쓰자.

7. 마무리

한 줄 결론

제미나이 API 무료 티어는 입문·프로토타이핑·저볼륨 자동화에 충분하다. Flash·Flash-Lite 계열과 임베딩을 신용카드 없이 쓸 수 있고, OpenAI 호환 엔드포인트까지 제공한다. 다만 2026년 4월부터 Pro 계열과 최신 3.5 Flash는 유료 전용이고, 무료 티어는 데이터가 학습에 쓰이며, 한도는 프로젝트 단위로 자주 바뀐다는 점만 기억하면 된다.

정리하면, 무료 티어로 "되는 것"과 "안 되는 것"의 경계가 분명하다. Flash·Flash-Lite 텍스트·임베딩은 OK, 이미지·영상 생성과 Pro 계열·최신 3.5 Flash는 유료. 그리고 무료의 진짜 비용은 "데이터가 학습에 쓰인다"는 점이다. 개인 학습·실험용이면 이 정도 트레이드오프는 충분히 합리적이라고 본다.

다음 글에서는 이 무료 키로 간단한 RAG 파이프라인이나 챗봇을 붙여보는 과정을 다뤄볼 예정이다.

※ 본 글의 모델·요금·한도 정보는 구글 공식 가격/요율 문서와 2026년 6월 기준 공개 자료를 토대로 작성했습니다. 무료 티어 정책·한도는 수시로(반년 새 3차례 이상) 변경된 이력이 있으니, 실제 사용 전 반드시 본인 AI Studio 대시보드와 공식 문서에서 최신 값을 확인하시기 바랍니다.
참고: Google AI for Developers 공식 문서 (ai.google.dev/gemini-api/docs/pricing, /rate-limits, /billing)
728x90
반응형

▲ TOP