Claude API Key, Console und Pricing: der praktische Start
Die Claude API ist stark, wenn sie sauber in App, Backend oder Automation eingebunden wird. Der Start ist einfach, Production braucht aber Modellstrategie, Kostenkontrolle und Monitoring.
API Key und Console
Der Einstieg läuft über die Anthropic Console: Workspace anlegen, Billing konfigurieren, API Key erzeugen und den Key sicher im Secret-Manager oder in Umgebungsvariablen speichern.
API Keys gehören nie in Repos, Frontend-Code, Screenshots oder CLAUDE.md. In Team-Setups trennen wir Entwicklungs-, Test- und Production-Keys.
Pricing richtig lesen
Die offizielle Pricing-Seite rechnet in Millionen Tokens. Relevant sind Input, Output, Cache Writes, Cache Hits, Batch-Verarbeitung und bei langen Kontexten eventuelle Premium-Raten.
Für die meisten Apps ist nicht der einzelne Call teuer, sondern Wiederholung: lange System-Prompts, viele Retries, schlecht geschnittene Dokumente und fehlendes Caching.
Modellwahl für Production
- Haiku: schnelle Klassifikation, Extraktion, Routing, einfache Transformationen.
- Sonnet: Standard für Analyse, Content, Coding-nahe Aufgaben und robuste Workflows.
- Opus: schwierige Reasoning-Aufgaben, kritische Entscheidungen und lange Agentenläufe.
Gute Architekturen nutzen mehrere Modelle statt alles über das teuerste Modell laufen zu lassen.
Production-Checkliste
- Keys und Workspaces trennen.
- Rate Limits und Retry-Strategie definieren.
- Prompt Caching für wiederkehrenden Kontext nutzen.
- Costs, Latency und Fehlerquoten monitoren.
- JSON-Outputs validieren und reparieren.
- Fallback-Modell und Budget-Stopps einbauen.
Für ein echtes Beispiel: Claude API in Production bei meineGBU.com.
API-Architektur, die in Production hält
- Gateway: Ein eigener Backend-Endpunkt nimmt App-Anfragen entgegen. Der API-Key bleibt serverseitig.
- Prompt-Schicht: System-Prompts, Beispiele und Modellwahl liegen versioniert im Backend.
- Validation: JSON-Schema, Pflichtfelder und Fehlerfälle werden geprüft.
- Observability: Kosten, Latenz, Modell, Fehlerrate und User-Flow werden geloggt.
- Fallback: Bei Rate Limit, Timeout oder Budgetstop gibt es eine definierte Antwort.
Key-Hygiene: Was niemals passieren darf
- API-Key im Frontend ausliefern.
- Key in Git committen.
- Production- und Development-Key mischen.
- Alle Entwickler mit demselben persönlichen Key arbeiten lassen.
- Ohne Budget-Alerts und Usage-Monitoring starten.
Ein kompromittierter Key ist kein theoretisches Risiko. Er kann direkt Kosten erzeugen und sensible Datenflüsse offenlegen.
Beispiel: Dokumenten-Workflow mit Kostenkontrolle
Ein robuster Dokumenten-Workflow läuft nicht "PDF rein, Opus raus". Besser:
- Dokument in Abschnitte zerlegen.
- Haiku klassifiziert Dokumenttyp und Risiko.
- Sonnet extrahiert strukturierte Felder.
- Opus prüft nur kritische oder unklare Fälle.
- Output wird gegen Schema validiert und als Review-Entwurf gespeichert.
So entsteht Qualität dort, wo sie nötig ist, ohne jedes Dokument maximal teuer zu verarbeiten.