Wie Aurion.AI IT-Support-Anrufe lost
Vom Moment des eingehenden Anrufs bis zur Problemlosung — so funktioniert Aurion.AIs KI-Sprach-Pipeline im Detail.

Anruf eingehend
Mitarbeiter meldet sich
Ihre bestehende Telefonnummer über Twilio SIP, ein WebRTC-Widget in Ihrem Intranet oder die Aurion.AI Support Mobile App (iOS und Android). Drei Kanäle, ein KI-Agent.
Twilio SIP Trunking → LiveKit SIP → LiveKit Room · WebRTC Widget · Aurion.AI Support (React Native / Expo)

KI hort zu
Sprache wird in Echtzeit in Text umgewandelt
Aurion.AI nutzt OpenAI Whisper fur Sprache-zu-Text mit semantischer Sprecherwechselerkennung — ein KI-Modell, das versteht, wann der Anrufer seinen Gedanken beendet hat, nicht nur, wann er aufhort zu sprechen.
Audio-Frames → Silero VAD → OpenAI Whisper STT → Semantischer Sprecherwechseldetektor (Qwen2.5-0.5B).

KI authentifiziert
Anrufer wird mit sprachbasierter 2-Faktor-Authentifizierung verifiziert
Bevor auf sensible Informationen zugegriffen wird, verifiziert Aurion.AI die Identitat des Anrufers mittels zwei Faktoren — Namenserkennung (Fuzzy-Matching) und Badge-ID (bcrypt-gehasht).
LLM-Namensextraktion → Requester-Tabelle Fuzzy-Suche (80 %-Schwellenwert) → bcrypt Badge-Verifizierung.

KI lost
KI versteht das Problem und ergreift Massnahmen
Aurion.AIs LLM versteht die Absicht des Anrufers und nutzt die richtigen Tools zur Lösung — Wissensdatenbank durchsuchen, Tickets erstellen, Lösungen Schritt fur Schritt durchgehen.
Claude/GPT mit MCP-Tool-Calling → JSON-RPC 2.0 Sidecar → Freshservice oder HaloITSM API.

KI antwortet
Naturliche Sprachantwort in unter einer Sekunde
Die Antwort der KI wird mit Cartesias neuronalem Text-to-Speech-Engine in naturliche Sprache umgewandelt. Vier kuratierte neuronale Stimmen, jeweils lokalisiert in alle 6 unterstützten Sprachen.
LLM-Antwort → Cartesia TTS API → LiveKit Audio-Stream → Telefon-Lautsprecher. Gesamt: < 1 Sekunde.

Alles protokolliert
Volle Transparenz in Ihrem Admin-Dashboard
Jeder Anruf erzeugt einen vollständigen Datensatz: Transkript, Aufnahme, Tool-Aufrufe, Ergebnis und Analysen. Nichts passiert in einer Blackbox.
Gesprachsmetadaten → PostgreSQL. Aufnahme → S3 (AES256). Analysen → Dashboard-API.
Uberzeugen Sie sich selbst
Buchen Sie eine 15-minutige Demo und sehen Sie, wie Aurion.AI einen echten IT-Support-Anruf bearbeitet — von Anfang bis Ende.