Worum es geht Wir bauen die Infrastruktur, die KI in der Rechtsbranche tatsächlich belastbar macht, nicht als Demo, sondern in Produktion, mit messbarer juristischer Qualität.
Dafür suchen wir Menschen, die tief in die Mathematik und Architektur moderner LLM-Systeme eintauchen wollen, nicht nur APIs verketten.
Wenn du dich in den letzten zwölf Monaten gefragt hast, ob es irgendwo einen Job gibt, in dem du die ganze Tiefe moderner KI gleichzeitig brauchst: hier ist er.
Aufgaben Dein Beitrag Eine Multi-Provider-LLM-Council-Architektur, in der mehrere Modelle parallel arbeiten und über strittige juristische Fragen abstimmen, mit deterministischem Replay für reproduzierbare Evaluations.
Ein Eval-Framework von Grund auf: stratifizierte Gold-Standard-Datensätze, Inter-Rater-Reliability gegen menschliche Anwälte, Backtesting-Pipelines, Confidence-Kalibrierung.
Eine mathematisch belastbare Antwort auf die zentrale Forschungsfrage: Wie quantifiziert man "juristische Belastbarkeit"? Eigene Forschungsbeiträge, Konferenzpaper und Open-Source-Releases sind explizites Projektziel.
Eine produktionsreife Orchestrierungs-Infrastruktur, die täglich zehntausende Inferenz-Calls über mehrere Modellfamilien koordiniert, mit voller Observability und Fehlertoleranz.
Warum das spannend ist Forschungstiefe wie in einer akademischen Gruppe, mit Produktions-Hebel wie in einem Top-Startup.
Die meisten AI-Rollen sind API-Wrapper.
Hier baust du die Schicht darunter.
Recht ist eine der größten noch unautomatisierten Branchen.
Wer KI in einer traditionellen, hochregulierten Branche zum Laufen bringt, hat ein deutlich schwierigeres Problem als Web-Demos, und einen entsprechend größeren Hebel.
Klare Deadlines, klare Deliverables.
Ein 24-Monats-Plan mit hartem Meilenstein nach 12 Monaten und konkreten Forschungsoutputs.
Du wirst in 24 Monaten mehr über produktionsreife LLM-Systeme gelernt haben als in fünf Jahren bei einem Konzern.
Das versprechen wir dir.
Qualifikation Was du mitbringen solltest P.