Head of AI Engineering (f/m/x)

neoshare
München

Your mission

About neoshare
We’re a Munich-based AI-first fintech scale-up (founded 2019) with offices in Munich, Frankfurt, and Sofia. Our SaaS platform brings banks, investors, and advisors together to collaborate on complex financial deals — making due diligence faster, smarter, and more transparent. Our AI features are already live with leading banks. Now we’re scaling.


The Role
Own and evolve our AI engineering function — transforming a 15–20 person ML team from research-heavy to a high-throughput, production-grade organization. You’ll partner with the Director of AI on strategy, build the platform that unifies LLM access, RAG, and backend services, and ship reliable, scalable AI features that change how banks work.


Key responsibilities

  • Team leadership and org build
    • Hire, mentor, and develop a high-performing team; set the technical bar, operating rhythms, and code/research review practices
    • Organize sub-teams (e.g., Core Modeling, AI Platform/Infra, Integrations) with clear ownership, SLOs, and on-call
    • Manage roadmap, capacity planning, and delivery across parallel initiatives
  • Architecture and platform
    • Own the LLM gateway: unified APIs and proxy layers for multi-provider routing (OpenAI, Gemini, Bedrock), with rate limits, fallbacks, and cost tracking
    • Build high-performance RAG pipelines (ingestion, embeddings, vector stores, caching) with robust observability and safety guardrails
    • Partner with Java/ NestJS teams to define clean async contracts, schemas, and eventing patterns; drive low-latency, scalable inference
  • Model lifecycle and operations
    • Lead end-to-end model and prompt lifecycle: data curation, training/fine-tuning, evaluation, deployment, rollback
    • Establish LLMOps / MLOps : model/prompt registries, CI/CD, canary/A/B tests, offline/online evals, drift and cost monitoring
    • Optimize inference throughput and cost (autoscaling, batching, quantization/distillation, caching)
  • Strategy and collaboration
    • Translate company goals into an AI/ML roadmap with measurable outcomes; balance exploration with reliability and cost
    • Own build-vs-buy/vendor strategy for models, infrastructure, and data services; manage budgets and SLAs
  • Governance and security
    • Implement data privacy, security, and compliance practices (RBAC, secrets, auditability); track prompt/model lineage and reproducibility
    • Define incident response, runbooks, and postmortems for AI features

Your profile

  • 5+ years as a backend engineer and 4+ years leading AI/ML engineering in production (10+ years total experience ideal)
  • Deep architecture expertise in Java (JVM) and/or Node.js ( NestJS ), distributed systems, APIs, microservices, and messaging/streaming
  • Hands-on with LLM stacks: orchestration (e.g., LangChain / LlamaIndex or custom), vector DBs (Pinecone, Qdrant , FAISS), cloud AI (e.g., AWS Bedrock)
  • Proven operation of systems at scale (millions of daily API calls) with strong SLOs, observability, and incident management
  • MLOps foundations: model registries, experiment tracking, CI/CD, Kubernetes, IaC (e.g., Terraform), security best practices
  • Excellent communication and stakeholder management; strong product sense focused on shipping user-facing feature
Nice to have
  • Experience with GPU/accelerator serving and optimization ( vLLM , TGI, Triton, ONNX Runtime)
  • Cost optimization for LLM workloads (token budgets, dynamic routing, caching)
  • Evaluation and safety/red-teaming for generative systems; startup/high-growth experience
Impact metrics
  • Platform: adoption of a unified LLM gateway; standardized observability and cost reporting
  • Delivery: 2–3 user-facing AI features shipped with clear SLOs and measurable impact
  • Reliability/cost: reduced average latency and cost per request; autoscaling and caching in place
  • Org: sub-team structure established ; improved code quality and on-time delivery; targeted hiring completed

Our stack
  • Backend: Java (JVM), Node.js ( NestJS ); event-driven microservices; API gateways/proxies
  • AI platform: Python, PyTorch , LLM orchestration, prompt pipelines/registry; vector DBs (Pinecone, Qdrant ); RAG services
  • Infra/DevOps: AWS (incl. Bedrock), Kubernetes, Terraform, CI/CD, Observability ( OpenTelemetry , Prometheus/Grafana)

Why us?

International & Inclusive Team: Collaboration with diverse teams at our locations in Munich, Frankfurt, Berlin, and Sofia.
Modern & Dog-friendly Offices: Ergonomic, green, and inspiring for collaboration and productivity.
Flexibility: 30 vacation days, flexible working hours, and hybrid work.
Special Time Off: Additional half-day off on Christmas Eve and New Year's Eve.
Workation: Work remotely for a limited period each year from selected destinations.
Wellbeing & Mobility Benefits: Support for well-being and sustainable lifestyle:

  • Urban Sports/EGYM Club subsidy: Monthly support for your membership.
  • Jobticket: 50% monthly subsidy for the Deutschlandticket.
  • JobRad: Leasing of bicycles or e-bikes at attractive conditions.
Candidates must have the right to work in the EU; visa sponsorship is not provided for this role.

About us

neoshare AG, founded in 2019 in Munich, has quickly evolved into an international fintech company and now operates locations in Munich, Frankfurt and Sofia, Bulgaria. As an “AI-First Company,” it offers an innovative end-to-end solution with its SaaS platform "neoshare" for the efficient digitization and management of large-scale project and real estate financing. In close collaboration with banks and real estate companies, the product is continuously developed to sustainably transform the financial sector.

Veröffentlicht am 2026-05-15

Empfohlene Jobs

Aushilfe Service (m/w/d) / Werkstudent

StepStone Jobs
München

Jedes Hotel der Dean Group ist so individuell wie das Viertel, in dem es steht. Mit viel Liebe zum lokalen Flair und kleinen, besonderen Details schaffen wir Orte, die neugierig machen – und alles and…

Details Anzeigen
Veröffentlicht am 2026-04-21

Praktikant Prozessanalyse & KI-Enablement (w/m/x)

München

Unser Team bei der BMW Group ermöglicht innovative Vertriebsprozesse und fördert die Weiterentwicklung durch Prozessanalyse und KI-Enablement. Im Rahmen deines Praktikums erhältst du tiefe Einblick…

Details Anzeigen
Veröffentlicht am 2026-01-08

Produktionshelfer (gn) Gute Bezahlung

Gi Group Deutschland GmbH (Düsseldorf )
München

Produktionshelfer (gn) Gute Bezahlung in München, Vollzeit ab sofort Die Gi Group ist ein international agierender Personaldienstleister mit mehr als 500 Standorten in 40 Ländern. Angebot -…

Details Anzeigen
Veröffentlicht am 2026-04-21

Mitarbeiter:in Reisendenlenkung

DB Zeitarbeit GmbH
München

Zum nächstmöglichen Zeitpunkt suchen wir dich als Zeitarbeitnehmer:in im Auftrag der DB InfraGO für einen Einsatz als Mitarbeiter:in in der Reisendenlenkung (w/m/d) am Standort München. Als Zeitarbei…

Details Anzeigen
Veröffentlicht am 2026-03-30

Projektingenieur (m/w/d) Life Science

Liqmatic GmbH
München

Concept-, Basic- und Detail-Design-Engineering von Automatisierungs- und Prozessleitsystemen Ausarbeitung von Konzeptdokumenten und Spezifikationen koordinative Tätigkeiten als Schnittstelle zw…

Details Anzeigen
Veröffentlicht am 2025-07-26

Sales Specialist im Außendienst (m/w/d)

Henry Schein Medical GmbH
München

Doing well by doing good Henry Schein, Inc. (Nasdaq: HSIC) bietet mit einem breiten Netzwerk an Menschen und Technologien hochwertige Lösungen für Mediziner und Fachkräfte im Gesundheitsbereich. M…

Details Anzeigen
Veröffentlicht am 2026-05-14

IT-Vertriebsmitarbeiter (m/w/d) / Sales Manager (m/w/d)

AraCom IT Services GmbH
München

IT-Vertriebsmitarbeiter (m/w/d) / Sales Manager (m/w/d) für Augsburg, München, Bamberg und Stuttgart Du brennst für den Vertrieb? IT - Sind für dich nicht nur zwei Buchstaben, sondern eine span…

Details Anzeigen
Veröffentlicht am 2026-04-12

Sales Assistant (m/w/d)

Arina Deutschland GmbH
München

Unsere geschätzte Kollegin, die über viele Jahre unser Sales-Team mit Herz, Genauigkeit und Humor unterstützt hat, verabschiedet sich bald in den wohlverdienten Ruhestand. Für ihre Nachfolge suc…

Details Anzeigen
Veröffentlicht am 2026-05-09

HR Business Partner - Recruiting (m/w/d)

CIMPA
München

Unternehmensbeschreibung Wer wir sind – CIMPA GmbH Als hundertprozentige Tochtergesellschaft der Sopra Steria Gruppe mit mehr als 45.000 Mitarbeitern in über 20 Ländern bietet CIMPA innovative…

Details Anzeigen
Veröffentlicht am 2026-04-17

Java Softwareentwickler (m/w/d) gesucht

RADAS Jobbörse & Personalvermittlung GmbH
München

+++ DIREKTVERMITTLUNG in Festanstellung (keine Zeitarbeit) / Vermittlungsgutscheine (AVGS) werden akzeptiert +++ Bei Fragen einfach unverbindlich anrufen: 03048479484 oder einen Rückruf vereinbaren…

Details Anzeigen
Veröffentlicht am 2026-05-13