AI Data Engineer im Bereich Wissensmanagement Bots (m/w/d)

SOLCOM GmbH
München

Aufgaben:


Aktuell sind wir auf der Suche nach einem AI Data Engineer im Bereich Wissensmanagement Bots für einen unserer Kunden.

Auslastung 100%, 2-3 Tage pro Quartal onsite, der Rest remote

Aufgaben:
- Entwicklung und Optimierung von skalierbaren Datenmodellen für große Datenmengen (Big Data)
- Aufbau und Pflege von Datenbanken und Data-Warehouses, insbesondere mit PostgreSQL
- Sicherstellung der Performance und Skalierbarkeit von Datenarchitekturen für mehrere tausend parallele Nutzer (inkl. Query-Optimierung, Index-Strategien, Partitionierung)
- Entwicklung und Umsetzung robuster ETL-/ELT-Pipelines mit Fokus auf:
- Skalierbarkeit und Fehlerisolierung
- Observability (Logging, Metrics, Tracing)
- Design und Implementierung moderner Data-Lake- / Data-Warehouse-Architekturen mit Schichten wie:
- Raw Layer
- Staging/Cleansing
- Curated/Business Layer
- Entwicklung und Optimierung von ETL-/ELT-Strecken mit Tools wie z. B. Airflow, dbt, Kafka, Spark oder vergleichbaren Technologien
- Sicherstellung der Datenqualität in produktiven Pipelines durch:
- Schema-Validierung, Null-/Range-Checks, Duplikat-Prüfungen
- automatisierte Tests, Data Contracts und Data Lineage
- Monitoring von Freshness, SLAs/SLOs und Alerting
- Konzeption und Umsetzung von Batch- und Near-Real-Time-Pipelines (inkl. Event-Driven-Architekturen, Streaming-Lösungen, DLQ-Handling, Replay-Fähigkeit)
- Optimierung von SQL-Abfragen auf sehr großen Tabellen (Execution Plans, Index-Design, Window Functions, Materialized Views, Voraggregation etc.)
- Entwicklung performanter Datenverarbeitungslogik in Python (z. B. Pandas, Spark, Dask, Polars) inkl. Umgang mit Speicher- und Skalierungsgrenzen
- Enge Zusammenarbeit mit anderen Entwicklern und Fachbereichen zur Umsetzung datengetriebener Lösungen und Etablierung guter Data-Engineering-Praktiken

Anforderungen:


Must:
+ Mehrjährige praktische Erfahrung in der Datenmodellierung und im Aufbau skalierbarer Datenarchitekturen für große Datenmengen
+ Sehr gute SQL-Kenntnisse und fundierte Erfahrung mit relationalen Datenbanken, insbesondere PostgreSQL (inkl.:
- Performance-Tuning, Index-Strategien, Partitionierung
- Nutzung von Window Functions
+ Mehrjährige Python-Erfahrung im Data-Engineering-Umfeld (z. B. Pandas, PySpark, Dask, Polars) inkl.:
- effizienter Umgang mit großen Datenmengen (Vektorisierung, Chunk Processing, Typenoptimierung)
- sinnvoller Aufteilung von Logik zwischen SQL und Python
+ Erfahrung in der Entwicklung robuster ETL-/ELT-Pipelines:
- Orchestrierung (z. B. Airflow oder vergleichbare Tools)
- Trennung von Raw-, Staging- und Business-Layern
- Berücksichtigung von Schema-Evolution
+ Praxis in der Sicherstellung von Datenqualität in produktiven Umgebungen:
- Einsatz von Data-Quality-Frameworks (z. B. Great Expectations, dbt Tests oder vergleichbar)
+ Erfahrung mit Observability im Data-Engineering-Kontext:
- Logging, Metriken, Tracing (z. B. Prometheus, Grafana, OpenTelemetry oder ähnliche Lösungen)
- Debugging von sporadisch fehlschlagenden Pipelines (Race Conditions, Timeouts, Speicherengpässe etc.)
+ Erfahrung im Umgang mit großen Datenmengen (Big Data) und verteilten Systemen (z. B. Spark, Kafka, Streaming-Frameworks)
+ Nachweisbare Erfahrung in der Entwicklung von Lösungen, die für hohe Nutzerzahlen und parallele Zugriffe optimiert sind
+ Kenntnisse in der Optimierung von Datenbankabfragen und Performance-Tuning, insbesondere:
- Analyse von Execution Plans (EXPLAIN/EXPLAIN ANALYZE)
- Vermeidung typischer Anti-Patterns (SELECT *, unnötige Subqueries, nicht indexierbare Filter)
+ Idealerweise Erfahrung mit Cloud-Technologien und modernen Datenplattformen (z. B. AWS, Azure, GCP, Snowflake, Databricks oder vergleichbar)
+ Verständnis typischer Data-Engineering-Anti-Patterns (z. B. zu viel Businesslogik in Skripten, fehlende Data Contracts, Monolith-ETL, fehlende Idempotenz, CSV als Dauerformat)
+ Erfahrung im Design von Near-Real-Time-Architekturen (Streaming, Event Processing, Exactly-/At-least-once-Semantik, Umgang mit Late Data) ist ein Plus

+ Teamplayer, kein Einzelkämpfer
+ Ausgeprägtes analytisches Denkvermögen und strukturierte, qualitätsorientierte Arbeitsweise
+ Teamfähigkeit und Fähigkeit, Fachbereiche sowie andere Tech-Teams in Daten- und Architekturfragen zu beraten
+ „Product Mindset“ im Umgang mit Datenprodukten (Ownership, Versionierung, Stabilität, Wartbarkeit)

Zusätzliche Informationen:


Konnten wir Ihr Interesse wecken? Dann freuen wir uns auf die Zusendung Ihres aussagekräftigen Expertenprofils unter Angabe Ihrer Stundensatzvorstellung.
Veröffentlicht am 2026-06-02

Empfohlene Jobs

Bankkaufmann als Kundenberater (m/w/d)

Sparda-Bank München eG
München

Die Sparda-Bank München eG ist Deutschlands erste Gemeinwohl-Bank. In ihrem Geschäftsgebiet Oberbayern betreut sie mit über 700 Mitarbeitenden ca. 349.000 Kundinnen und Kunden. Die 1930 gegründete Ge…

Details Anzeigen
Veröffentlicht am 2025-09-10

Risk-Assessment & Release Process (m/w/d)

Alpha-Engineering KG
München

Dein neuer Job im Bereich Engineering, IT & Office Werde jetzt Teil eines starken Teams! Wir suchen ab sofort in München eine/n Risk-Assessment & Release Process (m/w/d). € 60.000 - € 70.000 p.a. bei…

Details Anzeigen
Veröffentlicht am 2026-06-03

Junior Marketplace Manager (m/w/d) Fokus Amazon EU

New Flag GmbH
München

Das erwartet Dich bei uns Als Junior Marketplace Manager (m/w/d) hast Du echten Impact und unterstützt unser E-Commerce Key-Account -Team bei Aufbau und Weiterentwicklung unserer bekannten Brands wie …

Details Anzeigen
Veröffentlicht am 2026-06-03

Stellvertretende Filialleitung (m/w/d)

Creditplus Bank
München

Wer wir sind Wir machen Wünsche machbar – unsere Mission ist es, das Leben unserer Kund:innen zu bereichern und mit unseren Finanzdienstleistungen Träume zu verwirklichen. Wir verstehen uns nicht …

Details Anzeigen
Veröffentlicht am 2026-05-06

Warenpräsentation im Außendienst - Verkauf in Teilzeit (w/m/d)

beeline Group
München

beeline ist eines der größten internationalen Handelsunternehmen für Modeschmuck. Wir bieten die Accessoires unserer Marken SIX, I AM, TOSH und weiteren Labels im stationären Handel  im Umfeld vo…

Details Anzeigen
Veröffentlicht am 2026-05-18

Praktikum im Bereich Strategisches Providermanagement

München

Bei der BMW Bank GmbH, einer 100%igen Tochtergesellschaft der BMW AG, verbindet uns die Begeisterung, unseren Kunden mit modernen Finanzierungslösungen Freude am Fahren zu vermitteln. Als Teil von…

Details Anzeigen
Veröffentlicht am 2026-01-27

Produktionsmitarbeiter (m/w/d)

Personalhansa GmbH
München

Gemeinsam mehr erreichen! Für unseren Kunden in München suchen wir einen Produktionsmitarbeiter (gn) Ihre Aufgaben: Ausführen von manuellen Montagearbeiten Montagemängel an Teilen, Baugrupp…

Details Anzeigen
Veröffentlicht am 2026-05-30

Alliance Manager Deutsche Telekom

Huawei Europe
München

Stellenbeschreibung – Alliance Manager Deutsche Telekom Region Süd & Südwest (Deutschland) Bereich: Carrier Partner Development / Enterprise Business Fokus: B2B-Geschäft mit Deutsche Telekom …

Details Anzeigen
Veröffentlicht am 2026-04-28

IT Support (m/w/d)

Puro Personaldienstleistung
München

Starten Sie bei einem IT Unternehmen aus München  im Service Desk . Mit Berufs- und Lebenserfahrung sowie Begeisterung für IT Infrastrukturen, gelingt es dem Team, unterschiedlichste Service Reque…

Details Anzeigen
Veröffentlicht am 2026-03-09

Bauingenieur Objektplanung konstr. Ingenieurbau

Ingenieurbüro Merkin & Völker GmbH
München

Du bist Bauingenieur im Bereich Objektplanung konstruktiver Ingenieurbau und hast Lust auf spannende und abwechslungsreiche Projekte? Bewirb dich jetzt als beim Ingenieurbüro Merkin & Völker (mitte…

Details Anzeigen
Veröffentlicht am 2026-06-01