Lead Kernel Engineer/Architect (m/f/d)
We're looking for a Lead Kernel Engineer/Architect to join our team in Germany in a hybrid working mode.
Are you passionate about pushing advanced hardware accelerators to their limits? Join us in shaping the future of AI performance and scalability.
As a Lead Kernel Engineer/Architect, you will drive the optimization of critical machine learning operations for large-scale training and inference, working with cutting-edge hardware like TPUs and GPUs, advanced ML models and performance toolchains. Your work will enable faster AI research and production deployments on cloud platforms and within open-source ecosystems.
In this role, you will collaborate with researchers, compiler engineers and framework developers to deliver optimized, high-performance solutions that set the standard for modern AI computation.
Design and optimize high-performance kernels for TPU and GPU architectures using low-level programming frameworks such as Pallas, Triton or Mosaic Build and maintain performance infrastructure, including benchmarking suites, autotuning systems, regression testing frameworks and tooling Collaborate with ML framework developers (e.g., JAX, PyTorch) and compiler teams (XLA/MLIR) to integrate custom kernels and reduce performance bottlenecks Track advancements in accelerator hardware, compiler technology and AI model design to identify opportunities for kernel-level optimization Develop clear documentation, APIs and supporting OSS components that improve developer usability and adoption Analyze and resolve complex performance issues impacting large-scale distributed training and inference systems Bachelor’s degree or equivalent practical experience 12+ years of industry experience in software engineering or systems programming 5+ years of experience in software development using C++ or Python 3+ years of experience in testing, maintaining or launching software products and at least 1 year in software design or architecture Hands-on experience in performance optimization at the kernel level for accelerators or high-performance systems Proficiency in low-level accelerator programming (CUDA, Triton, Pallas) Familiarity with ML frameworks such as JAX or PyTorch and optimization techniques for attention layers, Mixture of Experts (MoE) and precision tuning Strong understanding of modern hardware accelerators, including pipelining, data movement and heterogeneous compute Knowledge of compiler principles and intermediate representations (e.g., MLIR, OpenXLA) Experience building OSS developer infrastructure, APIs and performance-critical libraries Excellent problem-solving skills and ability to collaborate in cross-functional engineering environmentsEmpfohlene Jobs
Projektleitung (w/m/d) - JobID 25685
40.000 Profis für die Zukunft des Gebäudes: Das ist Apleona. Wir sind führender Gebäudedienstleister und erleichtern täglich das Leben Tausender Menschen aus Industrie, Wirtschaft und öffentlicher Han…
(Senior) Manager IT-Audit/ -Prüfung - Technology Risk - Voll/Teilzeit (w/m/d)
Are you ready to shape your future with confidence? Gemeinsam die Welt jeden Tag ein bisschen besser machen. Für diesen Anspruch setzen wir bei EY alles in Bewegung und gehen als Team „all in“. Sch…
Heilerziehungspflegerin und Erzieher im Schichtdienst (m/w/d)
Heilerziehungspflegerin und Erzieher im Schichtdienst (m/w/d)05.06.2026 MFZ Münchner Förderzentrum GmbH München Weitere passende Anzeigen: Jobmailer Ihre Merkliste / Mit Klick auf einen St…
Legal Counsel
Als Legal Counsel bei Red Bull erwartet Sie eine Rolle, in der juristische Expertise auf unternehmerische Dynamik trifft. In einem Umfeld, das Individualität, Leidenschaft und Professionalität lebt, …
Disponent (m/w/d) national und international
Aufgaben Die eigenständige Disposition und Abwicklung von nationalen und/oder internationalen Linien- und Charterverkehren (Teil- und Komplettladungen) unter qualitäts- und kostenorientierte…
Payroll Specialist (m/w/d) in München
Ihre Chance im Personalmanagement als Payroll Specialist (m/w/d) in München Für ein etabliertes Unternehmen im sozialen Umfeld in München suchen wir im Rahmen der Zeitarbeit einen Payroll Specia…
Network Security Consultant - Systems Integrator
Ein spezialisiertes IT-Systemhaus im Bereich Cybersecurity und Netzwerkinfrastrukturen sucht einen erfahrenen Network Security Consultant, der Kunden bei der Planung, Umsetzung und Weiterentwicklun…
Chief Financial Officer (CFO)
Deine Aufgaben Dein Fokus liegt auf der strategischen Kapitalbeschaffung und der Professionalisierung unserer Finanzstrukturen. Deine Verantwortungsbereiche im Detail: 1. Debt Fundraising & Refi…
Bürokaufmann m/w/d im Großraum München gesucht
Wir suchen im Großraum München für unseren Kunden einen Bürokaufmann m/w/d. Die Stelle ist in Zeitarbeit zu besetzen. ~ Wir bieten Ihnen auch gut ausgestattete Wohnmöglichkeiten Aufgab…
Filialleiter (m/w/d)
Einleitung Wir wollen für unsere Kunden nur das Beste. Dich zum Beispiel. Denn wenn du unsere Filialen leitest, kann nichts schiefgehen. Du machst aus Mitarbeitern ein Team und aus deiner Leidenschaf…