Freelance AI Evaluation Engineer (Python/Full-Stack)
Please submit your CV in English and indicate your level of English proficiency.
Mindrift connects specialists with project-based AI opportunities for leading tech companies, focused on testing, evaluating, and improving AI systems. Participation isproject-based, not permanent employment.
What this opportunity involves
You’ll create challenging coding test cases that push AI coding systems to their limits:
- Review and refine realistic coding tasks based on provided production codebases with realistic scope, requirements and information sources
- Write comprehensive functional tests that validate actual end-to-end behavior and edge-cases, not just superficial checks
- Craft “fair but hard” challenges where the AI has all the context it needs, but has to work for it (information scattered across files and external sources, complex reasoning required)
- Analyze AI failures to understand what the model struggles with vs. what it masters
- Iterate based on feedback from expert QA reviewers who score your work on 7 quality criteria
What we look for
This opportunity is a good fit for experienced developers, software engineers, and/or test automation specialists open to part-time, non-permanent projects. Ideally, contributors will have:
- Degree in Computer Science, Software Engineering or related fields
- 5+ years in software development, primarily Python (pytest, async/await, subprocess, file operations)
- Background in Full-Stack development, with an equal focus on building React-based interfaces and robust Back-end systems
- Experience writing tests (functional, integration – not just running them)
- Docker containers (running evaluations locally in containers)
- CI/CD understanding (GitHub Actions as a user: triggers, labels, reading results)
- English proficiency - B2
How it works
Apply → Pass qualification(s) → Join a project → Complete tasks → Get paid
Effort estimate
Tasks for this project are estimated to take 20 hours to complete, depending on complexity. This is an estimate and not a schedule requirement; you choose when and how to work. Tasks must be submitted by the deadline and meet the listed acceptance criteria to be accepted.
Compensation
On this project, contributors can earn up to $50 per hour equivalent , depending on their level and pace of contribution.
Compensation varies across projects depending on scope, complexity, and required expertise. Please note that other projects on the platform may offer different earning levels based on their requirements.
Empfohlene Jobs
Erzieher oder Heilerziehungspfleger (m/w/d) für unsere Kinder- und Jugendabteilung in Prien am Chiemsee (München)
Herzlich willkommen! Spitzentherapie erfordert ein Spitzenteam. Und genau das sind wir! Wenn Sie Ihr Wissen und Knnen mit uns teilen und weiterentwickeln mchten, dann sind Sie bei uns genau richtig!…
Sales Development Representative (SDR) - DACH Market
&##128203; Job title: Sales Development Representative - DACH Market (German Speaking) &##128101; Team: Sales &##128205; Location: Hybrid work model from Munich, Germany About Dcycle Dcyc…
Mitarbeiter m/w/d für Nachtschicht in München gesucht
Wir suchen im Kundenauftrag einen Mitarbeiter m/w/d für die Nachtschicht im Front Office. Die Stelle ist in einem Münchner Hotel zu besetzen. Die Option zur Übernahme besteht. ~ Wir bieten Ihn…
Kreditsachbearbeiter (m/w/d) Fördergeschäft
Bayern ist in Topform. Dank wettbewerbsstarker Wirtschaft, hoher Innovations- und Leistungsfähigkeit, einem gründerfreundlichen Klima und einer konsequenten Standortpolitik geht es den Menschen gut i…
Consultant
Die Wiese Dental Beratungs GmbH unterstützt Zahnarztpraxen und Zahnkliniken beim Wachstum. Unser Ziel ist es, diese Organisationen dabei zu unterstützen, nachhaltiges Wachstum aufzubauen. Dies durch…
HR Generalist (m/w/d) Schwerpunkt KI
HR Generalist (m/w/d) Schwerpunkt KI in München ~ Arbeitszeit: Vollzeit 40 Std./Woche ~Gehalt: 55.000 – 60.000 EUR / Jahr ~Vertragsdauer: Projektbezogen, Option auf 12 Monate ~Homeoffice möglic…
Kraftwerksmeister*in (m/w/d)
Das können Sie bei uns bewegen Überwachung, Kontrolle und Bedienung der zugeordneten Kraftwerksanlagen An- und Abfahren von Haupt-, Hilfs- und Nebenanlagen Sicherstellung der geplanten Strom…
Operativer Einkäufer (m/w/d)
Egal ob als Junior, Professional oder Führungskraft: Wir begleiten den gesamten Karriereweg. Bundesweit warten attraktive Jobs, insbesondere in den Bereichen Mobility, Tech und Energy. Unser Ziel ist…
Elektroniker / Servicetechniker / Mechatroniker (m/w/d)
Über uns: Willkommen bei Astriol academics - deine Tür zu neuen und spannenden Karrierechancen in ganz Deutschland! Astriol academics ist einer der am schnellsten wachsenden Personalvermittler in…
Teamassistent Vertriebssupport (w/m/d) für München
+++ DIREKTVERMITTLUNG in Festanstellung (keine Zeitarbeit) / Vermittlungsgutscheine (AVGS) werden akzeptiert +++ Bei Fragen einfach unverbindlich anrufen: 03048479484 oder einen Rückruf vereinbaren…