Sie entwerfen und implementieren fortschrittliche Trainings- und Feinabstimmungsmethoden (Reinforcement Learning from Human Feedback, Reinforcement Finetuning, Mixture-of-Experts usw.), um die Reasoning-Fähigkeiten von LLMs zu verbessern
1
Completed (or close to completing) a Master's degree or equivalent in business mathematics, mathematics, economics, business informatics, industrial engineering, computer science … Knowledge in the field of machine learning and reinforcement learning or willing to learn more about it
2
Wir entwickeln militärische Simulationsumgebungen für Studien und Forschungsprojekte, welche für Analysen und zum KI-Training verwendet werden. Mittels Machine Learning/Deep Learning Ansätzen entwickeln wir KI-Verfahren zur autonomen Planung und Entscheidungsfindung unter unsicheren Bedingungen und in komplexen …
3
You will work alongside experts in autonomous driving and artificial intelligence, contributing to state-of-the-art research and production-oriented AI systems in an agile, research-driven environment … Explore novel approaches for end-to-end automated driving systems, including imitation learning …
4
Hill-climb in large-scale training: Conduct large-scale LLM training runs, analyze evaluation scores in depth, propose hypotheses for improvement and directly implement them in order to maximize performance on our benchmarks
5
Vorbereitung und Aufbau einer Reinforcement-Learning Umgebung als virtuelle Testplattform (Digital Twin) … Studium im Bereich Künstliche Intelligenz/Data Science, Informatik, Elektrotechnik oder eine vergleichbare Ingenieurausbildung
6
WIN – Forschungsgruppe Environmental and Sustainable Information Systems … Du unterstützt uns bei spannenden Forschungstätigkeiten rund um das Projekt - „ADAPT – Adaptive AI-supported Simulation Toolbox for Energy Markets Design"
7
The Fraunhofer-Gesellschaft ( www.fraunhofer.com ) is one of the world's leading organizations for application-oriented research … Reinforcement learning (RL) offers a promising approach to develop adaptive and robust control policies, but training on physical hardware is often impractical and unsafe
8
Forschung im Bereich Machine Learning und KI für automatisiertes Fahren durchführen • Neue Ansätze für End-to-End-Systeme im automatisierten Fahren erforschen, einschließlich Imitation Learning, Reinforcement Learning und Weltmodellen
9
The project explores joint optimization of the driving stack by training perception, prediction, and planning within a unified model architecture, with emphasis on efficient training strategies, closed-loop evaluation, reinforcement learning, and integration with …
10