Chercheur Doctorant H/F
Sujet de thèse : Placement de tâches distribué et résilient sur infrastructures d’edge-computing hétérogènes et dynamiquesDomaine scientifique : InformatiqueTravaux de rechercheContexte scientifiqueLes applications intensives [2] génèrent d’importants volumes de données à traiter sous des contraintes temps réel, notamment avec l’essor des objets connectés et des flux numériques variés (images, vidéos, textes, sons, paroles).
En un coup d’œil :
- Type de contrat : CDD
- Durée : à temps plein
- Date de publication : Publié le
- Rémunération : à partir de 28000 € jusqu’à 28000
- Lieu : Strasbourg (Lingolsheim), France
- Référence : Réf. 9nkdpo
- Postulez (Ouvre un nouvel onglet)
Le poste proposé

L’externalisation des calculs exige des stratégies d’ordonnancement efficaces et décentralisées, particulièrement pour des applications comme la reconnaissance d’objets, le traitement de la voix [8] ou la réalité augmentée [1]. Le cloud computing [3] offre une capacité quasi illimitée mais présente des limites, notamment pour le traitement d’informations sensibles et les contraintes de latence dues aux interconnexions best-effort. Pour y pallier, l’edge computing [10], par sa proximité avec les sources de données, permet une réactivité accrue et réduit l’exposition des informations. L’exploitation de ces ressources de calcul hétérogènes et dynamiques du réseau améliore la réactivité requise pour les applications intensives. Cette hétérogénéité se traduit par la diversité des unités de calcul (CPUs, GPUs, FPGAs, MPPAs), leurs spécifications (débit d’instruction, taille des caches) et leur accessibilité réseau. De plus, la variabilité des applications et des jeux de données accentue la complexité des plateformes [5, 4], nécessitant des stratégies d’ordonnancement adaptées et décentralisées.
Sujet de thèse
Dans ce projet de thèse, nous nous intéressons essentiellement aux questions d’ordonnancement de tâches dans des milieux fortement dynamiques ; en particulier le pool de ressources disponibles évolue en cours d’exécution. Dans ces conditions, répondre aux contraintes de qualité de service (QoS) et d’expérience (QoE) des usagers repose sur une exploitation efficace des infrastructures de calcul. Cependant, l’ordonnancement des tâches dans un tel contexte est rendu complexe par la diversité des ressources déployées (capteurs, drones, robots, véhicules, cloud, etc.), chacune avec ses propres contraintes de disponibilité et de puissance. La planification des tâches est d’autant plus difficile que la connectivité est fluctuante et l’environnement sujet à des perturbations (brouillage, défaillance de matériel, conditions météorologiques).
Face à ces enjeux, nous proposons un ordonnanceur de tâches distribué, capable d’exploiter l’ensemble des ressources hétérogènes présentes, afin d’éviter une centralisation excessive des calculs dans le cloud et de garantir une meilleure réactivité et résilience. Pour cela, plusieurs défis scientifiques doivent être relevés :
— Optimisation de l’affectation des tâches en temps réel, en intégrant la duplication automatique ou contrôlée afin de masquer les temps de communication et d’améliorer la résilience du système. Cette optimisation doit aussi tenir compte des contraintes spécifiques des applications critiques, où l’exécution des traitements ne peut être interrompue.
— Facilitation de la collaboration entre ressources hétérogènes, sans dépendre exclusivement d’un cloud centralisé, en exploitant une infrastructure multi-couches dynamique, intégrant potentiellement un cloud privé en fonction de la sensibilité des informations traitées.
— Robustesse des décisions d’ordonnancement face à un environnement dynamique, où la connectivité est intermittente et les ressources fluctuantes. L’algorithme doit s’adapter aux pertes de connexion et aux variations de disponibilité des ressources, tout en garantissant la continuité des traitements.
— Résilience intrinsèque de l’ordonnanceur, nécessitant la mise en place de stratégies de récupération rapide, de redondance intelligente et d’auto-adaptation aux perturbations du système, afin d’assurer un ordonnancement efficace et robuste quelles que soient les contraintes rencontrées.
En amont, nous avons élaboré un ordonnanceur de tâches pour des infrastructures edgecloud, avec un objectif de minimisation des retards (QoS). L’approche intègre la duplication des tâches pour améliorer la réactivité du système. Nous avons développé un modèle MILP (Mixed Integer Linear Programming) permettant la duplication des tâches en fonction des contraintes. Ce modèle a été implémenté sous trois métaheuristiques ACO (Ant Colony Optimization) : Ant Colony System (ACS), Max-Min Ant System (MMAS) et Rank-Based Ant System (RBAS). Différents benchmarks, couvrant plusieurs contextes d’utilisation, ont été définis. Les résultats initiaux montrent une convergence rapide vers des solutions optimales ou quasi-optimales.
En s’appuyant sur ces travaux préliminaires, l’objectif sera de concevoir un ordonnanceur distribué capable d’analyser en temps réel l’état des ressources hétérogènes à disposition et d’optimiser l’affectation des tâches, y compris par duplication partielle ou intégrale selon leur criticité. Il s’agit de garantir un fonctionnement assurant réactivité et robustesse, dans des environnements hautement dynamiques, où ni les requêtes futures ni la disponibilité des ressources ne sont prévisibles. Nos premiers résultats suggèrent que les algorithmes ACO sont bien adaptés à ce type de problème. En particulier, l’ACS permet une convergence rapide vers des solutions proches de l’optimal pour l’ordonnancement [9]. Par ailleurs, les ACO peuvent s’adapter à un environnement dynamique tant que les variations restent modérées [7]. L’intelligence artificielle, via les systèmes multi-agents, constitue une approche complémentaire pertinente [6]. Ces agents analyseront l’état de l’environnement et des ressources, ainsi que les décisions prises par l’ACO. En établissant des corrélations avec les situations passées, ils permettront une adaptation contextuelle et une réactivité accrue de l’algorithme.
Programme de travail
1. Étudier les techniques de placement de tâches pour les applications (quasi-) temps réel sur des infrastructures d’edge-computing dynamiques.
2. Orchestrer les tâches avec efficacité et robustesse sur une infrastructures edge.
— A partir des travaux d’ores et déjà menés par l’équipe d’encadrement de ce projet, proposer un modèle de placement de tâches distribué et dynamique basé sur l’ACO.
— Sur base des travaux amont, implémenter un système de monitoring décentralisé, basé sur des agents, qui vont permettre de remonter l’état des ressources, afin de permettre un paramétrage fin des ordonnanceurs ACO.
L’ensemble des travaux aboutiront à une production technique évaluée en simulation et sur plateformes en conditions d’opérations réelles.
Production scientifique/technique attendue
Les travaux donneront lieu à des publications dans des conférences et journaux internationaux de premier rang. La thèse aboutira sur l’élaboration d’un ordonnanceur dynamique et distribué capable d’orchestrer les tâches sur des plateformes edge hautement dynamiques.
Contexte
Présentation du Laboratoire
CESI LINEACT (UR 7527), Laboratoire d’Innovation Numérique pour les Entreprises et les Apprentissages au service de la Compétitivité des Territoires, anticipe et accompagne les mutations technologiques des secteurs et des services liés à l’industrie et au BTP. La proximité historique de CESI avec les entreprises est un élément déterminant pour nos activités de recherche, et a conduit à concentrer les efforts sur une recherche appliquée proche de l’entreprise et en partenariat avec elles. Une approche centrée sur l’humain et couplée à l’utilisation des technologies, ainsi que le maillage territorial et les liens avec la formation, ont permis de construire une recherche transversale ; elle met l’humain, ses besoins et ses usages, au centre de ses problématiques et aborde l’angle technologique au travers de ces apports. Sa recherche est organisée selon deux équipes scientifiques interdisciplinaires et deux domaines applicatifs.
— L’équipe 1 ”Apprendre et Innover” relève principalement des Sciences cognitives, Sciences sociales et Sciences de gestion, Sciences et techniques de la formation et celles de l’innovation. Les principaux objectifs scientifiques visés sont la compréhension des effets de l’environnement, et plus particulièrement des situations instrumentées par des objets techniques (plateformes, ateliers de prototypage, systèmes
immersifs…) sur les processus d’apprentissage, de créativité et d’innovation.
— L’équipe 2 ”Ingénierie et Outils Numériques” relève principalement des Sciences du Numérique et de l’Ingénierie. Les principaux objectifs scientifiques portent sur la modélisation, la simulation, l’optimisation et l’analyse de données de systèmes cyber physiques. Les travaux de recherche portent également sur les outils d’aide à la décision associés et sur l’étude des interactions humains-systèmes notamment à travers les jumeaux numériques couplés à des environnements virtuels ou augmentés.
Ces deux équipes développent et croisent leurs recherches dans les deux domaines applicatifs de l’Industrie du Futur et de la Ville du Futur, soutenues par des plateformes de recherche, principalement celle de Rouen dédiée à l’Usine du Futur et celles de Nanterre dédiée à l’Usine et au Bâtiment du Futur.
Le profil souhaité
Compétences
Compétences scientifiques et techniques :
— Solide niveau en programmation et réseaux.
— Bonne connaissance des techniques de la recherche opérationnelle (programmation linéaire, méta-heuristiques, etc.).
— Bonnes capacités à élaborer des modèles d’optimisation.
— Appétence pour le calcul haute performance.
— Bon niveau en anglais à l’écrit et à l’oral.
Compétences relationnelles :
— être autonome, avoir un esprit d’initiative et de curiosité,
— savoir travailler en équipe et avoir un bon relationnel,
— être rigoureux.
Organisation
Financement : Co-financement CESI région EST et AID (Agence de l’Innovation de Défense).
Localisation : CESI LINEACT, Strasbourg (2 allées des Foulons, 67380 LINGOLSHEIM),FRANCE.
Date de début : Dès septembre 2025.
Durée : 3 ans.
Les avantages pour rejoindre CESI :
– CDD 36 mois
– 6 semaines de congés payés (au prorata du temps travaillé)
– 14 RTT (au prorata du temps travaillé)
– Tickets restaurant
– Mutuelle entreprise
– Prime participation/intéressement
– Charte du télétravail
– Ordinateur portable
Références
[1] Mihir Bala et al. “The ooda loop of cloudlet-based autonomous drones”. In : 2024 IEEE/ACM Symposium on Edge Computing (SEC). 2024, p. 178-190.
[2] Antoine Caillot et al. “Multi-Agent Cooperative Camera-Based Semantic Grid Generation”. In : Journal of Intelligent & Robotic Systems 110.2 (2024), p. 64.
[3] Hsing-Yu Chen, Yue-Hsun Lin et Chen-Mou Cheng. “Coca: Computation offload to clouds using aop”. In : 2012 12th IEEE/ACM International Symposium on Cluster, Cloud and Grid Computing (ccgrid 2012). IEEE. 2012, p. 466-473.
[4] Jean-François Dollinger, Kaouther Bouhouch et Imen Bouzarkouna. “Benchmarking OpenStack for edge computing applications”. In : IEEE/ACIS 8th International Conference on Big Data, Cloud Computing, and Data Science (BCD). 2023, p. 295-302.
[5] Jean-François Dollinger et Vincent Loechner. “Adaptive runtime selection for GPU”. In : 42nd International Conference on Parallel Processing (ICPP). IEEE. 2013, p. 70-79.
[6] Ali Dorri, Salil S. Kanhere et Raja Jurdak. “Multi-Agent Systems: A Survey”. In : IEEE Access 6 (2018), p. 28573-28593. doi : 10.1109/ACCESS.2018.2831228.
[7] Felipe Martins Müller et Iaê Santos Bonilha. “Hyper-Heuristic Based on ACO and Local Search for Dynamic Optimization Problems”. In : Algorithms 15 (2021), p. 9. url : https://api.semanticscholar.org/CorpusID:245526728.