Fi Group

Urchade Zaratiana, doctorant en thèse CIFRE sur l'extraction de données

Urchade Zaratiana réalise une thèse CIFRE au sein de F.initiatives, sur l’extraction de données. Il fait parti des six Chercheurs présents au sein du Research Lab.

Peux-tu me présenter ton parcours ?  

Après mon baccalauréat, j’ai rejoint une école préparatoire en Physique, Mathématiques et Technologies, de 2015 à 2017, à la Réunion. Ces deux années m’ont permis d’intégrer l’école d’ingénieurs du numérique ISEP à Paris. J’avais pour projet professionnel, lors de ma première année, d’évoluer dans le domaine du développement web. Cependant, au cours de mes trois années d’études, j’ai décidé de m’orienter vers l’Intelligence Artificielle et de poursuivre dans ce domaine. J’ai donc réalisé un premier stage en Data Sciences, puis un deuxième dans la recherche, avec pour projet la recommandation d’articles sur le web. Ce dernier stage a conforté ma volonté de continuer dans le monde de la recherche, j’ai donc décidé de postuler à une thèse CIFRE sur l’extraction d’informations dans les textes scientifiques, en collaboration avec Sorbonne Université. F.initiatives a vite été intéressé par mon profil car je possédais déjà de l’expérience dans ce domaine.  

Ainsi, et dans l’attente de validation de mon dossier par l’ANRT, j’ai rejoint l’aventure FI en décembre 2020 comme Data Scientist. Cela m’a permis d’élargir mes connaissances et de réaliser certains projets (des moteurs de recherche multilingue, du question answering et du graph representation learning). J’ai également réalisé une veille sur les actualités de Machine Learning, afin d’aider mon équipe dans leurs recherches et de solidifier mes connaissances. C’est en juillet 2021 que j’ai débuté ma thèse CIFRE. 

De quelle manière s’est construit ton projet doctoral ?  

Pendant mes premières années d’études supérieures, j’avais une totale méconnaissance du monde de la recherche. C’est lors de mon semestre en Autriche que j’ai découvert ce qu’était la R&D. Les professeurs, là-bas, sont très portés sur la recherche, j’ai même eu l’occasion de suivre la conférence NeurIPS à distance. C’est à la suite de cet échange à l’étranger que mon choix s’est naturellement tourné vers la réalisation d’un dernier stage dans la recherche, puis vers une thèse. 

Pourquoi avoir décidé de réaliser une thèse CIFRE ?  

J’ai décidé de m’orienter sur une thèse CIFRE plutôt qu’une thèse uniquement universitaire car je souhaitais pouvoir appliquer mes recherches à l’entreprise et y analyser directement leur impact. De plus, il était important pour moi de rejoindre une équipe déjà composée de Docteurs. Cela permet des collaborations et de partages d’expériences très enrichissants. Petit point spécial sur mon manager F.initiatives qui a fait sa thèse dans le même laboratoire que moi, avec le même directeur de thèse !

En quoi consiste ton activité chez F.initiatives ?  

Chez F.initiatives, je réalise de la recherche fondamentale pouvant être appliquée, pour certains cas, à l’entreprise. Mes recherches sont très accès sur l’accès à l’information. 

Lors de mon arrivée au sein de F.initiatives, la première étape a été de réaliser un état de l’art afin de connaitre l’existant et de développer de nouvelles approches. De nombreux papiers sortent chaque jour, mon rôle a été d’implémenter les idées existantes pour y trouver les problématiques liées. Ensuite, j’ai dû décider du chemin à prendre pour pouvoir, ensuite, développer des algorithmes dépassant l’état de l’art. A terme, l’objectif de ma thèse est d’extraire des entités et de comprendre leurs relations, afin d’établir un graphe de connaissance.  

Comment s’intègre la R&D dans le fonctionnement de l’entreprise ?  

Il est important de trouver des améliorations pour faciliter l’accès à l’information (web, bases de connaissance internes, articles scientifiques, etc.) et aider les Consultant.es à être plus productif.ves. Il est, par conséquent, nécessaire d’utiliser des algorithmes fluides et performants sur de grandes quantités de données, afin de ressortir des résultats pertinents.  Mes travaux de recherche sont donc directement appliqués.