Junior Data Scientist - Quality Engineering & AI/ML Implementation - Data Scientist Junior – Ingénierie Qualité & Mise en œuvre de l’IA/ML (F/H)
About this role
Job Description Summary
GE Vernova is accelerating the path to more reliable, affordable, and sustainable energy, while helping our customers power economies and deliver the electricity that is vital to health, safety, security, and improved quality of life. Are you excited at the opportunity to electrify and decarbonize the world?
We are seeking a curious, analytically sharp and digitally passionate Junior Data Scientist to join our HQ Quality Engineering & AI/ML Implementation team — a team where collaboration and participative leadership are not just words, but the way we work every day.
This is your opportunity to create real impact from day one. As a core member of our quality engineering team, you will be at the forefront of our Quality 5.0 vision — where data intelligence and AI-powered tools redefine how we manage, predict and prevent quality issues across GE Vernova's global business. You will analyse quality data from across our enterprise systems, define how data assets from platforms like SAP and Salesforce can be leveraged, and translate those insights into Machine Learning models and LLM-powered solutions that make quality proactive rather than reactive.
You will act as the critical bridge between our Quality Engineering domain and our Digital execution team — defining what data we need, how it should be structured and used, and what AI/ML solutions can unlock the most value. You will support centralized quality reporting that delivers harmonized insights and KPIs to business stakeholders worldwide, and partner directly with our global business lines as valued customers of your solutions.
Job Description
The Junior Data Scientist will be responsible for:
• Analyzing quality data from multiple enterprise systems (including SAP, Salesforce and others) to identify patterns, gaps and opportunities for data-driven quality improvements.
• Defining which data assets are relevant for quality use cases and specify how data from different systems should be accessed, interpreted and used — in close collaboration with our Digital execution team.
• Translating business quality challenges into concrete data science and AI/ML problem statements, acting as the domain-aware bridge between Quality Engineering and the Digital team.
• Supporting our Digital team in delivering centralized quality reporting solutions, providing harmonized insights and KPIs to business stakeholders across GE Vernova's global business lines.
• Developing and validating Machine Learning models that support preventive and predictive quality use cases, contributing to our Quality 5.0 vision.
• Leveraging Large Language Models (LLMs) and prompt engineering to build intelligent quality tools that augment human decision-making and automate quality workflows.
• Collaborating closely with Data Engineers and AI/ML engineers to ensure that data requirements are correctly understood and implemented at pipeline and infrastructure level.
• Building and maintaining a deep understanding of Semantic Data Models to ensure consistent data interpretation across quality applications and business systems.
• Engaging with internal business line stakeholders to understand their quality data needs, gather requirements and iterate solutions based on real-world feedback.
• Contributing to the evolution of the Digital Quality Suite, bringing innovative ideas and a forward-thinking mindset to continuously improve our quality tooling landscape.
• Documenting analytical findings, model performance and data definitions clearly to ensure transparency and reproducibility across the team.
• Stay current with the latest advancements in AI, ML and data science, proactively proposing new approaches that could enhance our quality solutions.
QUALIFICATIONS / REQUIREMENTS
• Bachelor's or Master's degree in Data Science, Computer Science, Statistics, Mathematics, Engineering or a related technical field.
• Proven hands-on experience in data science, data analysis or a related discipline — experience gained in a startup or fast-paced digital environment is a strong plus.
• Proficiency in Python for data analysis, statistical modelling and ML development.
• Foundational to intermediate experience with Machine Learning frameworks and methodologies (e.g., scikit-learn, XGBoost, or similar).
• Familiarity with Large Language Models (LLMs) and basic prompt engineering techniques and their practical application in business contexts.
• Understanding of Semantic Data Models and data modelling concepts across heterogeneous systems.
• Experience working with structured and unstructured data from enterprise systems (e.g., ERP, CRM platforms).
• Strong collaborative mindset — able to define requirements clearly and work effectively with a distributed Digital execution team.
• Proactive, intellectually curious and comfortable operating in a dynamic, evolving environment.
• Fluent in English (written and spoken); additional languages are a plus.
DESIRED CHARACTERISTICS
• Ability to analyse, interpret and communicate complex data findings to both technical and non-technical audiences.
• First experience with enterprise platforms such as SAP, Salesforce or similar ERP/CRM systems from a data consumption perspective.
• Experience with AWS cloud services from a data science perspective (e.g., SageMaker, S3, Lambda).
• Knowledge of SQL and experience querying relational or NoSQL databases.
• Exposure to MLOps principles — model versioning, experiment tracking, deployment basics.
• Understanding of data governance principles and responsible AI practices.
• First Experience in international, multicultural team environments and working across time zones.
RÉSUMÉ DE L’OFFRE
Chez GE Vernova, nous accélérons la transition vers une énergie plus fiable, plus abordable et plus durable. En accompagnant nos clients, nous contribuons à faire tourner les économies et à fournir une électricité essentielle à la santé, à la sécurité et à une meilleure qualité de vie. Vous avez envie de participer à l’électrification et à la décarbonation du monde ?
Nous recherchons un(e) Junior Data Scientist curieux(se), doté(e) d’un solide esprit d’analyse et passionné(e) par le digital, pour rejoindre notre équipe Quality Engineering & AI/ML Implementation au siège. Vous intégrerez une équipe où la collaboration et le leadership participatif font réellement partie du quotidien.
C’est l’occasion d’avoir un impact concret dès votre arrivée. En tant que membre clé de l’équipe qualité, vous contribuerez activement à notre vision Quality 5.0, dans laquelle l’intelligence des données et les outils basés sur l’IA transforment notre façon de piloter, d’anticiper et de prévenir les problématiques qualité à l’échelle mondiale chez GE Vernova.
Dans ce rôle, vous analyserez les données qualité issues de nos différents systèmes d’entreprise, et vous identifierez comment exploiter au mieux les données provenant de plateformes telles que SAP et Salesforce. À partir de ces analyses, vous contribuerez au développement de modèles de machine learning et de solutions basées sur les LLM, afin de faire évoluer notre approche qualité vers un modèle plus prédictif et proactif.
Vous jouerez également un rôle clé d’interface entre les équipes Quality Engineering et les équipes digitales, en définissant les besoins en données, leur structuration, leurs usages, ainsi que les cas d’usage IA/ML les plus créateurs de valeur.
Enfin, vous participerez à la mise en place d’un reporting qualité centralisé, permettant de fournir des indicateurs harmonisés et des insights pertinents aux parties prenantes métier dans le monde entier. Vous travaillerez en lien direct avec nos différentes activités globales, qui seront les utilisateurs et bénéficiaires de vos solutions.
Le/La Data Scientist Junior sera chargé(e) de :
• Analyser des données qualité provenant de plusieurs systèmes d’entreprise (notamment SAP, Salesforce et d’autres) afin d’identifier des tendances, des lacunes et des opportunités d’amélioration de la qualité fondées sur les données.
• Définir quels actifs de données sont pertinents pour les cas d’usage qualité et préciser comment les données issues de différents systèmes doivent être accessibles, interprétées et utilisées — en étroite collaboration avec notre équipe d’exécution Digitale.
• Traduire les enjeux métier liés à la qualité en problématiques concrètes de data science et d’IA/ML, en jouant le rôle de passerelle métier entre l’Ingénierie Qualité et l’équipe Digitale.
• Soutenir notre équipe Digitale dans la mise en place de solutions centralisées de reporting qualité, en fournissant des analyses harmonisées et des KPI aux parties prenantes métier dans l’ensemble des lignes d’activité mondiales de GE Vernova.
• Développer et valider des modèles de Machine Learning soutenant des cas d’usage qualité préventifs et prédictifs, contribuant ainsi à notre vision Quality 5.0.
• Exploiter les Large Language Models (LLMs) et l’ingénierie de prompts pour créer des outils qualité intelligents qui renforcent la prise de décision humaine et automatisent les workflows qualité.
• Collaborer étroitement avec les Data Engineers et les ingénieurs IA/ML afin de garantir que les exigences en matière de données soient correctement comprises et mises en œuvre au niveau des pipelines et de l’infrastructure.
• Développer et maintenir une compréhension approfondie des modèles de données sémantiques afin d’assurer une interprétation cohérente des données dans les applications qualité et les systèmes métier.
• Échanger avec les parties prenantes internes des différentes lignes d’activité afin de comprendre leurs besoins en données qualité, recueillir les exigences et faire évoluer les solutions sur la base de retours concrets du terrain.
• Contribuer à l’évolution de la Digital Quality Suite, en apportant des idées innovantes et un état d’esprit tourné vers l’avenir pour améliorer en continu notre environnement d’outils qualité.
• Documenter clairement les résultats analytiques, la performance des modèles et les définitions de données afin d’assurer la transparence et la reproductibilité au sein de l’équipe.
• Se tenir informé(e) des dernières avancées en IA, ML et data science, et proposer de manière proactive de nouvelles approches susceptibles d’améliorer nos solutions qualité.
QUALIFICATIONS / EXIGENCES
• Diplôme de niveau Licence ou Master en Data Science, Informatique, Statistiques, Mathématiques, Ingénierie ou dans un domaine technique connexe.
• Expérience pratique avérée en data science, analyse de données ou dans une discipline connexe — une expérience acquise dans une startup ou un environnement digital dynamique constitue un atout majeur.
• Maîtrise de Python pour l’analyse de données, la modélisation statistique et le développement de modèles de ML.
• Expérience de niveau débutant à intermédiaire avec les frameworks et méthodologies de Machine Learning (par exemple : scikit-learn, XGBoost ou équivalent).
• Familiarité avec les Large Language Models (LLMs), les techniques de base de prompt engineering et leur application pratique dans des contextes métier.
• Compréhension des modèles de données sémantiques et des concepts de modélisation de données dans des systèmes hétérogènes.
• Expérience du travail avec des données structurées et non structurées issues de systèmes d’entreprise (par ex. ERP, plateformes CRM).
• Esprit fortement collaboratif — capacité à définir clairement les exigences et à travailler efficacement avec une équipe d’exécution Digitale distribuée.
• Proactif(ve), curieux(se) intellectuellement et à l’aise dans un environnement dynamique et en constante évolution.
• Maîtrise de l’anglais à l’écrit comme à l’oral ; d’autres langues constituent un plus.
PROFIL RECHERCHÉ / ATOUTS SUPPLÉMENTAIRES
• Capacité à analyser, interpréter et communiquer des résultats complexes issus des données à des publics techniques comme non techniques.
• Première expérience avec des plateformes d’entreprise telles que SAP, Salesforce ou des systèmes ERP/CRM similaires du point de vue de la consommation de données.
• Expérience avec les services cloud AWS dans une perspective data science (par ex. SageMaker, S3, Lambda).
• Connaissance de SQL et expérience des requêtes sur des bases de données relationnelles ou NoSQL.
• Connaissance des principes du MLOps — versioning des modèles, suivi des expérimentations, notions de base sur le déploiement.
• Compréhension des principes de gouvernance des données et des pratiques d’IA responsable.
• Première expérience dans des environnements d’équipe internationaux et multiculturels, avec collaboration à travers plusieurs fuseaux horaires.
La différence crée l’énergie.
La Mission Handicap Grid Solutions facilite l’intégration des personnes en situation de handicap.
Additional Information
Relocation Assistance Provided: Yes