Choose est un concept-store digital qui présente de nouvelles marques tous les jours.
Pour aider l’équipe e-merchandising dans la mise en ligne des catalogues de produits, nous recherchons un-e stagiaire qui travaillera sur une solution innovante pour récupérer les informations relatives aux produits (nom, prix, description, images…) de façon automatique afin de faciliter le travail de l’équipe e-merchandising.
Les missions :
• Participer à la création d’un jeu de données constitué de pages HTML brutes, dont seront extraites les différentes balises, leurs attributs et leur contenu.
• Déterminer si ces balises renvoient à un prix, au nom du produit, à leur description ou à rien qui ne soit relatif au produit.
• Analyse des patterns : y a-t-il des patterns communs aux balises de produits, de prix, etc ? Par exemple, quelle est la proportion des prix qui sont rangés dans des balises dont la classe contient le mot ‘price’ ?
• Tester différents modèles de classification de texte capables d’extraire automatiquement le contenu d’intérêt et évaluer leurs performances.
• Mise en place d’une API (FastAPI) permettant d’exploiter le modèle.
• Dans un contexte plus opérationnel, le ou la stagiaire pourra parfois être appelé-e à réaliser des extractions pour se familiariser avec les tâches de l’équipe e-merchandising et les outils d’extraction (scrapy, BeautifulSoup).
• Bonus : participer à un sujet de crawling permettant d’identifier les nouveautés susceptibles de correspondre à l’univers Choose.
Les missions :
• Participer à la création d’un jeu de données constitué de pages HTML brutes, dont seront extraites les différentes balises, leurs attributs et leur contenu.
• Déterminer si ces balises renvoient à un prix, au nom du produit, à leur description ou à rien qui ne soit relatif au produit.
• Analyse des patterns : y a-t-il des patterns communs aux balises de produits, de prix, etc ? Par exemple, quelle est la proportion des prix qui sont rangés dans des balises dont la classe contient le mot ‘price’ ?
• Tester différents modèles de classification de texte capables d’extraire automatiquement le contenu d’intérêt et évaluer leurs performances.
• Mise en place d’une API (FastAPI) permettant d’exploiter le modèle.
• Dans un contexte plus opérationnel, le ou la stagiaire pourra parfois être appelé-e à réaliser des extractions pour se familiariser avec les tâches de l’équipe e-merchandising et les outils d’extraction (scrapy, BeautifulSoup).
• Bonus : participer à un sujet de crawling permettant d’identifier les nouveautés susceptibles de correspondre à l’univers Choose.
Le profil recherché :
• Formation Bac + 5 en école d’ingénieur avec une composante mathématiques / statistiques / informatique.Compétences techniques :
• Stage de fin d’études pour une durée de 6 mois, à temps plein
• Tu aimes mettre à disposition tes compétences pour aider les autres
• Tu as soif d’apprendre, tu es ouvert-e au feedback et tu aimes prendre des initiatives
• Idéalement, tu justifies d’une première expérience dans un poste similaire ou dans une start-up.
• Python, SQLSi tu as lu l’intégralité de cette annonce, nous préférons, plutôt qu’une lettre de motivation, un petit mot personnalisé !
• Pandas, sklearn et Pytorch/Tensorflow
• De l’expérience avec Google Cloud Platform, des connaissances en HTML et de l’expérience avec BeautifulSoup sont un plus !
Conditions de travail :
• Stage (6 mois)
• Début : 2 janvier 2023
• Lieu : Paris (75)
• Éducation : Bac +5 / Master
Conditions de travail :
• Stage (6 mois)
• Début : 2 janvier 2023
• Lieu : Paris (75)
• Éducation : Bac +5 / Master
1. Call avec Aurélie, notre Talent Acquisition Specialist
2. Entretien visio avec Amine, notre head of Data
3. Entretien dans nos locaux Choose pour rencontrer la team
1. Call avec Aurélie, notre Talent Acquisition Specialist
2. Entretien visio avec Amine, notre head of Data
3. Entretien dans nos locaux Choose pour rencontrer la team