Nous évoluons en permanence et faisons évoluer nos assets

🚀 Prêt(e) à passer au niveau supérieur en Data Science ?

Chez Myriad, nos Data Scientists et experts ouvrent leurs carnets de bonnes pratiques !

Nous lançons la série « Tips du DS 5.0 » : des conseils concrets, actionnables et issus du terrain pour débloquer vos projets Data.

Suivez Myriad pour ne manquer aucun épisode de cette série pensée par et pour celles et ceux qui font la Data d’aujourd’hui.

🧠 TIPS DU DS 5.0 - Astuces pour réussir vos projets Data #1

C’est parti pour ce premier épisode de la série « Tips du Data Scientist 5.0 » : Comment réussir son arrivée sur un nouveau projet Data ?

 

Voici les astuces de Noah Kwa Moutome pour une prise de projet Data réussie :

 

On pense souvent que la réussite d’un projet Data repose uniquement sur la technique.

C’est faux. La clé, c’est la compréhension du contexte. Quand on débarque dans un secteur inconnu, le risque est de se noyer dans la théorie ou de passer à côté des enjeux métier. Voici ma méthode pour gagner du temps :

1️⃣ Casser la barrière de l’expert : Ne restez pas dans votre coin. Posez énormément de questions, même celles qui semblent « bêtes ». Échangez avec les experts (DS ou non) pour maîtriser le vocabulaire et les contraintes. C’est ce qui vous fera gagner des semaines plus tard.

2️⃣ Ancrer la théorie dans le réel : En R&D, on lit beaucoup de papiers. Pour ne pas me perdre, je fais immédiatement le lien avec mes données : Qu’est-ce qui est comparable dans ce papier vs mon dataset ? Qu’est-ce qui diffère ? Comment adapter cette approche à mes contraintes ?

 

💡Le conseil : Ne codez pas à l’aveugle. Passez à la pratique seulement quand vous avez une vision claire de vos données et de vos objectifs.

🧠 TIPS DU DS 5.0 - Le Data Scientist ne doit pas être un loup solitaire #2 by Mehdi SOLTANI

Un projet Data ne se joue pas uniquement dans le code ou les modèles. Il se gagne surtout dans la donnée… et dans la collaboration avec les métiers. Un projet Data mobilise des chefs de projet, des ingénieurs, des équipes métiers… Mais l’acteur principal reste la Donnée. Sa qualité et son historique dictent tout. Pour éviter l’effet tunnel, voici deux piliers souvent négligés 👇

 

1️⃣ Ne partez pas d’une page blanche : capitalisez sur l’existant Regarder des projets similaires permet de : • Réutiliser des scripts de prétraitement (gain de temps) • Anticiper les problèmes d’accès ou de déploiement déjà rencontrés • Identifier les écueils techniques (versions, ressources) avant qu’ils ne surviennent

2️⃣ Co-construisez avec le métier : le besoin métier contient des ambiguïtés qu’un DS ne peut lever seul. 👉 Impliquez les opérationnels dès le jour 1. • Partagez votre vision de la solution (valeur, format) • Intégrez-les dans l’annotation et la validation (Active Learning) • Transformez-les en co-constructeurs : cela garantit l’adoption de l’IA

 

💡Ce temps de collaboration est souvent sous-estimé dans les plannings, alors qu’il crée le plus de valeur en phase amont. Une fois en prod, le budget part en maintenance. C’est avant qu’il faut créer l’engagement maximal.

🧠 TIPS DU DS 5.0 - Votre modèle de recommandation perd-il la tête ? #3 Un tips by Walid Benbihi

C’est un classique : en production, après quelques semaines, les performances chutent. Les campagnes marketing changent, les comportements utilisateurs évoluent… c’est le Data Drift.

Sur un projet e-commerce temps réel, j’ai constaté que les signaux de clic évoluaient trop vite pour le modèle. La solution mise en place ? Un mécanisme de « Drift Detection » léger et automatisé.

👉 Chaque jour, on compare les distributions des features clés (fréquence de clic, temps passé…) avec le jeu d’entraînement.

👉 L’outil : Tests de Kolmogorov–Smirnov (KS Tests).

👉 L’action : Si le drift dépasse un seuil, le réentraînement se lance automatiquement. Résultat : -30% de temps passé à diagnostiquer les bugs et des recommandations qui restent pertinentes. Et vous, comment surveillez-vous vos modèles en prod ?

🧠 TIPS DU DS 5.0 - Stop aux Notebooks "Jetables" en production, #4 by Walid Benbihi

Le syndrome du « Notebook hétérogène » tue la maintenance des projets Data Science.

C’est rapide pour explorer, mais un cauchemar pour passer en prod.

Pour industrialiser nos pratiques, Walid a mis en place un Toolkit interne standardisé :

✅ Standardisation : Template de repo, structure de package, tests, logging, configuration. ✅ CI/CD simple : Lint, tests unitaires, build automatique de wheels et déploiement interne. ✅ Onboarding : Une formation courte pour aider les DS à adopter ces outils sans les bloquer.

L’impact : Réduction notable des temps de refactorisation, adoption rapide du framework, et meilleure traçabilité du code entre exploration, validation et production. Le code propre, c’est aussi de la Data Science. 📌 Suivez-nous en 2026 pour accéder à encore plus de tips et bonnes pratiques Data Science !