Un Nouvel Outil pour Prédire et Classer le Risque de Cancer du Sein chez les Femmes Chinoises
Le cancer du sein est le cancer le plus fréquent chez les femmes dans le monde. En Chine, il est la principale cause de nouveaux cas de cancer chez les femmes. En 2020, environ 416 000 nouveaux cas ont été diagnostiqués. Ce chiffre alarmant montre qu’il est urgent de développer des outils efficaces pour évaluer le risque de cancer du sein spécifiquement pour la population chinoise.
Les modèles traditionnels de prédiction du risque de cancer du sein, comme le modèle de Gail, ont montré des limites. Leur précision est souvent faible, avec des scores (AUC) compris entre 0,55 et 0,65. De plus, ces modèles nécessitent souvent des méthodes invasives, comme des tests génétiques ou des biopsies, qui ne sont pas pratiques pour une utilisation à grande échelle en Chine. Une nouvelle étude propose une solution : des modèles basés sur l’apprentissage automatique (machine learning) qui sont plus précis, non invasifs et adaptés aux femmes chinoises.
Une Étude de Grande Envergure
Cette étude s’appuie sur les données de la « Breast Cancer Cohort Study in Chinese Women » (BCCS-CW). Cette cohorte comprend 122 058 femmes âgées de 25 à 70 ans, recrutées dans l’est de la Chine entre 2008 et 2009. Les participantes ont fourni des informations détaillées sur leur mode de vie, leurs antécédents médicaux et familiaux, ainsi que leurs habitudes alimentaires. Les cas de cancer du sein ont été identifiés grâce à des bases de données nationales et locales.
Des Modèles Innovants
Les chercheurs ont utilisé des techniques avancées d’apprentissage automatique pour développer deux modèles de prédiction. Le premier, appelé EPLR (Ensemble Penalized Logistic Regression), est conçu pour prédire le risque à court terme. Le second, EPLT (Ensemble Penalized Long-Term), est destiné à la prédiction à long terme. Ces modèles sont basés sur une méthode appelée « bagging », qui combine plusieurs modèles pour améliorer la précision et la stabilité.
Le modèle EPLR utilise 72 facteurs de risque non expérimentaux, tandis que le modèle EPLT en utilise 51. Ces facteurs incluent des éléments comme le statut ménopausique, les antécédents familiaux de cancer du sein, et les habitudes alimentaires. Les modèles ont été testés et validés avec des données provenant de plusieurs provinces chinoises.
Des Résultats Prometteurs
Les performances des modèles ont été évaluées en termes de discrimination (capacité à distinguer les cas de cancer du sein des non-cas) et de calibration (précision des prédictions). Le modèle EPLR a montré une excellente discrimination, avec des scores (AUC) de 0,800 en validation interne et 0,751 en validation externe. Le modèle EPLT a également bien performé, avec des scores de 0,692 et 0,760 respectivement.
Un des points forts de ces modèles est leur capacité à classer l’importance des facteurs de risque. Par exemple, le modèle EPLR a identifié la « satisfaction globale de la vie » comme le facteur de risque le plus important. Cela montre que les facteurs psychologiques jouent un rôle significatif dans le risque de cancer du sein.
Avantages et Limites
Ces modèles présentent plusieurs avantages. Ils utilisent des facteurs de risque non expérimentaux, ce qui les rend plus accessibles et moins coûteux. Ils surpassent également les modèles traditionnels comme celui de Gail, qui utilisent moins de variables et nécessitent souvent des tests invasifs.
Cependant, l’étude a quelques limites. La validation externe des modèles a été limitée à trois provinces, et les prédictions à long terme du modèle EPLT n’ont été validées qu’avec trois années de données de suivi. De plus, certains facteurs de risque établis, comme la consommation d’alcool, n’ont pas été inclus dans les modèles. Enfin, l’étude n’a pas pris en compte les sous-types de cancer du sein, car les données manquaient sur le statut des récepteurs d’œstrogènes.
Conclusion
Cette étude a développé et validé des modèles innovants pour prédire et classer le risque de cancer du sein chez les femmes chinoises. Les modèles EPLR et EPLT montrent une précision supérieure à celle des modèles traditionnels, ce qui en fait des outils précieux pour le dépistage et la prévention du cancer du sein en Chine. Leur utilisation de facteurs de risque non expérimentaux et leur capacité à classer ces facteurs offrent une approche pratique et économique pour évaluer le risque de cancer du sein. Des recherches futures devraient valider ces modèles dans des populations plus larges et diversifiées, et inclure d’autres facteurs de risque pour améliorer encore leur précision.
For educational purposes only.
doi.org/10.1097/CM9.0000000000002891