banner

Nouvelles

Jan 16, 2024

FracAtlas : un ensemble de données pour la classification, la localisation et la segmentation des fractures des radiographies musculo-squelettiques

Données scientifiques volume 10, Numéro d'article : 521 (2023) Citer cet article

2 Altmétrique

Détails des métriques

La radiographie numérique est l'une des normes les plus courantes et les plus rentables pour le diagnostic des fractures osseuses. Pour de tels diagnostics, l'intervention d'un expert est nécessaire, ce qui prend du temps et exige une formation rigoureuse. Avec le développement récent des algorithmes de vision par ordinateur, on constate un regain d’intérêt pour le diagnostic assisté par ordinateur. Le développement d’algorithmes nécessite de grands ensembles de données dotés d’annotations appropriées. Les ensembles de données X-Ray existants sont soit petits, soit dépourvus d'annotations appropriées, ce qui entrave le développement d'algorithmes d'apprentissage automatique et l'évaluation des performances relatives des algorithmes de classification, de localisation et de segmentation. Nous présentons FracAtlas, un nouvel ensemble de données d'analyses à rayons X organisées à partir des images collectées dans 3 grands hôpitaux du Bangladesh. Notre ensemble de données comprend 4 083 images qui ont été annotées manuellement pour la classification, la localisation et la segmentation des fractures osseuses avec l'aide de 2 radiologues experts et d'un orthopédiste à l'aide de la plateforme d'étiquetage open source makesense.ai. Il existe 717 images avec 922 cas de fractures. Chacune des instances de fracture possède son propre masque et son propre cadre de délimitation, tandis que les analyses comportent également des étiquettes globales pour les tâches de classification. Nous pensons que l’ensemble de données constituera une ressource précieuse pour les chercheurs intéressés par le développement et l’évaluation d’algorithmes d’apprentissage automatique pour le diagnostic des fractures osseuses.

La demande de systèmes de diagnostic assisté par ordinateur (CAO) a connu une forte augmentation au cours des dernières décennies. De plus, différents domaines de la science médicale ont récemment connu un développement rapide de processus d'automatisation du diagnostic, exploitant de vastes ensembles de données et des algorithmes avancés d'apprentissage automatique1,2. Des modèles tels que les réseaux neuronaux convolutifs (CNN)3, You only look once (YOLO)4 et U-NET5 peuvent atteindre des performances dignes d'un expert dans la détection d'anomalies à partir d'analyses à rayons X. La formation de tels modèles nécessite des ensembles de données volumineux et bien annotés6,7,8. Il est difficile de collecter de telles données auprès des hôpitaux et des centres de diagnostic. Le processus d’annotation peut être très coûteux car il nécessite la participation de plusieurs médecins et radiologues pour parvenir à un consensus afin d’éliminer les préjugés et les erreurs humaines. En raison de la nature sensible des données médicales, il est également très difficile de rendre les données acquises accessibles au public. En résumé, la création de tels ensembles de données est coûteuse et prend du temps2,9.

Certains des ensembles de données X-Ray bien connus qui sont accessibles au public et qui se concentrent sur les anomalies incluent MURA10, MedPix11, GRAZPEDWRI-DX12, IIEST1, MOST13, VinDr-CXR2, VinDr-SpineXR14 et ChestX-ray1415. Parmi ces ensembles de données, MURA est une collection de radiographies musculo-squelettiques en 2D avec 40 561 images de différentes régions telles que le coude, le doigt, l’avant-bras, la main, l’humérus, l’épaule et le poignet10. Chaque image est étiquetée comme « Normale » ou « Anormale », ce qui la rend adaptée aux tâches de classification. Cependant, il lui manque une annotation appropriée pour la localisation et la segmentation. MedPix est une base de données en ligne d'analyses médicales 2D et 3D de diverses maladies qui peuvent être filtrées par le mot-clé « fracture », ce qui donne 954 images. Ces images comprennent des radiographies, des images réelles, l'imagerie par résonance magnétique (IRM), la tomodensitométrie (TDM) et l'imagerie par ultrasons. Cependant, l'ensemble de données présente des problèmes tels que des annotations non organisées et des images faussement étiquetées, ainsi que des images de spam. GRAZPEDWRI-DX est un ensemble de données récemment publié, contenant 20 327 analyses avec annotation pour la localisation collectées auprès de 6 091 patients. Bien qu’il s’agisse d’un ensemble de données suffisamment volumineux, il ne couvre que les fractures du poignet, omettant le reste des parties du corps humain. IIEST est un petit ensemble de données de radiographies 2D contenant 217 images, dont 49 saines, 99 fracturées et 69 scintigraphies osseuses cancéreuses. Cet ensemble de données est très petit et inadéquat pour les activités d'apprentissage automatique. MOST est un ensemble de données contenant 4 446 examens radiographiques et IRM étiquetés selon le système de notation Kellgren-Lawrence (KL)16, comportant cinq classes allant du niveau 0 au niveau 4, avec une gravité croissante de l'une à l'autre. Cet ensemble de données n'est plus disponible dans le domaine public en raison du manque de financement et de la clôture. Il couvre également uniquement les fractures de l’articulation du genou. VinDr-CXR est également un ensemble de données récemment publié, qui contient 18 000 images de radiographies pulmonaires (CXR) avec annotation manuelle pour la localisation. Cet ensemble de données contient des échantillons pour 28 types différents de maladies et anomalies thoraciques. Bien qu’il s’agisse d’un bon ensemble de données pour identifier les maladies thoraciques, il ne convient pas à l’identification des fractures osseuses. De même, le groupe VinDr dispose d’autres ensembles de données VinDr-Mammo17, VinDr-SpineXR14 et PediCXR18 qui ne conviennent pas à l’étude des fractures pour des raisons similaires. ChestX-ray14 est un ensemble de données pour les graphiques radio contenant 112 000 scans CXR. Cet ensemble de données ne convient pas non plus à l’étude des fractures osseuses car il ne contient que des échantillons de maladies thoraciques. Certains ensembles de données importants de radiographies du corps humain sont comparés à l’ensemble de données FracAtlas19 dans le tableau 1.

PARTAGER