ดาวน์โหลด MedMNIST - ดาวน์โหลดซอร์สโค้ด MedMNIST

MedMNIST

หลาม

1.0.0

ดาวน์โหลด

Medmnist: medmnist.com

ข้อมูล (Zenodo) | สิ่งพิมพ์ (Nature Scientific Data'23 / isbi'21) | preprint (arxiv)

Jiancheng Yang, Rui Shi, Donglai Wei, Zequan Liu, Lin Zhao, Bilian KE, Hanspeter Pfister, Bingbing Ni

ชุดข้อมูลมาตรฐาน 18x สำหรับการจำแนกรูปภาพ 2D และ 3D Biomedical Image

ตัวเลือกหลายขนาด: 28 (เหมือน MNIST), 64, 128 และ 224

เราแนะนำ Medmnist ซึ่งเป็นคอลเล็กชั่น Mnist ขนาดใหญ่ของภาพชีวการแพทย์ที่ได้มาตรฐานรวมถึงชุดข้อมูล 12 ชุดสำหรับชุดข้อมูล 2D และ 6 สำหรับ 3D ภาพทั้งหมดจะถูกประมวลผลล่วงหน้าเป็น 28x28 (2D) หรือ 28x28x28 (3D) ด้วยฉลากการจำแนกประเภทที่สอดคล้องกันเพื่อให้ผู้ใช้ไม่จำเป็นต้องมีความรู้พื้นฐานสำหรับผู้ใช้ Medmnist ครอบคลุมการครอบคลุมข้อมูลหลักในภาพชีวการแพทย์ Medmnist ได้รับการออกแบบมาเพื่อทำการจำแนกประเภทบนภาพ 2D และ 3D ที่มีน้ำหนักเบาด้วยเครื่องชั่งข้อมูลต่างๆ (จาก 100 ถึง 100,000) และงานที่หลากหลาย (ไบนารี/หลายคลาสการถดถอยตามลำดับและหลายฉลาก) ชุดข้อมูลที่เกิดขึ้นประกอบด้วยภาพ 2D ประมาณ 708K และภาพทั้งหมด 10K ภาพทั้งหมดสามารถรองรับการวิจัยและการศึกษาจำนวนมากในการวิเคราะห์ภาพชีวการแพทย์วิสัยทัศน์คอมพิวเตอร์และการเรียนรู้ของเครื่องจักร เราเปรียบเทียบวิธีการพื้นฐานหลายวิธีเกี่ยวกับ MedMnist รวมถึงเครือข่ายประสาท 2D / 3D และเครื่องมือ Open-Source / Outmar AutomL

ข้อจำกัดความรับผิดชอบ : ลิงค์การกระจายอย่างเป็นทางการเพียงอย่างเดียวสำหรับชุดข้อมูล MedMnist คือ Zenodo เราขอให้ผู้ใช้อ้างอิงลิงก์ชุดข้อมูลต้นฉบับนี้สำหรับข้อมูลที่ถูกต้องและทันสมัย

อัปเดต 2024-01-17 : เราตื่นเต้นที่จะปล่อย Medmnist+ ด้วยขนาดที่ใหญ่กว่า: 64x64, 128x128 และ 224x224 สำหรับ 2D และ 64x64x64 สำหรับ 3D ในฐานะที่เป็นส่วนประกอบของ Medmnist ขนาด 28 รุ่นก่อนหน้ารุ่นขนาดใหญ่สามารถใช้เป็นมาตรฐานมาตรฐานสำหรับโมเดลมูลนิธิการแพทย์ ติดตั้ง API ล่าสุดเพื่อลอง!

การอัปเดตของบุคคลที่สาม 2024-05-13 : @Sdoerrich97 เปิดตัวการประเมินที่ครอบคลุมสำหรับ Medmnist+ ครอบคลุม 10 โมเดลการเรียนรู้ลึกที่แตกต่างกันที่ได้รับการฝึกฝนผ่าน 3 แผนการฝึกอบรมที่แตกต่างกันในชุดข้อมูล 12d ทั้งหมด 12d และความละเอียดของภาพที่มีอยู่ (28x28, 64x64, 128x128 และ 224x224) ตรวจสอบปัญหาที่นี่

การอัปเดตของบุคคลที่สาม 2024-12-20 : @FrancescodisalVo05 แนะนำ Medmnist-C ซึ่งเป็นชุดข้อมูล MedMnist ที่เสียหายพร้อมกับการทุจริตของภาพเฉพาะและ APIs APIs ซึ่งได้รับแรงบันดาลใจจากมาตรฐาน Imagenet-C งานนี้มีวัตถุประสงค์เพื่อประเมินและเพิ่มความทนทานของโมเดล ตรวจสอบปัญหาที่นี่

สำหรับรายละเอียดเพิ่มเติมโปรดดูเอกสารของเรา:

Medmnist V2: เกณฑ์มาตรฐานน้ำหนักเบาขนาดใหญ่สำหรับการจำแนกภาพชีวการแพทย์ 2D และ 3D (Nature Scientific Data'23)

หรือเวอร์ชันการประชุม:

การจำแนกประเภท Medmnist Decathlon: มาตรฐาน Automl ที่มีน้ำหนักเบาสำหรับการวิเคราะห์ภาพทางการแพทย์ (ISBI'21)

คุณสมบัติที่สำคัญ

ความหลากหลาย : มันครอบคลุมถึงรูปแบบข้อมูลที่หลากหลายเครื่องชั่งชุดข้อมูล (จาก 100 ถึง 100,000) และงาน (ไบนารี/หลายคลาสหลายฉลากและการถดถอยตามลำดับ) มันมีความหลากหลายเท่ากับ VDD และ MSD เพื่อประเมินประสิทธิภาพทั่วไปของอัลกอริทึมการเรียนรู้ของเครื่องในการตั้งค่าที่แตกต่างกัน แต่มีการจัดเตรียมภาพชีวการแพทย์ 2D และ 3D
มาตรฐาน : แต่ละส่วนย่อยจะถูกประมวลผลล่วงหน้าในรูปแบบเดียวกันซึ่งไม่จำเป็นต้องมีความรู้พื้นฐานสำหรับผู้ใช้ ในฐานะคอลเลกชันชุดข้อมูลที่เหมือน MNIST เพื่อดำเนินงานการจำแนกประเภทบนภาพขนาดเล็กมันมุ่งเน้นไปที่ส่วนการเรียนรู้ของเครื่องมากกว่าระบบ end-to-end นอกจากนี้เรายังมีการแยกการทดสอบการตรวจสอบความถูกต้องของรถไฟมาตรฐานสำหรับชุดข้อมูลทั้งหมดใน MedMnist ดังนั้นอัลกอริทึมสามารถเปรียบเทียบได้ง่าย
ใช้งานง่าย : ขนาดเล็ก 28x28 (2d) หรือ 28x28x28 (3D) มีน้ำหนักเบาและเหมาะสำหรับการประเมินอัลกอริทึมการเรียนรู้ของเครื่อง นอกจากนี้เรายังเสนอรุ่นที่ใหญ่กว่า Medmnist+: 64x64 (2d), 128x128 (2d), 224x224 (2d) และ 64x64x64 (3D) ทำหน้าที่เป็นส่วนประกอบของ Medmnist ขนาด 28 ขนาดนี่อาจเป็นทรัพยากรที่ได้มาตรฐานสำหรับการพัฒนาแบบจำลองพื้นฐานการแพทย์ ชุดข้อมูลทั้งหมดเหล่านี้สามารถเข้าถึงได้ผ่าน API เดียวกัน
การศึกษา : ในฐานะที่เป็นพื้นที่วิจัยสหวิทยาการการวิเคราะห์ภาพชีวการแพทย์เป็นเรื่องยากที่จะมอบให้กับนักวิจัยจากชุมชนอื่น ๆ เนื่องจากต้องมีความรู้พื้นฐานจากการมองเห็นคอมพิวเตอร์การเรียนรู้ของเครื่องจักรการถ่ายภาพชีวการแพทย์และวิทยาศาสตร์ทางคลินิก ข้อมูลของเรากับใบอนุญาต Creative Commons (CC) ใช้งานง่ายเพื่อการศึกษา

โปรดทราบว่าชุดข้อมูลนี้ ไม่ ได้มีไว้สำหรับการใช้งานทางคลินิก

โครงสร้างรหัส

medmnist/ :
- dataset.py : ชุดข้อมูล pytorch และ dataloaders ของ medmnist
- evaluator.py : ฟังก์ชั่นการประเมินมาตรฐาน
- info.py : dict ชุดข้อมูลสำหรับแต่ละชุดย่อยของ medmnist
examples/ :
- getting_started.ipynb : เพื่อสำรวจชุดข้อมูล medmnist ด้วยสมุดบันทึก Jupyter มันมีไว้สำหรับการสำรวจอย่างรวดเร็วเช่นมันไม่ได้ให้การฝึกอบรมเต็มรูปแบบและฟังก์ชั่นการประเมินผล
- getting_started_without_PyTorch.ipynb : สมุดบันทึกนี้ให้ตัวอย่างเกี่ยวกับวิธีการใช้ข้อมูล medmnist (ไฟล์ .npz ) โดยไม่ต้อง pytorch
setup.py : ในการติดตั้ง medmnist เป็นโมดูล
[ภายนอก] MedMNIST/experiments : การฝึกอบรมและการประเมินผลสคริปต์เพื่อทำซ้ำทั้งการทดลอง 2D และ 3D ในกระดาษของเรารวมถึง Pytorch, สเคลเทอร์, Autokeras และ Google Automl Vision พร้อมกับน้ำหนักของพวกเขา;)

การติดตั้งและข้อกำหนด

ตั้งค่าสภาพแวดล้อมที่ต้องการและติดตั้ง medmnist เป็นแพ็คเกจ Python มาตรฐานจาก PYPI:

 pip install medmnist

หรือติดตั้งจากแหล่งที่มา:

 pip install --upgrade git+https://github.com/MedMNIST/MedMNIST.git

ตรวจสอบว่าคุณได้ติดตั้งเวอร์ชันรหัสล่าสุดหรือไม่:

 >>> import medmnist
>>> print(medmnist.__version__)

รหัสต้องการเฉพาะสภาพแวดล้อม Python ทั่วไปสำหรับการเรียนรู้ของเครื่อง โดยพื้นฐานแล้วมันถูกทดสอบด้วย

Python 3 (> = 3.6)
pytorch == 1.3.1
numpy == 1.18.5, pandas == 0.25.3, scikit-learn == 0.22.2, หมอน == 8.0.1
ไฟ, scikit-image

รุ่นที่สูงกว่า (หรือต่ำกว่า) ควรใช้งานได้ (อาจมีการดัดแปลงเล็กน้อย)

เริ่มต้นอย่างรวดเร็ว

หากต้องการใช้เวอร์ชัน 28 ขนาดมาตรฐาน (เหมือน MNIST) โดยใช้ไฟล์ที่ดาวน์โหลดมา:

 >>> from medmnist import PathMNIST
>>> train_dataset = PathMNIST(split="train")

เพื่อเปิดใช้งานการดาวน์โหลดอัตโนมัติโดยการตั้ง download=True :

 >>> from medmnist import NoduleMNIST3D
>>> val_dataset = NoduleMNIST3D(split="val", download=True)

หรือคุณสามารถเข้าถึง Medmnist+ ด้วยขนาดภาพที่ใหญ่ขึ้นโดยการระบุพารามิเตอร์ size :

 >>> from medmnist import ChestMNIST
>>> test_dataset = ChestMNIST(split="test", download=True, size=224)

ถ้าคุณใช้ pytorch ...

ยอดเยี่ยม! รหัสของเราได้รับการออกแบบให้ทำงานกับ Pytorch
สำรวจชุดข้อมูล medmnist ด้วยสมุดบันทึก Jupyter ( getting_started.ipynb ) และฝึกอบรมเครือข่ายประสาทขั้นพื้นฐานใน Pytorch

ถ้าคุณไม่ใช้ pytorch ...

แม้ว่ารหัสของเราจะถูกทดสอบด้วย pytorch แต่คุณมีอิสระที่จะแยกวิเคราะห์ด้วยรหัสของคุณเอง (โดยไม่ต้อง pytorch หรือแม้กระทั่งไม่มี Python!) เนื่องจากเป็นเพียงไฟล์อนุกรม NumPy มาตรฐานเท่านั้น มันง่ายที่จะสร้างชุดข้อมูลโดยไม่ต้อง pytorch
ไปที่ getting_started_without_PyTorch.ipynb ซึ่งให้ตัวอย่างเกี่ยวกับวิธีการใช้ข้อมูล medmnist (ไฟล์ .npz ) โดยไม่ต้อง pytorch
เพียงเปลี่ยนคลาส Super MedMNIST จาก torch.utils.data.Dataset เป็น collections.Sequence คุณจะได้รับชุดข้อมูลมาตรฐานโดยไม่ต้อง pytorch ตรวจสอบ dataset_without_pytorch.py สำหรับรายละเอียดเพิ่มเติม
คุณยังคงมีฟังก์ชั่นมากที่สุดของรหัส medmnist ของเรา;)

ชุดข้อมูล

โปรดดาวน์โหลดชุดข้อมูลผ่าน Zenodo คุณสามารถใช้รหัสของเราเพื่อดาวน์โหลดโดยอัตโนมัติโดยการตั้ง download=True ใน dataset.py

ชุดข้อมูล medmnist มีหลายชุดย่อย แต่ละชุดย่อย (เช่น pathmnist.npz ) ประกอบด้วย 6 ปุ่ม: train_images , train_labels , val_images , val_labels , test_images และ test_labels

train_images / val_images / test_images : N × 28 × 28 สำหรับชุดข้อมูลระดับสีเทา 2D, N × 28 × 28 × 3 สำหรับชุดข้อมูล RGB 2D, N × 28 × 28 × 28 สำหรับชุดข้อมูล 3D N หมายถึงจำนวนตัวอย่าง
train_labels / val_labels / test_labels : N × L N หมายถึงจำนวนตัวอย่าง L หมายถึงจำนวนฉลากงาน สำหรับการจำแนกประเภท label (ไบนารี/หลายคลาส), L=1 และ {0,1,2,3,..,C} หมายถึงฉลากหมวดหมู่ ( C=1 สำหรับไบนารี); สำหรับการจำแนกประเภทหลายฉลาก L!=1 , เช่น, L=14 สำหรับ chestmnist.npz

นอกจากนี้เรายังมีไฟล์ CSV สำหรับชุดย่อย MedMnist แต่ละรายการที่นี่ซึ่งแมป "Image_id" ในชุดย่อยกับภาพที่เกี่ยวข้องในชุดข้อมูลต้นฉบับ สำหรับแต่ละรายการจะมีรายละเอียด "แยก" และ "ดัชนี" เฉพาะภายในชุดย่อย medmnist พร้อมกับชื่อภาพที่เกี่ยวข้องจากชุดข้อมูลอย่างเป็นทางการ

เครื่องมือบรรทัดคำสั่ง

แสดงรายการชุดข้อมูลที่มีอยู่ทั้งหมด:
```
  python -m medmnist available
```
ดาวน์โหลดชุดข้อมูลที่มีขนาดเฉพาะ ( size=None (28) โดยค่าเริ่มต้น):
```
  python -m medmnist download --size=28
```
ในการดาวน์โหลดขนาดที่มีอยู่ทั้งหมด:
```
  python -m medmnist download --size=all
```
ลบ NPZ ทั้งหมดที่ดาวน์โหลดจากรูท:
```
  python -m medmnist clean
```
พิมพ์รายละเอียดชุดข้อมูลที่ได้รับธงชุดย่อย:
```
  python -m medmnist info --flag=xxxmnist
```
บันทึกชุดข้อมูลเป็นตัวเลขมาตรฐานและไฟล์ CSV ซึ่งสามารถใช้สำหรับเครื่องมือ AutomL เช่น Google Automl Vision:
สำหรับชุดข้อมูล 2D:
```
  python -m medmnist save --flag=xxxmnist --folder=tmp/ --postfix=png --download=True --size=28
```
สำหรับชุดข้อมูล 3D:
```
  python -m medmnist save --flag=xxxmnist3d --folder=tmp/ --postfix=gif --download=True --size=28
```
โดยค่าเริ่มต้น download=False และ size=None (28)
แยกวิเคราะห์และประเมินไฟล์ผลลัพธ์มาตรฐานโปรดดู Evaluator.parse_and_evaluate สำหรับรายละเอียด
```
  python -m medmnist evaluate --path=folder/{flag}{size_flag}_{split}@{run}.csv
```
ที่นี่ size_flag ว่างเปล่าสำหรับ 28 ภาพและ _size สำหรับภาพขนาดใหญ่เช่น "_64" เช่น
```
  python -m medmnist evaluate --path=bloodmnist_64_val_[AUC]0.486_[ACC][email protected]
```
หรือ
```
  python -m medmnist evaluate --path=chestmnist_test_[AUC]0.500_[ACC][email protected]
```

ใบอนุญาตและการอ้างอิง

ชุดข้อมูล MedMnist ได้รับใบอนุญาตภายใต้ Creative Commons Attribution 4.0 International (CC โดย 4.0) ยกเว้น Dermamnist ภายใต้ Creative Commons Attribution-Noncommercial 4.0 International (CC BY-NC 4.0) รหัสอยู่ภายใต้ใบอนุญาต Apache-2.0

หากคุณพบว่าโครงการนี้มีประโยชน์ในการวิจัยของคุณโปรดอ้างอิงเอกสารต่อไปนี้:

 Jiancheng Yang, Rui Shi, Donglai Wei, Zequan Liu, Lin Zhao, Bilian Ke, Hanspeter Pfister, Bingbing Ni. Yang, Jiancheng, et al. "MedMNIST v2-A large-scale lightweight benchmark for 2D and 3D biomedical image classification." Scientific Data, 2023.

Jiancheng Yang, Rui Shi, Bingbing Ni. "MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis". IEEE 18th International Symposium on Biomedical Imaging (ISBI), 2021.

หรือใช้ bibtex:

 @article{medmnistv2,
    title={MedMNIST v2-A large-scale lightweight benchmark for 2D and 3D biomedical image classification},
    author={Yang, Jiancheng and Shi, Rui and Wei, Donglai and Liu, Zequan and Zhao, Lin and Ke, Bilian and Pfister, Hanspeter and Ni, Bingbing},
    journal={Scientific Data},
    volume={10},
    number={1},
    pages={41},
    year={2023},
    publisher={Nature Publishing Group UK London}
}
 
@inproceedings{medmnistv1,
    title={MedMNIST Classification Decathlon: A Lightweight AutoML Benchmark for Medical Image Analysis},
    author={Yang, Jiancheng and Shi, Rui and Ni, Bingbing},
    booktitle={IEEE 18th International Symposium on Biomedical Imaging (ISBI)},
    pages={191--195},
    year={2021}
}

โปรดอ้างถึงเอกสารข้อมูลต้นฉบับของชุดย่อย medmnist ตามคำอธิบายในหน้าโครงการ

บันทึกย่อ

v3.0.2 : แก้ไขข้อผิดพลาดในผู้ประเมิน ( size_flag ) และ PYPI อัปเดต
v3.0.1 : อัปเดตข้อความแสดงข้อผิดพลาดในการดาวน์โหลดเพื่อให้คำแนะนำมากขึ้น
v3.0.0 : Medmnist+ มีขนาดใหญ่ขึ้น: 64x64, 128x128 และ 224x224 สำหรับ 2d และ 64x64x64 สำหรับ 3d
v2.2.4 : ลบตัวอย่างว่างเปล่าจำนวนเล็กน้อยใน Organamnist, Organcmnist, Organsmnist, Organmnist3d และ Vesselmnist3d
v2.2.3 : ใบอนุญาต Dermamnist ถึง CC BY-NC 4.0
v2.2.2 : Python 3.11 Sequence จาก collections.abc รองรับ
v2.2.1 : อัปเดตข้อมูล PYPI
v2.2.0 : วิธี montage ที่รองรับสำหรับ scikit-image> = 0.20.0
v2.1.0 : ข้อผิดพลาดข้อมูล NoduleMNIST3D แก้ไข
v2.0.0 : Medmnist V2 release (บน PYPI)
v1.0.0 : การเปิดตัว medmnist v1
v0.2.0 : การเปิดตัวเบต้า medmnist

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-14
ขนาด 4.9MB
มาจาก Github

แอปที่เกี่ยวข้อง

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
datamule python

2024-11-08
เครื่องมือแผนภูมิข้อมูลโอเพ่นซอร์ส Redash v24.10.0

2024-11-27
แพลตฟอร์มการแสดงภาพข้อมูล smartchart เวอร์ชัน 6.9

2024-11-27
เครื่องมือทดสอบโหลดตั๊กแตน v2.32.0

2024-11-27

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
datamule python

หลาม
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด