CVNETS adalah toolkit visi komputer yang memungkinkan para peneliti dan insinyur untuk melatih model visi komputer seluler dan non-seluler dan novel untuk berbagai tugas, termasuk klasifikasi objek, deteksi objek, segmentasi semantik, dan model pondasi (mis. Klip).
Kami merekomendasikan untuk menggunakan Python 3.10+ dan Pytorch (Versi> = V1.12.0)
Instruksi di bawah ini Gunakan conda, jika Anda tidak menginstal Conda, Anda dapat memeriksa cara menginstal Conda.
# Clone the repo
git clone [email protected]:apple/ml-cvnets.git
cd ml-cvnets
# Create a virtual env. We use Conda
conda create -n cvnets python=3.10.8
conda activate cvnets
# install requirements and CVNets package
pip install -r requirements.txt -c constraints.txt
pip install --editable . Untuk melihat daftar model dan tolok ukur yang tersedia, silakan merujuk ke Folder Model Zoo dan Contoh.
Kode ini dikembangkan oleh Sachin, dan sekarang dikelola oleh Sachin, Maxwell Horton, Mohammad Sekhavat, dan Yanzi Jin.
Di bawah ini adalah daftar publikasi dari Apple yang menggunakan CVNET:
Kami menyambut PR dari komunitas! Anda dapat menemukan informasi tentang berkontribusi pada CVNET dalam dokumen berkontribusi kami.
Harap ingat untuk mengikuti kode perilaku kami.
Untuk detail lisensi, lihat lisensi.
Jika Anda menganggap pekerjaan kami bermanfaat, silakan kutip makalah berikut:
@inproceedings{mehta2022mobilevit,
title={MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer},
author={Sachin Mehta and Mohammad Rastegari},
booktitle={International Conference on Learning Representations},
year={2022}
}
@inproceedings{mehta2022cvnets,
author = {Mehta, Sachin and Abdolhosseini, Farzad and Rastegari, Mohammad},
title = {CVNets: High Performance Library for Computer Vision},
year = {2022},
booktitle = {Proceedings of the 30th ACM International Conference on Multimedia},
series = {MM '22}
}