CVNets- это инструментарий компьютерного зрения, который позволяет исследователям и инженерам обучать стандартные и новые модели мобильного и не-мобильного компьютерного зрения для разнообразных задач, включая классификацию объектов, обнаружение объектов, семантическую сегментацию и модели фундамента (например, клип).
Мы рекомендуем использовать Python 3.10+ и Pytorch (версия> = v1.12.0)
Инструкции, приведенные ниже, используют Conda, если у вас нет установки Conda, вы можете проверить, как установить Conda.
# Clone the repo
git clone [email protected]:apple/ml-cvnets.git
cd ml-cvnets
# Create a virtual env. We use Conda
conda create -n cvnets python=3.10.8
conda activate cvnets
# install requirements and CVNets package
pip install -r requirements.txt -c constraints.txt
pip install --editable . Чтобы увидеть список доступных моделей и тестов, пожалуйста, обратитесь к папке модели и примеров.
Этот код разрабатывается Сачином и в настоящее время поддерживается Сачином, Максвеллом Хортоном, Мохаммадом Секхаватом и Янзи Джин.
Ниже приведен список публикаций из Apple, в которых используется CVNets:
Мы приветствуем PRS от сообщества! Вы можете найти информацию о участии в CVNets в нашем документе.
Пожалуйста, не забудьте следовать нашему кодексу поведения.
Для получения информации о лицензии см. Лицензию.
Если вы найдете нашу работу полезной, пожалуйста, укажите следующую статью:
@inproceedings{mehta2022mobilevit,
title={MobileViT: Light-weight, General-purpose, and Mobile-friendly Vision Transformer},
author={Sachin Mehta and Mohammad Rastegari},
booktitle={International Conference on Learning Representations},
year={2022}
}
@inproceedings{mehta2022cvnets,
author = {Mehta, Sachin and Abdolhosseini, Farzad and Rastegari, Mohammad},
title = {CVNets: High Performance Library for Computer Vision},
year = {2022},
booktitle = {Proceedings of the 30th ACM International Conference on Multimedia},
series = {MM '22}
}