Этот репозиторий содержит код, поддерживающий базовую модель GPT-4V для использования с AutoDistill.
GPT-4V, разработанный OpenAI, является многомодальной языковой моделью. С GPT-4V вы можете задать вопросы об изображениях на естественном языке. Модуль autodistill-gpt4v позволяет классифицировать изображения с помощью GPT-4V.
Эта модель использует API GPT-4-Vision-Preview, объявленное Openai 6 ноября 2023 года.
Примечание
Использование этого проекта будет нести плату за вызовы API в API OpenAI GPT-4 Vision. Обратитесь к странице OpenAI Ценообразования для получения дополнительной информации и для рассчитания ваших ожидаемых цен. Этот пакет делает один вызов API на изображение, которое вы хотите пометить.
Прочитайте полную документацию Autodistill.
Прочитайте документацию GPT-4V Autodistill.
Чтобы использовать GPT-4V с AutoDistill, вам необходимо установить следующую зависимость:
pip3 install autodistill-gpt-4v from autodistill_gpt_4v import GPT4V
# define an ontology to map class names to our GPT-4V prompt
# the ontology dictionary has the format {caption: class}
# where caption is the prompt sent to the base model, and class is the label that will
# be saved for that caption in the generated annotations
# then, load the model
base_model = GPT4V (
ontology = CaptionOntology (
{
"person" : "person" ,
"a forklift" : "forklift"
}
),
api_key = "OPENAI_API_KEY"
)
base_model . label ( "./context_images" , extension = ".jpeg" )Этот проект лицензирован по лицензии MIT.
Мы любим ваш вклад! Пожалуйста, смотрите основное руководство Autodistill, чтобы начать работу. Спасибо всем нашим участникам!