Repositori ini berisi kode yang mendukung model dasar GPT-4V untuk digunakan dengan AutoDistill.
GPT-4V, yang dikembangkan oleh Openai, adalah model bahasa multi-modal. Dengan GPT-4V, Anda dapat mengajukan pertanyaan tentang gambar dalam bahasa alami. Modul autodistill-gpt4v memungkinkan Anda untuk mengklasifikasikan gambar menggunakan GPT-4V.
Model ini menggunakan API GPT-4-Vision-Preview yang diumumkan oleh OpenAI pada 6 November 2023.
Catatan
Menggunakan proyek ini akan dikenakan biaya penagihan untuk panggilan API ke OpenAI GPT-4 Vision API. Lihat halaman harga OpenAI untuk informasi lebih lanjut dan untuk menghitung harga yang Anda harapkan. Paket ini membuat satu panggilan API per gambar yang ingin Anda beri label.
Baca dokumentasi AutoDistill lengkap.
Baca dokumentasi Autodistill GPT-4V.
Untuk menggunakan GPT-4V dengan AutoDistill, Anda perlu menginstal ketergantungan berikut:
pip3 install autodistill-gpt-4v from autodistill_gpt_4v import GPT4V
# define an ontology to map class names to our GPT-4V prompt
# the ontology dictionary has the format {caption: class}
# where caption is the prompt sent to the base model, and class is the label that will
# be saved for that caption in the generated annotations
# then, load the model
base_model = GPT4V (
ontology = CaptionOntology (
{
"person" : "person" ,
"a forklift" : "forklift"
}
),
api_key = "OPENAI_API_KEY"
)
base_model . label ( "./context_images" , extension = ".jpeg" )Proyek ini dilisensikan di bawah lisensi MIT.
Kami menyukai masukan Anda! Silakan lihat Panduan Kontribusi Autodistill Inti untuk memulai. Terima kasih untuk semua kontributor kami!