ดาวน์โหลด autodistill - autodistill Source Source Download

autodistill

หลาม

v0.1.25

ดาวน์โหลด

สมุดบันทึก การอนุมาน Autodistill | เก็บรวบรวม

Autodistill ใช้โมเดลรองพื้นขนาดใหญ่ที่ช้ากว่าเพื่อฝึกอบรมโมเดลขนาดเล็กที่รวดเร็วกว่า การใช้ autodistill คุณสามารถเปลี่ยนจากภาพที่ไม่มีป้ายกำกับไปสู่การอนุมานบนโมเดลที่กำหนดเองที่ทำงานที่ขอบโดยไม่มีการแทรกแซงของมนุษย์ในระหว่างนั้น

เคล็ดลับ

คุณสามารถใช้ Autodistill บนฮาร์ดแวร์ของคุณเองหรือใช้ Autodistill Roboflow Hosted เวอร์ชันเพื่อติดฉลากภาพในคลาวด์

ปัจจุบัน autodistill รองรับงานวิสัยทัศน์เช่นการตรวจจับวัตถุและการแบ่งส่วนอินสแตนซ์ แต่ในอนาคตมันสามารถขยายเพื่อสนับสนุนรูปแบบภาษา (และอื่น ๆ )

- ลิงก์ QuickLinks

การสอน	เอกสาร	รุ่นที่รองรับ	มีส่วนช่วย

- ตัวอย่างเอาต์พุต

นี่คือตัวอย่างการคาดการณ์ของโมเดลเป้าหมายที่ตรวจพบขวดนมและขวดหลังจากได้รับการฝึกฝนในชุดข้อมูลที่ติดฉลากอัตโนมัติโดยใช้ Autodistill (ดูวิดีโอ Autodistill YouTube สำหรับคำแนะนำเต็มรูปแบบ):

คุณสมบัติ

- อินเทอร์เฟซที่สามารถเชื่อมต่อได้เพื่อเชื่อมต่อโมเดลเข้าด้วยกัน
- ชุดข้อมูลโดยอัตโนมัติ
- ฝึกอบรมแบบจำลองที่มีการดูแลอย่างรวดเร็ว
เป็นเจ้าของโมเดลของคุณ
ปรับใช้โมเดลกลั่นไปยังคลาวด์หรือขอบ

แนวคิดพื้นฐาน

ในการใช้ autodistill คุณป้อนข้อมูลที่ไม่มีป้ายกำกับลงในโมเดลพื้นฐานซึ่งใช้ ontology เพื่อติดฉลากชุดข้อมูลที่ใช้ในการฝึกอบรมโมเดลเป้าหมายซึ่งส่งออกโมเดลกลั่นปรับแต่งเพื่อทำงานเฉพาะ

Autodistill กำหนดเบื้องต้นพื้นฐานหลายประการ:

งาน - งานกำหนดว่าโมเดลเป้าหมายจะทำนายได้อย่างไร งานสำหรับแต่ละองค์ประกอบ (โมเดลฐานอภิปรัชญาและโมเดลเป้าหมาย) ของไปป์ไลน์ autodistill จะต้องตรงกับพวกเขาให้เข้ากันได้กับกันและกัน การตรวจจับวัตถุและการแบ่งส่วนอินสแตนซ์ได้รับการสนับสนุนในปัจจุบันผ่านงาน detection การสนับสนุน classification จะถูกเพิ่มในไม่ช้า
โมเดลฐาน - โมเดลพื้นฐานเป็นรุ่นรองพื้นขนาดใหญ่ที่รู้มากเกี่ยวกับมาก โมเดลพื้นฐานมักจะมีหลายรูปแบบและสามารถทำงานได้มากมาย พวกเขามีขนาดใหญ่ช้าและมีราคาแพง ตัวอย่างของโมเดลพื้นฐานคือตัวแปรหลายรูปแบบและ GPT-4 ที่กำลังจะมาถึงของ GPT-4 เราใช้โมเดลพื้นฐาน (พร้อมกับข้อมูลอินพุตที่ไม่มีป้ายกำกับและ ontology) เพื่อสร้างชุดข้อมูล
Ontology - ontology กำหนดวิธีการแจ้งเตือนพื้นฐานของคุณชุดข้อมูลของคุณจะอธิบายและรูปแบบเป้าหมายของคุณจะทำนายได้อย่างไร ontology ที่เรียบง่ายคือ CaptionOntology ซึ่งแจ้งให้แบบจำลองพื้นฐานพร้อมคำบรรยายภาพข้อความและแมปกับชื่อคลาส ตัวอย่างเช่น ontologies อื่น ๆ อาจใช้เวกเตอร์คลิปหรือตัวอย่างภาพแทนคำอธิบายข้อความ
ชุดข้อมูล - ชุดข้อมูลเป็นชุดของข้อมูลที่มีป้ายกำกับอัตโนมัติซึ่งสามารถใช้ในการฝึกอบรมโมเดลเป้าหมาย มันเป็นเอาต์พุตที่สร้างขึ้นโดยโมเดลพื้นฐาน
โมเดลเป้าหมาย - โมเดลเป้าหมายเป็นรูปแบบการดูแลที่ใช้ชุดข้อมูลและส่งออกโมเดลกลั่นที่พร้อมสำหรับการปรับใช้ โมเดลเป้าหมายมักจะมีขนาดเล็กเร็วและปรับแต่งเพื่อทำงานเฉพาะได้ดีมาก (แต่พวกเขาไม่ได้พูดคุยกันดีกว่าข้อมูลที่อธิบายไว้ในชุดข้อมูลของพวกเขา) ตัวอย่างของโมเดลเป้าหมายคือ YOLOV8 และ DETR
โมเดลกลั่น - แบบจำลองกลั่นคือผลลัพธ์สุดท้ายของกระบวนการ autodistill ; มันเป็นชุดของน้ำหนักที่ปรับแต่งสำหรับงานของคุณที่สามารถปรับใช้เพื่อรับการคาดการณ์

ทฤษฎีและข้อ จำกัด

การติดฉลากของมนุษย์เป็นหนึ่งในอุปสรรคที่ใหญ่ที่สุดในการใช้วิสัยทัศน์คอมพิวเตอร์อย่างกว้างขวาง อาจใช้เวลาหลายพันชั่วโมงในการสร้างชุดข้อมูลที่เหมาะสมสำหรับการฝึกอบรมรูปแบบการผลิต กระบวนการกลั่นสำหรับการฝึกอบรมแบบจำลองการดูแลไม่ใช่เรื่องใหม่ในความเป็นจริงการติดฉลากมนุษย์แบบดั้งเดิมเป็นเพียงรูปแบบหนึ่งของการกลั่นจากแบบจำลองฐานที่มีความสามารถอย่างมาก (สมองมนุษย์?)

โมเดลรากฐานมีความรู้มากเกี่ยวกับมาก แต่สำหรับการผลิตเราต้องการโมเดลที่รู้มากเกี่ยวกับเล็กน้อย

เมื่อโมเดลพื้นฐานดีขึ้นเรื่อย ๆ พวกเขาจะสามารถเพิ่มหรือแทนที่มนุษย์ในกระบวนการติดฉลากได้มากขึ้น เราต้องการเครื่องมือสำหรับการบังคับเลี้ยวการใช้และเปรียบเทียบโมเดลเหล่านี้ นอกจากนี้โมเดลรากฐานเหล่านี้มีขนาดใหญ่แพงและมักจะอยู่เบื้องหลัง API ส่วนตัว สำหรับกรณีการใช้งานการผลิตจำนวนมากเราต้องการโมเดลที่สามารถทำงานได้อย่างถูกและตามแบบเรียลไทม์ที่ขอบ

โมเดลพื้นฐานของ Autodistill สามารถสร้างชุดข้อมูลสำหรับกรณีการใช้งานทั่วไปจำนวนมาก (และผ่านการแจ้งเตือนความคิดสร้างสรรค์และการถ่ายภาพไม่กี่ครั้งเราสามารถขยายยูทิลิตี้ของพวกเขาไปอีกมากมาย) แต่พวกเขายังไม่สมบูรณ์แบบ ยังมีงานอีกมากที่ต้องทำ นี่เป็นเพียงจุดเริ่มต้นและเราชอบการทดสอบความช่วยเหลือของคุณและขยายขีดความสามารถของระบบ!

- การติดตั้ง

Autodistill เป็นโมดูลาร์ คุณจะต้องติดตั้งแพ็คเกจ autodistill (ซึ่งกำหนดอินเทอร์เฟซสำหรับแนวคิดข้างต้น) พร้อมกับโมเดลพื้นฐานและปลั๊กอินโมเดลเป้าหมาย (ซึ่งใช้โมเดลเฉพาะ)

โดยการบรรจุสิ่งเหล่านี้แยกต่างหากเป็นปลั๊กอินการพึ่งพาและความไม่ลงรอยกันของลิขสิทธิ์จะลดลงและทุกรุ่นสามารถนำไปใช้และบำรุงรักษาได้

ตัวอย่าง:

pip install autodistill autodistill-grounded-sam autodistill-yolov8

ติดตั้งจากแหล่งที่มา

นอกจากนี้คุณยังสามารถโคลนโครงการจาก GitHub เพื่อการพัฒนาในท้องถิ่น:

git clone https://github.com/roboflow/autodistill
cd autodistill
pip install -e .

โมเดลฐานและเป้าหมายเพิ่มเติมมีการระบุด้านล่าง

เร็ว

ดูสมุดบันทึกตัวอย่างสำหรับการแนะนำอย่างรวดเร็วเกี่ยวกับ autodistill สมุดบันทึกนี้เดินผ่านการสร้างรูปแบบการตรวจจับภาชนะนมโดยไม่มีการติดฉลาก

ด้านล่างนี้เราได้ย่อส่วนสำคัญของสมุดบันทึกเพื่อแนะนำ autodistill อย่างรวดเร็ว

คุณยังสามารถเรียกใช้ Autodistill ในคำสั่งเดียว ก่อนอื่นติดตั้ง autodistill :

pip install autodistill

จากนั้นเรียกใช้:

autodistill images --base= " grounding_dino " --target= " yolov8 " --ontology ' {"prompt": "label"} ' --output= " ./dataset "

คำสั่งนี้จะติดฉลากรูปภาพทั้งหมดในไดเรกทอรีที่เรียกว่า images ด้วยดิน Dino และใช้ภาพที่มีป้ายกำกับเพื่อฝึกอบรมรุ่น YOLOV8 Dino Grounding จะติดฉลากรูปภาพทั้งหมดด้วย "พรอมต์" และบันทึกฉลากเป็น "ฉลาก" คุณสามารถระบุพรอมต์และฉลากได้มากเท่าที่คุณต้องการ ชุดข้อมูลที่ได้จะถูกบันทึกในโฟลเดอร์ที่เรียกว่า dataset

ติดตั้งแพ็คเกจ

สำหรับตัวอย่างนี้เราจะแสดงวิธีกลั่นกรอง Groundedsam ในรุ่น YOLOV8 ขนาดเล็กโดยใช้ Autodistill-Grounded-Sam และ Autodistill-YOLOV8

 pip install autodistill autodistill-grounded-sam autodistill-yolov8

กลั่นแบบจำลอง

 from autodistill_grounded_sam import GroundedSAM
from autodistill . detection import CaptionOntology
from autodistill_yolov8 import YOLOv8

# define an ontology to map class names to our GroundingDINO prompt
# the ontology dictionary has the format {caption: class}
# where caption is the prompt sent to the base model, and class is the label that will
# be saved for that caption in the generated annotations
base_model = GroundedSAM ( ontology = CaptionOntology ({ "shipping container" : "container" }))

# label all images in a folder called `context_images`
base_model . label (
  input_folder = "./images" ,
  output_folder = "./dataset"
)

target_model = YOLOv8 ( "yolov8n.pt" )
target_model . train ( "./dataset/data.yaml" , epochs = 200 )

# run inference on the new model
pred = target_model . predict ( "./dataset/valid/your-image.jpg" , confidence = 0.5 )
print ( pred )

# optional: upload your model to Roboflow for deployment
from roboflow import Roboflow

rf = Roboflow ( api_key = "API_KEY" )
project = rf . workspace (). project ( "PROJECT_ID" )
project . version ( DATASET_VERSION ). deploy ( model_type = "yolov8" , model_path = f"./runs/detect/train/" )

ภาพการทำนาย

ในการพล็อตคำอธิบายประกอบสำหรับภาพเดียวโดยใช้ autodistill คุณสามารถใช้รหัสด้านล่าง รหัสนี้มีประโยชน์ในการมองเห็นคำอธิบายประกอบที่สร้างขึ้นโดยโมเดลพื้นฐานของคุณ (เช่น GroundedSam) และผลลัพธ์จากโมเดลเป้าหมายของคุณ (เช่น YOLOV8)

 import supervision as sv
import cv2

img_path = "./images/your-image.jpeg"

image = cv2 . imread ( img_path )

detections = base_model . predict ( img_path )
# annotate image with detections
box_annotator = sv . BoxAnnotator ()
label_annotator = sv . LabelAnnotator ()

labels = [
    f" { base_model . ontology . classes ()[ class_id ] } { confidence :0.2f } "
    for _ , _ , confidence , class_id , _ , _ in detections
]

annotated_frame = box_annotator . annotate (
    scene = image . copy (), detections = detections
)
annotated_frame = label_annotator . annotate (
    scene = annotated_frame , detections = detections , labels = labels
)

sv . plot_image ( annotated_frame , ( 16 , 16 ))

- รุ่นที่มีอยู่

เป้าหมายของเราคือ autodistill เพื่อสนับสนุนการใช้แบบจำลองพื้นฐานทั้งหมดเป็นแบบจำลองพื้นฐานและโมเดล SOTA ที่ดูแลส่วนใหญ่เป็นรุ่นเป้าหมาย เรามุ่งเน้นไปที่งานตรวจจับวัตถุและการแบ่งส่วนก่อน แต่วางแผนที่จะเปิดการสนับสนุนการจำแนกประเภทเร็ว ๆ นี้! ในอนาคตเราหวังว่า autodistill จะถูกใช้สำหรับรุ่นที่นอกเหนือจากการมองเห็นคอมพิวเตอร์

✅ - เสร็จสิ้น (คลิกที่ส่วนหัวแถว/คอลัมน์เพื่อไปที่ repo)
- - ทำงานระหว่างดำเนินการ

การตรวจจับวัตถุ

ฐาน / เป้าหมาย	YOLOV8	YOLO-NAS	YOLOV5	เครื่องดั่ง	YOLOV6	YOLOV7	MT-YOLOV6
Sam 2 สายดิน					-
พยากรณ์					-
สายดิน					-
ดิน					-
นกฮูก					-
คลิปแซม					-
llava-1.5					-
Kosmos-2					-
OWLV2					-
โมเดล Roboflow Universe (รุ่น 50K+ ที่ผ่านการฝึกอบรมมาก่อน)					-
ตัวเข้ารหัส					-
Azure Custom Vision					-
aws rekognition					-
Google Vision					-

การแบ่งส่วนอินสแตนซ์

ฐาน / เป้าหมาย	YOLOV8	YOLO-NAS	YOLOV5
สายดิน		-	-
คลิปแซม		-	-
ซุกซน		-	-
Fastsam	-	-	-

การจำแนกประเภท

ฐาน / เป้าหมาย	ความรู้สึก	YOLOV8	YOLOV5
คลิป			-
การเผาผลาญ			-
Dinov2			-
ทำให้เสีย			-
อัลเบฟ			-
FastVit			-
อัลดิสคลิป			-
การอพยพ			-
ราศีเมถุน			-
ฟูวู	-	-	-
เปิดฟลามิงโก	-	-	-
GPT-4
ปาล์ม 2

การสนับสนุนการปรับใช้โมเดล Roboflow

คุณสามารถเลือกปรับใช้รุ่นเป้าหมายบางอย่างที่ผ่านการฝึกอบรมโดยใช้ Autodistill บน Roboflow การปรับใช้บน Roboflow ช่วยให้คุณใช้ SDKs ที่กระชับสำหรับการใช้โมเดลของคุณบนขอบจาก Roboflow.js สำหรับการปรับใช้เว็บไปยังอุปกรณ์ Nvidia Jetson

โมเดลเป้าหมาย Autodistill ต่อไปนี้ได้รับการสนับสนุนโดย Roboflow สำหรับการปรับใช้:

ชื่อนางแบบ	รองรับ?
การตรวจจับวัตถุ YOLOV8
การแบ่งส่วนอินสแตนซ์ของ YOLOV8
การตรวจจับวัตถุ YOLOV5
การแบ่งส่วนอินสแตนซ์ของ YOLOV5
การจำแนกประเภท YOLOV8

- คู่มือวิดีโอ

Autodistill: ฝึก YOLOV8 ด้วยคำอธิบายประกอบเป็นศูนย์

เผยแพร่: 8 มิถุนายน 2566

ในวิดีโอนี้เราจะแสดงวิธีการใช้ห้องสมุดใหม่เพื่อฝึกอบรมรุ่น YOLOV8 เพื่อตรวจจับขวดที่เคลื่อนที่บนสายพานลำเลียง ใช่ถูกต้อง - จำเป็นต้องใช้เวลาหลายชั่วโมง! เราดำดิ่งลงไปในฟังก์ชั่นของ Autodistill ครอบคลุมหัวข้อจากการตั้งค่าสภาพแวดล้อม Python ของคุณและเตรียมภาพของคุณไปยังคำอธิบายประกอบอัตโนมัติที่น่าตื่นเต้น

ทรัพยากรชุมชน

กลั่นแบบจำลองการมองเห็นขนาดใหญ่เป็นรุ่นที่เล็กกว่าและมีประสิทธิภาพด้วย Autodistill: โพสต์ประกาศพร้อมคู่มือเป็นลายลักษณ์อักษรเกี่ยวกับวิธีการใช้ Autodistill
การเปรียบเทียบข้อมูลที่ติดฉลาก AI กับข้อมูลที่มีป้ายกำกับของมนุษย์: การประเมินเชิงคุณภาพของ Dino ที่มีการต่อสายดินที่ใช้กับ Autodistill ในงานและโดเมนต่างๆ
วิธีการประเมิน Autodistill Prompts ด้วย cvevals: ประเมินการแจ้งเตือน Autodistill
Autodistill: ติดฉลากและฝึกอบรมแบบจำลองการมองเห็นคอมพิวเตอร์ภายใน 20 นาที: สร้างแบบจำลองเพื่อตรวจจับเครื่องบินภายใน 20 นาที
การเปรียบเทียบข้อมูลที่มีป้ายกำกับ AI กับข้อมูลที่มีป้ายกำกับของมนุษย์: สำรวจจุดแข็งและข้อ จำกัด ของแบบจำลองพื้นฐานที่ใช้กับ Autoditsill
ฝึกอบรมรูปแบบการจำแนกรูปภาพโดยไม่มีการติดฉลาก: ใช้ SAM ที่ต่อสายดินเพื่อติดฉลากภาพโดยอัตโนมัติสำหรับการฝึกอบรมแบบจำลองการจำแนกประเภท YOLOV8 Ultralytics โดยอัตโนมัติ
ฝึกอบรมรูปแบบการแบ่งส่วนโดยไม่มีการติดฉลาก: ใช้คลิปเพื่อติดฉลากภาพโดยอัตโนมัติสำหรับการฝึกอบรมแบบจำลองการแบ่งกลุ่ม ultalytics YOLOV8 โดยอัตโนมัติ
ยื่น PR เพื่อเพิ่มทรัพยากรของคุณเองที่นี่!

️แผนงาน

นอกเหนือจากการเพิ่มโมเดลใหม่แล้วยังมีหลายพื้นที่ที่เราวางแผนที่จะสำรวจด้วย autodistill รวมถึง:

การสร้างอภิปรัชญาและวิศวกรรมที่รวดเร็ว
? ‍ มนุษย์ในการสนับสนุนวนรอบ
- การประเมินแบบจำลอง
การเรียนรู้อย่างแข็งขัน
งานภาษา

- การบริจาค

เรารักการป้อนข้อมูลของคุณ! โปรดดูคู่มือการสนับสนุนของเราในการเริ่มต้น ขอบคุณผู้สนับสนุนทุกคนของเรา!

? ‍⚖ ใบอนุญาต

แพ็คเกจ autodistill ได้รับอนุญาตภายใต้ Apache 2.0 ปลั๊กอินโมเดลฐานหรือเป้าหมายแต่ละตัวอาจใช้ใบอนุญาตของตัวเองที่สอดคล้องกับใบอนุญาตของโมเดลพื้นฐาน โปรดดูใบอนุญาตในปลั๊กอิน repo แต่ละรายการสำหรับข้อมูลเพิ่มเติม

คำถามที่พบบ่อย❓

อะไรทำให้ `PytorchStreamReader failed reading zip archive: failed finding central directory` ?

ข้อผิดพลาดนี้เกิดขึ้นเมื่อ Pytorch ไม่สามารถโหลดน้ำหนักแบบจำลองสำหรับรุ่นได้ ไปที่ไดเรกทอรี ~/.cache/autodistill และลบโฟลเดอร์ที่เกี่ยวข้องกับรุ่นที่คุณพยายามโหลด จากนั้นเรียกใช้รหัสของคุณอีกครั้ง น้ำหนักรุ่นจะถูกดาวน์โหลดตั้งแต่เริ่มต้น ปล่อยให้กระบวนการติดตั้งอย่างต่อเนื่อง

สำรวจโครงการโอเพ่นซอร์ส Roboflow เพิ่มเติม

โครงการ	คำอธิบาย
การดูแล	ยูทิลิตี้อเนกประสงค์ทั่วไปสำหรับใช้ในโครงการวิสัยทัศน์คอมพิวเตอร์จากการคาดการณ์การกรองและการแสดงผลจนถึงการติดตามวัตถุไปจนถึงการประเมินแบบจำลอง
Autodistill (โครงการนี้)	ติดฉลากภาพโดยอัตโนมัติสำหรับใช้ในการฝึกอบรมแบบจำลองการมองเห็นคอมพิวเตอร์
การอนุมาน	เซิร์ฟเวอร์การอนุมานพร้อมการผลิตที่ใช้งานง่ายสำหรับการมองเห็นคอมพิวเตอร์ที่รองรับการปรับใช้สถาปัตยกรรมโมเดลยอดนิยมมากมายและรุ่นที่ปรับจูน
สมุดบันทึก	บทเรียนสำหรับงานการมองเห็นคอมพิวเตอร์ตั้งแต่การฝึกอบรมโมเดลที่ทันสมัยไปจนถึงการติดตามวัตถุไปจนถึงการนับวัตถุในโซน
เก็บรวบรวม	การรวบรวมข้อมูลอัจฉริยะอัตโนมัติขับเคลื่อนโดยคลิป