ดาวน์โหลด lida - ดาวน์โหลดซอร์สโค้ด lida

lida

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

LIDA: การสร้างภาพและอินโฟกราฟิกแบบอัตโนมัติโดยใช้แบบจำลองภาษาขนาดใหญ่

Lida เป็นห้องสมุดสำหรับการสร้างการสร้างภาพข้อมูลและอินโฟกราฟิกที่ซื่อสัตย์ของข้อมูล Lida เป็นไวยากรณ์ผู้ไม่เชื่อเรื่องพระเจ้า (จะทำงานกับภาษาการเขียนโปรแกรมและไลบรารีการสร้างภาพข้อมูลเช่น Matplotlib, Seoborn, Altair, D3 ฯลฯ ) และทำงานร่วมกับผู้ให้บริการแบบจำลองภาษาขนาดใหญ่หลายแห่ง (Openai, Azure Openai, Palm, Cohere, Huggingface) รายละเอียดเกี่ยวกับส่วนประกอบของ LIDA มีการอธิบายไว้ในกระดาษที่นี่และในสมุดบันทึกการสอนนี้ ดูหน้าโครงการที่นี่สำหรับการอัปเดต!

หมายเหตุเกี่ยวกับการดำเนินการรหัส: เพื่อสร้างการสร้างภาพข้อมูล LIDA จะสร้าง และ เรียกใช้ รหัส ตรวจสอบให้แน่ใจว่าคุณเรียกใช้ Lida ในสภาพแวดล้อมที่ปลอดภัย

คุณสมบัติ

ส่วนประกอบ Lida

Lida ถือว่า การสร้างภาพข้อมูลเป็นรหัส และให้ API ที่สะอาดสำหรับการสร้างดำเนินการแก้ไขอธิบายการประเมินและซ่อมแซมรหัสการสร้างภาพข้อมูล

การสรุปข้อมูล
การสร้างเป้าหมาย
การสร้างภาพ
การแก้ไขการสร้างภาพ
คำอธิบายการสร้างภาพข้อมูล
การประเมินและซ่อมแซมการสร้างภาพข้อมูล
คำแนะนำการสร้างภาพข้อมูล
Infographic Generation (BETA) # PIP ติดตั้ง LIDA [Infographics]

 from lida import Manager , llm

lida = Manager ( text_gen = llm ( "openai" )) # palm, cohere ..
summary = lida . summarize ( "data/cars.csv" )
goals = lida . goals ( summary , n = 2 ) # exploratory data analysis
charts = lida . visualize ( summary = summary , goal = goals [ 0 ]) # exploratory data analysis

เริ่มต้น

การตั้งค่าและตรวจสอบว่าสภาพแวดล้อม Python ของคุณคือ python 3.10 หรือสูงกว่า (ควรใช้ conda) ติดตั้งไลบรารีผ่าน PIP

pip install -U lida

Lida ขึ้นอยู่กับ llmx และ openai หากคุณติดตั้งไลบรารีเหล่านี้ก่อนหน้านี้ให้พิจารณาอัปเดต

pip install -U llmx openai

เมื่อตรงตามข้อกำหนดแล้วให้ตั้งค่าคีย์ API ของคุณ เรียนรู้เพิ่มเติมเกี่ยวกับการตั้งค่าคีย์สำหรับผู้ให้บริการ LLM รายอื่นที่นี่

 export OPENAI_API_KEY= < your key >

อีกทางเลือกหนึ่งคุณสามารถติดตั้งไลบรารีในรุ่น Dev ได้โดยการโคลน repo นี้และเรียกใช้ pip install -e . ในรูทที่เก็บ

Web API และ UI

Lida มาพร้อมกับ UI และ Web API ที่ให้มาพร้อมกับคุณสามารถสำรวจได้โดยเรียกใช้คำสั่งต่อไปนี้:

lida ui  --port=8080 --docs

จากนั้นนำทางไปที่ http: // localhost: 8080/ในเบราว์เซอร์ของคุณ หากต้องการดูข้อมูลจำเพาะของ Web API ให้เพิ่มตัวเลือก --docs ลงในคำสั่ง CLI และนำทางไปยัง http://localhost:8080/api/docs ในเบราว์เซอร์ของคุณ

วิธีที่เร็วที่สุดและแนะนำในการเริ่มต้นหลังจากการติดตั้งคือลองใช้เว็บ UI ด้านบนหรือเรียกใช้สมุดบันทึกการสอน

การสร้างเว็บ API และ UI ด้วย Docker

Lida Web API และ UI สามารถตั้งค่าได้โดยใช้ Docker และคำสั่งด้านล่าง (ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Docker และคุณได้ตั้งค่าตัวแปรสภาพแวดล้อม OPENAI_API_KEY ของคุณ)

docker compose up

การสรุปข้อมูล

กำหนดชุดข้อมูลให้สร้างข้อมูลสรุปขนาดกะทัดรัดของข้อมูล

 from lida import Manager

lida = Manager ()
summary = lida . summarize ( "data/cars.json" ) # generate data summary

การสร้างเป้าหมาย

สร้างชุดของเป้าหมายการสร้างภาพข้อมูลที่ได้รับสรุปข้อมูล

 goals = lida . goals ( summary , n = 5 , persona = "ceo with aerodynamics background" ) # generate goals

เพิ่มพารามิเตอร์ persona เพื่อสร้างเป้าหมายตาม persona นั้น

การสร้างภาพ

สร้าง, ปรับแต่ง, ดำเนินการและกรองรหัสการสร้างภาพข้อมูลโดยให้สรุปข้อมูลและเป้าหมายการสร้างภาพข้อมูล โปรดทราบว่า LIDA แสดงถึง การสร้างภาพข้อมูลเป็นรหัส

 # generate charts (generate and execute visualization code)
charts = lida . visualize ( summary = summary , goal = goals [ 0 ], library = "matplotlib" ) # seaborn, ggplot ..

การแก้ไขการสร้างภาพ

ให้การสร้างภาพข้อมูลแก้ไขการสร้างภาพโดยใช้ภาษาธรรมชาติ

 # modify chart using natural language
instructions = [ "convert this to a bar chart" , "change the color to red" , "change y axes label to Fuel Efficiency" , "translate the title to french" ]
edited_charts = lida . edit ( code = code ,  summary = summary , instructions = instructions , library = library , textgen_config = textgen_config )

คำอธิบายการสร้างภาพข้อมูล

ให้การสร้างภาพข้อมูลสร้างคำอธิบายภาษาธรรมชาติของรหัสการสร้างภาพ (การเข้าถึงการแปลงข้อมูลที่ใช้รหัสการสร้างภาพข้อมูล)

 # generate explanation for chart
explanation = lida . explain ( code = charts [ 0 ]. code , summary = summary )

การประเมินและซ่อมแซมการสร้างภาพข้อมูล

ให้การสร้างภาพข้อมูลประเมินเพื่อค้นหาคำแนะนำในการซ่อมแซม (ซึ่งอาจเป็นมนุษย์ที่ประพันธ์หรือสร้างขึ้น) ซ่อมแซมการสร้างภาพข้อมูล

 evaluations = lida . evaluate ( code = code ,  goal = goals [ i ], library = library )

คำแนะนำการสร้างภาพข้อมูล

กำหนดชุดข้อมูลให้สร้างชุดของการสร้างภาพข้อมูลที่แนะนำ

 recommendations = lida . recommend ( code = code , summary = summary , n = 2 ,  textgen_config = textgen_config )

การสร้างอินโฟกราฟิก [WIP]

ให้การสร้างภาพข้อมูลสร้างอินโฟกราฟิกที่ซื่อสัตย์ของข้อมูล วิธีการนี้ควรได้รับการพิจารณาการทดลองและใช้แบบจำลองการแพร่กระจายที่เสถียรจากห้องสมุด Peacasso คุณจะต้องเรียกใช้ pip install lida[infographics] เพื่อติดตั้งการอ้างอิงที่ต้องการ

 infographics = lida . infographics ( visualization = charts [ 0 ]. raster , n = 3 , style_prompt = "line art" )

การใช้ LIDA กับ LLM ที่โฮสต์ในพื้นที่ (HuggingFace)

Lida ใช้ไลบรารี LLMX เป็นส่วนต่อประสานสำหรับการสร้างข้อความ LLMX รองรับรุ่นท้องถิ่นหลายรุ่นรวมถึง HuggingFace Models คุณสามารถใช้โมเดล HuggingFace ได้โดยตรง (สมมติว่าคุณมี GPU) หรือเชื่อมต่อกับจุดสิ้นสุดรุ่นท้องถิ่นที่เข้ากันได้ของ OpenAI เช่นโดยใช้ไลบรารี VLLM ที่ยอดเยี่ยม

ใช้โมเดล HuggingFace โดยตรง

!p ip3 install - - upgrade llmx == 0.0 . 17 a0

# Restart the colab session

from lida import Manager
from llmx import  llm
text_gen = llm ( provider = "hf" , model = "uukuguy/speechless-llama2-hermes-orca-platypus-13b" , device_map = "auto" )
lida = Manager ( text_gen = text_gen )
# now you can call lida methods as above e.g.
sumamry = lida . summarize ( "data/cars.csv" ) # ....

การใช้เซิร์ฟเวอร์ Vllm ที่เข้ากันได้ของ OpenAI

 from lida import Manager , TextGenerationConfig , llm

model_name = "uukuguy/speechless-llama2-hermes-orca-platypus-13b"
model_details = [{ 'name' : model_name , 'max_tokens' : 2596 , 'model' : { 'provider' : 'openai' , 'parameters' : { 'model' : model_name }}}]

# assuming your vllm endpoint is running on localhost:8000
text_gen = llm ( provider = "openai" ,  api_base = "http://localhost:8000/v1" , api_key = "EMPTY" , models = model_details )
lida = Manager ( text_gen = text_gen )

หมายเหตุสำคัญ / คำเตือน / คำถามที่พบบ่อย

LIDA สร้างและเรียกใช้รหัสตามอินพุตที่ให้ไว้ ตรวจสอบให้แน่ใจว่าคุณเรียกใช้ LIDA ในสภาพแวดล้อมที่ปลอดภัยโดยมีสิทธิ์ที่เหมาะสม
ปัจจุบัน Lida ทำงานได้ดีที่สุดกับชุดข้อมูลที่มีคอลัมน์จำนวนน้อย (<= 10) นี่คือสาเหตุหลักมาจากขนาดบริบทที่ จำกัด สำหรับรุ่นส่วนใหญ่ สำหรับชุดข้อมูลขนาดใหญ่ให้พิจารณาการประมวลผลชุดข้อมูลของคุณล่วงหน้าเพื่อใช้ชุดย่อยของคอลัมน์
Lida ถือว่าชุดข้อมูลมีอยู่และอยู่ในรูปแบบที่สามารถโหลดลงในแพนด้า dataframe ตัวอย่างเช่นไฟล์ CSV หรือไฟล์ JSON ที่มีรายการวัตถุ ในการปฏิบัติชุดข้อมูลที่เหมาะสมอาจต้องได้รับการดูแลและประมวลผลล่วงหน้าเพื่อให้แน่ใจว่าเหมาะสำหรับงานที่อยู่ในมือ
LLMS ขนาดเล็ก (เช่น OSS LLMs บน HuggingFace) มีคำแนะนำที่ จำกัด ตามความสามารถและอาจใช้งานไม่ได้กับ LIDA Lida ทำงานได้ดีที่สุดกับ LLM ที่ใหญ่กว่า (เช่น OpenAI GPT 3.5, GPT 4)
วิธี LIDA มีความน่าเชื่อถือแค่ไหน? กระดาษ LIDA อธิบายการทดลองที่ประเมินความน่าเชื่อถือของ LIDA โดยใช้ตัวชี้วัดอัตราความผิดพลาดในการสร้างภาพข้อมูล ด้วยเวอร์ชันปัจจุบันของพรอมต์เทคนิคการสรุปข้อมูลการประมวลผลล่วงหน้า/การประมวลผลตรรกะและ LLMS, LIDA มีอัตราความผิดพลาด <3.5% สำหรับการสร้างภาพข้อมูลมากกว่า 2200 ครั้งที่สร้างขึ้น (เทียบกับพื้นฐานของอัตราความผิดพลาดมากกว่า 10%) พื้นที่นี้กำลังดำเนินการอยู่
ฉันสามารถสร้างแอพของตัวเองด้วย Lida ได้หรือไม่? ใช่! คุณสามารถใช้ Python API ได้โดยตรงในแอพของคุณหรือตั้งค่าจุดสิ้นสุดของ Web API และใช้ Web API ในแอปของคุณ ดูส่วน Web API สำหรับรายละเอียดเพิ่มเติม
LIDA เกี่ยวข้องกับ OpenAI Code Interpreter อย่างไร: LIDA แบ่งปันความคล้ายคลึงกันหลายอย่างกับ Code Interpreter ในแง่ที่ว่าทั้งคู่เกี่ยวข้องกับการเขียนและการดำเนินการรหัสเพื่อจัดการกับความตั้งใจของผู้ใช้ Lida แตกต่างกันไปในการมุ่งเน้นไปที่การสร้างภาพข้อมูลโดยให้ API แบบแยกส่วนสำหรับการใช้ซ้ำนักพัฒนาและให้การวัดการประเมินผลในกรณีการใช้การสร้างภาพ

โดยธรรมชาติแล้วข้อ จำกัด บางประการข้างต้นอาจได้รับการแก้ไขด้วยการประชาสัมพันธ์ที่ได้รับการต้อนรับอย่างมาก

ตัวอย่างชุมชนที่สร้างด้วย Lida

lida + streamlit: lida-streamlit

เอกสารและการอ้างอิง

กระดาษสั้นที่อธิบาย LIDA (ยอมรับในการประชุม ACL 2023) มีให้ที่นี่

 @inproceedings { dibia2023lida ,
    title = " {LIDA}: A Tool for Automatic Generation of Grammar-Agnostic Visualizations and Infographics using Large Language Models " ,
    author = " Dibia, Victor " ,
    booktitle = " Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 3: System Demonstrations) " ,
    month = jul,
    year = " 2023 " ,
    address = " Toronto, Canada " ,
    publisher = " Association for Computational Linguistics " ,
    url = " https://aclanthology.org/2023.acl-demo.11 " ,
    doi = " 10.18653/v1/2023.acl-demo.11 " ,
    pages = " 113--126 " ,
}

LIDA สร้างข้อมูลเชิงลึกในการสร้างการสร้างภาพข้อมูลอัตโนมัติจากกระดาษก่อนหน้านี้ - DATA2VIS: การสร้างการสร้างภาพข้อมูลอัตโนมัติโดยใช้ลำดับเพื่อลำดับเครือข่ายประสาทที่เกิดขึ้นอีก

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-03-01
ขนาด 8.05MB
มาจาก Github

แอปที่เกี่ยวข้อง

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

ซอร์สโค้ดอื่น ๆ

1.0.0

ข้อมูลที่เกี่ยวข้อง ทั้งหมด