lida скачать - скачать исходный код lida

lida

Другой исходный код

1.0.0

Скачать

LIDA: автоматическая генерация визуализаций и инфографики с использованием больших языковых моделей

LIDA-это библиотека для создания визуализаций данных и инфографики. LIDA является грамматической агностикой (будет работать с любыми библиотеками языка программирования и визуализацией, например, Matplotlib, Seaborn, Altair, D3 и т. Д.), И работает с несколькими поставщиками моделей крупных языков (Openai, Azure Openai, ладонь, кожура, Huggingface). Подробная информация о компонентах LIDA описана здесь и в этой учебной записной книжке. Смотрите страницу проекта здесь для обновлений!.

Примечание по выполнению кода: Для создания визуализаций LIDA генерирует и выполняет код. Убедитесь, что вы управляете LIDA в безопасной среде.

Функции

Компоненты LIDA

Лида рассматривает визуализации как код и предоставляет чистый API для генерации, выполнения, редактирования, объяснения, оценки и восстановления кода визуализации.

Суммизация данных
Генерация целей
Визуализация генерации
Редактирование визуализации
Объяснение визуализации
Оценка и восстановление визуализации
Рекомендация визуализации
Инфографическая генерация (бета) # pip установить Lida [Infographics]

 from lida import Manager , llm

lida = Manager ( text_gen = llm ( "openai" )) # palm, cohere ..
summary = lida . summarize ( "data/cars.csv" )
goals = lida . goals ( summary , n = 2 ) # exploratory data analysis
charts = lida . visualize ( summary = summary , goal = goals [ 0 ]) # exploratory data analysis

Начиная

Установите и убедитесь, что ваша среда Python составляет python 3.10 или выше (предпочтительно, используйте Conda). Установите библиотеку через PIP.

pip install -U lida

Лида зависит от llmx и openai . Если бы у вас были установлены эти библиотеки ранее, рассмотрите возможность их обновления.

pip install -U llmx openai

Как только требования будут выполнены, настройте свой ключ API. Узнайте больше о настройке ключей для других поставщиков LLM здесь.

 export OPENAI_API_KEY= < your key >

В качестве альтернативы вы можете установить библиотеку в Dev Model, клонируя это репо и выполняя pip install -e . В корне репозитория.

Веб -API и пользовательский интерфейс

Lida поставляется с дополнительным пользовательским интерфейсом и веб -API, который вы можете изучить, выполнив следующую команду:

lida ui  --port=8080 --docs

Затем перейдите к http: // localhost: 8080/в вашем браузере. Чтобы просмотреть спецификацию Web API, добавьте опцию --docs в команду CLI и перейдите по http://localhost:8080/api/docs в вашем браузере.

Самым быстрым и рекомендуемым способом начать работу после установки будет пробовать веб -интерфейс выше или запустить учебную записную книжку.

Создание веб -API и пользовательского интерфейса с Docker

Web API и пользовательский интерфейс LIDA можно настроить с помощью Docker и команды ниже (убедитесь, что у вас установлен Docker, и вы установили свою переменную среды OPENAI_API_KEY ).

docker compose up

Суммизация данных

Учитывая набор данных, создайте компактную сводку данных.

 from lida import Manager

lida = Manager ()
summary = lida . summarize ( "data/cars.json" ) # generate data summary

Генерация целей

Создайте набор целей визуализации, учитывая сводку данных.

 goals = lida . goals ( summary , n = 5 , persona = "ceo with aerodynamics background" ) # generate goals

Добавьте параметр persona для достижения целей на основе этой личности.

Визуализация генерации

Сгенерировать, уточнить, выполнить и фильтровать код визуализации, учитывая сводку данных и цель визуализации. Обратите внимание, что LIDA представляет визуализации как код .

 # generate charts (generate and execute visualization code)
charts = lida . visualize ( summary = summary , goal = goals [ 0 ], library = "matplotlib" ) # seaborn, ggplot ..

Редактирование визуализации

Учитывая визуализацию, отредактируйте визуализацию с использованием естественного языка.

 # modify chart using natural language
instructions = [ "convert this to a bar chart" , "change the color to red" , "change y axes label to Fuel Efficiency" , "translate the title to french" ]
edited_charts = lida . edit ( code = code ,  summary = summary , instructions = instructions , library = library , textgen_config = textgen_config )

Объяснение визуализации

Учитывая визуализацию, генерируйте естественный язык объяснение кода визуализации (доступность, применяемые преобразования данных, код визуализации)

 # generate explanation for chart
explanation = lida . explain ( code = charts [ 0 ]. code , summary = summary )

Оценка и восстановление визуализации

Учитывая визуализацию, оцените, чтобы найти инструкции по восстановлению (которые могут быть созданы человеком или сгенерированы), восстановить визуализацию.

 evaluations = lida . evaluate ( code = code ,  goal = goals [ i ], library = library )

Инфографическая генерация [WIP]

Учитывая визуализацию, генерируйте инфографику, прикрепленную к данным. Эти методы следует считать экспериментальными и используют стабильные диффузионные модели из библиотеки Peacasso. Вам нужно будет запустить pip install lida[infographics] чтобы установить необходимые зависимости.

 infographics = lida . infographics ( visualization = charts [ 0 ]. raster , n = 3 , style_prompt = "line art" )

Использование LIDA с локально размещенными LLMS (HuggingFace)

Lida использует библиотеку LLMX в качестве интерфейса для генерации текста. LLMX поддерживает несколько локальных моделей, включая модели HuggingFace. Вы можете напрямую использовать модели HuggingChipface (при условии, что у вас есть графический процессор) или подключиться к совместимой с открытой локальной конечной точкой модели, например, с использованием превосходной библиотеки VLLM.

Использование моделей Huggingface напрямую

!p ip3 install - - upgrade llmx == 0.0 . 17 a0

# Restart the colab session

from lida import Manager
from llmx import  llm
text_gen = llm ( provider = "hf" , model = "uukuguy/speechless-llama2-hermes-orca-platypus-13b" , device_map = "auto" )
lida = Manager ( text_gen = text_gen )
# now you can call lida methods as above e.g.
sumamry = lida . summarize ( "data/cars.csv" ) # ....

Использование совместимой с открытой конечной точкой, например, VLLM Server

 from lida import Manager , TextGenerationConfig , llm

model_name = "uukuguy/speechless-llama2-hermes-orca-platypus-13b"
model_details = [{ 'name' : model_name , 'max_tokens' : 2596 , 'model' : { 'provider' : 'openai' , 'parameters' : { 'model' : model_name }}}]

# assuming your vllm endpoint is running on localhost:8000
text_gen = llm ( provider = "openai" ,  api_base = "http://localhost:8000/v1" , api_key = "EMPTY" , models = model_details )
lida = Manager ( text_gen = text_gen )

Важные примечания / предостережения / часто задаваемые вопросы

LIDA генерирует и выполняет код на основе предоставленного ввода. Убедитесь, что вы запускаете LIDA в безопасной среде с соответствующими разрешениями.
В настоящее время LIDA работает лучше всего с наборами данных, которые имеют небольшое количество столбцов (<= 10). Это в основном связано с ограниченным размером контекста для большинства моделей. Для более крупных наборов данных рассмотрите предварительную обработку вашего набора данных, чтобы использовать подмножество столбцов.
Lida предполагает, что набор данных существует и находится в формате, который может быть загружен в DataFrame Pandas. Например, файл CSV или файл JSON со списком объектов. В практике может потребоваться курировать правильный набор данных, чтобы убедиться, что он подходит для поставленной задачи.
Меньшие LLMS (например, OSS LLMS на HuggingFace) имеют ограниченное обучение после возможностей и могут не работать с LIDA. Лида лучше всего работает с более крупными LLMS (например, OpenAI GPT 3.5, GPT 4).
Насколько надежен подход LIDA? В статье LIDA описываются эксперименты, которые оценивают надежность LIDA с использованием показателя частоты ошибок визуализации. Благодаря текущей версии подсказок, методов суммирования данных, логики предварительной обработки/постобработки и LLMS, LIDA имеет частоту ошибок <3,5% при более 2200 визуализации (по сравнению с базовой уровнем уровня более 10% ошибок). Эта область находится в стадии разработки.
Могу ли я создать свои собственные приложения с Lida? Да! Вы можете либо использовать API Python непосредственно в вашем приложении, либо настроить конечную точку Web API и использовать веб -API в вашем приложении. Смотрите раздел Web API для получения более подробной информации.
Как LIDA связано с интерпретатором Code OpenAI: LIDA делится несколькими сходствами с интерпретатором кода в том смысле, что оба включают в себя написание и выполнение кода для решения намерений пользователя. LIDA отличается тем, что сосредоточено на визуализации, предоставляя модульный API для повторного использования разработчиков и предоставляя показатели оценки на вариант использования визуализации.

Естественно, некоторые из приведенных выше ограничений могут быть рассмотрены очень приветственным PR.

Примеры сообщества, построенные с LIDA

LIDA + StriveLit: LIDA-Streamlit,

Документация и цитата

Короткая статья, описывающая Лиду (принятую на конференции ACL 2023) доступна здесь.

 @inproceedings { dibia2023lida ,
    title = " {LIDA}: A Tool for Automatic Generation of Grammar-Agnostic Visualizations and Infographics using Large Language Models " ,
    author = " Dibia, Victor " ,
    booktitle = " Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (Volume 3: System Demonstrations) " ,
    month = jul,
    year = " 2023 " ,
    address = " Toronto, Canada " ,
    publisher = " Association for Computational Linguistics " ,
    url = " https://aclanthology.org/2023.acl-demo.11 " ,
    doi = " 10.18653/v1/2023.acl-demo.11 " ,
    pages = " 113--126 " ,
}

Lida опирается на понимание автоматической генерации визуализации из более ранней статьи - Data2vis: автоматическая генерация визуализаций данных с использованием последовательности для последовательности рецидивирующих нейронных сетей.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-01
размер 8.05MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

lida

LIDA: автоматическая генерация визуализаций и инфографики с использованием больших языковых моделей

Функции

Начиная

Веб -API и пользовательский интерфейс

Создание веб -API и пользовательского интерфейса с Docker

Суммизация данных

Генерация целей

Визуализация генерации

Редактирование визуализации

Объяснение визуализации

Оценка и восстановление визуализации

Рекомендация визуализации

Инфографическая генерация [WIP]

Использование LIDA с локально размещенными LLMS (HuggingFace)

Использование моделей Huggingface напрямую

Использование совместимой с открытой конечной точкой, например, VLLM Server

Важные примечания / предостережения / часто задаваемые вопросы

Примеры сообщества, построенные с LIDA

Документация и цитата

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf