Скачать LightAutoML - Скачать исходный код LightAutoML

LightAutoML

Другой исходный код

v0.3.0

Скачать

Lightautoml (лама) - это а автоматическая структура Sber AI Lab.

Он обеспечивает автоматическое создание модели для следующих задач:

бинарная классификация
Классификация мультикласс
регрессия

Текущая версия пакета обрабатывает наборы данных, которые имеют независимые образцы в каждой строке. Т.е. каждая строка является объектом с его конкретными функциями и целью . Наборы данных и последовательности многоднамерных данных - это работа :)

Примечание . Мы используем библиотеку AutoWoE для автоматического создания интерпретируемых моделей.

Авторы : Александр Ричков, Антон Вахрушев, Дмитрий Симаков, Василия Банаков, Ринчин Дамдинов, Павел Шветс, Александр Кирилин.

Документация LightAutoml доступна здесь, вы также можете его генерировать.

(Новая функция) трубопровод графического процессора

Полный трубопровод GPU для LightAutoml, в настоящее время доступный для тестирования разработчиков (все еще в процессе). Код и учебные пособия, доступные здесь

Установка

Чтобы установить Lama Framework на вашем компьютере из PYPI, выполните следующие команды:

 # Install base functionality:

pip install -U lightautoml

# For partial installation use corresponding option.
# Extra dependecies: [nlp, cv, report]
# Or you can use 'all' to install everything

pip install -U lightautoml[nlp]

Добавление, запустите следующие команды, чтобы включить генерацию отчета PDF:

 # MacOS
brew install cairo pango gdk-pixbuf libffi

# Debian / Ubuntu
sudo apt-get install build-essential libcairo2 libpango-1.0-0 libpangocairo-1.0-0 libgdk-pixbuf2.0-0 libffi-dev shared-mime-info

# Fedora
sudo yum install redhat-rpm-config libffi-devel cairo pango gdk-pixbuf2

# Windows
# follow this tutorial https://weasyprint.readthedocs.io/en/stable/install.html#windows

Вернуться к вершине

Быстрый тур

Давайте решим популярную конкурс Kaggle Titanic ниже. Есть два основных способа решения проблем машинного обучения с помощью LightAutoml:

Используйте готовые предварительные условия для табличных данных:

 import pandas as pd
from sklearn . metrics import f1_score

from lightautoml . automl . presets . tabular_presets import TabularAutoML
from lightautoml . tasks import Task

df_train = pd . read_csv ( '../input/titanic/train.csv' )
df_test = pd . read_csv ( '../input/titanic/test.csv' )

automl = TabularAutoML (
    task = Task (
        name = 'binary' ,
        metric = lambda y_true , y_pred : f1_score ( y_true , ( y_pred > 0.5 ) * 1 ))
)
oof_pred = automl . fit_predict (
    df_train ,
    roles = { 'target' : 'Survived' , 'drop' : [ 'PassengerId' ]}
)
test_pred = automl . predict ( df_test )

pd . DataFrame ({
    'PassengerId' : df_test . PassengerId ,
    'Survived' : ( test_pred . data [:, 0 ] > 0.5 ) * 1
}). to_csv ( 'submit.csv' , index = False )

Lighautoml Framework имеет множество готовых к использованию деталей и обширных вариантов настройки, чтобы узнать больше о разделе ресурсов.

Вернуться к вершине

Ресурсы

Примеры ядра Kaggle примеры использования LightAutoml:

Searge Series Series Playground Series April 2021
Решение о конкуренции Титаника (точность 80%)
Конкурентное решение Titanic 12-код (точность 78%)
Решение конкуренции по ценам дома
Обработка естественного языка с помощью твитов твитов бедствий
Search Series Series March 2021 March 2021
Решение соревнований в табличной игрной площадке февраль 2021 года
Интерпретируемое решение белого ящика
Пользовательские элементы трубопровода ML внутри существующих

Учебники Google Colab и другие примеры:

Tutorial_1_basics.ipynb - Начните с Lightautoml на табличных данных.
Tutorial_2_WhiteBox_AutoWoE.ipynb - Создание интерпретируемых моделей.
Tutorial_3_sql_data_source.ipynb - показывает, как использовать предустановки LightAutoml (как автономные, так и используемые временные варианты) для решения задач ML на табличных данных из базы данных SQL вместо CSV.
Tutorial_4_NLP_Interpretation.ipynb - Пример использования PRESET TabularnlPautoml, LimetExtexplainer.
Tutorial_5_uplift.ipynb показывает, как использовать LightAutoml для задачи повышения моделирования.
Tutorial_6_custom_pipeline.ipynb - показывает, как создать свой собственный конвейер из указанных блоков: трубопроводы для генерации функций и выбора функций, алгоритмы ML, оптимизация гиперпараметрии и т. Д.
Tutorial_7_ICE_and_PDP_interpretation.ipynb - показывает, как получить локальную и глобальную интерпретацию результатов модели с использованием подходов ICE и PDP.

ПРИМЕЧАНИЕ 1 : Для производства вам не нужно использовать Profiler (который увеличивает рабочее время и концепция памяти), поэтому, пожалуйста, не включайте его - он в Off Cathate по умолчанию

Примечание 2 : Чтобы взглянуть на этот отчет после запуска, прокомментируйте последнюю строку демонстрации с командой по удалению отчетов.

Курсы, видео и документы

Lightautoml Crash Courses :
- (Русский) курс автоматического сообщества Opendatascience
Видео -гиды :
- (Русский) вебинар LightAutoml для сообщества Sberloga (Александр Райжков, Дмитрий Симаков)
- (Русский) LightAutoml Практическое руководство в ядрах Kaggle (Александр Рычков)
- (Английский) Автоматическое машинное обучение с Lightautoml: теория и практика (Александр Ryzhkov)
- (Английский) Общий обзор LightAutoml Framework, тесты и преимущества для бизнеса (Александр Рычков)
- (Английский) LightAutoml Практическое руководство - ML Pripeline Presets Обзор (Dmitry Simakov)
Документы :
- Антон Вахрушев, Александр Ричков, Дмитрий Симаков, Ринчин Дамдинов, Максим Савченко, Александр Тужалин "Lightautoml: Automl Solution для крупной экосистемы финансовых услуг". Arxiv: 2109.01528, 2021.
Статьи о LightAutoml :
- (Английский) Lightautoml против Titanic: точность 80% в нескольких строках кода (Medium)
- (Английский) Практическое руководство по Python по Lightautoml-автоматической структуре создания модели ML (Analytic Indian Mag)

Вернуться к вершине

Вклад в LightAutoml

Если вы заинтересованы в участии в LightAutoml, пожалуйста, прочитайте руководство для начала.

Вернуться к вершине

Лицензия

Этот проект лицензирован по лицензии Apache, версия 2.0. См. Файл лицензии для получения более подробной информации.

Вернуться к вершине

Для разработчиков

Установка из исходного кода

Прежде всего вам нужно установить git и поэзию.

 # Load LAMA source code
git clone https://github.com/sberbank-ai-lab/LightAutoML.git

cd LightAutoML/

# !!!Choose only one item!!!

# 1. Global installation: Don't create virtual environment
poetry config virtualenvs.create false --local

# 2. Recommended: Create virtual environment inside your project directory
poetry config virtualenvs.in-project true

# For more information read poetry docs

# Install LAMA
poetry lock
poetry install

Создайте свой собственный трубопровод:

 import pandas as pd
from sklearn . metrics import f1_score

from lightautoml . automl . presets . tabular_presets import TabularAutoML
from lightautoml . tasks import Task

df_train = pd . read_csv ( '../input/titanic/train.csv' )
df_test = pd . read_csv ( '../input/titanic/test.csv' )

# define that machine learning problem is binary classification
task = Task ( "binary" )

reader = PandasToPandasReader ( task , cv = N_FOLDS , random_state = RANDOM_STATE )

# create a feature selector
model0 = BoostLGBM (
    default_params = { 'learning_rate' : 0.05 , 'num_leaves' : 64 ,
    'seed' : 42 , 'num_threads' : N_THREADS }
)
pipe0 = LGBSimpleFeatures ()
mbie = ModelBasedImportanceEstimator ()
selector = ImportanceCutoffSelector ( pipe0 , model0 , mbie , cutoff = 0 )

# build first level pipeline for AutoML
pipe = LGBSimpleFeatures ()
# stop after 20 iterations or after 30 seconds
params_tuner1 = OptunaTuner ( n_trials = 20 , timeout = 30 )
model1 = BoostLGBM (
    default_params = { 'learning_rate' : 0.05 , 'num_leaves' : 128 ,
    'seed' : 1 , 'num_threads' : N_THREADS }
)
model2 = BoostLGBM (
    default_params = { 'learning_rate' : 0.025 , 'num_leaves' : 64 ,
    'seed' : 2 , 'num_threads' : N_THREADS }
)
pipeline_lvl1 = MLPipeline ([
    ( model1 , params_tuner1 ),
    model2
], pre_selection = selector , features_pipeline = pipe , post_selection = None )

# build second level pipeline for AutoML
pipe1 = LGBSimpleFeatures ()
model = BoostLGBM (
    default_params = { 'learning_rate' : 0.05 , 'num_leaves' : 64 ,
    'max_bin' : 1024 , 'seed' : 3 , 'num_threads' : N_THREADS },
    freeze_defaults = True
)
pipeline_lvl2 = MLPipeline ([ model ], pre_selection = None , features_pipeline = pipe1 ,
 post_selection = None )

# build AutoML pipeline
automl = AutoML ( reader , [
    [ pipeline_lvl1 ],
    [ pipeline_lvl2 ],
], skip_conn = False )

# train AutoML and get predictions
oof_pred = automl . fit_predict ( df_train , roles = { 'target' : 'Survived' , 'drop' : [ 'PassengerId' ]})
test_pred = automl . predict ( df_test )

pd . DataFrame ({
    'PassengerId' : df_test . PassengerId ,
    'Survived' : ( test_pred . data [:, 0 ] > 0.5 ) * 1
}). to_csv ( 'submit.csv' , index = False )

Вернуться к вершине

Запросы на поддержку и функции

Поиск быстрого совета в Slack Community или Telegram Group.

Откройте отчеты об ошибках и запросы функций по вопросам GitHub.

Расширять

Дополнительная информация

Версия v0.3.0
Тип Другой исходный код
Время обновления 2025-04-18
размер 11.27MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
mongo express

2025-06-04
hidusbf

2025-02-14
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

LightAutoML

(Новая функция) трубопровод графического процессора

Оглавление

Установка

Быстрый тур

Ресурсы

Примеры ядра Kaggle примеры использования LightAutoml:

Учебники Google Colab и другие примеры:

Курсы, видео и документы

Вклад в LightAutoml

Лицензия

Для разработчиков

Установка из исходного кода

Создайте свой собственный трубопровод:

Запросы на поддержку и функции

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express