Téléchargement luga - luga Source Code Download

luga

Code Source AI

v0.2.7

Télécharger

Luga

Une détection de langage rapide flamboyante à l'aide des modèles de langage de FastText.

Langues

Luga est un mot swahili pour la langue. FastText fournit un outil de détection de langage fast-rapide. Lamentablement, l'API de FastText est sans beauté, et la documentation est un peu floue. Il est également funky que nous devons télécharger et charger manuellement les modèles.

C'est là que Luga entre en jeu. Nous abstrons des étapes inutiles et vous permettons de faire précisément une chose: détecter le langage du texte.

image de couverture

Rester immobile. Restez silencieux - les relations entre les langues indo-européennes et uraliques par Minna Sundberg.

Montre, ne dis pas

Luga en action

Installation

python -m pip install -U luga

Usage:

️ Remarque: le premier utilisation télécharge le modèle pour vous. Il faudra un peu plus de temps pour importer en fonction de la vitesse Internet. Cela ne se fait qu'une seule fois.

 from luga import language

print ( language ( "the world ended yesterday" ))

# Language(name='en', score=0.98)

Avec la liste des textes, nous pouvons créer un masque pour un pipeline de filtrage, qui peut être utilisé, par exemple, avec DataFrames

 from luga import language
import pandas as pd

examples = [ "Jeg har ikke en rød reje" , "Det blæser en halv pelican" , "We are not robots yet" ]
languages ( texts = examples , only_language = True , to_array = True ) == "en"
# output
# array([False, False, True])

dataf = pd . DataFrame ({ "text" : examples })
dataf . loc [ lambda d : languages ( texts = d [ "text" ]. to_list (), only_language = True , to_array = True ) == "en" ]
# output
# 2    We are not robots yet
# Name: text, dtype: object

Sans Luga:

Télécharger le modèle

wget https://dl.fbaipublicfiles.com/fasttext/supervised-models/lid.176.bin -O /tmp/lid.176.bin

Charge et utilisation

 import fasttext

PATH_TO_MODEL = '/tmp/lid.176.bin'
fmodel = fasttext . load_model ( PATH_TO_MODEL )
fmodel . predict ([ "the world has ended yesterday" ])

# ([['__label__en']], [array([0.98046654], dtype=float32)])

Dev:

poetry run pre-commit install

Flux de libération

 # assumes git push is completed
git tag -l #  lists tags
git tag v * . * . * # Major.Minor.Fix
git push origin tag v * . * . *

# to delete tag:
git tag -d v * . * . * && git push origin tag -d v * . * . *

# change project_toml and __init__.py to reflect new version

FAIRE:

Refactor artefacts.py
Auto camionneurs avec pré-engagement | invoquer
Écrire plus de tests
Écrire des actions GitHub
Créez un vérificateur de données intelligent (une liste rapide [Str], que faire avec aucune chaîne)
Racontez plus vite avec Cython
Obtenez correctement NDARRAY
Correction artifacts.py
Supprimer les npyping lorsque plus de packages se déplacent vers Numpy> 1,21

Développer

Informations supplémentaires

Version v0.2.7
Type Code Source AI
Date de mise à jour 2025-09-06
taille 511.88KB
Provenant de Github

Applications connexes

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout