Descargar luga - Descargar código fuente luga

luga

Código Fuente de IA

v0.2.7

Descargar

Luga

Una detección de lenguaje rápido y ardiente utilizando modelos de lenguaje de FastText.

Lenguas

Luga es una palabra swahili para el idioma. FastText proporciona una herramienta de detección de lenguaje de rápido rápido. Lamentablemente, la API de FastText es sin belleza, y la documentación es un poco confusa. También es funky que tengamos que descargar y cargar modelos manualmente.

Aquí es donde entra Luga . Abrazamos pasos innecesarios y le permitimos hacer precisamente una cosa: detectar el lenguaje de texto.

imagen de portada

Estarse quieto. Mantente en silencio: las relaciones entre las lenguas indoeuropeas y urálicas por Minna Sundberg.

Muestra, no digas

Luga en acción

Instalación

python -m pip install -U luga

Uso:

️ Nota: El primer uso descarga el modelo para usted. Tomará un poco más de tiempo importar dependiendo de la velocidad de Internet. Se hace solo una vez.

 from luga import language

print ( language ( "the world ended yesterday" ))

# Language(name='en', score=0.98)

Con la lista de textos, podemos crear una máscara para una tubería de filtrado, que se puede usar, por ejemplo, con DataFrames

 from luga import language
import pandas as pd

examples = [ "Jeg har ikke en rød reje" , "Det blæser en halv pelican" , "We are not robots yet" ]
languages ( texts = examples , only_language = True , to_array = True ) == "en"
# output
# array([False, False, True])

dataf = pd . DataFrame ({ "text" : examples })
dataf . loc [ lambda d : languages ( texts = d [ "text" ]. to_list (), only_language = True , to_array = True ) == "en" ]
# output
# 2    We are not robots yet
# Name: text, dtype: object

Sin Luga:

Descarga el modelo

wget https://dl.fbaipublicfiles.com/fasttext/supervised-models/lid.176.bin -O /tmp/lid.176.bin

Cargar y usar

 import fasttext

PATH_TO_MODEL = '/tmp/lid.176.bin'
fmodel = fasttext . load_model ( PATH_TO_MODEL )
fmodel . predict ([ "the world has ended yesterday" ])

# ([['__label__en']], [array([0.98046654], dtype=float32)])

Dev:

poetry run pre-commit install

Flujo de liberación

 # assumes git push is completed
git tag -l #  lists tags
git tag v * . * . * # Major.Minor.Fix
git push origin tag v * . * . *

# to delete tag:
git tag -d v * . * . * && git push origin tag -d v * . * . *

# change project_toml and __init__.py to reflect new version

HACER:

Artifactos de refactores.py
Auto Checkers con precomito | invocar
Escribe más pruebas
Escribir acciones de Github
Cree un verificador de datos inteligente (una lista rápida [STR], qué hacer con ninguna cadena)
Hazlo más rápido con Cython
Obtenga la escritura de NDarray correctamente
Arreglar artifacts.py Línea 111 Cast para enumerar [STR] que causa problemas
Eliminar los nptyping cuando más paquetes se muevan a Numpy> 1.21

Expandir

Información adicional

Versión v0.2.7
Tipo Código Fuente de IA
Fecha de actualización 2025-09-06
tamaño 511.88KB
Proviene de Github

Aplicaciones relacionadas

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo