Detectar el lenguaje del texto.
† - Basado en el UDHR, el documento sin derechos de autor más traducido del mundo.
Franc admite muchos idiomas, lo que significa que se confunde fácilmente en pequeñas muestras. Asegúrese de aprobarlo grandes documentos para obtener resultados confiables.
Nota : Esto instala el paquete
franc, con soporte para 187 idiomas (idiomas que tienen 1 millón o más altavoces).franc-min(82 idiomas, 8m o más hablantes) yfranc-all(todos los 414 idiomas posibles) también están disponibles. Finalmente, usefranc-clipara instalar la CLI.
Este paquete es solo ESM. En node.js (versión 14.14+, 16.0+), instale con npm:
npm install franc En Deno con esm.sh :
import { franc , francAll } from 'https://esm.sh/franc@6' En navegadores con esm.sh :
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] Este paquete exporta los identificadores franc , francAll . No hay exportación predeterminada.
franc(value[, options])Obtenga el idioma más probable para el valor dado.
value ( string ) - valor para probaroptions ( Options , opcional) - Configuración El lenguaje más probable ( string ).
francAll(value[, options])Obtenga el idioma más probable para el valor dado.
value ( string ) - valor para probaroptions ( Options , opcional) - Configuración Matriz que contiene lenguaje - Distance tuples ( Array<[string, number]> ).
Options Configuración ( Object , opcional) con los siguientes campos:
options.only Idiomas para permitir ( Array<string> , opcional).
options.ignore Idiomas para ignorar ( Array<string> , opcional).
options.minLength Longitud mínima para aceptar ( number , predeterminado: 10 ).
Instalar:
npm install franc-cli --globalUsar:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| Paquete | Lenguas | Altavoces |
|---|---|---|
franc-min | 82 | 8m o más |
franc | 187 | 1m o más |
franc-all | 414 | - |
Nota : Franc devuelve los códigos ISO 639-3 (códigos de tres letras). No ISO 639-1 o ISO 639-2. Ver también GH-10 y GH-30.
Para obtener más información sobre los idiomas representados por ISO 639-3, use iso-639-3 . También hay un índice disponible para mapear los códigos ISO 639-3 a ISO 639-1, iso-639-3/to-1.json , pero tenga en cuenta que no todos los códigos 639-3 pueden representarse en 639-1.
Estos paquetes están completamente escritos con TypeScript. Exportan los tipos adicionales TrigramTuple y Options .
Estos paquetes son al menos compatibles con todas las versiones mantenidas de Node.js. A partir de ahora, eso es Node.js 14.14+ y 16.0+. También trabajan en Deno y navegadores modernos.
Franc ha sido portado a varios otros lenguajes de programación.
paasaaefrancfranco , whatlanggofrancwhatlang-rsfrancdpyfrancLas obras de Franc se derivan de sí mismos también se han portado a otros idiomas.
Franc es un trabajo derivado del lenguaje de adivinación (Python, LGPL), GuessLanguage (C ++, LGPL) y Language :: Guess (Perl, GPL). Sus creadores me otorgaron los derechos para distribuir Franc bajo la licencia del MIT: respectivamente, Kent S. Johnson, Jacob R. Rideout y Maciej Ceglowski.
¡Sí, por favor! Vea cómo contribuir al código abierto.
Este paquete es seguro.
MIT © Titus Wormer