Détecter la langue du texte.
† - Sur la base de l'UDHR, le document sans droit d'auteur le plus traduit au monde.
Franc soutient de nombreuses langues, ce qui signifie qu'il est facilement confus sur de petits échantillons. Assurez-vous de passer ses grands documents pour obtenir des résultats fiables.
Remarque : Cela installe le package
franc, avec une prise en charge de 187 langues (langues qui ont 1 million de haut-parleurs ou plus).franc-min(82 langues, 8 m ou plus en haut-parleurs) etfranc-all(les 414 langues possibles) sont également disponibles. Enfin, utilisezfranc-clipour installer la CLI.
Ce package est uniquement ESM. Dans Node.js (version 14.14+, 16.0+), installez avec NPM:
npm install franc En deno avec esm.sh :
import { franc , francAll } from 'https://esm.sh/franc@6' Dans les navigateurs avec esm.sh :
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] Ce package exporte les identifiants franc , francAll . Il n'y a pas d'exportation par défaut.
franc(value[, options])Obtenez le langage le plus probable pour la valeur donnée.
value ( string ) - valeur à testeroptions ( Options , facultative) - Configuration Le langage le plus probable ( string ).
francAll(value[, options])Obtenez le langage le plus probable pour la valeur donnée.
value ( string ) - valeur à testeroptions ( Options , facultative) - Configuration Array contenant la langue - tuples de la liste ( Array<[string, number]> ).
Options Configuration ( Object , facultatif) avec les champs suivants:
options.only Langues à autoriser ( Array<string> , facultatif).
options.ignore Langues à ignorer ( Array<string> , facultatif).
options.minLength Longueur minimale à accepter ( number , par défaut: 10 ).
Installer:
npm install franc-cli --globalUtiliser:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| Emballer | Langues | Conférenciers |
|---|---|---|
franc-min | 82 | 8m ou plus |
franc | 187 | 1m ou plus |
franc-all | 414 | - |
Remarque : FRANC renvoie les codes ISO 639-3 (codes de trois lettres). Pas ISO 639-1 ou ISO 639-2. Voir aussi GH-10 et GH-30.
Pour obtenir plus d'informations sur les langues représentées par ISO 639-3, utilisez iso-639-3 . Il existe également un index disponible pour cartographier les codes ISO 639-3 à ISO 639-1, iso-639-3/to-1.json , mais notez que tous les codes 639-3 ne peuvent pas être représentés dans 639-1.
Ces packages sont entièrement dactylographiés avec TypeScript. Ils exportent les types supplémentaires TrigramTuple et Options .
Ces emballages sont au moins compatibles avec toutes les versions maintenues de Node.js. À l'heure actuelle, c'est Node.js 14.14+ et 16.0+. Ils travaillent également dans Deno et les navigateurs modernes.
Franc a été porté vers plusieurs autres langages de programmation.
paasaaefrancfranco , whatlanggofrancwhatlang-rsfrancdpyfrancLes œuvres qui dérivent ont elles-mêmes été portées vers d'autres langues.
Franc est une œuvre dérivée de Guess-Language (Python, LGPL), deviner (C ++, LGPL) et Language :: Deviner (Perl, GPL). Leurs créateurs m'ont accordé les droits de distribuer Franc en vertu de la licence du MIT: respectivement, Kent S. Johnson, Jacob R. Rideout et Maciej Ceglowski.
Oui s'il vous plait! Voyez comment contribuer à l'open source.
Ce package est sûr.
MIT © Titus Wormer