Detectar a linguagem do texto.
† - Com base no UDHR, o documento mais traduzido de direitos autorais do mundo.
Franc suporta muitos idiomas, o que significa que é facilmente confuso em pequenas amostras. Certifique -se de passar por grandes documentos para obter resultados confiáveis.
Nota : Isso instala o pacote
franc, com suporte para 187 idiomas (idiomas que têm 1 milhão ou mais de alto -falantes).franc-min(82 idiomas, 8m ou mais alto-falantes) efranc-all(todos os 414 idiomas possíveis) também estão disponíveis. Por fim, usefranc-clipara instalar a CLI.
Este pacote é apenas ESM. No Node.js (versão 14.14+, 16.0+), instale com o NPM:
npm install franc Em Deno com esm.sh :
import { franc , francAll } from 'https://esm.sh/franc@6' Em navegadores com esm.sh :
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] Este pacote exporta os identificadores franc , francAll . Não há exportação padrão.
franc(value[, options])Obtenha a linguagem mais provável para o valor fornecido.
value ( string ) - valor para testaroptions ( Options , opcional) - Configuração A linguagem mais provável ( string ).
francAll(value[, options])Obtenha a linguagem mais provável para o valor fornecido.
value ( string ) - valor para testaroptions ( Options , opcional) - Configuração Array contendo linguagem - Tuplas de distância ( Array<[string, number]> ).
Options Configuração ( Object , opcional) com os seguintes campos:
options.only Idiomas a serem permitidos ( Array<string> , opcional).
options.ignore Idiomas para ignorar ( Array<string> , opcional).
options.minLength Comprimento mínimo a aceitar ( number , padrão: 10 ).
Instalar:
npm install franc-cli --globalUsar:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| Pacote | Idiomas | Alto -falantes |
|---|---|---|
franc-min | 82 | 8m ou mais |
franc | 187 | 1m ou mais |
franc-all | 414 | - |
Nota : Franc retorna os códigos ISO 639-3 (três códigos de letra). Não ISO 639-1 ou ISO 639-2. Veja também GH-10 e GH-30.
Para obter mais informações sobre os idiomas representados pela ISO 639-3, use iso-639-3 . Há também um índice disponível para mapear os códigos ISO 639-3 para ISO 639-1, iso-639-3/to-1.json , mas observe que nem todos os códigos 639-3 podem ser representados em 639-1.
Esses pacotes são totalmente digitados com o TypeScript. Eles exportam os tipos adicionais de TrigramTuple e Options .
Esses pacote são pelo menos compatíveis com todas as versões mantidas do Node.JS. A partir de agora, esse é o Node.js 14.14+ e 16.0+. Eles também trabalham em deno e navegadores modernos.
Franc foi portado para várias outras linguagens de programação.
paasaaefrancfranco , whatlanggofrancwhatlang-rsfrancdpyfrancOs trabalhos que francos são derivados também foram portados para outros idiomas.
Franc é um trabalho derivado de adivinhação (Python, LGPL), GuessLanguage (C ++, LGPL) e Idioma :: adivinhe (Perl, GPL). Seus criadores me concederam os direitos de distribuir Franc sob a licença do MIT: respectivamente, Kent S. Johnson, Jacob R. Rideout e Maciej Ceglowski.
Sim, por favor! Veja como contribuir para o código aberto.
Este pacote é seguro.
Mit © titus wormer