Обнаружение языка текста.
† - На основании UDHR, наиболее переведенный документ без авторских прав в мире.
Франк поддерживает множество языков, что означает, что он легко смущен небольшими образцами. Обязательно передайте ему большие документы, чтобы получить надежные результаты.
Примечание . Это устанавливает пакет
francс поддержкой 187 языков (языки, на которых есть 1 миллион или более динамиков).franc-min(82 языка, 8 м или более ораторов) иfranc-all(все 414 возможных языков) также доступны. Наконец, используйтеfranc-cli, чтобы установить CLI.
Этот пакет только ESM. В node.js (версия 14.14+, 16.0+), установите с NPM:
npm install franc В Deno с esm.sh :
import { franc , francAll } from 'https://esm.sh/franc@6' В браузерах с esm.sh :
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] Этот пакет экспортирует идентификаторы franc , francAll . Нет экспорта по умолчанию.
franc(value[, options])Получите наиболее вероятный язык для данной ценности.
value ( string ) - значение для тестированияoptions ( Options , необязательно) - конфигурация Наиболее вероятный язык ( string ).
francAll(value[, options])Получите наиболее вероятный язык для данной ценности.
value ( string ) - значение для тестированияoptions ( Options , необязательно) - конфигурация Массив, содержащий язык - расстояние кортежи ( Array<[string, number]> ).
Options Конфигурация ( Object , необязательно) с помощью следующих полей:
options.only Языки для разрешения ( Array<string> , необязательно).
options.ignore Языки, чтобы игнорировать ( Array<string> , необязательно).
options.minLength Минимальная длина для принятия ( number , по умолчанию: 10 ).
Установить:
npm install franc-cli --globalИспользовать:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| Упаковка | Языки | Докладчики |
|---|---|---|
franc-min | 82 | 8 м или более |
franc | 187 | 1 м или более |
franc-all | 414 | - |
ПРИМЕЧАНИЕ : Франк возвращает коды ISO 639-3 (три буквенных кода). Не ISO 639-1 или ISO 639-2. Смотрите также GH-10 и GH-30.
Чтобы получить больше информации о языках, представленных ISO 639-3, используйте iso-639-3 . Существует также индекс, доступный для карты ISO 639-3 для кодов ISO 639-1, iso-639-3/to-1.json , но обратите внимание, что не все 639-3 кодов могут быть представлены в 639-1.
Эти пакеты полностью напечатаны с помощью TypeScript. Они экспортируют дополнительные типы TrigramTuple и Options .
Эти пакет, по крайней мере, совместимы со всеми поддерживаемыми версиями node.js. На данный момент это node.js 14.14+ и 16,0+. Они также работают в Дено и современных браузерах.
Франк был перенесен на несколько других языков программирования.
paasaaefrancfranco , whatlanggofrancwhatlang-rsfrancdpyfrancРабочий франк происходит от того, что сами также были перенесены на другие языки.
Franc-это производная работа от языкового языка (Python, LGPL), угадания (C ++, LGPL) и Language :: uge (perl, gpl). Их создатели предоставили мне права на распространение франка по лицензии MIT: соответственно, Кент С. Джонсон, Джейкоб Р. Руджату и Макия Цегловски.
Да, пожалуйста! Посмотрите, как внести свой вклад в открытый исходный код.
Этот пакет безопасен.
MIT © Titus Wormer