Mendeteksi bahasa teks.
† - Berdasarkan UDHR, dokumen bebas hak cipta yang paling diterjemahkan di dunia.
Franc mendukung banyak bahasa, yang berarti mudah bingung pada sampel kecil. Pastikan untuk meneruskannya dokumen besar untuk mendapatkan hasil yang dapat diandalkan.
Catatan : Ini menginstal paket
franc, dengan dukungan untuk 187 bahasa (bahasa yang memiliki 1 juta atau lebih speaker).franc-min(82 bahasa, 8m atau lebih speaker) danfranc-all(semua 414 bahasa yang mungkin) juga tersedia. Akhirnya, gunakanfranc-cliuntuk menginstal CLI.
Paket ini hanya ESM. Di node.js (versi 14.14+, 16.0+), instal dengan NPM:
npm install franc Di Deno dengan esm.sh :
import { franc , francAll } from 'https://esm.sh/franc@6' Di browser dengan esm.sh :
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] Paket ini mengekspor pengidentifikasi franc , francAll . Tidak ada ekspor default.
franc(value[, options])Dapatkan bahasa yang paling mungkin untuk nilai yang diberikan.
value ( string ) - nilai untuk diujioptions ( Options , Opsional) - Konfigurasi Bahasa yang paling mungkin ( string ).
francAll(value[, options])Dapatkan bahasa yang paling mungkin untuk nilai yang diberikan.
value ( string ) - nilai untuk diujioptions ( Options , Opsional) - Konfigurasi Array yang mengandung bahasa - tupel yang berbeda ( Array<[string, number]> ).
Options Konfigurasi ( Object , opsional) dengan bidang berikut:
options.only Bahasa untuk mengizinkan ( Array<string> , opsional).
options.ignore Bahasa untuk diabaikan ( Array<string> , opsional).
options.minLength Panjang minimum untuk menerima ( number , default: 10 ).
Memasang:
npm install franc-cli --globalMenggunakan:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| Kemasan | Bahasa | Pembicara |
|---|---|---|
franc-min | 82 | 8m atau lebih |
franc | 187 | 1m atau lebih |
franc-all | 414 | - |
Catatan : Franc Mengembalikan Kode ISO 639-3 (tiga kode huruf). Bukan ISO 639-1 atau ISO 639-2. Lihat juga GH-10 dan GH-30.
Untuk mendapatkan info lebih lanjut tentang bahasa yang diwakili oleh ISO 639-3, gunakan iso-639-3 . Ada juga indeks yang tersedia untuk memetakan kode ISO 639-3 ke ISO 639-1, iso-639-3/to-1.json , tetapi perhatikan bahwa tidak semua kode 639-3 dapat diwakili dalam 639-1.
Paket -paket ini sepenuhnya diketik dengan naskah. Mereka mengekspor jenis tambahan TrigramTuple dan Options .
Paket ini setidaknya kompatibel dengan semua versi Node.js. Sampai sekarang, itu adalah Node.js 14.14+ dan 16.0+. Mereka juga bekerja di Deno dan browser modern.
Franc telah diangkut ke beberapa bahasa pemrograman lainnya.
paasaaefrancfranco , whatlanggofrancwhatlang-rsfrancdpyfrancKarya -karya Franc berasal dari mereka sendiri juga telah diangkut ke bahasa lain.
Franc adalah karya turunan dari tebakan-bahasa (Python, LGPL), GuessLanguage (C ++, LGPL), dan Bahasa :: Guess (Perl, GPL). Pencipta mereka memberi saya hak untuk mendistribusikan Franc di bawah lisensi MIT: masing -masing, Kent S. Johnson, Jacob R. Rideout, dan Maciej Ceglowski.
Ya tolong! Lihat cara berkontribusi ke open source.
Paket ini aman.
MIT © Titus Wormer