テキストの言語を検出します。
† - UDHRに基づいて、世界で最も翻訳された著作権のない文書。
フランは多くの言語をサポートしています。つまり、小さなサンプルで簡単に混乱しています。信頼できる結果を得るために、必ず大きなドキュメントを渡してください。
注:これにより、
francパッケージがインストールされ、187の言語(100万個以上のスピーカーがある言語)がサポートされています。franc-min(82言語、8m以上スピーカー)とfranc-all(414個の可能な言語すべて)も利用できます。最後に、franc-cliを使用してCLIをインストールします。
このパッケージはESMのみです。 node.js(バージョン14.14+、16.0+)で、NPMにインストールします。
npm install franc esm.shとのデノで:
import { franc , francAll } from 'https://esm.sh/franc@6' esm.shのブラウザで:
< script type =" module " >
import { franc , francAll } from 'https://esm.sh/franc@6?bundle'
</ script > import { franc , francAll } from 'franc'
franc ( 'Alle menslike wesens word vry' ) //=> 'afr'
franc ( 'এটি একটি ভাষা একক IBM স্ক্রিপ্ট' ) //=> 'ben'
franc ( 'Alle menneske er fødde til fridom' ) //=> 'nno'
franc ( '' ) //=> 'und' (language code that stands for undetermined)
// You can change what’s too short (default: 10):
franc ( 'the' ) //=> 'und'
franc ( 'the' , { minLength : 3 } ) //=> 'sco'
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' ) )
//=> [['por', 1], ['glg', 0.771284519307895], ['spa', 0.6034146900423971], …123 more items]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { only : [ 'por' , 'spa' ] } ) )
//=> [['por', 1 ], ['spa', 0.6034146900423971]]
console . log ( francAll ( 'Considerando ser essencial que os direitos humanos' , { ignore : [ 'spa' , 'glg' ] } ) )
//=> [['por', 1], ['cat', 0.5367251059928957], ['src', 0.47461899851037015], …121 more items] このパッケージは、識別子franc 、 francAllをエクスポートします。デフォルトのエクスポートはありません。
franc(value[, options])指定された値に対して最も可能性の高い言語を取得します。
value ( string ) - テストする値options ( Options 、オプション) - 構成最も可能性の高い言語( string )。
francAll(value[, options])指定された値に対して最も可能性の高い言語を取得します。
value ( string ) - テストする値options ( Options 、オプション) - 構成言語を含む配列-distanceタプル( Array<[string, number]> )。
Options次のフィールドを使用した構成( Object 、オプション):
options.only許可する言語( Array<string> 、オプション)。
options.ignore無視する言語( Array<string> 、オプション)。
options.minLength受け入れる最小長さ( number 、デフォルト: 10 )。
インストール:
npm install franc-cli --global使用:
CLI to detect the language of text
Usage: franc [options] <string>
Options:
-h, --help output usage information
-v, --version output version number
-m, --min-length <number> minimum length to accept
-o, --only <string> allow languages
-i, --ignore <string> disallow languages
-a, --all display all guesses
Usage:
# output language
$ franc "Alle menslike wesens word vry"
# afr
# output language from stdin (expects utf8)
$ echo "এটি একটি ভাষা একক IBM স্ক্রিপ্ট" | franc
# ben
# ignore certain languages
$ franc --ignore por,glg "O Brasil caiu 26 posições"
# src
# output language from stdin with only
$ echo "Alle mennesker er født frie og" | franc --only nob,dan
# nob
| パッケージ | 言語 | スピーカー |
|---|---|---|
franc-min | 82 | 8m以上 |
franc | 187 | 1m以上 |
franc-all | 414 | - |
注:フランはISO 639-3コード(3つの文字コード)を返します。 ISO 639-1またはISO 639-2ではありません。 GH-10およびGH-30も参照してください。
ISO 639-3で表される言語に関する詳細情報を取得するには、 iso-639-3を使用してください。 ISO 639-3をISO 639-1コード、 iso-639-3/to-1.jsonにマッピングするためのインデックスもありますが、639-3コードすべてを639-1で表すことはできないことに注意してください。
これらのパッケージには、TypeScriptが完全に入力されています。それらは、追加のタイプのTrigramTupleとOptionsをエクスポートします。
これらのパッケージは、少なくともnode.jsのすべての保守バージョンと互換性があります。現在のところ、それはnode.js 14.14+および16.0+です。また、DenoとModern Browserでも機能します。
フランは、他のいくつかのプログラミング言語に移植されました。
paasaaefrancfranco 、 whatlanggofrancwhatlang-rsfrancdpyfrancフランの作品は、それ自体が他の言語にも移植されていることから派生しています。
フランは、推測言語(Python、LGPL)、GuessLanguage(C ++、LGPL)、およびLanguage :: Juess(Perl、GPL)の派生作業です。彼らのクリエイターは、それぞれMITライセンスに基づいてフランを配布する権利を私に付与しました。それぞれ、ケント・S・ジョンソン、ジェイコブ・R・ライドアウト、マシエ・セグロウスキです。
はい、お願いします!オープンソースに貢献する方法をご覧ください。
このパッケージは安全です。
MIT©Titus Wormer