bayes : Pengklasifikasi Naive- bayes untuk PHP bayes mengambil dokumen (sepotong teks), dan memberi tahu Anda kategori apa yang termasuk dalam dokumen tersebut.
Perpustakaan ini porting dari lib nodejs @ https://github.com/ttezel/bayes
Anda dapat menggunakan ini untuk mengkategorikan konten teks apa pun ke dalam kumpulan kategori apa pun. Misalnya:
composer require niiknow/ bayes
$ classifier = new Niiknow bayes ();
// teach it positive phrases
$ classifier -> learn ( ' amazing, awesome movie!! Yeah!! Oh boy. ' , ' positive ' );
$ classifier -> learn ( ' Sweet, this is incredibly, amazing, perfect, great!! ' , ' positive ' );
// teach it a negative phrase
$ classifier -> learn ( ' terrible, shitty thing. Damn. Sucks!! ' , ' negative ' );
// now ask it to categorize a document it has never seen before
$ classifier -> categorize ( ' awesome, cool, amazing!! Yay. ' );
// => 'positive'
// serialize the classifier's state as a JSON string.
$ stateJson = $ classifier -> toJson ();
// load the classifier back from its JSON representation.
$ classifier -> fromJson ( $ stateJson );$classifier = new Niiknow bayes ([options])Mengembalikan contoh Pengklasifikasi bayes .
Masukkan objek options opsional untuk mengonfigurasi instance. Jika Anda menentukan fungsi tokenizer di options , fungsi tersebut akan digunakan sebagai tokenizer instance.
$classifier->learn(text, category) Ajari pengklasifikasi Anda category apa yang termasuk dalam text tersebut. Semakin banyak Anda mengajarkan pengklasifikasi Anda, semakin dapat diandalkan pengklasifikasi tersebut. Ia akan menggunakan apa yang telah dipelajarinya untuk mengidentifikasi dokumen baru yang belum pernah dilihatnya sebelumnya.
$classifier->categorize(text) Mengembalikan category yang menurutnya termasuk dalam text . Penilaiannya didasarkan pada apa yang telah Anda ajarkan dengan .learn() .
$classifier->probabilities(text)Ekstrak probabilitas untuk setiap kategori yang diketahui.
$classifier->toJson()Mengembalikan representasi JSON dari pengklasifikasi.
$classifier->fromJson(jsonStr) Mengembalikan instance pengklasifikasi dari representasi JSON. Gunakan ini dengan representasi JSON yang diperoleh dari $classifier->toJson()
Anda dapat meneruskan fungsi tokenizer Anda sendiri di konstruktor. Contoh:
// array containing stopwords
$stopwords = array("der", "die", "das", "the");
// escape the stopword array and implode with pipe
$s = '~^W*('.implode("|", array_map("preg_quote", $stopwords)).')W+b|bW+(?1)W*$~i';
$options['tokenizer'] = function($text) use ($s) {
// convert everything to lowercase
$text = mb_strtolower($text);
// remove stop words
$text = preg_replace($s, '', $text);
// split the words
preg_match_all('/[[:alpha:]]+/u', $text, $matches);
// first match list of words
return $matches[0];
};
$classifier = new niiknow bayes ($options);