Software

Doc Classifier - nástroj pro automatické rozpoznávání dokumentů

Zadal:Doc. Ing. Pavel Král, Ph.D.
Datum poslední úpravy:29.12.2013
Rok zařazení2012
Velikost:10.5 MB
Počet stažení:5
Zkratka:doc_classifier

Popis produktu

Doc Classifier je nástroj určený pro automatickou klasifikaci textových dokumentů. Jsou zde zahrnuty tři klasifikátory: Naivní Bayes (NB), metoda podpůrných vektorů (SVM) a metoda maximální entropie. Pro výběr příznaků nabízí nástroj použití jedné z pěti metod: Dokumentová Frekvence (DF), Information Gain (IG), Mutual Information (MI), Chi-kvadrát test a GSS koeficient. Doc classifier byl vyvinut především pro testování a vyhodnocení metod určených pro klasifikaci dokumentů a pro nastavení parametrů, které ovlivňují přesnost těchto metod.


Stáhnout

Použití produktu je vázáno licencí:GNU-GPL

GNU General Public License v.3 - pouze open source použití



Soubory produktu

#NázevPopisVelikost
1.doc_classifier.tgz10768 kB