Doc Classifier - nástroj pro automatické rozpoznávání dokumentů
Zadal: | Doc. Ing. Pavel Král, Ph.D. |
Datum poslední úpravy: | 29.12.2013 |
Rok zařazení | 2012 |
Velikost: | 10.5 MB |
Počet stažení: | 9 |
Zkratka: | doc_classifier |
Popis produktu
Doc Classifier je nástroj určený pro automatickou klasifikaci textových dokumentů. Jsou zde zahrnuty tři klasifikátory: Naivní Bayes (NB), metoda podpůrných vektorů (SVM) a metoda maximální entropie. Pro výběr příznaků nabízí nástroj použití jedné z pěti metod: Dokumentová Frekvence (DF), Information Gain (IG), Mutual Information (MI), Chi-kvadrát test a GSS koeficient.
Doc classifier byl vyvinut především pro testování a vyhodnocení metod určených pro klasifikaci dokumentů a pro nastavení parametrů, které ovlivňují přesnost těchto metod.
Soubory produktu
# | Název | Popis | Velikost |
---|
1. | doc_classifier.tgz | | 10768 kB |