Bakalářská práce v programu, specializaci Informatika (Bc).
Motivace
========
Firma chce zjistit efektivitu vyuzivani emailove komunikace zamestnanci. Potrebuje tedy shromazdovat statisticka data o prichozi i odchozi komunikaci a dale z techto dat cist prislusne statistiky. Samozrejmosti je zachovani soukromi (postovni tajemstvi)
Zadani:
=======
Cilem projektu je ziskat nastroj pro analyzu obsahu emailovych zprav prochazejicich mailovym serverem (MTA) firmy (firemni korespondence).
Cilem analyzy je:
* zachovat soukromi uzivatelu (t.j. nezpracovavat zadna duverna data, t.j. ziskavat ze zprav jen data z hlavicek + delku textu
* ziskat statisticka data pro zhodnoceni efektivity uzivani firemniho mailu zamestnanci
Zpracovavana data (cile statistiky a analyzy) - vse pro smer ven, dovnitr a soucet:
* pocet zprav celkove
* pocet zprav nedorucenych
* pocet zprav nevyzadanych (spam)
* pocet zprav obsahujici viry
* pocet zprav s prilohou, bez, HTML
* velikosti priloh
* typy priloh (MIME)
* vyskyt klicovych slov ci spojeni (napr. \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"preposlat dale\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\", \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"jak se mas\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\" )
* pocet adresatu (To, CC, BCC)
* delka textu
* kodovani textu
* user agent (procentualni zastoupeni)
* pozadavky potvrzeni doruceni/precteni
o moznost implementovat ulozenim vsech hlavicek k danemu mailu + vysledek analyzy vyskytu klicovych slov
Analyticke zpracovani dat s ohledem na:
* uzivatele (za casove obdobi),
* na cast firmy (oddeleni)
* adresata/odesilatele geograficky (dle koncovky domenu, dle freemailu)
Projekt ma 2 casti:
* Parsovani e-mailovych zprav na MTA, ziskani klicovych informaci, ulozeni informaci do uloziste (jednoduchy programek ktery na zaklade regularnich vyrazu uklada ziskana data
* analyza ulozenych informaci o zpravach (nejspise web aplikace spolupracujici s databazi)
Cilovy OS:
==========
UN*X - Linux, *BSD (predpoklada se implementace v ramci MTA postfix)
Implementacni jazyk:
===================
Libovolny z mnoziny Perl, Python, Java, Rubby, C++ (doporuceno Perl pro prvni cast, Java pro druhou)
Charakter prace:
================
Experimentalni, implementacni (programovani, implementace v realnem prostredi), edikativni (student se uci s novymi technologiemi)
Vhodne pro:
===========
Prace je vhodna pro studenta schopneho pracovat s OS typu UN*X minimalne na uzivatelske urovni. Vhodne pro studenty kteri radi experimentuji a uci se pracovat s novymi technologiemi, v cemz zadavatel rad pomuze, poradi a poskytne prostredky. Predpoklada se uzsi spoluprace se zadavatelem.
Pozadovana schopnost porozumnet anglickemu textu (manualy).
Moznosti dalsiho rozvoje:
========================
Moznost dale rozsirit o zpracovani udaju z antiviroveho a antispamoveho filtru, pripadne spolupracovat s temito
Kontakt na zadavatele:
=====================
Jindrich Vimr
HSF Sokolov, spol. s r.o.
Morseova 5, Plzen
724 293 903
Podrobnosti: http://www.kiv.zcu.cz/~brada/vyuka/dipl/bakalarky
Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)
Externí téma:Vypsáno pro akademický rok 2005/2006 dne: 2005-04-05
Zadáno komu: Václav Hrdina (dokončeno: 2007-12-10)