Popis tématu

Bakalářská práce v oboru Informatika (Bc).

Analyzator mailoveho provozu

Motivace
========
Firma chce zjistit efektivitu vyuzivani emailove komunikace zamestnanci. Potrebuje tedy shromazdovat statisticka data o prichozi i odchozi komunikaci a dale z techto dat cist prislusne statistiky. Samozrejmosti je zachovani soukromi (postovni tajemstvi)

Zadani:
=======
Cilem projektu je ziskat nastroj pro analyzu obsahu emailovych zprav prochazejicich mailovym serverem (MTA) firmy (firemni korespondence).

Cilem analyzy je:

* zachovat soukromi uzivatelu (t.j. nezpracovavat zadna duverna data, t.j. ziskavat ze zprav jen data z hlavicek + delku textu
* ziskat statisticka data pro zhodnoceni efektivity uzivani firemniho mailu zamestnanci

Zpracovavana data (cile statistiky a analyzy) - vse pro smer ven, dovnitr a soucet:

* pocet zprav celkove
* pocet zprav nedorucenych
* pocet zprav nevyzadanych (spam)
* pocet zprav obsahujici viry
* pocet zprav s prilohou, bez, HTML
* velikosti priloh
* typy priloh (MIME)
* vyskyt klicovych slov ci spojeni (napr. \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"preposlat dale\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\", \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\"jak se mas\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\" )
* pocet adresatu (To, CC, BCC)
* delka textu
* kodovani textu
* user agent (procentualni zastoupeni)
* pozadavky potvrzeni doruceni/precteni
o moznost implementovat ulozenim vsech hlavicek k danemu mailu + vysledek analyzy vyskytu klicovych slov

Analyticke zpracovani dat s ohledem na:

* uzivatele (za casove obdobi),
* na cast firmy (oddeleni)
* adresata/odesilatele geograficky (dle koncovky domenu, dle freemailu)

Projekt ma 2 casti:

* Parsovani e-mailovych zprav na MTA, ziskani klicovych informaci, ulozeni informaci do uloziste (jednoduchy programek ktery na zaklade regularnich vyrazu uklada ziskana data
* analyza ulozenych informaci o zpravach (nejspise web aplikace spolupracujici s databazi)

Cilovy OS:
==========
UN*X - Linux, *BSD (predpoklada se implementace v ramci MTA postfix)

Implementacni jazyk:
===================
Libovolny z mnoziny Perl, Python, Java, Rubby, C++ (doporuceno Perl pro prvni cast, Java pro druhou)

Charakter prace:
================
Experimentalni, implementacni (programovani, implementace v realnem prostredi), edikativni (student se uci s novymi technologiemi)

Vhodne pro:
===========
Prace je vhodna pro studenta schopneho pracovat s OS typu UN*X minimalne na uzivatelske urovni. Vhodne pro studenty kteri radi experimentuji a uci se pracovat s novymi technologiemi, v cemz zadavatel rad pomuze, poradi a poskytne prostredky. Predpoklada se uzsi spoluprace se zadavatelem.

Pozadovana schopnost porozumnet anglickemu textu (manualy).

Moznosti dalsiho rozvoje:
========================
Moznost dale rozsirit o zpracovani udaju z antiviroveho a antispamoveho filtru, pripadne spolupracovat s temito

Kontakt na zadavatele:
=====================
Jindrich Vimr
HSF Sokolov, spol. s r.o.
Morseova 5, Plzen

724 293 903

Podrobnosti: http://www.kiv.zcu.cz/~brada/vyuka/dipl/bakalarky

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Externí téma:
  • Firma (kontaktní osoba) je vedoucím práce,
  • Kontaktní osoba: Tomáš Metz, HSF Sokolov,

Vypsáno pro akademický rok 2005/2006 dne: 2005-04-05

Zadáno komu: Václav Hrdina (dokončeno: 2007-12-10)

Aktualizováno 0