Popis tématu

Diplomová práce v oborech Softwarové inženýrství, Informační systémy.

Získávání a klasifikace dat softwarových projektů

Pro analýzy a výzkumy potřebujeme vytvořit rozsáhlejší datovou sadu obsahující data projektů (issues, team members, commits, documents). Cílem práce je analyzovat a upravit existující nástroje pro natěžení takových dat a související datové struktury, navrhnout systém pro klasifikaci softwarových projektů dle různých charakteristik, vybrat dostatečně velkou a reprezentativní (vzhledem ke klasifikaci) množinu vhodných projektů software s otevřeným kódem, a jejich natěžená data pomoci převést do formy datové sady. Nástroje by měly umožňovat výběr těžených projektů a dat, a také jejich předzpracování vč. anonymizace/pseudonymizace, a využijí implementace projektu SPADe https://github.com/ReliSA/SPADe .

Téma vypsal: Doc. Ing. Přemysl Brada, MSc., Ph.D. (UC 354)

Vypsáno pro akademický rok 2021/2022 dne: 2021-04-09

Rezervace tématu

Toto téma je sice volné, ale protože bylo vypsáno pro akademický rok 2021/2022, tak ho již nelze rezervovat. Pro případné bližší informace kontaktujte osobu, která téma vypsala.

Aktualizováno 0