Kommentare/Lernziele:

Das Proseminar „Data Analytics“ führt in die Techniken zur Analyse und Auswertung von großen Datenmengen ein, die für Software und Requirements Engineering relevant sind, mit dem Ziel versteckte Muster, Korrelationen und andere Einblicke zu gewinnen. 

Im Seminar werden insbesondere Methoden für die Analyse und Auswertung von nutzergenerierten Texten vermittelt, wie z.B. Fragen und Antworten auf Stack Overflow, Fehlerberichte auf Bugzilla (Eclipse), oder Nutzerfeedback in bekannten online Software Marktplätzen. 

Auf Basis von ausgewählter Publikationen aus bekannten Konferenzen wie der Mining Software Repositories (MSR) oder Requirements Engineering (RE) werden gängige und neuartige Ansätze und Werkzeuge zur Acquise, Aufbereitung und Auswertung der Daten innerhalb frei verfügbarer Datensätze diskutiert (z.B., Datensätze von Stack Overflow oder Twitter).


Lernziel:

  • Grundkenntnisse über Methoden und Werkzeuge der Datenanalyse, wie sie in der Praxis und Forschung des eingesetzt werden. 
  • Grundkenntnisse über das wissenschaftliche Anwenden der Methoden der Datenanalyse in der Forschung 
  • Aufklärung über den Stand der Technik und aktuellen Forschungsthemen 
  • Grundlagen im Umgang mit gängigen Methoden und Werkzeugen wie dem Natural Language ToolKit (NLTK) oder SciKit. 


Vorgehen:

Die übergreifende Lernziel im Laufe des Seminars ist es, die behandelten Forschungsfragen, die Methodik, sowie die verwendeten Datenanalysewerkzeuge in den angegebenen Publikationen zu verstehen und weiter zu untersuchen. Studierende behandeln dabei in Gruppen bestimmte Methoden und Werkzeuge der Datenanalyse auf Basis ausgewählter Publikationen und öffentlich verfügbaren Datensätzen. 

Nach der Vergabe eines individuellen Themas (z.B. Datenaquise) wird von jeder Gruppe eine 20-minutige Präsentation vorbereitet und im Seminar präsentiert, diskutiert und weiter vertieft.   

Die Teams erhalten ein individuelles Feedback zur Präsentation und erarbeiten anschließend als Team einen Methodenbericht von mind. zwei DIN A4 Seiten, der die Anwendung der präsentierten Methode auf einen konkreten Anwendungsfall beschreibt.