Bachelor Projekt von Julienne Büchele. Es wurde ein News Recommender-System basierend auf der Twitter-API mit scikit learn umgesetzt.
- Die verwendete IDE ist PyCharm
- Es wurde Anaconda für das Package Management und Deployment verwendet
- Sonstige Packages:
- Tweepy (Twitter-API Helper)
- Yellowbrick (Visualizer)
- src/data: Schnittstelle zur Twitter-API sowie Daten Vor- und Aufbereitung
- src/helper:
- Hier wird der Klassifizierer trainiert (Modeling.py)
- Hier werden die Methoden umgesetzt (Modeling.py und Recommender.py)
- src/models: Tweet und User Objekte
- Um die Methoden zu starten, muss die Datei treiber.py geöffnet werden
- Der Teil unter "Get data" muss dabei stets einkommentiert sein
- Unter "Visualization" können die verwendeten Twitter-Beiträge visualisiert werden, dazu einfach den Code einkommentieren
- Unter "Evaluation" können die verschiedenen Methoden ausgewertet werden. Dafür muss jeweils der Code unter der beschrieben Methode einkommentiert werden
- Unter "Test different classifier" können können die verschiedenen Klassifizierungsalgorithmen getestet werden
- Unter "Plain Recommender" wird das klassische Empfehlungssystem getestet
- Unter "Bounded-Greedy-Selection", "User Profile Partitioning" und "Anomalies and exceptions" können die einzelnen Methoden getestet und die Werte dargestellt werden
- Unter "Test every method" können alle Methoden auf einmal ausgeführt werden. Dies könnte etwas länger dauern
- Man kann nicht zu viele Anfragen auf einmal machen, sonst überschreitet man die Rate Limits der Twitter-API
- Falls dass passiert reicht es maximal 10min zu warten, dann müsste die Anfrage wieder durchgehen