The variety of the datasets include tabular, text and image data.
Tabular datasets:
- Arrhythmia
- Mammography
- Webpage
Models:
- VAE
- SMOTE
- Borderline-SMOTE
- Random Oversampling
classifiers:
- Gaussian NB
- Logistic Regression
- SVM
Metrics:
- G-mean
- F1
Text datasets:
- dataset consisting of tweets in Greek concerning public transport and cycling was used, retrieved from Twitter using a list of relevant keywords.
keywords: λεωφορείο, λεωφορειόδρομος, μετρό, τραμ, ΟΑΣΘ, ΟΑΣΑ, Μέσα Μαζικής Μεταφοράς, ΜΜΜ, Δημόσιες συγκοινωνίες, ποδήλατο, ποδηλατόδρομος, ποδηλάτης, πεζός, πεζοδρόμιο, κυκλοφοριακή συμφόρηση, μποτιλιάρισμα, Βιώσιμη Αστική Κινητικότητα, μεγάλος περίπατος, μέσα μεταφοράς
Models:
- VAE
- SMOTE
- Borderline-SMOTE
- Random Oversampling
classifiers:
- Gaussian NB
- Logistic Regression
- SVM
Metrics:
- G-mean
- F1
Image datasets:
- MNIST (Modified National Institute of Standards and Technology) dataset
Models:
- VAE
- GAN
classifiers:
- Random Forest
Metrics:
- Precision
- Recall
- F1