Orbit Classification Data Mining Project

Overview

This project applies various data mining techniques to the Orbit Classification dataset for pattern recognition, classification prediction, and data grouping.

Dataset

The dataset used in this project is the "Orbit Classification For Prediction / NASA" dataset from Kaggle. It contains information about celestial bodies and their orbital characteristics.

Techniques Used

Data Preprocessing
Classification:
- Decision Trees and KNN models were implemented for classification.
- For KNN, SMOTEEN was used to balance class distribution.
Clustering:
- Similar objects were grouped using K-Means, Agglomerative Clustering, and DBSCAN.
- Before clustering, Principal Component Analysis (PCA) was applied to reduce dimensionality.
Association Rule Mining:
- Applied the Apriori algorithm within IBM SPSS Modeler.

Project Structure

├── dataset
│   └── classast-pha.csv
├── models
│   ├── association_rules
│   │   ├── associationRules.str
│   │   └── classast-pha.csv
│   ├── classification
│   │   ├── decision_tree_classifier.ipynb
│   │   └── KNN_classifier.ipynb
│   └── clustering
│       ├── agglomerative_clustering.ipynb
│       ├── dbscan_clustering.ipynb
│       └── k_means.ipynb
├── preprocessing
│   ├── data_preprocessed.csv
│   └── preprocess.ipynb
├── README.md
└── report

Tools and Technologies

Python
Jupyter Notebooks
Scikit-learn library for machine learning algorithms
Pandas and NumPy libraries for data manipulation
Matplotlib and Seaborn for data visualization

Results and Insights

Project results are documented in report/report.pdf.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Orbit Classification Data Mining Project

Overview

Dataset

Techniques Used

Project Structure

Tools and Technologies

Results and Insights

About

Releases

Packages

Contributors 2

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
dataset		dataset
models		models
preprocessing		preprocessing
report		report
.gitignore		.gitignore
README.md		README.md

MATF-istrazivanje-podataka-1/2023_Data_Mining_Pedestrian_in_Traffic_Dataset

Folders and files

Latest commit

History

Repository files navigation

Orbit Classification Data Mining Project

Overview

Dataset

Techniques Used

Project Structure

Tools and Technologies

Results and Insights

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages