Audio Source Separation Based on U-Net

Project Slides

Spleeter Baseline

U-Net based audio source separation by Deezer

Modification

Experiment with different loss functions to compare their performance. Different spectro losses: mel-spectrogram and magnitude. Different distance costs: L1 and MSE.

Files Note:

logs contains training loss log with tensorboard

data.py dataloader, experimented with both original baseline Spleeter dataloader and Open-Unmix dataloader dataloader

display_mask.ipynb contains what model outputs (a ratio mask) and spectrogram comparison between ground truth audio source (vocal) with separated audio source (mixture * ratio mask)

run.py model training code

splitter.py inferencing code

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
logs-sdr		logs-sdr
logs		logs
poster		poster
.gitignore		.gitignore
README.md		README.md
check_dimension.ipynb		check_dimension.ipynb
data.py		data.py
display_mask.ipynb		display_mask.ipynb
evaluate.ipynb		evaluate.ipynb
phase_debug.ipynb		phase_debug.ipynb
psychoacoustic.ipynb		psychoacoustic.ipynb
run.py		run.py
splitter.py		splitter.py
train.py		train.py
unet.py		unet.py
unet_copy.py		unet_copy.py
util.py		util.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Audio Source Separation Based on U-Net

Project Slides

Spleeter Baseline

Modification

Files Note:

Project Poster

About

Releases

Packages

Languages

tangy1227/UNet-Audio-Source-Separation

Folders and files

Latest commit

History

Repository files navigation

Audio Source Separation Based on U-Net

Project Slides

Spleeter Baseline

Modification

Files Note:

Project Poster

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages