Symbolic Music Generation with Diffusion Models

Supplementary code release.

Installation

All code is written in Python 3 (Anaconda recommended). To install the dependencies:

pip install -r requirements.txt

A copy of the Magenta codebase is required for access to MusicVAE and related components. Installation instructions can be found on the Magenta public repository. You will also need to download pretrained MusicVAE checkpoints. For our experiments, we use the 2-bar melody model.

Datasets

We use the Lakh MIDI Dataset to train our models. Follow these instructions to download and build the Lakh MIDI Dataset.

To encode the Lakh dataset with MusicVAE, use scripts/generate_song_data_beam.py:

python scripts/generate_song_data_beam.py \
  --checkpoint=/path/to/musicvae-ckpt \
  --input=/path/to/lakh_tfrecords \
  --output=/path/to/encoded_tfrecords

To preprocess and generate fixed-length latent sequences for training diffusion and autoregressive models, refer to scripts/transform_encoded_data.py:

python scripts/transform_encoded_data.py \
  --encoded_data=/path/to/encoded_tfrecords \
  --output_path =/path/to/preprocess_tfrecords \
  --mode=sequences \
  --context_length=32

Training

Diffusion

python train_ncsn.py --flagfile=configs/ddpm-mel-32seq-512.cfg

TransformerMDN

python train_mdn.py --flagfile=configs/mdn-mel-32seq-512.cfg

Sampling and Generation

Diffusion

python sample_ncsn.py \
  --flagfile=configs/ddpm-mel-32seq-512.cfg \
  --sample_seed=42 \
  --sample_size=1000 \
  --sampling_dir=/path/to/latent-samples

TransformerMDN

python sample_ncsn.py \
  --flagfile=configs/mdn-mel-32seq-512.cfg \
  --sample_seed=42 \
  --sample_size=1000 \
  --sampling_dir=/path/to/latent-samples

Decoding sequences

To convert sequences of embeddings (generated by diffusion or TransformerMDN models) to sequences of MIDI events, refer to scripts/sample_audio.py.

python scripts/sample_audio.py
  --input=/path/to/latent-samples/[ncsn|mdn] \
  --output=/path/to/audio-midi \
  --n_synth=1000 \
  --include_wav=True

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
.github		.github
checkpoints		checkpoints
configs		configs
lmd_full		lmd_full
models		models
scripts		scripts
utils		utils
.gitignore		.gitignore
.pylintrc		.pylintrc
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
calculate_metrics.py		calculate_metrics.py
calculate_metrics.sh		calculate_metrics.sh
calculate_metrics_mdn.sh		calculate_metrics_mdn.sh
config.py		config.py
convert_dataset.sh		convert_dataset.sh
create_custom_ns.py		create_custom_ns.py
create_edit_splits.py		create_edit_splits.py
create_edit_splits.sh		create_edit_splits.sh
create_subset_list.sh		create_subset_list.sh
decode_sequences.sh		decode_sequences.sh
decode_sequences_mdn.sh		decode_sequences_mdn.sh
encode_dataset.sh		encode_dataset.sh
generate_song_data_beam.py		generate_song_data_beam.py
input_pipeline.py		input_pipeline.py
load_music_vae.py		load_music_vae.py
requirements.txt		requirements.txt
run_edit.sh		run_edit.sh
sample_audio.py		sample_audio.py
sample_mdn.py		sample_mdn.py
sample_mdn.sh		sample_mdn.sh
sample_ncsn.py		sample_ncsn.py
sample_ncsn.sh		sample_ncsn.sh
sd_edit.py		sd_edit.py
sd_edit.sh		sd_edit.sh
sd_edit_synthesis.sh		sd_edit_synthesis.sh
todo.txt		todo.txt
train_ddp.py		train_ddp.py
train_mdn.py		train_mdn.py
train_mdn.sh		train_mdn.sh
train_ncsn.py		train_ncsn.py
transform_encoded_data.py		transform_encoded_data.py
transform_encoded_dataset.sh		transform_encoded_dataset.sh
visualize_midi.py		visualize_midi.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Symbolic Music Generation with Diffusion Models

Installation

Datasets

Training

Diffusion

TransformerMDN

Sampling and Generation

Diffusion

TransformerMDN

Decoding sequences

About

Releases

Packages

Languages

License

bhchiang/symbolic-music-diffusion

Folders and files

Latest commit

History

Repository files navigation

Symbolic Music Generation with Diffusion Models

Installation

Datasets

Training

Diffusion

TransformerMDN

Sampling and Generation

Diffusion

TransformerMDN

Decoding sequences

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages