Publications

Yewon Kim, Sung-Ju Lee, Chris Donahue (2024). Amuse: Human-AI Collaborative Songwriting with Multimodal Inspirations. In CHI 2025.

arXiv PDF BibTeX Sound 🔊

Satvik Dixit, Laurie M. Heller, Chris Donahue (2024). Vision Language Models Are Few-Shot Audio Spectrogram Classifiers. In NeurIPS Audio Imagination Workshop 2024.

arXiv PDF BibTeX

Xun Zhou, Charlie Ruan, Zihe Zhao, Tianqi Chen, Chris Donahue (2024). Local Deployment of Large-Scale Music AI Models on Commodity Hardware. In ISMIR LBD 2024.

arXiv PDF BibTeX 🕹️ Demo

Irmak Bukey, Michael Feffer, Chris Donahue (2024). Just Label the Repeats for In-The-Wild Audio-to-Score Alignment. In ISMIR 2024.

arXiv PDF BibTeX Code Video Examples

Chris Donahue, Shih-Lun Wu, Yewon Kim, Dave Carlton, Ryan Miyakawa, John Thickstun (2024). Hookpad Aria: A Copilot for Songwriters. In ISMIR LBD 2024.

arXiv PDF BibTeX Project Page

Alexander Wang, David Lindlbauer, Chris Donahue (2024). Towards Music-Aware Virtual Assistants. In UIST 2024.

PDF BibTeX DOI Video

Megan Wei, Michael Freeman, Chris Donahue, Chen Sun (2024). Do Music Generation Models Encode Music Theory?. In ISMIR 2024.

arXiv PDF BibTeX Sound 🔊

Wayne Chi, Ameet Talwalkar, Chris Donahue (2024). The Impact of Element Ordering on LM Agent Performance. In NeurIPS Workshops 2024.

arXiv PDF BibTeX

Yusong Wu, Tim Cooijmans, Kyle Kastner, Adam Roberts, Ian Simon, Alexander Scarlatos, Chris Donahue, Cassie Tarakajian, Shayegan Omidshafiei, Aaron Courville, Pablo Samuel Castro, Natasha Jaques, Cheng-Zhi Anna Huang (2024). Adaptive Accompaniment with ReaLchords. In ICML 2024.

arXiv PDF BibTeX

Kun Su, Judith Yue Li, Qingqing Huang, Dima Kuzmin, Joonseok Lee, Chris Donahue, Fei Sha, Aren Jansen, Yu Wang, Mauro Verzetti, Timo I. Denk (2024). V2Meow: Meowing to the Visual Beat via Video-to-Music Generation. In AAAI 2024.

arXiv PDF BibTeX Music Samples

Shih-Lun Wu, Chris Donahue, Shinji Watanabe, Nicholas J. Bryan (2023). Music ControlNet: Multiple Time-varying Controls for Music Generation. In TASLP 2024.

arXiv PDF BibTeX 🔊 Examples Video

Michael Feffer, Zachary C. Lipton, Chris Donahue (2023). DeepDrake ft. BTS-GAN and TayloRVC: An Exploratory Analysis of Musical Deepfakes and Hosting Platforms. In HCMIR 2023.

PDF BibTeX Dataset

John Thickstun, David Hall, Chris Donahue, Percy Liang (2023). Anticipatory Music Transformer. In TMLR 2024.

arXiv PDF BibTeX 🔊 Examples Code

Chris Donahue, Antoine Caillon, Adam Roberts, Ethan Manilow, Philippe Esling, Andrea Agostinelli, Mauro Verzetti, Ian Simon, Olivier Pietquin, Neil Zeghidour, Jesse Engel (2023). SingSong: Generating Musical Accompaniments from Singing.

arXiv PDF BibTeX 🔊 Examples

Chris Donahue, John Thickstun, Percy Liang (2022). Melody Transcription via Generative Pre-training. In ISMIR.

arXiv PDF BibTeX 🔊 Examples Code Dataset Video

Karan Goel, Albert Gu, Chris Donahue, Christopher Ré (2022). It's Raw! Audio Generation with State-Space Models. In ICML (Long Talk; Top 2%).

arXiv PDF BibTeX 🔊 Examples Code

Hao-Wen Dong, Chris Donahue, Taylor Berg-Kirkpatrick, Julian McAuley (2021). Towards Automatic Instrumentation by Learning to Separate Parts in Symbolic Multitrack Music. In ISMIR.

arXiv PDF BibTeX 🔊 Examples Code

Rodrigo Castellon, Chris Donahue, Percy Liang (2021). Codified Audio Language Modeling Learns Useful Representations for Music Information Retrieval. In ISMIR (Best Paper Runner-up).

arXiv PDF BibTeX Code

Mina Lee, Chris Donahue, Robin Jia, Alexander Iyabor, Percy Liang (2021). Swords ⚔️: A Benchmark for Lexical Substitution with Improved Data Coverage and Quality. In NAACL.

arXiv PDF BibTeX Code Dataset

Chris Donahue, Mina Lee, Percy Liang (2020). Enabling Language Models to Fill in the Blanks. In ACL.

arXiv PDF BibTeX Code Demo

Chris Donahue, Huanru Henry Mao, Yiting Ethan Li, Garrison W. Cottrell, Julian McAuley (2019). LakhNES: Improving Multi-instrumental Music Generation with Cross-domain Pre-training. In ISMIR.

arXiv PDF BibTeX 🔊 Examples Code

Paarth Neekhara, Chris Donahue, Miller Puckette, Shlomo Dubnov, Julian McAuley (2019). Expediting TTS Synthesis with Adversarial Vocoding. In INTERSPEECH (Oral).

arXiv PDF BibTeX 🔊 Examples Code

Jesse Engel, Kumar Krishna Agrawal, Shuo Chen, Ishaan Gulrajani, Chris Donahue, Adam Roberts (2019). GANSynth: Adversarial Neural Audio Synthesis. In ICLR.

arXiv PDF BibTeX 🔊 Examples Code Blog

Chris Donahue, Julian McAuley, Miller Puckette (2019). Adversarial Audio Synthesis. In ICLR.

arXiv PDF BibTeX 🔊 Examples Code 🕹️ Demo Notebook

Chris Donahue, Ian Simon, Sander Dieleman (2019). Piano Genie. In ACM IUI.

arXiv PDF BibTeX Code 🕹️ Demo Video Blog

Chris Donahue, Huanru Henry Mao, Julian McAuley (2018). The NES Music Database: A Multi-instrumental Dataset with Expressive Performance Attributes. In ISMIR.

arXiv PDF BibTeX Code Dataset Notebook

Chris Donahue, Zachary C. Lipton, Akshay Balsubramani, Julian McAuley (2018). Semantically Decomposing the Latent Spaces of Generative Adversarial Networks. In ICLR.

arXiv PDF BibTeX Code 🕹️ Demo

Chris Donahue, Bo Li, Rohit Prabhavalkar (2018). Exploring Speech Enhancement with Generative Adversarial Networks for Robust Speech Recognition. In ICASSP (Oral).

arXiv PDF BibTeX

Chris Donahue, Zachary C. Lipton, Julian McAuley (2017). Dance Dance Convolution. In ICML.

arXiv PDF BibTeX Code Dataset 🕹️ Demo