Digital Multi-Channel Audio Workstation for Live Performance

Digital Multi-Channel Audio Workstation for Live Performance Master thesis Study programme: N2612 – Electrical engineering and informatics Study branch: 1802T007 – Information technology Author: Bc. Daniel Louda Supervisor: doc. Ing. Zbyněk Koldovský, Ph.D. Consultants: Ing. Jiří Málek, Ph.D Fernando Perdigão Liberec 2019 Zadání diplomové práce Digitální vícekanálová audio stanice pro živá vystoupení Jméno a příjmení: Bc. Daniel Louda Osobní číslo: M16000177 Studijní program: N2612 Elektrotechnika a informatika Studijní obor: Informační technologie Zadávající katedra: Ústav informačních technologií a elektroniky Akademický rok: 2017/2018 Zásady pro vypracování: 1. Seznamte se s knihovnami PortAudio a Qt pro C++. Zvolte si vhodné vývojové nástroje pro jazyk C++ a vhodné API (např. ASIO). 2. Vytvořte aplikaci pro míchání audio signálů v reálném čase s následujícími možnostmi: -možnost vícestopého záznamu/přehrávání -import/export WAV souborů -přidávání/ubíraní mono/stereo stop -nastavení pevného nebo plovoucího tempa, ve druhém případě řízeného vybraným audio vstupem -výstup synchronizace tempa na MIDI a metronomu do vybrané audio stopy -možnost vložení VST pluginu do signálové cesty před výstupem -správa souborů a playlistů s rychlým načítáním 3. Upravte grafické uživatelské prostředí aplikace tak, aby bylo vhodné pro ovládání při živých vystoupení. Ověřte aplikaci v reálném provozu. 4. Text práce zpracujte v anglickém jazyce. Rozsah grafických prací: Dle potřeby dokumentace Rozsah pracovní zprávy: cca 40-50 stran Forma zpracování práce: tištěná/elektronická Jazyk zpracování práce: Angličtina Seznam odborné literatury: [1] H. L. Van Trees, Optimum Array Processing: Part IV of Detection, Estimation, and Modulation Theory, John Wiley & Sons, Inc.,2002. [2] U. Zolzer, DAFX: Digital Audio Effects, John Wiley & Sons, 2002. Vedoucí práce: doc. Ing. Zbyněk Koldovský, Ph.D. Ústav informačních technologií a elektroniky Konzultanti práce: Ing. Jiří Málek, Ph.D. Ústav informačních technologií a elektroniky Fernando Perdigao Universidade de Coimbra, Portugalsko Datum zadání práce: 19. října 2017 Předpokládaný termín odevzdání: 14. května 2018 L. S. prof. Ing. Zdeněk Plíva, Ph.D. prof. Ing. Ondřej Novák, CSc. děkan vedoucí ústavu V Liberci 19. října 2017 Declaration I hereby certify I have been informed that my master thesis is fully governed by Act No. 121/2000 Coll., the Copyright Act, in partic- ular Article 60 – School Work. I acknowledge that the Technical University of Liberec (TUL) does not infringe my copyrights by using my master thesis for the TUL’s internal purposes. I am aware of my obligation to inform the TUL on having used or granted license to use the results of my master thesis; in such a case the TUL may require reimbursement of the costs incurred for creating the result up to their actual amount. I have written my master thesis myself using the literature listed below and consulting it with my thesis supervisor and my tutor. At the same time, I honestly declare that the texts of the printed version of my master thesis and of the electronic version uploaded into the IS STAG are identical. 30. 4. 2019 Bc. Daniel Louda Digital Multi-Channel Audio Workstation for Live Performance Abstract Whenever there is complex audio playback or recording necessary, audio workstations have been used to fit the needs of musicians and sound engineers. In this thesis, research and development of a digital audio workstation (DAW) is described. A software DAW is an application for personal computers that uses internal or ex- ternal sound card to obtain, process and output audio in real-time, allowing application to be used during live performances where low latency output is mandatory. Application is implemented in C++ using Qt graphical framework and PortAudio audio I/O library. It allows users to create custom routing between sound card input and output channels as well as audio files. Several features like creating and saving of a playlist settings or displaying graph of a signal in time were implemented. Interface for signal processing units was designed and four processing units were created that can be applied on any input selected by the user. These units are: Volume Pro- cessing Unit to control the volume of the signal, VST Processing Unit that allows usage of open standard for application indepen- dent DSP blocks called VST Plug-ins, Tempo Processing Unit that implements state-of-the-art algorithm for detecting tempo of a song using spectral flux and MIDI Process Unit for sending pre-defined MIDI message triggered by musical onset to selected MIDI device. Keywords: digital audio workstation, music processing, onset detection 4 Digitální vícekanálová audio stanice pro živá vystoupení Abstrakt Digitální audio stanice (DAW) jsou využívány muzikanty a zvukovými inženýry, kdykoliv je vyžadováno komplexní přehrávání nebo nahrávání zvuku. Vývoj DAW specializované pro živá vystoupené je popsán v této práci. Softwarová DAW pro živá vystoupení je aplikace pro osobní počítače, která využívá interní nebo externí zvukovou kartu k přijímání a odesílání signálu s min- imální latencí. Signál může být dle nastavení aplikace zpracován a vyhodnocován. Aplikace je implementovaná v programovacím jazyce C++ s použitím grafického frameworku Qt a knihovny Por- tAudio pro práci se zvukovými vstupy a výstupy. Umožňuje uži- vatelům vytvoření a uložení vlastních pravidel pro přesměrování a slučování vstupů a výstupů zvukové karty a zvukových souborů. Jsou implementovány funkce jako zobrazení grafu signálu v čase nebo vytváření playlistů. Bylo navrhnuto rozhraní pro zpracování signálu a implementovány čtyři jednotky, které je možné apliko- vat na libovolný vstup. Tyto jednotky jsou: Volume Processing Unit pro úpravu hlasitosti signálu, VST Processing Unit, která umožňuje využití otevřeného standardu pro nezávisle DSP bloky nazvané VST Plug-in, Tempo Processing Unit, která implementuje moderní algoritmus pro detekci tempa na základě analýzy spek- trální diference a MIDI Process Unit pro odesílání předdefinovaných MIDI zpráv při detekci první doby. Klíčová slova: digitální audio stanice, zpracování hudby, detekce tempa 5 Acknowledgements I would like to express enormous thanks to all the people that made this paper possible. You know who you are. 6 Contents List of abbreviations .............................. 9 1 Introduction 10 1.1 Available Alternatives .......................... 11 1.1.1 Ableton Live ........................... 11 1.1.2 Steinberg Cubase ......................... 11 2 Fundamentals on Musical Tempo and Beat Analysis 12 2.1 State of the Art .............................. 12 2.2 Onset Detection .............................. 13 2.2.1 Energy-Based Novelty ...................... 13 2.2.2 Spectral-Based Novelty ...................... 14 2.2.3 Phase-Based Novelty ....................... 16 2.2.4 Complex-Domain Novelty .................... 18 2.3 Tempo Analysis .............................. 18 2.3.1 Tempogram ............................ 19 2.3.2 Fourier Tempogram ....................... 20 2.3.3 Autocorrelation Tempogram ................... 21 2.4 Conclusion ................................. 21 3 VST 25 3.1 Basic Conception ............................. 25 3.2 VST Plug-in ................................ 25 3.2.1 Processor ............................. 26 3.2.2 Edit Controller .......................... 28 3.2.3 Private Communication ..................... 28 4 MIDI 30 4.1 MIDI Interface .............................. 30 4.2 Windows OS Support .......................... 30 5 Development 31 5.1 Requirements Analysis .......................... 31 5.1.1 Functional Requirements ..................... 31 5.1.2 Graphical Requirements ..................... 31 5.1.3 Non-Functional Requirements .................. 31 5.2 Software Development Model ...................... 31 7 5.3 Environment ............................... 32 5.3.1 Compiler ............................. 33 5.4 Libraries .................................. 33 5.4.1 Qt Framework .......................... 33 5.4.2 FFTW ............................... 34 5.4.3 libsndfile ............................. 34 5.4.4 PortAudio ............................. 34 5.5 Implementation .............................. 37 5.5.1 Graphical User Interface ..................... 37 5.5.2 Features .............................. 43 5.6 Debugging ................................. 54 5.7 Deployment ................................ 55 6 Results and Conclusion 56 6.1 Libraries .................................. 56 6.2 Application ................................ 56 6.3 Future Work ............................... 57 8 List of abbreviations DSP Digital Signal Processing DAW Digital Audio Workstation PA PortAudio CPU central processing unit GPU graphic processing unit STFT short-time Fourier transform FFT fast Fourier transform VST Virtual Studio Technology SDK software development kit API application programming interface MIDI Musical Instrument Digital Interface I/O input/output OS operating system ASIO Audio Stream Input/Output ALSA Advanced Linux Sound Architecture HTML HyperText Markup Language CSS Cascading Style Sheets MS Microsoft GNU GNU’s Not Unix GCC GNU Compiler Collection MSYS Minimal SYStem MSVC Microsoft Visual C++ bpm beats per minute CLI Command Line Interface 9 1 Introduction Whenever there is complex sound recording, editing or producing necessary, people have been using audio workstations to perform such tasks. It took almost 50 years from the first reel-to-reel recording to the creation of the first digital

Load more