Audio mit KI in Noten umwandeln: Audio2score Pro 4 im Test

Audio2score Pro 4 analysiert musikalische Aufnahmen und stellt das Ergebnis in Form von Noten und Akkordsymbolen dar. Wir testen, wie gut es funktioniert.

Artikel verschenken
In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 3 Min.
Von
  • Dr. Justus Noll
Inhaltsverzeichnis

Audio2score lädt Dateien der Typen WAV und MP3 sowie unter Windows auch WMA und zeigt zunächst eine spezielle Pianorollen-Darstellung des Audiomaterials, den "Klangteppich". Erkannte Frequenzen sehen wie farbige Schlangen aus, über die das Programm Kästchen für die Bearbeitung legt. Es berechnet anschließend Stimmung, Tonart und Noten.

Mehr zum Thema Musik

Grundsätzlich kann sich Audio2score 4 zwar an beliebigem Audiomaterial versuchen, der Hersteller hat es aber für drei Instrumentenfamilien optimiert: Bläser, Streicher und Klavier- beziehungsweise Zupfinstrumente, darunter Cembalo, Gitarre und Harfe. Damit eignet es sich beispielsweise zur Analyse von Streichquartetten, Bläserquintetten, Reduktionen von Orchesterstücken auf einen Klavierauszug oder schlicht für einstimmigen Notensatz wie im Screenshot. Dabei rearrangiert Audio2score das Stück auf Wunsch: Erkannte Klänge kann man über Midi beliebigen neuen Instrumenten zum Beispiel des mitgelieferten Soundfont-Players capella-tune zuweisen.

Die Notenerkennung klappt am besten mit reinen Instrumentalaufnahmen, besonders vom Klavier – kommt Gesang dazu, gerät das Programm in Schwierigkeiten. Auch Schlagzeug erkennt es im Test nicht richtig, ebenso wenig synthetische oder verzerrte Klänge. Möchte man Begleitung unabhängig vom Gesang analysieren, hilft Audio2score mit einem Workaround: Beim Erstellen von Projekten lässt sich festlegen, dass es die Gesangsstimme in der Stereomitte durch Subtraktion der Kanäle unterdrücken soll. Das gut gemachte Handbuch verrät: Eine verbesserte Gesangserkennung soll in künftigen Versionen folgen. Eine gute Ergänzung bleibt das kostenlos auf Github verfügbare Programm Ultimate Vocal Remover (UVR). Es stellt eine Fülle von KI-Modellen bereit, um Audiostimmen zu separieren.