Wie Klang.io mit KI die Musikwelt digitalisiert

Sebastian Murgul und Alex Lüngen bei der Arbeit mit Klang.io

Es begann mit einer simplen Bitte: Die kleine Schwester von Sebastian Murgul wollte eine Melodie von ihrem E-Piano nachspielen, aber es gab keine Noten dazu. Was folgte, war ein Umweg über eine Oszilloskop-App, mühsames Frequenzmessen und handschriftliche Notation auf Papier. Doch aus dieser frustrierenden Erfahrung entstand eine Geschäftsidee: Klang.io.

Das Karlsruher Startup hat sich der automatisierten Musiktranskription verschrieben und verwandelt mit Künstlicher Intelligenz Audioaufnahmen in wenigen Sekunden in lesbare Notenblätter. Ein Problem, das Musikerinnen und Musiker seit jeher begleitet, wird damit elegant gelöst – während professionelle Transkribierende für ein vierminütiges Klavierstück noch rund acht Stunden benötigen, schafft Klang.io dies in Sekundenschnelle.

Vom KIT-Student zum Gründer

Die Entstehungsgeschichte von Klang.io liest sich wie ein typisches Startup-Märchen aus dem Silicon Valley – nur dass sie in Karlsruhe spielt. „Die Idee zu klang.io entstand vor rund zehn Jahren aus einer persönlichen Erfahrung“, erzählt Murgul uns im Interview. Als Elektrotechnikstudent am KIT griff er damals zur Oszilloskop-App, wandelte gemessene Frequenzen in Tonhöhen um und schrieb diese mühsam auf Notenpapier. „Dabei stellte ich mir die Frage: Geht das nicht einfacher?“

Das Tüfteln begann, und Anfang 2018 hatte er seinen ersten Prototyp entwickelt, den er kostenlos online stellte. „Die Resonanz war überwältigend und zeigte mir, dass es einen echten Bedarf gibt.“ Der nächste logische Schritt war die Unternehmensgründung – mit tatkräftiger Unterstützung der Karlsruher Startup-Szene. „Unterstützung fand ich bei der KIT-Gründerschmiede, im CyberForum und in der Pioniergarage. Dort erhielt ich wertvolle Hilfe bei den Herausforderungen der Gründung und lernte viele inspirierende Gründer:innen, Consultants und Mentor:innen kennen, die unseren Weg bis heute begleiten.“

Sebastian Murgul und Alex Lüngen, die Gründer von klang.io. Foto: Sebastian Weindel

Learnings eines Technikers

Doch der Weg war nicht ohne Hürden. „Ein Unternehmen zu gründen ist kein Bestandteil eines Elektrotechnikstudiums“, reflektiert der Gründer heute. „Technisch war ich bestens vorbereitet, aber in unternehmerischen Fragen völlig unerfahren. Entsprechend bin ich recht naiv gestartet und habe versucht, vieles allein zu bewältigen.“

Die wichtigste Erkenntnis: „Dabei habe ich schnell gelernt, dass man nicht alles selbst machen kann. Der wichtigste Schritt war, die richtigen Menschen um mich zu versammeln: meinen smarten und stets gut strukturierten Mitgründer und CTO Alex Lüngen, unser großartiges Team sowie Mentor:innen, die wir über das CyberForum kennengelernt haben, und nicht zuletzt unseren Steuerberater. Ohne sie wäre der Weg deutlich steiniger gewesen.“

KI-Technologie trifft Musikwissenschaft

Das Herzstück von Klang.io ist ein einzigartiges KI-System, das bereits vor dem ChatGPT-Hype entwickelt wurde. „Als wir gegründet haben, war die Zeit vor ChatGPT, als die ersten KI-Softwarebibliotheken gerade aufkamen. Wir haben früh erkannt, dass Deep Learning eine spannende Lösung für Musiktranskription sein könnte“, erklärt Murgul, der diesem Thema seine Bachelor-, Master- und Doktorarbeit widmete.

Die Funktionsweise klingt komplex, ist aber elegant durchdacht: „Im Prinzip funktioniert unser System so: Zunächst wandeln wir das eingehende Audio in ein Spektrogramm um. Dieses zweidimensionale Bild zeigt in der einen Achse die Zeit, in der anderen die Frequenz, während die Helligkeit die Lautstärke anzeigt. Darauf wenden wir selbstentwickelte Verfahren aus der Bilderkennung und Sprachmodellen an, um Tonhöhen, Rhythmus und Harmonien zu extrahieren.“

Der finale Schritt kombiniert diese Informationen mit einem Sprachmodell, „das die musikalische ‚Grammatik‘ des jeweiligen Instruments abbildet, sodass am Ende ein lesbares und spielbares Notenblatt entsteht.“

Eine besondere Herausforderung lag in der Datenbeschaffung: „Die größte Herausforderung liegt in der Verfügbarkeit von Trainingsdaten. Musik-Urheberrecht ist ein komplexes und sensibles Thema. Deshalb haben wir Verfahren entwickelt, um Millionen synthetischer Musikbeispiele zu erzeugen, die wir für das Training unserer Modelle nutzen.“

Ein App-Universum für jeden Musikgeschmack

Klang.io hat sich zu einem umfassenden Ökosystem entwickelt. „Seit einigen Jahren bauen wir unser klang.io App-Universum auf. In diesem App Universum befinden sich Apps für die verschiedensten Musikinstrumente, wie Klavier (Piano2Notes), Gitarre (Guitar2Tabs), Gesang (Sing2Notes), Schlagzeug (Drum2Notes), Blasinstrumente (Wind2Notes) und Streicher (Violin2Notes).“

Der Grund für diese Spezialisierung liegt im Detail: „Denn jedes Musikinstrument ist auf eine Art und Weise besonders und das haben wir versucht zu berücksichtigen. Zum Beispiel gibt es beim Klavier Haltepedale, beim Gesang verschiedene Stimmlagen und bei der Gitarre eine ganz eigene Notationsform, die Gitarren-Tabs.“

Die Zielgruppe ist dabei bewusst breit gefächer und reicht “von Musizierenden, von Komponist:innen, die unsere Tools zum Notieren neuer Kompositionen nutzen, über Musiklehrende die uns in der Unterrichtsgestaltung einsetzen, bis hin zu Hobbymusiker:innen, die unsere Tools benutzen um die Noten für ihren Lieblingssong herauszufinden.“

Das Geschäftsmodell folgt einem durchdachten Freemium-Ansatz: „Die ersten 20 Sekunden einer Aufnahme können kostenlos transkribiert werden. Das ist wichtig, da die Anforderungen an Musiktranskription sehr vielfältig sind. Nutzer:innen können so testen, ob unsere Lösung für ihren Anwendungsfall passt, bevor sie sich für ein Abo entscheiden.“

Bild der Klang.io App
Klang.io nutzt KI um Audioaufnahmen schnell in Noten umzuwandeln.

Karlsruhe als Startup-Sprungbrett

Auch in der Wachstumsphase profitiert Klang.io von der lebendigen Karlsruher Startup-Szene und die lokale Vernetzung zahlt sich aus: „Wir profitieren bis heute von der lebendigen Karlsruher Startup-Szene. Das K3 hat uns bei der Bürosuche unterstützt, das Usability Testessen hilft uns, unsere Apps nutzerfreundlicher zu machen, und in CEO- und CTO-Circles tauschen wir uns regelmäßig mit anderen Gründer:innen aus. Zudem erhalten wir weiterhin Unterstützung vom KIT und der HFM für Forschungsprojekte.“

Obwohl in Karlsruhe verwurzelt, ist Klang.io von Beginn an global aufgestellt und verzeichnet die meisten Kund:innen in den USA, Japan und Südkorea, “erst danach folgen Deutschland und Großbritannien.” Für die Zukunft des Standorts hat der Gründer klare Vorstellungen: „Besonders spannend fände ich es, wenn hier mehr Music-Tech-Startups entstehen würden. Die Musikbranche wird oft unterschätzt, doch gerade durch KI entstehen dort neue Chancen und Geschäftsmodelle.“

Teamkultur mit musikalischer DNA

Das Team von Klang.io verbindet mehr als nur die Arbeit: „Wir haben eine freundschaftliche, offene und musikbegeisterte Teamkultur. Alle spielen selbst Instrumente und kennen das Problem fehlender Noten aus eigener Erfahrung. Das verbindet uns und erleichtert die Zusammenarbeit.” Der pragmatische Ansatz prägt auch den Umgang mit Herausforderungen: „Unser Team ist sehr

Besonders stolz ist das Team auf einen wichtigen Meilenstein: „Der wichtigste Meilenstein war für uns der Schritt in die Profitabilität. Bis auf ein kleines Investment im Rahmen von Startup BW Pre-Seed sind wir gebootstrapt, also ohne Finanzierung von außen gewachsen.“

Der Weg dorthin war kreativ: „In der Anfangsphase haben wir nebenbei Webseiten für Mittelständler programmiert, um die Entwicklung zu finanzieren. Umso größer war die Freude, als wir Anfang 2024, wenige Monate nach unserer Teilnahme bei ‚Die Höhle der Löwen‘, profitabel wurden, also all unsere Ausgaben aus unserem Umsatz decken konnten.“

Die Zahlen sprechen für sich: „Heute generieren Nutzerinnen und Nutzer weltweit über 15.000 Transkriptionen täglich. Gleichzeitig ist unser Team gewachsen, unsere Apps wurden erweitert, und die Qualität unserer Transkriptionen hat sich deutlich verbessert.“

Die nächsten Entwicklungsschritte sind bereits konkret geplant: „Am 6. Oktober 2025 launchen wir unsere neuen KI-Modelle für Multiinstrumentaltranskription. Dazu gehört ein Rock-Modell, das Lead- und Rhythmusgitarre, Bass und Schlagzeug aus abgemischten Songs erkennt, sowie ein Klassik-Modell, das komplexe Ensembles aus Streichern und Bläsern transkribieren kann. Beide Modelle werden Teil unseres Transcription Studios sein.“

Klang.io steht exemplarisch für die Digitalisierung einer traditionell analogen Branche: „Die Musikbranche ist in vielen Bereichen noch stark papierorientiert und im Vergleich zu anderen Branchen wenig digitalisiert. Das liegt am komplexen Urheberrecht und an einer gewissen Technik-Skepsis in Teilen der Szene.“

Mehr Informationen gibt es unter klang.io. Die Apps sind für iOS, Android und als Webanwendung verfügbar.