Auf der Suche nach einem besseren Verfahren, um die Vorlieben oder auch passende Musik für einen Nutzer zu finden, könnte Spotify in Zukunft unter anderem auf die Sprache der Hörer setzen. Laut dem Patent könnte man etwa prosodische Informationen, wie Intonation oder Rhythmus der Stimme, dazu verwenden, um die Stimmung des Nutzers zu ermitteln. Darauf basierend könnten dann entsprechende Songs oder Musiker vorgeschlagen werden.

Neben der reinen Sprache eines Nutzers könnten aber auch Hintergrundgeräusche in derartige Vorschläge einbezogen werden. Anhand dieser ließe sich beispielsweise feststellen, ob der Hörer alleine oder von anderen Personen umgeben ist.

Optimierung von Musikvorschlägen durch Spracherkennung

Einer der Gründe für derartige Forschungen ist die derzeitig verwendete Technik, um die Nutzer „kennenzulernen“. Oftmals müssen hierbei lange und zeitaufwendige Dialoge ausgefüllt oder eine Liste von präferierten Musikern ausgewählt werden, um darauf basierende personalisierte Vorschläge zu erhalten.

Laut dem Patent sei ein „völlig anderer Ansatz zum Sammeln von Geschmacksattributen eines Benutzers“ notwendig. Dieser soll manuelle Eingaben zumindest teilweise überflüssig machen. Genau hier soll die Analyse eines Audiosignals, also Sprache und Hintergrundgeräusche, ansetzen.

Was die Sprache über einen Nutzer verraten kann

In dem Patent werden einige Beispiele genannt, was das neue System erkennen können soll. Neben der reinen Erkennung dessen, was ein Nutzer gesagt hat, sollen auch die Metadaten herausgefiltert werden können. Dazu gehört etwa der emotionale Zustand, Geschlecht, Alter und möglicher Akzent des Anwenders.

Anhand der Hintergrundkulisse sei es des Weiteren möglich, die Umgebung zu erkennen. Dies beinhaltet nicht nur, ob man sich etwa in einem Zug, Auto, Park oder Geschäft befindet, sondern auch, ob man alleine, in einer kleinen Gruppe oder auf einer Party ist.

All diese Informationen sollen dann zum Beispiel mit früheren Anfragen des Hörers, der bereits bestehenden Musikbibliothek und auch Bewertungen von Freunden zusammengefasst werden, um Vorschläge für kommende Inhalte zu machen.

Audioaufzeichnungen der Nutzer: Was ist mit der Privatsphäre?

Das beschriebene System lässt offen, wie genau Spotify an diese Audiodaten seiner Nutzer gelangen will. Denkbar wäre etwa eine Funktion zur direkten Spracheingabe in der App. Was passiert also beispielsweise mit den Aufzeichnungen der Nutzer, nachdem sie analysiert wurden? Und was ist mit den Ergebnissen dieser Analysen an sich?

Da es sich jedoch bislang nur um ein Patent handelt, kann darüber nur spekuliert werden. Die Freigabe des Mikrofons für eine App muss vom Nutzer explizit aktiviert werden, sodass ein unerwünschtes Mithören durch Spotify unwahrscheinlich ist.

Unternehmen patentieren sich darüber hinaus oftmals Technologien, ohne dass diese am Ende in den finalen Produkten zu finden sind. Es ist daher gut möglich, dass ein derartiges Feature niemals in Spotify integriert wird.