ANZEIGE

Axel Springer launcht eigenen Text-To-Speech-Service


Audio-Inhalte gewinnen weiter an Beliebtheit. Für viele Medienmarken werden entsprechende Angebote deshalb immer wichtiger. Axel Springer hat unter dem Namen Aravoices nun eine eigene Text-To-Speech-Anwendung entwickelt, mit der synthetische Markenstimmen produziert und Texte in Echtzeit in Audioformate umgewandelt werden können. "Die derzeit im Markt genutzten Stimmen sind generisch und werden von vielen Kunden parallel verwendet", erklärt Anne Küpper, Product Owner von Aravoices bei Axel Springer. "Wir wollen mit Aravoices synthetische Stimmen produzieren, die so einzigartig sind, wie die Marken, die sie verwenden."

Synthetische Stimmen der Technologie können für bestimmte Funktionen wie etwa journalistische Inhalte optimiert werden und bilden die Basis für verschiedene Audioformate wie Vorlesefunktion, Playlisten oder Voice-Apps. Die Text-To-Speech-Technologie besteht aus einem Maschine-Learning-Modell, mit dem synthetische Markenstimmen entwickelt und trainiert werden können, sowie einer sogenannten "Synthese-Pipeline", die einzelne Texte importiert, umwandelt und als Audio-Datei ausliefert.

Als erste Medienmarke setzt Welt eine eigene Markenstimme von Aravoices ein. In diesem Zuge bietet das Unternehmen ab sofort eine Vorlesefunktion für ausgewählte Artikeln auf welt.de an. Die Stimme soll sukzessive auf weitere Formate und Kanäle wie beispielsweise Smart-Speaker ausgeweitet werden und zukünftig die zentrale und wiedererkennbare Markenstimme von Welt bilden. Perspektivisch soll Aravoices auch anderen Medienunternehmen als Service angeboten werden. Dabei wird das Team den kompletten Entwicklungsprozess über die Sprecherauswahl bis hin zur Qualitätskontrolle der final erstellten Audiodateien unterstützen und begleiten.