Go to Menu
Celebrating 25 Years of Voice! 🎉

Die Bedeutung von Tonfall und Sprechstil für Ihre Marke

Beim Aufbau einer Marke kommt es auf jedes Detail an: nicht nur darauf, was gesagt wird, sondern auch wie. Genau darum ist der Tonfall dabei so wichtig.

August 8, 2024 by Gaea Vilage

Marken definieren sich nach dem, was sie von der Konkurrenz unterscheidet, z. B. Namen, Logos oder Farbschemen. Ein einheitlicher und wiedererkennbarer Tonfall gehört auch dazu. Der Internationalen Organisation für Normung zufolge besteht der Zweck der Markenbildung darin, „in den Köpfen der Akteure bestimmte Bilder und Verknüpfungen“ zu kreieren. Der Tonfall Ihrer Marke kann genau diese Bilder und Verknüpfungen entstehen lassen.

Es lohnt sich also, sich einmal mit dem Tonfall für das Corporate Branding auseinanderzusetzen: Aber worum geht es dabei, warum ist das wichtig und wie passt Ihr schriftlicher Stil zu bestimmten Sprechweisen? Ein wirkungsvoller Tonfall wird immer wichtiger, denn über digitale Kommunikationskanäle findet immer mehr Kommunikation zwischen Marken und Verbrauchern statt. Gleichzeitig verändern Voicebots, Smart-Speaker-Apps, virtuelle Assistenten und andere KI-basierte Konversationsplattformen die Art und Weise, wie Verbraucher mit Unternehmen in Kontakt treten. Das kann zu Verwirrung zwischen zwei verwandten, aber getrennten Markenmerkmalen führen: dem Tonfall und dem Sprechstil.

Wir erläutern an dieser Stelle, wie Sie Ihrer Marke durch einen durchdachten Einsatz von Tonfall und Sprechstil in schriftlichen Mitteilungen und über das Internet der Stimme zu mehr Erfolg verhelfen.

Was versteht man bei der Markenkommunikation unter Tonfall?

Das lässt sich recht leicht definieren: Der Tonfall ist eine einheitliche Art der Kommunikation. Idealerweise werden die technischen Einzelheiten dieses Tonfalls gesteuert, damit nichts dem Zufall überlassen bleibt. Deshalb folgt hier eine etwas wissenschaftlichere Definition:

Als Tonfall bezeichnet man diejenigen sprachlichen Elemente, die Identität, Stimmungslage und Persönlichkeit vermitteln. Es geht dabei nicht um die Worte an sich, sondern um die Art der Präsentation.

Ein abgerissenes Stück schwarzes Papier mit einem Wörterbucheintrag für den Begriff: Tonfall. Dem Eintrag zufolge umfasst der Tonfall diejenigen sprachlichen Elemente, darunter Wortwahl, Satzbau und Grad der Formalität, die Identität, Stimmungslage und Persönlichkeit vermitteln.
Dem Eintrag zufolge umfasst der Tonfall diejenigen sprachlichen Elemente, darunter Wortwahl, Satzbau und Grad der Formalität, die Identität, Stimmungslage und Persönlichkeit vermitteln.

Beim Tonfall geht es darum, wie eine Botschaft ausgedrückt wird und nicht um die Botschaft an sich. Ein bestimmter Tonfall entsteht durch die Wortwahl, den Satzbau, den Blickwinkel und auch durch die Zeichensetzung. All diese Merkmale müssen mit den Markenwerten übereinstimmen. Wenn Sie zum Beispiel Energy Drinks verkaufen, ist wahrscheinlich ein informeller Ton in der zweiten Person am besten: „Das musst du unbedingt probieren!“ Für Unternehmensversicherungen sollte der Ton eher formell und technisch sein: „Angesichts der aktuellen unsicheren Wirtschaftslage brauchen Geschäftsinhaber eine zuverlässige Betriebshaftpflicht.“

Ganz gleich, wie Sie Ihren Tonfall gestalten: Ein Leitfaden dazu für Kommunikationsmitarbeiter ist Pflicht, und das Wichtigste dabei ist Konsistenz. Damit eine starke Markenbindung entstehen kann, muss der Ton auf allen Kanälen der gleiche sein. Wenn Sie in den sozialen Medien gerne Witze reißen, muss auch die Website flotte Sprüche enthalten. Soll Ihre Marke ernsthaft und seriös rüberkommen, dann halten Sie am besten auch die Sprache in Blogeinträgen und Newslettern formell.

Natürlich umfasst Sprache sowohl schriftliche als auch mündliche Äußerungen. Der Tonfall beim Branding bezieht sich auf beides, auch wenn das Schriftliche bei Marken immer noch im Vordergrund steht. Der Tonfall bezieht sich auf die Art und Weise, wie etwas gesagt oder geschrieben wird. Er umfasst die Wahl der Worte, die Satzstruktur und den Grad der Formalität. Neben dem Tonfall gibt es aber auch den Gesprächston mit bestimmten Sprechweisen. (Weitere Infos zum Tonfall im Marketing finden Sie in unserem Artikel (auf Englisch) mit Negativbeispielen, die Marketing-Fachleute vermeiden sollten.)

Ein abgerissenes Stück schwarzes Papier mit einem Wörterbucheintrag für den Begriff: Gesprächston. Dem Eintrag zufolge umfasst der Gesprächston sprachliche Elemente wie Betonung, Emotionen, Intonation, Pausen usw., die einen bestimmten Sprechstil ausmachen.
Dem Eintrag zufolge umfasst der Gesprächston sprachliche Elemente wie Betonung, Emotionen, Intonation, Pausen usw., die einen bestimmten Sprechstil ausmachen.

Was versteht man bei der Markenkommunikation unter Gesprächston?

Während ein bestimmter Tonfall auch Einfluss darauf hat, welche Worte jemand sagt, beschreibt der Gesprächston die Art und Weise, wie es gesagt werden soll. Der Tonfall ist wichtig für das Verfassen eines Skripts, der Gesprächston ist für die Performance wichtig. Der Gesprächston ist also beim Sprechen das, was der Tonfall beim Schreiben ist, auch wenn die beiden Begriffe sich natürlich gelegentlich überschneiden, da aus geschriebenem Text Sprache wird und umgekehrt.

Lassen Sie uns etwas genauer darauf eingehen. Sprachwissenschaftler bezeichnen die Worte in der Sprache auch als „linguistische Informationen“. Gemeint ist damit der Inhalt der Botschaft. Der Gesprächston dagegen ist alles außer diesen linguistischen Informationen. Die Sprechweise umfasst Elemente wie Betonung, Emotionen, Tonhöhe, Betonungen, Pausen, „Ähs“ und „Alsos“ und auch den einmaligen Klang einer Stimme. Bei der Markenbildung steht diese Sprechweise in direktem Zusammenhang mit der Beziehung zu den Verbrauchern.

Sprechweise, Emotionen und Markenpersönlichkeit

Sprechweise, Emotionen und Persönlichkeit sind eng miteinander verbunden. Bei der Beschreibung eines Sprechstils geht es immer auch um Emotionen: Wir nehmen ihn als glücklich, traurig, wütend etc. wahr. Bei der Kreation einer synthetischen Stimme sollten Unternehmen darauf achten, dass diese einem echten menschlichen Kontakt zwischen Unternehmen und Verbraucher möglichst nahe kommt. Emotionen sind das Bindeglied, auf das es ankommt. Wer verstehen möchte, welchen Einfluss die Sprechweise auf die emotionalen Bindungen mit einer Marke und das Verbrauchererlebnis hat, sollte sich dieses Szenario vor Augen führen:

Sie rufen bei Ihrer Bank an um die letzte Rate einer Kreditkartenabrechnung zu bezahlen. Die Abzahlung läuft bereits seit Jahren. Bei Ihrem Anruf hören Sie eine der folgenden beiden Optionen:

  1. „Herzlichen Glückwunsch! Sie haben es geschafft. Wir senden Ihnen einen Geschenkgutschein über 10 EUR, einfach um Danke zu sagen. Benötigen Sie vielleicht einen höheren Kreditrahmen?“
  2. „Die Zahlung wurde akzeptiert. Haben Sie sonst noch einen Wunsch?“

Welches Erlebnis wir lieber hätten, ist wohl keine Frage. Der erste Mitarbeiter hat vermutlich erreicht, dass Sie der Bank treu bleiben. Der zweite hat eventuell einen guten Kunden verloren. Hier zeigt sich, wie unmittelbar der Zusammenhang zwischen Tonfall, Inhalt und Markenimage ist. Auch gelegentliche Interaktionen sind wichtig, ob sie nun über einen Online-Voicebot oder eine gesprochene Werbebotschaft beim bevorzugten Musik-Streaming-Dienst Ihres Kunden zustande kommen.

Warum das so ist, erklärt der theoretische Ansatz zur Markenpersönlichkeit. Für die Marketing-Theoretikerin Jennifer Aaker ist die Markenpersönlichkeit „das Paket an menschlichen Eigenschaften, das mit einer Marke assoziiert wird“. In ihrer Studie listet Aaker Persönlichkeitszüge auf, die bestimmten Typen entsprechen. Eine „aufrichtige“ Persönlichkeit zeichnet sich durch Ehrlichkeit, Freundlichkeit und Häuslichkeit aus. Eine „wilde“ Marke dagegen ist taff und auf Outdoor-Aktivitäten ausgerichtet. Weitere mögliche Dimensionen sind Begeisterung, Kompetenz und Kultiviertheit. Sie alle kommen über bestimmte Persönlichkeitszüge zum Ausdruck.

Das Interessante an diesen Zügen: Sie alle werden mit unterschiedlichen Stimmmerkmalen assoziiert. Eine raue Stimme ist wahrscheinlich tief und schroff. Eine aufrichtige Stimme klingt ehrlich und zuversichtlich. Ganz unabhängig von der eigentlichen Persönlichkeit vermittelt der Tonfall dem Hörer einen Eindruck davon, um wen es sich beim Sprecher handelt. Er führt also unmittelbar zur Identität.

Durch eine bestimmte Stimme mit der passenden Sprechweise kommt diese Identität zum Ausdruck. Ob bei Schulungen für Mitarbeitende des Kundenservice oder bei der Entwicklung einer TTS-Stimme: Achten Sie immer darauf, dass der Gesprächston zu Ihrer Markenpersönlichkeit passt. Das gilt vor allem dann, wenn die Stimme auf sämtlichen Audiokanälen – von Ansagen im Geschäft über Smart-Speaker-Apps bis hin zu automatisierten Telefonsystemen – zum Einsatz kommen soll. Bei einer Text-to-Speech-Stimme kommt es darauf an, dass Sie Ihre Marke, und zwar nur Ihre Marke, repräsentiert. Mit dem richtigen Gesprächston lässt sich hier viel erreichen.

Steuerung von Sprechweisen mit KI-basierter Text-to-Speech

ReadSpeaker ist natürlich keine Branding-Agentur (auch wenn wir eng mit solchen zusammenarbeiten). Deshalb bieten wir keine Beratung zur Entwicklung einer kompletten Markenidentität an. Wir sind Marktführer bei der Entwicklung individueller digitaler Stimmen mit einer leistungsstarken Forschungsabteilung, die die TTS-Wissenschaft immer weiter vorantreibt. Genau deshalb sind wir der ideale Partner, wenn es darum geht, Ihre einzigartige Stimme, die Ihre Markenidentität optimal widerspiegelt, zum Leben zu erwecken.

Unser Spezialgebiet ist die Gestaltung individueller und einzigartiger TTS-Stimmen. Es ist ein Muss eine markenspezifische Stimme für jedes Unternehmen zu haben, das per Voice Computing mit seinen Kunden interagiert. Auch eine generische bzw. eine Standard-TTS-Stimme von Tech-Giganten wie Amazon oder Google kann eine Alternative sein. Damit sind dann aber einige Risiken verbunden:

  1. Sie generieren keinen Markenwert. Wenn Sie sich beim Alexa Skill Ihrer Marke für die Standard-Stimme von Alexa entscheiden, verbinden die Verbraucher diese wohl kaum mit Ihrer Marke. Sie denken wohl eher an Amazon.
  2. Es besteht die Gefahr, dass direkte Mitbewerber dieselbe Stimme nutzen. Das ist das Gegenteil von individuellem Branding. Mit einem unabhängigen digitalen Sprechpartner wie ReadSpeaker kann sich Ihre Marke mit einer einzigartigen Stimme, die auf das Hören genau so wirkt, wie ein Logo auf das Sehen, von anderen abheben.

Damit sind wir jetzt bei der Sprachweise bei TTS angelangt – ein wichtiger Bestandteil einer markenspezifischen synthetischen Stimme. Bei ReadSpeaker hat Ihr Unternehmen während des Designprozesses verschiedene Möglichkeiten, die Sprechweise Ihrer TTS-Stimme zu verändern. Unter anderem diese:

  • TTS mit emotionaler Ausdruckskraft: Genau wie bei der Kommunikation zwischen Menschen muss der emotionale Ton zum jeweiligen Kontext passen. Deshalb können neuronale TTS-Stimmen von ReadSpeaker verschiedene Stimmungen zum Ausdruck bringen. Ein und dieselbe Stimme kann entweder sympathisch, aufgeregt oder so sogar wütend klingen. Wenn Sie mit einem unserer Partner für Emotionserkennungstools zusammenarbeiten, ist es auf modernen Konversationsplattformen sogar möglich, den emotionalen Ton auf die Stimmung des Nutzers abzustimmen – genau wie bei Menschen.
  • Angemessene Betonung „STEIG in diesen Bus ein“ hat natürlich eine andere Bedeutung als „Steig in DIESEN Bus ein“. Im ersten Fall handelt es sich um eine Anweisung einer verantwortlichen (und wohl etwas ärgerlichen) Person, im zweiten Fall wird angegeben, welches der richtige Bus ist, oder dass die Zeit drängt. In die TTS-Stimmen von ReadSpeaker können individuelle Betonungen integriert werden, die eine bestimmte Stimmung oder Persönlichkeit zum Ausdruck bringen.
  • Sprechgeschwindigkeit und -rhythmus: Eine Energy-Drink-Marke würde sich wünschen, Spannung und Abenteuer auszudrücken. Die zugehörige TTS-Stimme muss also etwas schneller sprechen. Auch Sprechpausen können zu einem Identitätsgefühl beitragen: „Ich … glaube schon“ klingt zum Beispiel weniger überzeugt als „Ich glaube schon“. All dieser Elemente sind wichtig, damit eine markenspezifische TTS-Stimme mit eigenem Charakter entsteht. Mit TTS von ReadSpeaker ist genau das möglich.

Einige Beispiele für Tonfallmerkmale bei TTS-Stimmen finden Sie auf unserer Demo-Seite.

Dort können Sie außerdem unsere sprachübergreifenden TTS-Möglichkeiten ausprobieren. Mit diesen kann Ihre Markenstimme auch in mehreren Sprachen sprechen. Wie die Steuerung des Tonfalls bei TTS zu einer besseren Kundenbindung führen kann, zeigt sich allerdings am besten anhand einiger Beispiele aus der Praxis. Nachstehend schildern wir einige echte Fälle, die zeigen, wie wichtig der Tonfall bei TTS-basierten Interaktionen ist.

5 Beispiele für Sprechweisen in TTS-Interaktionen

Menschen denken über die Sprechweise gar nicht nach. Ein guter Kundenservice-Mitarbeiter bringt beim Sprechen Sympathie, Ermunterung oder auch neutrale Sachlichkeit zum Ausdruck und kann den Tonfall spontan ändern. Dank fortschrittlicher KI-Technologie sind auch TTS-Stimmen dazu in der Lage. So entstehen bei jedem Kontakt mit der Marke ein lebensechtes Erlebnis und eine positivere Interaktion.

Wie aber klingt ein bestimmter TTS-Stil in der Praxis? Hier einige Beispiele:

1. Giancarlo Esposito für die Sprachsteuerung von Sonos

Das Team von Sonos hatte eine genaue Vorstellung davon, wessen Stimme mit den Hörern kommunizieren sollte – die des berühmten Schauspielers Giancarlo Esposito. In Zusammenarbeit mit Esposito und dem VoiceLab, der ReadSpeaker-Sparte für die Entwicklung individueller Stimmen, entwickelte Sonos in der Folge eine lebensechte digitale Version der markanten Stimme.

Wenn Nutzer heute die Smart Speaker von Sonos nutzen, hören sie jedes Mal Espositos Stimme. Dadurch ist die Marke sofort erkennbar. Dank zahlreicher Aufnahme-Sessions mit Esposito und den fortschrittlichen Deep Neural Networks von ReadSpeaker spricht die individuelle TTS-Stimme in einem einheitlich natürlichen und freundlichen Ton. Außerdem ist sie in der Lage, Wörter in mehreren Sprachen korrekt auszusprechen.

Der Schauspieler Giancarlo Esposito, bekannt aus den Serien Breaking Bad und The Mandalorian, steht mit Kopfhörer in einem Aufnahmestudio und zeigt auf die Zuhörenden. Links von ihm ist ein Mikrofon zu sehen.

2. Ana, die KI-Assistentin aus dem Augmented-Reality-Spiel „Acolyte“

Als das Game-Studio Superstring Ltd. mit der Entwicklung des Augmented-Reality-Spiels „Acolyte“ startete, stießen die Programmierer schnell an eine technologische Grenze. Bei dem Spiel geht es vor allem um Interaktionen zwischen den Spielenden und der KI-Assistentin Ana. Dabei kommt eine KI für natürliche Sprache zum Einsatz. Auf diese Weise erhalten die Spielenden auf alles, was sie zu Ana sagen, sofort eine passende Antwort.

Voiceover-Aufnahmen für Ana waren also nicht möglich. ReadSpeaker hatte dafür eine Lösung – mit einem Plug-in, das Runtime-TTS in die Spiel-Engines von Unity und Unreal integriert. Mit dem TTS-Unity-Plug-in von ReadSpeaker konnte auch Superstring Ana eine charakteristische Stimme verliehen werden, mit der sie alles sagen kann, was die Software für die Generierung natürlicher Sprache (Natural Language Generation/NLG) sich ausdenkt.

„Der richtige Tonfall war für uns entscheidend“, berichtet Jamin Smith, Direktor und Chef-Designer bei Superstring Ltd. „Wenn Tonhöhe, Pausen und Betonung stimmen, sind bestimmte Spielszenen gleich viel eindrücklicher und emotionaler. Die TTS brachte zutage, was der Programmierung von Ana zugrunde liegt, und das Spiel ist dadurch viel besser geworden.“

3. ZOE, die virtuelle Assistentin von MSC Cruises

In 2019, Bei MSC Cruises ist jetzt ZOE aktiv, die weltweit erste digitale Sprachassistentin für Passagiere von Luxus-Kreuzfahrtschiffen. ZOEs Zuhause sind Smart Speaker in den Kabinen. Über sie erhalten die Gäste aktuelle Infos zu den Dienstleistungen, Aktivitäten und den Restaurants an Bord. Die lebensechte TTS-Stimme von ReadSpeaker verleiht ZOE eine freundliche, niveauvolle und recht positive Persönlichkeit – genau das, was die Gäste für eine angenehme Reise brauchen. Noch dazu spricht ZOE sieben Sprachen.

4. Die Google Assistant Voice App von bol.com

Beim führenden niederländischen Online-Einzelhändler bol.com sollte mit der Entwicklung der Google-Assistant-Shopping-App auch der Markenwert gesteigert werden. Die Pläne dafür umfassten auch eine individuelle TTS-Stimme von ReadSpeaker. Die so entstandene Stimme von bol.com klingt warm, maskulin und selbstsicher. Sie erinnert an einen freundlichen Einkaufsberater, und genau das ist sie im Grunde ja auch. Demnächst wird sie voraussichtlich auch über andere sprachfähige Vertriebskanäle zum Einsatz kommen. Auf diese Weise entsteht von Google Assistant bis hin zum Callcenter des Kundenservice ein einheitliches Markenerlebnis. Hier können Sie einige Kostproben der individuellen TTS-Stimme von bol.com hören.

Screenshot der Website von bol.com mit der Seite zu Google Assistant. Das Bild zeigt eine Schale mit Müsli und eine Hand, die ein Smartphone hält, das über Google Assistant mit bol.com kommuniziert. Die Übersetzung des niederländischen Textes unter dem Bild lautet: Okay, Google: Sprich mit bol.com! Suchen Sie nach Geschenktipps, dem Deal des Tages, was etwas kostet oder wo Ihr Paket ist. Für Smartphones mit Android 5.0 oder höher, iOS 10.0 oder höher sowie für Smart Speaker, die Google Assistant unterstützen.

5. Adam, die Sprachdialogstimme von ReadSpeaker in britischem Englisch

Wenn Sie nach einer freundlichen und ansprechenden TTS-Stimme für britisches Englisch suchen, haben wir die Lösung: Adam von ReadSpeaker. Adam wurde auf der Grundlage der proprietären Deep Neural Networks von ReadSpeaker entwickelt. Mit dieser fortschrittlichen KI-Computing-Architektur lässt sich menschliche Sprache präzise imitieren. Auf diese Weise entsteht eine extrem lebensechte synthetische Stimme.

Adam pflegt einen typischen Konversationsstil und ist damit ideal für Voicebots und andere Konversations-KI-Anwendungen. Auch wenn Adam zu keiner bestimmten Marke gehört, zeigt er doch sehr deutlich, wie lebensecht alle individuellen Branded Voices von ReadSpeaker sind. Hier stellt Adam sich selbst vor.

In den beiden ersten Beispielen aus unserer Liste steht die TTS-Stimme für eine bestimmte Persönlichkeit, die die Nutzer dann mit der Marke verbinden. Durch Konversation entstehen menschliche Bindungen – sogar dann, wenn einer der Sprecher eine Maschine ist. So sind wir eben veranlagt, und sowohl der Tonfall als auch ein bestimmter Sprechstil tragen dazu bei, die Bindung zu einer Marke zu intensivieren. Das gilt für schriftliche Mitteilungen ebenso wie in Kombination über das Internet der Stimme.

Related articles
Beginnen Sie noch heute mit Text To Speech

Gestalten Sie Ihre Produkte mit unseren innovativen Sprachlösungen attraktiver.

Kontaktieren Sie uns