Für den Feed ohne Ton gestalten: KI-Video, das auf stumm funktioniert

Der Großteil Ihrer Zielgruppe schaut ohne Ton und mit dem Handy hochkant. Das ist keine Einschränkung, für die man sich entschuldigen müsste. Es ist das Format, für das Sie tatsächlich gestalten. Warum stummes, vertikales Schauen das Creative ab dem ersten Frame prägen sollte und wie KI das günstiger macht.

Illustration eines vertikalen Handy-Videos auf stumm, dessen Untertitel die Botschaft tragen

Das Wichtigste in Kürze

  • Der Feed ist standardmäßig stumm und vertikal: Gehen Sie von der echten Schausituation aus, denn sie ist nicht die Ausnahme, sie ist die Regel.
  • Was „funktioniert auf stumm“ wirklich verlangt: Eine Anzeige, die auf stumm funktioniert, ist keine Anzeige, der man nachträglich Untertitel verpasst hat.
  • Vertikal ist nicht Querformat mit Balken: Die andere Hälfte des Formats ist der Bildausschnitt, und der häufige Fehler besteht darin, Hochkant für ein Querformat mit abgeschnittenen Seiten zu halten.

Zwischen der Art, wie Anzeigen gemacht werden, und der Art, wie sie geschaut werden, klafft eine Lücke. Gemacht werden sie auf großen Querformat-Monitoren, in stillen Räumen, mit voll aufgedrehtem Ton. Geschaut werden sie auf einem hochkant gehaltenen Handy, an einem lauten Ort, ohne Ton, in einem Feed, der ständig weiterläuft. Eine Anzeige, die für die erste Situation gestaltet und an die zweite nur angepasst wurde, läuft am Ende unauffällig unter ihren Möglichkeiten, nicht weil die Idee schwach gewesen wäre, sondern weil das Format, in dem sie tatsächlich läuft, erst im Nachhinein bedacht wurde.

Das ist kein neues Problem, aber neuerdings ein billig zu lösendes. Über weite Strecken der Videogeschichte bedeutete sauberes Gestalten für den vertikalen Feed ohne Ton, entweder zweimal zu drehen oder einen Kompromiss in Kauf zu nehmen. KI senkt diese Kosten so weit, dass es keine Ausrede mehr gibt, den Feed als bloßen Ort zum Zurechtschneiden zu behandeln. Das Format, für das Sie tatsächlich gestalten, kann das Format sein, von dem aus Sie gestalten.

Der Feed ist standardmäßig stumm und vertikal

Gehen Sie von der echten Schausituation aus, denn sie ist nicht die Ausnahme, sie ist die Regel. Der allergrößte Teil der Feed-Videos wird ohne Ton geschaut, jedenfalls anfangs; man scrollt im Büro, in der Bahn, im Bett neben jemandem, der schon schläft, und entscheidet längst, ob man dranbleibt, bevor man überhaupt überlegt, den Ton anzuschalten. Das Handy ist hochkant, weil man es so hält, und es für eine Anzeige zu drehen, ist eine Hürde, die sich fast niemand antut.

Der ehrliche Ausgangspunkt lautet also: stumm, hochkant, in Bewegung, im Wettstreit mit einem Daumen. Jede kreative Entscheidung, die etwas anderes voraussetzt (dass die Musik die Stimmung trägt, dass das Voiceover das Produkt erklärt, dass die breite Komposition zur Geltung kommt), gestaltet für einen Bildschirm, den der Großteil Ihrer Zielgruppe gar nicht nutzt. Ton und Querformat sind ein Bonus für die Minderheit, die sich aktiv dafür entscheidet, nicht der Kanal, über den die Botschaft ankommt.

Was „funktioniert auf stumm“ wirklich verlangt

Eine Anzeige, die auf stumm funktioniert, ist keine Anzeige, der man nachträglich Untertitel verpasst hat. Sie ist eine, deren Bedeutung auch ohne Ton trägt. Das ist eine höhere Messlatte als bloßes Untertiteln, und sie prägt das gesamte Creative. Das Bild muss die Geschichte allein tragen, die Untertitel müssen gestaltet und nicht transkribiert sein, und der erste Frame muss schon etwas sagen, bevor sich überhaupt jemand fürs Hinschauen entschieden hat.

Am deutlichsten zeigt sich diese Verschiebung bei den Untertiteln. Versteht man sie als Barrierefreiheit, sind sie Beiwerk: klein, generisch, unten hingeklatscht. Versteht man sie als Gestaltung, werden sie zum zentralen visuellen Element: groß, auf den Schnitt getaktet, genau dort, wo das Auge ohnehin schon ist, und sie tragen die Zeile, die sonst das Voiceover getragen hätte, könnte man es nur hören. In einem stummen Feed ist der Untertitel kein Transkript der Anzeige. Oft *ist* er ihre Stimme.

Wenn Ihre Anzeige in dem Moment keinen Sinn mehr ergibt, in dem Sie auf stumm schalten, haben Sie keine Feed-Anzeige gemacht. Sie haben einen TV-Spot gemacht, der zufällig im Feed läuft. Und der Feed wird ihn entsprechend behandeln.

Vertikal ist nicht Querformat mit Balken

Die andere Hälfte des Formats ist der Bildausschnitt, und der häufige Fehler besteht darin, Hochkant für ein Querformat mit abgeschnittenen Seiten zu halten. Das ist es nicht. Ein vertikaler Frame ist eine andere Komposition: Er setzt eher auf ein einzelnes Motiv als auf eine weite Szene, rückt Gesichter und Produkt vor die Umgebung und belohnt Bewegung, die im Bild auf- und abläuft statt quer hindurch. Schneidet man eine Querformataufnahme auf hochkant, verliert man meist das Motiv, den Kontext oder beides. Deshalb erkennt man Anzeigen mit schwarzen Balken oben und unten sofort als zweitverwertet und scrollt weiter.

Von Anfang an hochkant zu gestalten, verändert die Aufnahme selbst, nicht bloß das Seitenverhältnis. Ein paar Faustregeln zahlen sich aus:

  • Mit dem Bild einsteigen, nicht mit dem Vorlauf. Der erste Frame muss liefern, bevor Ton oder Kontext überhaupt da sind: ein klares Motiv, ein erkennbares Produkt, ein visueller Hook, der in der halben Sekunde sitzt, in der der Daumen entscheidet.
  • Untertitel als eigene Gestaltungsebene. Größe, Timing und Platzierung des Texts sind kreative Entscheidungen, kein abzuhakender Punkt in der Postproduktion. Halten Sie sie frei von den UI-Overlays der Plattform und genau in dem Bildbereich, in dem das Auge tatsächlich landet.
  • Für den Hochkant-Frame und seine Schutzzonen komponieren. Halten Sie Motiv und Kernbotschaft vom obersten und untersten Rand fern, wo Bedienelemente und Einblendungen der Plattform ins Bild ragen, und bauen Sie die Aufnahme um einen einzigen Fokuspunkt herum statt um eine weite Szene.

Nichts davon ist exotisch. Es ist schlicht das, was es bedeutet, für den Bildschirm zu gestalten, auf dem die Anzeige läuft, statt für den, auf dem sie geschnitten wurde.

Wo KI hilft, und wo sie Ecken abschneidet

Warum das gerade jetzt ein Thema ist: KI verändert die Ökonomie des Richtigmachens. Einen wirklich vertikalen, ohne Ton lesbaren Schnitt zu produzieren, mit Untertiteln als Gestaltungselement, gerahmt für ein einzelnes Motiv, eröffnet mit einem starken ersten Frame, kostete früher zusätzlich Geld und Zeit, oben drauf auf die „eigentliche“ Querformatversion. Wenn Varianten billig sind, ist der vertikale Schnitt ohne Ton kein heruntergestufter Export mehr, sondern eine vollwertige Version, die Sie wirklich gestalten und testen können.

Aber billig macht es eben auch leicht, genau dort zu schludern, wo es das Format am wenigsten verzeiht. Auto-Untertitel, die am Schnitt vorbeilaufen, ein Querformat-Clip, lieblos auf ein Hochkantbild aufgepolstert, generischer Text ohne Gespür dafür, wohin das Auge wandert: all das spuckt KI in Sekunden aus, und man sieht jedem Ergebnis sofort an, was es ist. Das Format wird nicht nachsichtiger, nur weil die Produktion billiger geworden ist. Im Gegenteil: In einem Feed voller sauber gemachter vertikaler Creatives sticht die halbherzige Version erst recht heraus, aus dem falschen Grund.

Die Teams, die den stummen, vertikalen Feed gewinnen, sind nicht die, die als Letztes noch Untertitel draufpacken. Es sind die, die stummes, hochkantes, bewegtes Schauen als das Briefing begreifen: den ersten Frame so bauen, dass er auch ohne Ton den Daumen stoppt, die Untertitel so, dass sie die Botschaft tragen, und die Komposition für den Bildschirm, den die Leute tatsächlich in der Hand halten. Und die günstige KI-Variation nutzen, um genau das zur Standardversion zu machen statt zur Nebensache.

Quellen

  • Meta, „Designing for sound-on and sound-off: best practices for mobile feed video“, Meta for Business Insights, 2025.
  • Think with Google, „Vertical video and the realities of mobile viewing“, 2024.
  • Verizon Media / Publicis, „The sound-off majority: how people really watch mobile video“, 2024.

Häufige Fragen

Was sollten Marketing-Teams über Der Feed ist standardmäßig stumm und vertikal wissen?
Gehen Sie von der echten Schausituation aus, denn sie ist nicht die Ausnahme, sie ist die Regel.
Was sollten Marketing-Teams über Was „funktioniert auf stumm“ wirklich verlangt wissen?
Eine Anzeige, die auf stumm funktioniert, ist keine Anzeige, der man nachträglich Untertitel verpasst hat.
Was sollten Marketing-Teams über Vertikal ist nicht Querformat mit Balken wissen?
Die andere Hälfte des Formats ist der Bildausschnitt, und der häufige Fehler besteht darin, Hochkant für ein Querformat mit abgeschnittenen Seiten zu halten.

Kostenloses Sample-Video

Zeigen Sie uns, was Sie bewerben möchten.

Wir erstellen einen ersten KI-gestützten Video-Ad-Prototyp für Ihr Produkt, Unternehmen oder Ihre App.

Sample anfragen