Urbaner Stil bei Nacht in Tokio: Eine modisch gekleidete Frau auf einer hell erleuchteten und belebten Straße.

OpenAI zeigt SORA, künstliche Intelligenz, die atemberaubende Videos erstellt!

Schlanker Catherine-Avatar
Mit dem Tool können Sie Textbefehle in Videos von bis zu 60 Sekunden umwandeln. Die Endergebnisse sind unglaublich. Sehen!

In einer Welt, in der Kreativität auf modernste Technologie trifft, OpenAI, erneut überrascht mit seiner neuesten Innovation: dem SORA. Dieser neue Fortschritt in der künstlichen Intelligenz verspricht, die Art und Weise, wie Videos erstellt werden, zu revolutionieren und bietet ein Werkzeug, mit dem Textansagen in überraschende visuelle Erlebnisse umgewandelt werden können.

Mit einer beeindruckenden Fähigkeit, detaillierte Szenen wiederzugeben, von einer Korallenriffwelt auf Papier bis hin zu Wollhaarmammuts in einer verschneiten Prärie SORA ist bereit zu beeindrucken und zu inspirieren.

Wie funktioniert SORA?

Stilvolle Frau, die nachts durch eine hell erleuchtete Straße in einer japanischen Stadt spaziert und dabei Neonfarben, urbane Mode, Technologie und Popkultur präsentiert.
KI, die Videos erstellt, beeindruckt durch ihren Detailreichtum (Bild: OpenAI)

Wir kannten bereits Modelle der künstlichen Intelligenz, die auf der Grundlage von Texten recht überraschende Bilder erzeugten, wie dies bei der Fall war DALL-E , Zum Beispiel. Jetzt beschäftigen wir uns jedoch mit etwas, das etwas wirkungsvoller ist SORA.

Obwohl es bereits andere Arten von KI-Projekten gibt, die Text in Video umwandeln, SORA zeichnet sich durch seine beeindruckende Fähigkeit zur Erstellung fotorealistischer Bilder und der Produktion längerer Clips von bis zu einer Minute aus. Im Gegensatz zu konkurrierenden Modellen, die nur kurze Videoausschnitte generieren, hat die neue KI das Potenzial, komplexere und ansprechendere Erzählungen zu erstellen.

Die Entwicklerfirma garantiert, dass die SORA ist in der Lage, Videos mit einer Länge von bis zu einer Minute zu erstellen, ohne die visuelle Qualität zu verlieren und dabei den durch den Benutzerbefehl definierten Parametern treu zu bleiben. Das ist das große Detail, das den Unterschied ausmacht.

Aber es ist wichtig, sich daran zu erinnern, dass die OpenAI verteilt das Tool weiterhin an einige ausgewählte Entwickler und Sicherheitsexperten, um mögliche Schwachstellen zu bewerten. Ziel ist es, es in naher Zukunft einem breiteren Publikum zugänglich zu machen.

Beispiele

Laut dem Einführungsbeitrag von OpenAI, neue KI für Videos hat die Fähigkeit, „Komplexe Szenen mit mehreren Charakteren, spezifischen Bewegungen und präzisen Details der Umgebung und Charaktere„. Darüber hinaus kann sie auch verstehen, wie Objekte „in der realen Welt interagieren" und auch "Interpretieren Sie Requisiten präzise und erschaffen Sie ansprechende Charaktere, die lebendige Emotionen ausdrücken„. Ein weiteres sehr relevantes Detail ist die Erstellung eines Videos basierend auf einem statischen Bild sowie das Füllen fehlender Frames in einem vorhandenen Video oder die Möglichkeit, dieses zu erweitern.

Obwohl einige Videos möglicherweise noch Hinweise enthalten, die typisch für die Generierung durch KI sind, sind die OpenAI behauptet, dass die SORA "Möglicherweise haben Sie Schwierigkeiten, die Physik einer komplexen Szene genau zu simulieren„. Insgesamt sind die Ergebnisse jedoch durchaus beeindruckend. Bei einer sehr detaillierten Beschreibung ist es möglich, dass Sora die Erwartungen übertrifft, wie es im Video unten der Fall war.

Nach dem von veröffentlichten Beispiel OpenAi, das war das Ergebnis mit der Eingabeaufforderung „Die animierte Szene zeigt eine Nahaufnahme eines kleinen, pelzigen Monsters, das neben einer schmelzenden roten Kerze kniet. Der Kunststil ist dreidimensional und realistisch, wobei der Schwerpunkt auf Beleuchtung und Textur liegt. Die Stimmung des Gemäldes ist von Staunen und Neugier geprägt, da das Monster die Flamme mit großen Augen und offenem Mund beobachtet. Ihre Haltung und ihr Gesichtsausdruck vermitteln ein Gefühl von Unschuld und Verspieltheit, als würde sie die Welt um sich herum zum ersten Mal erkunden. Der Einsatz warmer Farben und dramatischer Beleuchtung verstärkt die gemütliche Atmosphäre des Bildes zusätzlich."

Die Forscher hinter dem SORA Sie haben nicht verraten, wie lange das Rendern der Videos dauert, aber sie gehen davon aus, dass der Vorgang relativ schnell abläuft, vergleichbar mit einer Snackpause. Wenn die gezeigten Beispiele das Potenzial des Tools veranschaulichen, können wir mit einer Revolution in der Art und Weise rechnen, wie audiovisuelle Inhalte produziert und konsumiert werden.

Wenn man an ein Korallenriff denkt, kann man mit einer einfachen Eingabeaufforderung wie „„ zu einem solchen Ergebnis kommen.Eine Korallenriffwelt, wunderschön auf Papier gerendert, gefüllt mit bunten Fischen und Meerestieren"

Bill Peebles, ein Mitglied des Forschungsteams, stellt dies weiter fest SORA Er schuf durch seine Kamerawinkel und sein Timing eine zusammenhängende Erzählung. Er sagt, dass es mehrere Szenenwechsel gibt, die alle vom Modell in einer einzigen Iteration generiert werden, das heißt, niemand weist das Modell an, dies zu tun, es macht es einfach automatisch.

Ein weiteres großartiges Beispiel ist die Beschreibung: „Mehrere gigantische Wollmammuts nähern sich und stampfen durch eine verschneite Prärie. Ihre langen Wollmäntel wiegen sich beim Gehen sanft im Wind, schneebedeckte Bäume und dramatische schneebedeckte Berge im Hintergrund, Nachmittagslicht mit leichten Wolken und einer hohen Sonne in der Ferne erzeugen ein warmes Leuchten, die niedrige Kameraansicht ist atemberaubend und fesselnd das große pelzige Säugetier mit wunderschöner Fotografie und Tiefenschärfe“ und Sie erhalten Folgendes:

Auswirkungen von KIs, die Videos generieren

Computertastatur mit Kryptowährungssymbol auf digitalem Hintergrund, Technologie, Innovation, digitale Währungen, Blockchain, Finanzmarkt.
Neue Modelle der künstlichen Intelligenz haben Vor- und Nachteile (Bild: WIRED)

Während die Visuals von der neuen KI bereitgestellt werden OpenAI sind auf jeden Fall beeindruckend, doch ihre wahre Überraschung liegt in ihren unerwarteten Fähigkeiten. Angetrieben durch eine Version des vom Imager verwendeten Diffusionsmodells VON-3, zusammen mit dem transformatorbasierten Motor des GPT-4herunter, eine SORA Es geht über die bloße Erfüllung der Anforderungen der Aufforderungen hinaus und offenbart ein aufkeimendes Verständnis der filmischen Grammatik.

Zu berücksichtigen ist die Tatsache, dass es inhaltlichen Beschränkungen mit Gewalt, Pornografie, unerlaubter Aneignung von Identitäten oder Stilen bekannter Künstler unterliegt. Zusätzlich OpenAI ist bestrebt, den Zuschauern die Möglichkeit zu geben, die von ihnen generierten Inhalte eindeutig zu identifizieren SORA wie durch künstliche Intelligenz geschaffen. Kürzlich der Sänger Taylor Swift war mit einigen Konflikten mit seinem Image konfrontiert, die mit dieser Art von negativem Szenario verbunden waren Deepfakes im Internet.

Aber die Wahrheit ist, dass KI für Videos zwar eine große Neuigkeit ist, aber noch nicht perfekt. Trotz der positiven Auswirkungen steht die Technologie immer noch vor Herausforderungen. Ein Beispiel hierfür ist die Frage der Sicherheit und Richtigkeit sowie der Urheberrechtsverletzung durch die produzierten Inhalte.

Die Lösung von Fehlinformationen erfordert nicht nur unser Handeln, sondern auch ein kollektives Verständnis der Gesellschaft und die Anpassung der sozialen Medien.

Aditya Ramesh, Dall-E-Teamleiterin

Künstliche Intelligenz, die Videos generiert, wird jedoch weiterhin als mögliche Ergänzung für verschiedene Situationen angesehen. Es geht nicht darum, es als Ersatz zu betrachten, sondern darum, es strategisch zu nutzen. Beispielsweise kann die Filmproduktion die Vorteile der Technologie nutzen, um Szenarien auf praktische Weise umzuwandeln. Zweite Bill Peebles„Um einen professionellen Film zu produzieren, ist teures Equipment nötig. Dieses Modell wird es alltäglichen Social-Media-Nutzern ermöglichen, qualitativ hochwertige Inhalte zu erstellen.“

Showmetech TRIO

Sehen Sie sich diese und andere Neuigkeiten auf Showmetech TRIO an, Ihrem wöchentlichen Nachrichtentrio:

Siehe auch

Gemini löst Bard als Googles besten Assistenten für künstliche Intelligenz ab. Sehen Sie, wie man es verwendet

Fontes: VERDRAHTET, The Verge

Text Korrektur gelesen von: Pedro Bomfim


Erfahren Sie mehr über Showmetech

Melden Sie sich an, um unsere neuesten Nachrichten per E-Mail zu erhalten.

Related posts