Zwillinge 1. 5 pro

Mit dem Gemini 1.5 Pro-Update hört die KI zu und generiert Inhalte

João Lucas Batista-Avatar
Mit dem neuen Update versteht und analysiert Googles künstliche Intelligenz nun Audio. Imagen 2 kann jetzt Bildelemente hinzufügen und entfernen und 4-Sekunden-GIFs erstellen

A Künstliche Intelligenz von Googleoder Gemini, erhielt diesen Dienstag, den 9. April, während der ein neues und innovatives Update Google Cloud Weiter. Mit dem Upgrade wird die Gemini 1.5 Pro, erhielt die Fähigkeit, Audio- und Videozeilen zu verstehen und zu analysieren und Inhalte basierend auf den Eingaben in die Anwendung zu erstellen.

Die neue Funktion steht zunächst nur Nutzern des zur Verfügung Scheitelpunkt AI, Software, auf die es abzielt Maschinelles Lernen (maschinelles Lernen), das von Programmierern und Wissenschaftlern zur Entwicklung neuer KIs verwendet wird.

Was macht Gemini, Googles KI?

Mit dem Gemini 1. 5 Pro-Update können Sie zuhören und Inhalte generieren. Mit dem neuen Update versteht und analysiert Googles künstliche Intelligenz nun Audio. Imagen 2 kann jetzt Bildelemente hinzufügen und entfernen und 4-Sekunden-GIFs erstellen
Gemini-Schnittstelle. Bild: Lucas Gomes/Showmetech

O Gemini, Googles künstliche Intelligenz, wurde im Dezember letzten Jahres eingeführt, ersetzt Bardund zeichnet sich durch seine Fähigkeit aus, hochkomplexe Aufgaben zu bewältigen, von der Codierung bis zum verfeinerten logischen Denken.

Künstliche Intelligenz verfügt über Funktionen, die den Benutzer bei den unterschiedlichsten Aufgaben unterstützen können, indem sie eine Vielzahl von Dateien manipulieren, mit dem Ziel, verschiedene Arten von Informationen zu kombinieren und sie zu organisieren. Dank seiner Funktionen können Sie verschiedene Inhaltsformate verwenden, darunter:

  • Texte;
  • Bilder;
  • Audios;
  • Videos; Es ist
  • Programmiersprachen.

O Gemini Es verfügt über drei Betriebsmodi mit unterschiedlichen Besonderheiten:

  • Zwillinge Ultra — größer und leistungsfähiger für hochkomplexe Aufgaben;
  • Zwillinge Pro – am besten für die Skalierung einer Vielzahl von Aufgaben geeignet;
  • Zwillinge Nano — effizienter für mobile Aufgaben.

Gemini 1.5 Pro-Update und seine neuen Funktionen

Mit dem Gemini 1. 5 Pro-Update können Sie zuhören und Inhalte generieren. Mit dem neuen Update versteht und analysiert Googles künstliche Intelligenz nun Audio. Imagen 2 kann jetzt Bildelemente hinzufügen und entfernen und 4-Sekunden-GIFs erstellen
Zwillinge IA. Bild: Rafares/Shutterstock)

Dieses vom Technologieriesen vorgestellte neue Modell stellt einen erheblichen Fortschritt im Vergleich zum Vorgängermodell dar, mit Verbesserungen in der Leistung und beim Verständnis langer Kontexte. Der Gemini 1.5 Pro, die erste Version, die zum Testen zur Verfügung gestellt wird, ist für eine Vielzahl von Aufgaben optimiert und in Bezug auf die Berechnung effizienter, da sie eine robustere Version ist und die Anforderungen noch komplexerer Aktivitäten erfüllen kann.

Darüber hinaus ist die Gemini 1.5 Pro enthält eine experimentelle Ressource, die theoretisch bis zu verarbeiten könnte 1 Million Token für großformatige Basismodelle, die revolutionär sein werden. Laut Google handelt es sich dabei um eine immense Menge 700.000 Wörter und 30.000 Zeilen Code, was gleichbedeutend ist mit eine Stunde Video ou 11 Stunden Audio.

Neue Tools in Gemini 1.5 Pro ermöglichen es der Anwendung, zwischen Bildern (Frames) und Audio (Sprache) für auf das hochgeladene Videos zu unterscheiden Google AI Studio, was die Produktion von Inhalten erleichtern wird. Nach offiziellen Angaben ist das AI-Update von Google in mehr als verfügbar 180 Ländern über die Gemini API (Application Programming Interface, auf Portugiesisch) mit einer beispiellosen nativen Fähigkeit, Audio zu verstehen, und einer neuen API, die die Dateiverwaltung erleichtert.

Die Version enthält außerdem neue Systemanweisungen und Modusfunktionen. JSON (leichtes Datenformat zum Austausch von Informationen zwischen Computersystemen). Google glaubt an das Potenzial des neuen Updates und verspricht, dass das Texteinbettungsmodell Konkurrenten mit ähnlichen Funktionen übertrifft.

O Gemini 1.5 Pro ist derzeit nur über verfügbar Vertex-KI.

Imagen 2 kann GIFs erstellen

während der Veranstaltung Google Cloud Weiter, eine weitere wichtige Ankündigung von Google: das KI-Modell Imagen 2, mit dem Bilder und kurze Videos generiert werden können Eingabeaufforderungen von Text. Damit ist es möglich, bis zu vier Sekunden lange GIFs aus verschiedenen Kamerawinkeln zu erstellen und auch Bewegungen darzustellen.

Der Unterschied zu diesem Tool besteht genau in der Möglichkeit des Erkundens verschiedene Winkel, mit mehr Dynamik in den Szenen, weit über KI-Videos hinaus, die mit statischen Fotos und begrenzten Bewegungen generiert werden.

Beispiel für Kreationen aus Imagen 2 in Vertex IA. Video: Google Cloud/ YouTube

O Imagen 2 verfügt über die Möglichkeit, Videoclips, auch Livebilder genannt, in niedriger Auflösung zu produzieren 640 x 360. Darüber hinaus nutzt Google seine Technik SynthID anwenden a unsichtbares Wasserzeichen in KI-generierten Clips und Bildern. Das Unternehmen behauptet, dass die SynthID kann Bearbeitungen und sogar Komprimierung unterstützen, Maßnahmen, die darauf abzielen, zu fördern Datensicherheit.

Bis heute sind die Ressourcen von Imagen 2 sind nur über erhältlich Vertex-KI, das jetzt Unterstützung für internes und externes Malen sowie die Möglichkeit bietet, Bilder mithilfe von KI zu bearbeiten, sodass Sie die Ränder erweitern oder bestimmte Teile des Bildes hinzufügen/entfernen können. Tools für Marketingprofis und Content-Erstellung für Kampagnen, unter anderem für Werbeartikel und Videoplattformen.

Vertex-KI

Mit dem Gemini 1. 5 Pro-Update können Sie zuhören und Inhalte generieren. Mit dem neuen Update versteht und analysiert Googles künstliche Intelligenz nun Audio. Imagen 2 kann jetzt Bildelemente hinzufügen und entfernen und 4-Sekunden-GIFs erstellen
Vertex AI-Plattform. Bild: Google/Reproduktion

O Vertex-KI ist eine Plattform Maschinelles Lernen (ML), das das Training und den Einsatz von KI-Tools und -Anwendungen ermöglicht, einschließlich der Anpassung großer Sprachmodelle (LLMs) für den Einsatz in KI-gestützten Anwendungen.

Die Plattform bündelt die vielfältigen Funktionen und Anwendungen von Google und integriert Arbeitsabläufe in den Bereichen Datentechnik, Datenwissenschaft und Softwareentwicklung. Maschinelles LernenDies ermöglicht die Zusammenarbeit zwischen Teams über einen gemeinsamen Satz von Tools und ermöglicht die Skalierung von Anwendungen mit den Vorteilen von Google Cloud.

A Scheitelpunkt AI bietet mehrere Optionen zum Trainieren und Bereitstellen von Modellen:

  • AutoML ermöglicht es Ihnen, Tabellen-, Bild-, Text- oder Videodaten zu trainieren, ohne Code schreiben oder Datenaufteilungen vorbereiten zu müssen.
  • Durch das personalisierte Training haben Sie die volle Kontrolle über den Trainingsprozess, einschließlich der Verwendung von Rahmen bevorzugter ML-Code, eigene Trainingscodierung und Auswahl an Hyperparameter-Tuning-Optionen.
  • Mustergarten Ermöglicht das Erkennen, Testen, Anpassen und Bereitstellen von Vertex-KI-Modellen, einschließlich Modellauswahl und Open-Source-Ressourcen (OSS).
  • A Generative KI bietet Zugriff auf die großen generativen KI-Modelle von Google in mehreren Modalitäten (Text, Code, Bilder, Sprache). Sie können Google LLMs an Ihre Bedürfnisse anpassen und sie für die Verwendung in Ihren KI-gestützten Anwendungen bereitstellen.

Quelle: The Verge, Google für Entwickler, Toms Führer, Beebom, Google Cloud

Siehe auch:

Rezensiert von Glaukon Vital in 10 / 4 / 24.


Erfahren Sie mehr über Showmetech

Melden Sie sich an, um unsere neuesten Nachrichten per E-Mail zu erhalten.

Related posts