Einführung in Gemini 2.5 Pro in Google Cloud

Restzeit 72 Min.

Informationen zu diesem Codelab

Zuletzt aktualisiert: Apr. 23, 2025

Verfasst von Prashanth Subrahmanyam

1. Übersicht

Einführung

Gemini 2.5 Pro ist das leistungsstärkste Modell von Google für Programmieren und Weltwissen.

Mit der Version 2.5 sind die Gemini-Modelle jetzt Hybrid-Deduktionsmodelle. Gemini 2.5 Pro kann bei verschiedenen Aufgaben umfangreiche Denkprozesse anwenden und Tools verwenden, um die Genauigkeit der Antworten zu maximieren.

Gemini 2.5 Pro bietet folgende Vorteile:

Im Vergleich zu früheren Modellen wurden erhebliche Verbesserungen bei verschiedenen Funktionen erzielt, darunter Programmieren, Schlussfolgerung und Multimodalität.
Branchenführende Leistung im Bereich Logik mit Spitzenwerten bei Mathematik- und MINT-Benchmarks.
Ein hervorragendes Modell für Code, mit Schwerpunkt Webentwicklung.
Besonders gut für komplexe Prompts, aber dennoch ausgewogen, einschließlich der Nummer 1 auf LMSys.

Lerninhalte

In dieser Anleitung erfahren Sie, wie Sie die Gemini API und das Google Gen AI SDK for Python mit dem Gemini 2.5 Pro-Modell verwenden.

Aufgaben in diesem Lab:

Text aus Text-Prompts generieren
- Streamtext generieren
- Unterhaltungen in mehreren Runden starten
- Asynchrone Methoden verwenden
Modellparameter konfigurieren
Systemanweisungen festlegen
Sicherheitsfilter verwenden
Gesteuerte Generierung verwenden
Tokens zählen
Multimodale Daten (Audio, Code, Dokumente, Bilder, Video) verarbeiten
Automatische und manuelle Funktionsaufrufe verwenden
Codeausführung
Beispiele für den Denkmodus

2. Hinweis

Vorbereitung

Bevor Sie beginnen können, benötigen Sie ein Google Cloud-Projekt mit einem gültigen Rechnungskonto. Wählen Sie das Google Cloud-Projekt aus, das Sie verwenden möchten.

Für die Ausführung des Codelabs verwenden wir Colab Enterprise, eine kollaborative, verwaltete Notebook-Umgebung mit den Sicherheits- und Compliance-Funktionen von Google Cloud.

Aktivieren der erforderlichen APIs:

Klicken Sie auf die Schaltfläche unten, um die erforderlichen APIs für dieses Codelab in Ihrem Google Cloud-Projekt zu aktivieren: Vertex AI, Dataform und Compute Engine.

Colab-Notebook in Google Cloud kopieren

Klicken Sie auf die Schaltfläche unten, um das Notebook mit der Anleitung in Colab Enterprise zu öffnen. Dadurch wird eine Kopie des Colab-Notebooks in Ihrem aktuellen Google Cloud-Projekt erstellt, mit der Sie das Notebook dann ausführen können.

Los gehts!

3. Umgebung initialisieren

Nachdem wir das Colab-Notebook erstellt haben, können wir den darin enthaltenen Code ausführen. In den ersten Schritten werden die Abhängigkeiten installiert und die erforderlichen Bibliotheken importiert.

Führen Sie die Schritte unter „Jetzt starten“ aus.

Führen Sie zuerst die Zellen im Abschnitt „Erste Schritte“ nacheinander aus.

Codezellen im Abschnitt „Einstieg“

Hinweis:Sie können eine Zelle ausführen, indem Sie den Mauszeiger auf die Codezelle halten, die Sie ausführen möchten, und dann auf das Symbol „Zelle ausführen“ klicken.

Zelle ausführen

Am Ende dieses Abschnitts haben Sie Folgendes getan:

Google Gen AI SDK for Python installieren
Die erforderlichen Bibliotheken für das Lab importieren
Google Cloud-Projekt für die Verwendung von Vertex AI einrichten

Jetzt verwenden wir Gemini 2.5 Pro, um Text zu generieren.

4. Text mit Gemini generieren

In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Textvorschläge zu generieren.

Führen Sie die nächsten Zellen im Notebook aus und nehmen Sie sich Zeit, den Code zu lesen und die Verwendung des Google GenAI SDK zu verstehen.

Text aus Text-Prompts generieren

Am Ende dieses Abschnitts haben Sie Folgendes gelernt:

So geben Sie das zu verwendende Modell an.
Nicht-Streaming- und Streaming-Ausgabegenerierung
Die Multi-Turn-Chat-Funktion des SDKs verwenden
Das SDK asynchron aufrufen.
Konfigurieren Sie die Modellparameter.
Systemanweisungen festlegen, um das Modellverhalten anzupassen
Filter für die Sicherheit von Inhalten konfigurieren

Als Nächstes sehen wir uns an, wie Sie multimodale Prompts an Gemini senden.

5. Multimodale Prompts

In diesem Abschnitt des Notebooks verwenden Sie Gemini 2.5 Pro, um Bilder und Videos zu verarbeiten.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen für multimodale Prompts

Am Ende dieses Abschnitts haben Sie Folgendes gelernt:

Senden Sie einen Prompt, der aus einem Bild und Text besteht.
Video über eine URL verarbeiten

Als Nächstes generieren wir gut definierte und strukturierte Ergebnisse.

6. Strukturierte Ausgaben

Wenn wir die Antwort von Modellen in Code verwenden, ist es wichtig, dass wir konsistente und zuverlässige Ergebnisse vom Modell erhalten. Bei der gesteuerten Generierung können Sie ein Antwortschema definieren, um die Struktur der Modellausgabe, die Feldnamen und den erwarteten Datentyp für jedes Feld festzulegen.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen für kontrollierte Ausgabe

Als Nächstes sehen wir uns an, wie Sie die Modellausgaben erden.

7. Nullniveau

Wenn Sie vorhandene Wissensdatenbanken verwenden oder dem Modell Echtzeitinformationen zur Verfügung stellen möchten, sollten Sie sich mit der Begründung der Modellergebnisse befassen.

Mit Gemini und Vertex AI können Sie die Ausgabe in der Google Suche, in der Ausgabe von Funktionsantworten und schließlich im Code selbst fundieren. Mit der Codeausführung kann das Modell Code generieren und ausführen, um aus den Ergebnissen zu lernen und iterativ die endgültige Ausgabe zu erhalten.

Führen Sie die folgenden Zellen im Notebook aus. Codezellen zum Testen der Erdung

Als Nächstes sehen wir uns die Denkfähigkeiten von Gemini 2.5 Pro an.

8. Ich überlege

Der Denkmodus ist besonders nützlich für komplexe Aufgaben, die mehrere Runden der Strategieentwicklung und iterativer Lösungsfindung erfordern. Gemini 2.5-Modelle gehören zur Familie der Thinking Models (Denkmodelle). Sie besitzen die Fähigkeit, mithilfe interner Denkprozesse zu schlussfolgern, bevor sie Antworten geben. Das steigert sowohl ihre Leistung als auch ihre Genauigkeit.

Führen Sie die folgenden Zellen im Notebook aus. Achten Sie dabei auf die Denkleistung, bevor das Modell seine tatsächliche Ausgabe präsentiert. Codezellen für die Ausgabe von „Denken“

9. Fazit

Glückwunsch! Sie haben gelernt, wie Sie die Vorteile von Gemini 2.5 Pro mit dem Google Gen AI SDK for Python nutzen können. Dabei ging es um Textgenerierung, Multimodalität, Grounding, strukturierte Ausgabe und die erweiterten Denkfähigkeiten. Sie haben jetzt die Grundlagen, um mit dem SDK eigene innovative Anwendungen zu entwickeln. Gemini 2.5 Pro bietet mit seinem leistungsstarken Denk- und Schlussfolgerungsmodus neue Möglichkeiten und eignet sich für Innovationen in verschiedenen Anwendungsfällen.

Weitere Referenzen

Weitere Informationen finden Sie in der Referenzdokumentation zum Google Gen AI SDK.
Weitere Notebooks finden Sie im GitHub-Repository „Google Cloud Generative AI“.
KI-Modelle in Model Garden entdecken

Wie hat Ihnen dieses Codelab gefallen?

Sehr gutDurchschnittlichKönnte besser sein

Fehler melden