Filmplakate in BigQuery mithilfe von Remote-Modellen analysieren

Restzeit 22 Min.

Informationen zu diesem Codelab

Zuletzt aktualisiert: März 10, 2025

Verfasst von Alicia Williams

1. Einführung

In diesem Lab erfahren Sie, wie Sie BigQuery Machine Learning für Inferenzen mit Remote-Modellen ( Gemini-Modelle) verwenden, um Bilder von Filmplakaten zu analysieren und anhand der Plakate direkt in Ihrem BigQuery-Data Warehouse Zusammenfassungen der Filme zu erstellen.

Oben: Eine Auswahl der Filmposterbilder, die Sie analysieren werden.

BigQuery ist eine vollständig verwaltete, KI-fähige Datenanalyseplattform, mit der Sie die Wertschöpfung aus Daten maximieren können. Sie ist als Multi-Engine-, Multi-Format- und Multi-Cloud-Plattform konzipiert. Eines der zentralen Features ist BigQuery Machine Learning für Inferenzen. Damit können Sie ML-Modelle (Machine Learning) mithilfe von GoogleSQL-Abfragen erstellen und ausführen.

Gemini ist eine Familie von generativen KI-Modellen, die von Google entwickelt wurden und auf multimodale Anwendungsfälle ausgelegt sind.

ML-Modelle mit GoogleSQL-Abfragen ausführen

Normalerweise erfordert die Anwendung von ML oder künstlicher Intelligenz (KI) für große Datasets umfangreiche Programmier- und ML-Framework-Kenntnisse. Das beschränkt die Lösungsentwicklung in den meisten Unternehmen auf eine kleine Gruppe von Spezialisten. Mit BigQuery Machine Learning für Inferenzen können SQL-Anwender jedoch vorhandene SQL-Tools und ‑Fertigkeiten nutzen, um Modelle zu erstellen und Ergebnisse aus LLMs und Cloud AI APIs zu generieren.

Voraussetzungen

Grundlegende Kenntnisse der Google Cloud Console
Erfahrung mit BigQuery ist von Vorteil

Aufgaben in diesem Lab

Umgebung und Konto für die Verwendung von APIs konfigurieren
Cloud-Ressourcenverbindung in BigQuery erstellen
Dataset und Objekttabelle in BigQuery für Bilder von Filmplakaten erstellen
Gemini-Remote-Modelle in BigQuery erstellen
Gemini-Modell auffordern, für jedes Plakat eine Filmzusammenfassung bereitzustellen
Texteinbettungen für die auf den Plakaten abgebildeten Filme erstellen
Mit BigQuery VECTOR_SEARCH Bilder von Filmplakaten mit ähnlichen Filmen im Dataset abgleichen

Voraussetzungen

Ein Google Cloud-Konto und ein Google Cloud-Projekt mit aktivierter Abrechnung
Einen Webbrowser wie Chrome

2. Einrichtung und Anforderungen

Einrichtung der Umgebung im eigenen Tempo

Melden Sie sich in der Google Cloud Console an und erstellen Sie ein neues Projekt oder verwenden Sie ein vorhandenes. Wenn Sie noch kein Gmail- oder Google Workspace-Konto haben, müssen Sie ein Konto erstellen.

Der Projektname ist der Anzeigename für die Teilnehmer dieses Projekts. Es ist ein Zeichenstring, der von Google APIs nicht verwendet wird. Sie können ihn jederzeit aktualisieren.
Die Projekt-ID ist für alle Google Cloud-Projekte eindeutig und kann nach der Festlegung nicht mehr geändert werden. In der Cloud Console wird automatisch ein eindeutiger String generiert. In der Regel spielt es keine Rolle, wie er lautet. In den meisten Codelabs müssen Sie auf Ihre Projekt-ID verweisen (normalerweise als PROJECT_ID gekennzeichnet). Wenn Ihnen die generierte ID nicht gefällt, können Sie eine andere zufällige generieren. Alternativ können Sie Ihr eigenes Konto ausprobieren und prüfen, ob es verfügbar ist. Sie kann nach diesem Schritt nicht mehr geändert werden und bleibt für die Dauer des Projekts bestehen.
Zur Information: Es gibt einen dritten Wert, die Projektnummer, die von einigen APIs verwendet wird. Weitere Informationen zu diesen drei Werten finden Sie in der Dokumentation.

Als Nächstes müssen Sie in der Cloud Console die Abrechnung aktivieren, um Cloud-Ressourcen/-APIs verwenden zu können. Die Durchführung dieses Codelabs ist kostenlos oder kostet nur sehr wenig. Wenn Sie die Ressourcen deaktivieren möchten, um weitere Kosten nach Abschluss dieser Anleitung zu vermeiden, können Sie die von Ihnen erstellten Ressourcen oder das Projekt löschen. Neuen Google Cloud-Nutzern steht das kostenlose Testprogramm mit einem Guthaben von 300$ zur Verfügung.

Cloud Shell starten

Sie können Google Cloud zwar per Fernzugriff von Ihrem Laptop aus nutzen, in diesem Codelab verwenden Sie jedoch Google Cloud Shell, eine Befehlszeilenumgebung, die in der Cloud ausgeführt wird.

Klicken Sie in der Google Cloud Console oben rechts in der Symbolleiste auf das Cloud Shell-Symbol:

Die Bereitstellung und Verbindung mit der Umgebung sollte nur wenige Minuten dauern. Wenn der Vorgang abgeschlossen ist, sollte in etwa Folgendes angezeigt werden:

Diese virtuelle Maschine verfügt über sämtliche Entwicklertools, die Sie benötigen. Sie bietet ein Basisverzeichnis mit 5 GB nichtflüchtigem Speicher und läuft auf Google Cloud. Dadurch werden Netzwerkleistung und Authentifizierung erheblich verbessert. Alle Aufgaben in diesem Codelab können in einem Browser ausgeführt werden. Sie müssen nichts installieren.

3. Hinweis

Für die Arbeit mit Gemini-Modellen in BigQuery sind einige Einrichtungsschritte erforderlich, z. B. das Aktivieren von APIs, das Erstellen einer Cloud-Ressourcenverbindung und das Gewähren bestimmter Berechtigungen für das Dienstkonto für die Cloud-Ressourcenverbindung. Diese Schritte sind einmalig pro Projekt erforderlich und werden in den nächsten Abschnitten beschrieben.

APIs aktivieren

Prüfen Sie in Cloud Shell, ob Ihre Projekt-ID eingerichtet ist:

gcloud config set project [YOUR-PROJECT-ID]

Umgebungsvariable PROJECT_ID festlegen:

PROJECT_ID=$(gcloud config get-value project)

Konfigurieren Sie die Standardregion für die Vertex AI-Modelle. Weitere Informationen zu verfügbaren Standorten für Vertex AI In diesem Beispiel verwenden wir die Region us-central1.

gcloud config set compute/region us-central1

Umgebungsvariable REGION festlegen:

REGION=$(gcloud config get-value compute/region)

Aktivieren Sie alle erforderlichen Dienste:

gcloud services enable bigqueryconnection.googleapis.com \
                       aiplatform.googleapis.com

Erwartete Ausgabe nach Ausführung aller oben genannten Befehle:

student@cloudshell:~ (test-project-001-402417)$ gcloud config set project test-project-001-402417
Updated property [core/project].
student@cloudshell:~ (test-project-001-402417)$ PROJECT_ID=$(gcloud config get-value project)
Your active configuration is: [cloudshell-14650]
student@cloudshell:~ (test-project-001-402417)$ 
student@cloudshell:~ (test-project-001-402417)$ gcloud services enable bigqueryconnection.googleapis.com \
                       aiplatform.googleapis.com
Operation "operations/acat.p2-4470404856-1f44ebd8-894e-4356-bea7-b84165a57442" finished successfully.

4. Cloud-Ressourcenverbindung erstellen

In dieser Aufgabe erstellen Sie eine Cloud-Ressourcenverbindung, die es BigQuery ermöglicht, auf Bilddateien in Cloud Storage zuzugreifen und Vertex AI aufzurufen.

Klicken Sie in der Google Cloud Console im Navigationsmenü ( ) auf BigQuery.

Klicken Sie auf + HINZUFÜGEN und dann auf Verbindungen zu externen Datenquellen, um eine Verbindung zu erstellen.

Wählen Sie in der Liste „Verbindungstyp“ die Option Vertex AI-Remote-Modelle, Remote-Funktionen und BigLake (Cloud-Ressource) aus.
Geben Sie für Ihre Verbindung im Feld „Verbindungs-ID“ gemini_conn ein.
Wählen Sie als Standorttyp die Option Multiregional und dann USA (multiregional) aus.
Verwenden Sie für die anderen Optionen jeweils die Standardeinstellung.

Klicken Sie auf Verbindung erstellen.
Klicken Sie auf ZUR VERBINDUNG.
Kopieren Sie im Bereich „Verbindungsinformationen“ die Dienstkonto-ID in eine Textdatei für die nächste Aufgabe. Die Verbindung ist ebenfalls im BigQuery Explorer Ihres Projekts im Abschnitt „Externe Verbindungen“ zu finden.

5. Dem Dienstkonto der Verbindung IAM-Berechtigungen gewähren

In dieser Aufgabe gewähren Sie dem Dienstkonto der Cloud-Ressourcenverbindung eine Rolle mit IAM-Berechtigungen, mit denen der Zugriff auf Vertex AI-Dienste möglich ist.

Klicken Sie in der Google Cloud Console im Navigationsmenü auf IAM und Verwaltung.
Klicken Sie auf Zugriff gewähren.
Geben Sie im Feld Neue Hauptkonten die Dienstkonto-ID ein, die Sie zuvor kopiert haben.
Wählen Sie im Feld „Rolle auswählen“ die Option Vertex AI und dann Vertex AI User aus.

Klicken Sie auf Speichern. Die Dienstkonto-ID beinhaltet nun die Rolle „Vertex AI User“.

6. Dataset und Objekttabelle in BigQuery für Bilder von Filmplakaten erstellen

In dieser Aufgabe erstellen Sie ein Dataset für das Projekt und eine Objekttabelle darin, um die Plakatbilder zu speichern.

Der Datensatz mit Filmposterbildern, der in dieser Anleitung verwendet wird, wird in einem öffentlichen Google Cloud Storage-Bucket gespeichert: gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters.

Dataset erstellen

Sie erstellen ein Dataset, um Datenbankobjekte zu speichern, einschließlich Tabellen und Modellen, die in dieser Anleitung verwendet werden.

Klicken Sie in der Google Cloud Console auf das Navigationsmenü ( ) und dann auf BigQuery.
Wählen Sie im Bereich Explorer neben dem Projektnamen die Option Aktionen ansehen ( ) und dann Dataset erstellen aus.
Geben Sie im Bereich Dataset erstellen die folgenden Informationen ein:

Datensatz-ID: gemini_demo
Standorttyp: Wählen Sie Mehrere Regionen aus.
Mehrere Regionen: Wählen Sie USA aus.

Übernehmen Sie für alle anderen Felder die Standardeinstellung.

Klicken Sie auf Dataset erstellen.

Das Dataset gemini_demo wird nun erstellt und unter Ihrem Projekt im BigQuery Explorer aufgeführt.

Objekttabelle erstellen

BigQuery enthält nicht nur strukturierte Daten, sondern kann auch über Objekttabellen auf unstrukturierte Daten (z. B. die Posterbilder) zugreifen.

Sie erstellen eine Objekttabelle, indem Sie auf einen Cloud Storage-Bucket verweisen. Die resultierende Objekttabelle enthält eine Zeile für jedes Objekt aus dem Bucket mit dem Speicherpfad und den Metadaten.

Zum Erstellen der Objekttabelle verwenden Sie eine SQL-Abfrage.

Klicken Sie auf das Symbol +, um eine neue SQL-Abfrage zu erstellen.
Kopieren Sie die folgende Abfrage und fügen Sie sie in den Abfrageeditor ein.

CREATE OR REPLACE EXTERNAL TABLE
  `gemini_demo.movie_posters`
WITH CONNECTION `us.gemini_conn`
OPTIONS (
  object_metadata = 'SIMPLE',
  uris = ['gs://cloud-samples-data/vertex-ai/dataset-management/datasets/classic-movie-posters/*']
  );

Führen Sie die Abfrage aus. Das Ergebnis ist eine Objekttabelle movie_posters, die dem Dataset gemini_demo hinzugefügt und mit dem URI (dem Cloud Storage-Speicherort) der Filmplakatbilder gefüllt wird.
Klicken Sie im Explorer auf das Dreipunkt-Menü movie_posters und prüfen Sie das Schema und die Details. Sie können nun die Tabelle zur Prüfung einzelner Datensätze abfragen.

7. Gemini-Remote-Modell in BigQuery erstellen

Die Objekttabelle wurde erstellt und kann nun verwendet werden. In dieser Aufgabe erstellen Sie ein Remote-Modell für Gemini 1.5 Flash, um es in BigQuery verfügbar zu machen.

Gemini 1.5 Flash-Remote-Modell erstellen

Klicken Sie auf das Symbol +, um eine neue SQL-Abfrage zu erstellen.
Kopieren Sie die folgende Abfrage, fügen Sie sie in den Abfrageeditor ein und führen Sie sie aus.

CREATE OR REPLACE MODEL `gemini_demo.gemini_1_5_flash`
REMOTE WITH CONNECTION `us.gemini_conn`
OPTIONS (endpoint = 'gemini-1.5-flash')

Das Modell gemini_1_5_flash wird erstellt und dem Dataset gemini_demo im Abschnitt „Modelle“ hinzugefügt.

Klicken Sie im Explorer auf das Modell gemini_1_5_flash und prüfen Sie die Details.

8. Gemini-Modell auffordern, für jedes Plakat eine Zusammenfassung des Films zu generieren

In dieser Aufgabe analysieren Sie mit dem gerade erstellten Gemini-Remote-Modell Bilder von Filmplakaten und generieren für jeden Film eine Zusammenfassung.

Sie können Anfragen an das Modell senden, indem Sie die ML.GENERATE_TEXT-Funktion verwenden und in den Parametern auf das Modell verweisen.

Bilder mit dem Gemini 1.5 Flash-Modell analysieren

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE TABLE
`gemini_demo.movie_posters_results` AS (
SELECT
    uri,
    ml_generate_text_llm_result
FROM
    ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_1_5_flash`,
    TABLE `gemini_demo.movie_posters`,
    STRUCT( 0.2 AS temperature,
        'For the movie represented by this poster, what is the movie title and year of release? Answer in JSON format with two keys: title, year. title should be string, year should be integer. Do not use JSON decorators.' AS PROMPT,
        TRUE AS FLATTEN_JSON_OUTPUT)));

Wenn die Abfrage ausgeführt wird, fordert BigQuery das Gemini-Modell für jede Zeile der Objekttabelle auf und kombiniert das Bild mit dem angegebenen statischen Prompt. Die Tabelle movie_posters_results wird erstellt.

Sehen wir uns jetzt die Ergebnisse an. Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

SELECT * FROM `gemini_demo.movie_posters_results`

Es werden Zeilen für jedes Filmplakat mit dem URI (dem Cloud Storage-Speicherort des Filmplakatbilds) sowie einer JSON-Ausgabe mit dem Filmtitel und dem Jahr der Veröffentlichung des Films aus dem Gemini 1.5 Flash-Modell angezeigt.

Mit folgender Abfrage lassen sich die Ergebnisse in übersichtlicher Form darstellen. In dieser Abfrage werden mithilfe von SQL der Filmtitel und das Erscheinungsjahr aus diesen Antworten in neue Spalten extrahiert.

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE TABLE
  `gemini_demo.movie_posters_results_formatted` AS (
  SELECT
    uri,
    JSON_VALUE(ml_generate_text_llm_result, "$.title") AS title,
    JSON_VALUE(ml_generate_text_llm_result, "$.year") AS year
  FROM
    `gemini_demo.movie_posters_results` results )

Die Tabelle movie_posters_result_formatted wird erstellt.

Mit folgender Abfrage lassen sich die erstellten Tabellenreihen visualisieren.

SELECT * FROM `gemini_demo.movie_posters_results_formatted`

Beachten Sie, dass sich die ausgegebene URI-Spalte nicht verändert, die JSON-Ausgabe aber in die title- und year-Spalten konvertiert wird.

Gemini 1.5 Flash-Modell mit Prompts für Filmzusammenfassungen versehen

Was ist, wenn Sie mehr Informationen zu diesen Filmen benötigen, z. B. eine Textzusammenfassung? Dieser Anwendungsfall für die Inhaltsgenerierung eignet sich hervorragend für ein LLM-Modell wie das Gemini 1.5-Flash-Modell.

Mit Gemini 1.5 Flash können Sie für jedes Plakat eine Filmzusammenfassung bereitstellen. Führen Sie dazu die folgende Abfrage aus:

SELECT
  uri,
  title,
  year,
  prompt,
  ml_generate_text_llm_result
  FROM
 ML.GENERATE_TEXT( MODEL `gemini_demo.gemini_1_5_flash`,
   (
   SELECT
     CONCAT('Provide a short summary of movie titled ',title, ' from the year ',year,'.') AS prompt,
     uri,
     title,
     year
   FROM
     `gemini_demo.movie_posters_results_formatted`
   LIMIT
     20 ),
   STRUCT(0.2 AS temperature,
     TRUE AS FLATTEN_JSON_OUTPUT));

Beachten Sie das Feld ml_generate_text_llm_result in den Ergebnissen. Es enthält eine kurze Zusammenfassung des Films.

9. Texteinbettungen mit einem Remote-Modell generieren

Jetzt können Sie die von Ihnen erstellten strukturierten Daten mit anderen strukturierten Daten in Ihrem Data Warehouse verknüpfen. Das öffentliche IMDB-Dataset in BigQuery enthält eine große Menge an Informationen zu Filmen, einschließlich Bewertungen von Zuschauern und einigen Beispielen für freie Nutzerrezensionen. Anhand dieser Daten können Sie Ihre Analyse der Filmposter vertiefen und nachvollziehen, wie diese Filme wahrgenommen wurden.

Zum Zusammenführen von Daten benötigen Sie einen Schlüssel. In diesem Fall stimmen die vom Gemini-Modell generierten Filmtitel möglicherweise nicht genau mit den Titeln im IMDB-Dataset überein.

In dieser Aufgabe generieren Sie Text-Embeddings der Filmtitel und -jahre aus beiden Datasets und verwenden dann die Entfernung zwischen diesen Embeddings, um den am nächsten gelegenen IMDB-Titel mit den Filmplakattiteln aus Ihrem neu erstellten Dataset zu verknüpfen.

Remote-Modell erstellen

Zum Generieren der Texteinbettungen müssen Sie ein neues Remote-Modell erstellen, das auf den Endpunkt text-multilingual-embedding-002 verweist.

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE MODEL `gemini_demo.text_embedding`
REMOTE WITH CONNECTION `us.gemini_conn`
OPTIONS (endpoint = 'text-multilingual-embedding-002')

Das Modell text_embedding ist nun erstellt und wird im Explorer unter dem Dataset gemini_demo angezeigt.

Texteinbettungen für den Titel und das Jahr der Plakate generieren

Sie verwenden dieses Remote-Modell jetzt mit der ML.GENERATE_EMBEDDING-Funktion, um für jeden Filmpostertitel und jedes Jahr eine Einbettung zu erstellen.

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE TABLE
  `gemini_demo.movie_posters_results_embeddings` AS (
  SELECT
    *
  FROM
    ML.GENERATE_EMBEDDING(
    MODEL `gemini_demo.text_embedding`,
    (
    SELECT
      CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content,
      title,
      year,
      uri
    FROM
      `gemini_demo.movie_posters_results_formatted` ),
    STRUCT(TRUE AS flatten_json_output)));

Das Ergebnis ist die Tabelle movie_poster_results_embeddings mit den Einbettungen für den Textinhalt, der für jede Zeile der Tabelle gemini_demo.movie_posters_results_formatted zusammengefügt wurde.

Die Ergebnisse der Abfrage können Sie mit der folgenden neuen Abfrage aufrufen:

SELECT * FROM `gemini_demo.movie_posters_results_embeddings`

Sie sehen die vom Modell generierten Einbettungen (Vektoren, die durch Zahlen dargestellt werden) für jeden Film.

Texteinbettungen für einen Teil des IMDB-Datasets generieren

Sie erstellen eine neue Datenansicht aus einem öffentlichen IMDB-Dataset, das nur die Filme enthält, die vor 1935 veröffentlicht wurden (der bekannte Zeitraum der Filme aus den Posterbildern).

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE VIEW
  `gemini_demo.imdb_movies` AS (
  WITH
    reviews AS (
      SELECT
        reviews.movie_id AS movie_id,
        title.primary_title AS title,
        title.start_year AS year,
        reviews.review AS review
      FROM
        `bigquery-public-data.imdb.reviews` reviews
      LEFT JOIN
        `bigquery-public-data.imdb.title_basics` title
      ON
        reviews.movie_id = title.tconst)
  SELECT
    DISTINCT(movie_id),
    title,
    year
  FROM
    reviews
  WHERE
    year < 1935)

Die neue Ansicht enthält eine Liste der Film-IDs, Titel und Veröffentlichungsjahre aus der Tabelle bigquery-public-data.imdb.reviews für alle Filme im Dataset, die vor 1935 veröffentlicht wurden.

Sie erstellen jetzt Einbettungen für die Teilmenge der Filme von IMDB. Gehen Sie dabei ähnlich vor wie im vorherigen Abschnitt. Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

CREATE OR REPLACE TABLE
  `gemini_demo.imdb_movies_embeddings` AS (
  SELECT
    *
  FROM
    ML.GENERATE_EMBEDDING( MODEL `gemini_demo.text_embedding`,
      (
      SELECT
        CONCAT('The movie titled ', title, ' from the year ', year,'.') AS content,
        title,
        year,
        movie_id
      FROM
        `gemini_demo.imdb_movies` ),
      STRUCT(TRUE AS flatten_json_output) )
  WHERE
    ml_generate_embedding_status = '' );

Die Abfrage liefert eine Tabelle, die die Einbettungen für den Textinhalt der Tabelle gemini_demo.imdb_movies enthält.

Filmplakatbilder mithilfe von BigQuery `VECTOR_SEARCH` mit IMDB `movie_id` abgleichen

Jetzt können Sie die beiden Tabellen mithilfe der Funktion VECTOR_SEARCH zusammenführen.

Erstellen Sie mit der folgenden SQL-Anweisung eine neue Abfrage und führen Sie sie aus:

SELECT
  query.uri AS poster_uri,
  query.title AS poster_title,
  query.year AS poster_year,
  base.title AS imdb_title,
  base.year AS imdb_year,
  base.movie_id AS imdb_movie_id,
  distance
FROM
 VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`,
   'ml_generate_embedding_result',
   TABLE `gemini_demo.movie_posters_results_embeddings`,
   'ml_generate_embedding_result',
   top_k => 1,
   distance_type => 'COSINE');

In dieser Abfrage wird die Funktion VECTOR_SEARCH verwendet, um für jede Zeile in der Tabelle gemini_demo.movie_posters_results_embeddings den nächsten Nachbarn in der Tabelle gemini_demo.imdb_movies_embeddings zu finden. Der nächste Nachbar wird mithilfe des Kosinus-Abstandsmesswerts ermittelt, anhand dessen sich bestimmen lässt, wie ähnlich sich zwei Einbettungen sind.

Mit dieser Abfrage kann der ähnlichste Film im IMDB-Dataset für jeden der von Gemini 1.5 Flash in den Filmplakaten identifizierten Filme gefunden werden. Sie können beispielsweise die ähnlichste Entsprechung für den Film „Au Secours!“ im öffentlichen IMDB-Dataset finden, in dem dieser Film unter dem englischen Titel „Help!“ enthalten ist.

Erstellen Sie eine neue Abfrage und führen Sie sie aus, um zusätzliche Informationen zu den Filmbewertungen aus dem öffentlichen IMDB-Dataset einzubinden:

SELECT
  query.uri AS poster_uri,
  query.title AS poster_title,
  query.year AS poster_year,
  base.title AS imdb_title,
  base.year AS imdb_year,
  base.movie_id AS imdb_movie_id,
  distance,
  imdb.average_rating,
  imdb.num_votes
FROM
  VECTOR_SEARCH( TABLE `gemini_demo.imdb_movies_embeddings`,
    'ml_generate_embedding_result',
    TABLE `gemini_demo.movie_posters_results_embeddings`,
    'ml_generate_embedding_result',
    top_k => 1,
    distance_type => 'COSINE') DATA
LEFT JOIN
  `bigquery-public-data.imdb.title_ratings` imdb
ON
  base.movie_id = imdb.tconst
ORDER BY
  imdb.average_rating DESC

Diese Abfrage ähnelt der vorherigen. Auch hier werden spezielle numerische Darstellungen, sogenannte Vektoreinbettungen, dazu verwendet, Filme zu finden, die einem bestimmten Filmplakat ähneln. Es werden jedoch auch die durchschnittliche Bewertung und die Anzahl der Bewertungen für jeden als nächsten Nachbarn identifizierten Film aus einer separaten Tabelle des öffentlichen IMDb-Datasets hinzugefügt.

10. Glückwunsch

Herzlichen Glückwunsch zum Abschluss des Codelabs. Sie haben eine Objekttabelle für Ihre Plakatbilder in BigQuery erstellt, ein Remote-Gemini-Modell erstellt, das Modell dazu aufgefordert, Bilder zu analysieren, Filmzusammenfassungen bereitgestellt, Texteinbettungen für Filmtitel generiert und mithilfe dieser Einbettungen Filmplakatbilder mit dem entsprechenden Filmtitel im IMDB-Dataset abgeglichen.

Behandelte Themen

Umgebung und Konto für die Verwendung von APIs konfigurieren
Cloud-Ressourcenverbindung in BigQuery erstellen
Dataset und Objekttabelle in BigQuery für Bilder von Filmplakaten erstellen
Gemini-Remote-Modelle in BigQuery erstellen
Gemini-Modell auffordern, für jedes Plakat eine Filmzusammenfassung bereitzustellen
Texteinbettungen für die auf den Plakaten abgebildeten Filme erstellen
Mit BigQuery VECTOR_SEARCH Bilder von Filmplakaten mit ähnlichen Filmen im Dataset abgleichen

Weitere Informationen

11. Umfrage

Wie möchten Sie diese Anleitung verwenden?

Nur durchlesenLesen und die Übungen absolvieren

Fehler melden

Filmplakate in BigQuery mithilfe von Remote-Modellen analysieren

Informationen zu diesem Codelab

Voraussetzungen

Aufgaben in diesem Lab

Voraussetzungen

Einrichtung der Umgebung im eigenen Tempo

Cloud Shell starten

APIs aktivieren

Dataset erstellen

Objekttabelle erstellen

Gemini 1.5 Flash-Remote-Modell erstellen

Bilder mit dem Gemini 1.5 Flash-Modell analysieren

Gemini 1.5 Flash-Modell mit Prompts für Filmzusammenfassungen versehen

Remote-Modell erstellen

Texteinbettungen für den Titel und das Jahr der Plakate generieren

Texteinbettungen für einen Teil des IMDB-Datasets generieren

Filmplakatbilder mithilfe von BigQuery VECTOR_SEARCH mit IMDB movie_id abgleichen

Behandelte Themen

Wie möchten Sie diese Anleitung verwenden?

Filmplakatbilder mithilfe von BigQuery `VECTOR_SEARCH` mit IMDB `movie_id` abgleichen