Vereinfachte Stammdatenverwaltung: Abgleichen & Mit generativer KI kombinieren

1. Übersicht

Was ist Stammdatenmanagement?

Beim Stammdatenmanagement (Master Data Management, MDM) geht es darum, eine einzige, zuverlässige Quelle der Wahrheit für die wichtigsten Daten Ihres Unternehmens zu schaffen. Stellen Sie sich eine akribisch organisierte Bibliothek vor, in der jedes Buch (Datenpunkt) korrekt beschriftet, auf dem neuesten Stand und leicht zu finden ist.

Masterdaten stellen die zentralen, grundlegenden Geschäftsentitäten dar, die für den Betrieb eines Unternehmens unerlässlich sind. Hier sind die wichtigsten Elemente von Masterdaten:

  • Unternehmenssubjekte: Entitäten wie Kunden, Produkte, Lieferanten, Standorte und Mitarbeiter, also die Nomen, um die sich Ihr Unternehmen dreht
  • Kennzeichnungen: eindeutige Kennzeichnungen, die dafür sorgen, dass jede Entität eindeutig und systemübergreifend nachvollziehbar ist
  • Attribute: Die Merkmale, die die einzelnen Entitäten beschreiben, z. B. die Adresse eines Kunden oder der Preis eines Produkts.

Um Ihnen die Masterdaten besser zu veranschaulichen, vergleichen wir sie mit Transaktionsdaten. Transaktionsdaten erfassen einzelne Ereignisse (z. B. einen Kauf oder eine Lieferung). Masterdaten liefern dagegen den Kontext für diese Ereignisse, indem sie die beteiligten Entitäten definieren. Beispielsweise wird eine Verkaufstransaktion mit Stammdaten für den Kunden, das Produkt und den Verkäufer verknüpft.

Die Implementierung einer robusten MDM-Lösung ist zwar für strategische Entscheidungen unerlässlich, kann aber komplex und ressourcenintensiv sein. Hier kommt die transformative Kraft generativer KI, insbesondere von Modellen wie Gemini 1.0 Pro, Gemini 1.0 Pro Vision und Gemini 1.5 Pro, ins Spiel.

2. Ziel

In diesem Codelab zeigen Sie, wie Gemini 1.0 Pro Anwendungen zur Masterdatenverwaltung wie Datenanreicherung und Datendeduplizierung für die im öffentlichen BigQuery-Dataset verfügbaren Daten zu Citibike-Stationen vereinfacht.

Lernmittel

  1. Öffentliches BigQuery-Dataset bigquery-public-data.new_york_citibike.
  2. Gemini-Funktionsaufruf (eine Java-Cloud-Funktion, die die Adressinformationen mithilfe der Reverse Geocoding API für die Koordinaten abrufen, die in den citibike_stations-Daten verfügbar sind)
  3. Vertex AI Embeddings API und Vector Search in BigQuery zum Identifizieren von Duplikaten

Aufgaben

  1. Sie erstellen ein BigQuery-Dataset für den Anwendungsfall. In diesem Dataset erstellen Sie eine Landingpage-Tabelle mit Daten aus der Tabelle bigquery-public-data.new_york_citibike.citibike_stations des öffentlichen Datasets.
  2. Sie stellen die Cloud-Funktion bereit, die den Gemini-Funktionsaufruf für die Adressstandardisierung enthält.
  3. Sie speichern die angereicherten Adressdaten in den Landing-Tables (aus den beiden Quellen, die für diese Demonstration bereitgestellt werden).
  4. Sie rufen die Vertex AI Embeddings API aus BigQuery auf die Adressdaten.
  5. Sie verwenden die BigQuery-Vektorsuche, um doppelte Einträge zu ermitteln.

Das folgende Diagramm stellt den Datenfluss und die Schritte bei der Implementierung dar.

Allgemeiner Ablauf des Anwendungsfalls

3. Voraussetzungen

  • Ein Browser, z. B. Chrome oder Firefox
  • Google Cloud-Projekt mit aktivierter Abrechnungsfunktion.

4. Hinweis

  1. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.
  2. Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.
  3. Sie verwenden Cloud Shell, eine Befehlszeilenumgebung, die in Google Cloud ausgeführt wird und bq bereits vorinstalliert hat. Klicken Sie oben in der Google Cloud Console auf „Cloud Shell aktivieren“.

Bild der Schaltfläche „Cloud Shell aktivieren“

  1. Nachdem Sie eine Verbindung zu Cloud Shell hergestellt haben, prüfen Sie mit dem folgenden Befehl, ob Sie bereits authentifiziert sind und das Projekt auf Ihre Projekt-ID festgelegt ist:
gcloud auth list
  1. Führen Sie in Cloud Shell den folgenden Befehl aus, um zu prüfen, ob der gcloud-Befehl Ihr Projekt kennt.
gcloud config list project
  1. Wenn Ihr Projekt nicht festgelegt ist, verwenden Sie den folgenden Befehl, um es festzulegen:
gcloud config set project <YOUR_PROJECT_ID>
  1. Rufen Sie den Gemini for Google Cloud Marketplace auf, um die API zu aktivieren. Sie können auch den folgenden Befehl im Cloud Shell-Terminal verwenden:
gcloud services enable cloudaicompanion.googleapis.com --project PROJECT_ID
  1. Die APIs BigQuery, BigQuery Connection, Cloud Function, Cloud Run, Vertex AI und Cloud Build müssen aktiviert sein. Alternativ können Sie die Konsole über diesen Link aufrufen.

Weitere Informationen zu gcloud-Befehlen und deren Verwendung finden Sie in der Dokumentation.

5. BigQuery-Dataset und externe Verbindung erstellen

Erstellen Sie zuerst ein Dataset und eine Cloud-Ressourcenverbindung.

Ein Dataset in BigQuery ist ein Container für alle Tabellen und Objekte Ihrer Anwendung.

So erstellen Sie einen Datensatz:

  1. Rufen Sie in der Google Cloud Console die BigQuery-Seite auf.
  2. Wählen Sie im Bereich Explorer das Projekt aus, in dem Sie das Dataset erstellen möchten.
  3. Maximieren Sie die Option Aktionen (das vertikale Dreipunkt-Menü) und klicken Sie auf Dataset erstellen.

Bild des Menüs „Aktionen“ und der Option „Dataset erstellen“

  1. Geben Sie im Feld Dataset-ID den Wert mdm_gemini ein.
  2. Legen Sie den Standorttyp auf Multi-region fest und akzeptieren Sie den Standardwert US(multiple regions in United States..
  3. Klicken Sie auf Dataset erstellen.
  4. Prüfen Sie, ob das Dataset erstellt wurde und im Bereich Explorer unter Ihrer Projekt-ID aufgeführt ist.

Für die Interaktion mit Ihrer Cloud Functions-Funktion ist eine BigQuery-Verbindung erforderlich. Zum Erstellen einer Remote-Funktion müssen Sie eine BigQuery-Verbindung erstellen. In diesem Codelab verwenden wir die BigLake-Verbindung, um über die Cloud-Funktion auf das Modell aus BigQuery zuzugreifen. BigLake-Verbindungen dienen dazu, die externe Datenquelle zu verbinden. Sie stellen gleichzeitig eine detaillierte BigQuery-Zugriffssteuerung und Sicherheit bereit, in unserem Fall die Vertex AI Gemini Pro API.

So erstellen Sie die BigLake-Verbindung:

  1. Klicken Sie auf der BigQuery-Seite im Bereich Explorer auf Hinzufügen.

BigQuery Console mit hervorgehobener Schaltfläche „HINZUFÜGEN“, um eine externe Verbindung hinzuzufügen

  1. Klicken Sie auf Verbindungen zu externen Datenquellen.
  2. Wählen Sie in der Liste „Verbindungstyp“ die Option Vertex AI-Remote-Modelle, Remote-Funktionen und BigLake (Cloud-Ressource) aus.
  3. Geben Sie im Feld Connection ID (Verbindungs-ID) den Namen der Verbindung als gemini-bq-conn ein.
  4. Legen Sie den Standorttyp auf Multi-region fest und akzeptieren Sie den Standardwert US(multiple regions in United States..
  5. Klicken Sie auf Verbindung erstellen.
  6. Klicken Sie auf Verbindung aufrufen und kopieren Sie dann die Dienstkonto-ID im Bereich Verbindungsinformationen.

Screenshot zu Verbindungsinformationen

  1. Rufen Sie die Seite IAM & Verwaltung auf und klicken Sie auf Zugriff erlauben.
  2. Fügen Sie die Dienstkonto-ID in das Feld Neue Hauptkonten ein.
  3. Wählen Sie in der Rollenliste die Rolle Vertex AI user aus und klicken Sie auf Speichern.

Screenshot zum Gewähren des Zugriffs auf ein Dienstkonto

Sie haben jetzt das Dataset und die BigQuery-Verbindung erstellt.

6. Gemini-Funktionsaufruf (Java-Cloud-Funktion) bereitstellen

So stellen Sie die Java-Cloud-Funktion bereit, die den Gemini-Funktionsaufruf enthält:

  1. Klonen Sie das GitHub-Repository mit dem folgenden Befehl über das Cloud Shell-Terminal:
git clone https://github.com/AbiramiSukumaran/GeminiFunctionCalling
  1. Ersetzen Sie die Platzhalter YOUR_API_KEY und YOUR_PROJECT_ID durch Ihre Werte.

Wie Sie in diesem Blog erfahren haben, wird für die Funktionsaufrufe die Reverse Geocoding API verwendet. Eine Anleitung zum Erstellen eines eigenen API_KEYs finden Sie hier.

  1. Rufen Sie im Cloud Shell-Terminal das neu geklonte Projektverzeichnis GeminiFunctionCalling auf und führen Sie den folgenden Befehl aus, um die Cloud-Funktion zu erstellen und bereitzustellen:
gcloud functions deploy gemini-fn-calling --gen2 --region=us-central1 --runtime=java11 --source=. --entry-point=cloudcode.helloworld.HelloWorld --trigger-http

Antworten Sie mit „y“, wenn Sie zur Frage „Nicht authentifizierte Aufrufe zulassen?“ aufgefordert werden. Idealerweise richten Sie die Authentifizierung für Ihre Unternehmensanwendungen ein. Da dies jedoch eine Demo-App ist, fahren wir ohne Authentifizierung fort.

Die Ausgabe ist eine REST-URL im folgenden Format:

https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-fn-calling

  1. Testen Sie diese Cloud-Funktion, indem Sie im Terminal den folgenden Befehl ausführen:
gcloud functions call gemini-fn-calling --region=us-central1 --gen2 --data '{"calls":[["40.714224,-73.961452"]]}'

Antwort auf einen Zufallsstichproben-Prompt:

 '{"replies":["{ \"DOOR_NUMBER\": \"277\", \"STREET_ADDRESS\": \"Bedford Ave\", \"AREA\":
 null, \"CITY\": \"Brooklyn\", \"TOWN\": null, \"COUNTY\": \"Kings County\", \"STATE\":
 \"NY\", \"COUNTRY\": \"USA\", \"ZIPCODE\": \"11211\", \"LANDMARK\": null}}```"]}'

Die Anfrage- und Antwortparameter dieser Cloud Functions-Funktion sind so implementiert, dass sie mit dem Aufruf der Remote-Funktion in BigQuery kompatibel sind. Sie können direkt aus BigQuery-Daten vor Ort verwendet werden. Wenn Ihre Dateneingabe (Breiten- und Längengraddaten) in BigQuery gespeichert ist, können Sie die Remotefunktion auf die Daten anwenden und die Funktionsantwort abrufen, die direkt in BigQuery gespeichert oder verarbeitet werden kann.

  1. Führen Sie die folgende DDL-Anweisung in BigQuery aus, um eine Remote-Funktion zu erstellen, die diese bereitgestellte Cloud-Funktion aufruft:
CREATE OR REPLACE FUNCTION
 `mdm_gemini.MDM_GEMINI` (latlng STRING) RETURNS STRING
 REMOTE WITH CONNECTION `us.gemini-bq-conn`
 OPTIONS (
   endpoint = 'https://us-central1-YOUR_PROJECT_ID.cloudfunctions.net/gemini-fn-calling', max_batching_rows = 1
 );

Testabfrage, um die neue erstellte Remote-Funktion zu verwenden:

SELECT mdm_gemini.MDM_GEMINI(latlong) from mdm_gemini.CITIBIKE_STATIONS limit 1;

Wenn die Testabfrage, die die in BigQuery erstellte neue Remote-Funktion verwendet, aufgrund eines Cloud Functions-Berechtigungsproblems fehlschlägt, rufen Sie in der Google Cloud Console Cloud Functions auf und suchen Sie nach der bereitgestellten Cloud Functions-Funktion mit dem Namen gemini-fn-calling. Rufen Sie den Tab „Berechtigungen“ auf, fügen Sie „allUsers“ als Hauptkonto hinzu und gewähren Sie die Rolle „Cloud Functions-Aufrufer“, damit alle Nutzer auf die Cloud Functions zugreifen können (nur weil dies eine Demo-App ist).

7. Behelfslösung ausprobieren

Wenn Sie nicht den erforderlichen API_KEY für den Aufruf der Funktion „Reverse Geocoding“ haben oder die Cloud-Funktion aus irgendeinem Grund nicht bereitgestellt ist, können Sie stattdessen Folgendes tun:

  1. Laden Sie die Datei CITIBIKE_STATIONS.csv aus dem Repository in Ihren Cloud Shell-Projektordner herunter und wechseln Sie zu diesem Ordner.
  2. Exportieren Sie die Daten aus der CSV-Datei mit dem folgenden Befehl in das neue BigQuery-Dataset mdm_gemini:
bq load --source_format=CSV --skip_leading_rows=1 mdm_gemini.CITIBIKE_STATIONS ./CITIBIKE_STATIONS.csv \ name:string,latlng:string,capacity:numeric,num_bikes_available:numeric,num_docks_available:numeric,last_reported:timestamp,full_address_string:string

8. Tabelle erstellen und Adressdaten ergänzen

Schritt 1: Tabelle erstellen

Wichtig:Wenn Sie die Problemumgehung verwendet haben, können Sie diesen Schritt überspringen, da Sie die Tabelle bereits erstellt haben müssen.

Wenn Sie die Umgehung nicht verwendet haben, führen Sie die folgende DDL im BigQuery SQL-Editor aus:

CREATE TABLE mdm_gemini.CITIBIKE_STATIONS as (
select  name, latitude || ',' || longitude as latlong, capacity, num_bikes_available, num_docks_available,last_reported,
'' as full_address_string
from bigquery-public-data.new_york_citibike.citibike_stations) ;

Jetzt reichern wir die Adressdaten an, indem wir die Remote-Funktion auf die Breiten- und Längengradkoordinaten in der Tabelle anwenden. Legen Sie die folgenden Bedingungen für die Daten fest:

  • Im Jahr 2024 gemeldet
  • Anzahl der verfügbaren Fahrräder > 0
  • Kapazität > 100

Führen Sie die folgende Abfrage aus:

update `mdm_gemini.CITIBIKE_STATIONS`
set full_address_string = `mdm_gemini.MDM_GEMINI`(latlong)
where EXTRACT(YEAR FROM last_reported) = 2024 and num_bikes_available > 0 and capacity > 100;

Schritt 2: Zweite Quelle für die Standortdaten der Fahrradstationen erstellen

Überspringen Sie diesen Schritt nicht, auch wenn Sie die Tabelle mithilfe der Problemumgehung erstellt haben.

In diesem Schritt erstellen Sie für dieses Codelab eine zweite Quelle für die Standortdaten der Fahrradstationen. Dies soll veranschaulichen, dass MDM Daten aus mehreren Quellen zusammenführt und die Goldene Wahrheit ermittelt.

Führen Sie die folgenden DDLs im BigQuery SQL-Editor aus, um die zweite Quelle mit Standortdaten mit zwei Einträgen zu erstellen. Nennen wir diese Tabelle mdm_gemini.CITIBIKE_STATIONS_SOURCE2 und fügen ihr zwei Einträge hinzu.

CREATE TABLE mdm_gemini.CITIBIKE_STATIONS_SOURCE2 (name STRING(55), address STRING(1000), embeddings_src ARRAY<FLOAT64>);

insert into mdm_gemini.CITIBIKE_STATIONS_SOURCE2 VALUES ('Location broadway and 29','{ "DOOR_NUMBER": "1593", "STREET_ADDRESS": "Broadway", "AREA": null, "CITY": "New York", "TOWN": null, "COUNTY": "New York County", "STATE": "NY", "COUNTRY": "USA", "ZIPCODE": "10019", "LANDMARK": null}', null);

insert into mdm_gemini.CITIBIKE_STATIONS_SOURCE2 VALUES ('Allen St & Hester','{ "DOOR_NUMBER": "36", "STREET_ADDRESS": "Allen St", "AREA": null, "CITY": "New York", "TOWN": null, "COUNTY": "New York County", "STATE": "NY", "COUNTRY": "USA", "ZIPCODE": "10002", "LANDMARK": null}', null);

9. Einbettungen für Adressdaten generieren

Einbettungen sind hochdimensionale numerische Vektoren, die eine bestimmte Entität darstellen, z. B. einen Text oder eine Audiodatei. Bei Modellen für maschinelles Lernen (ML) werden Entitäten mithilfe von Einbettungen codiert, um die Argumentation und den Vergleich zu erleichtern. Ein gängiger Vorgang bei Clustering-, Klassifizierungs- und Empfehlungsmodellen ist beispielsweise die Messung der Entfernung zwischen Vektoren in einem Einbettungsraum, um Elemente zu finden, die semantisch am ähnlichsten sind. Mit der Vertex AI Text-Einbettungs-API können Sie eine Texteinbettung mithilfe von Generative AI in Vertex AI erstellen. Text-Embeddings sind numerische Darstellungen von Text, die Beziehungen zwischen Wörtern und Wortgruppen erfassen. Weitere Informationen zu Vertex AI-Text-Embeddings

  1. Führen Sie den folgenden DDL-Code aus, um ein Remote-Modell für die Vertex AI Text-Einbettungs-API zu erstellen:
CREATE OR REPLACE MODEL `mdm_gemini.CITIBIKE_STATIONS_ADDRESS_EMB`
REMOTE WITH CONNECTION `us.gemini-bq-conn`
OPTIONS (ENDPOINT = 'textembedding-gecko@latest');
  1. Nachdem das Modell für Remote-Embeddings bereit ist, generieren wir mit der folgenden Abfrage Einbettungen für die erste Quelle und speichern sie in einer Tabelle:
CREATE TABLE `mdm_gemini.CITIBIKE_STATIONS_SOURCE1` AS (
SELECT *
FROM ML.GENERATE_EMBEDDING(
 MODEL `mdm_gemini.CITIBIKE_STATIONS_ADDRESS_EMB`,
 ( select name, full_address_string as content from `mdm_gemini.CITIBIKE_STATIONS`
 where full_address_string is not null )
  )
);

Anstatt eine neue Tabelle zu erstellen, können Sie das Ergebnisfeld für die Einbettung auch in der Tabelle mdm_gemini.CITIBIKE_STATIONS speichern, die Sie zuvor erstellt haben.

  1. Führen Sie die folgende Abfrage aus,um Einbettungen für Adressdaten in der Tabelle CITIBIKE_STATIONS_SOURCE2 zu generieren:
update `mdm_gemini.CITIBIKE_STATIONS_SOURCE2` a set embeddings_src =
(
SELECT  ml_generate_embedding_result
FROM ML.GENERATE_EMBEDDING(
 MODEL `mdm_gemini.CITIBIKE_STATIONS_ADDRESS_EMB`,
 ( select name, address as content from `mdm_gemini.CITIBIKE_STATIONS_SOURCE2` ))
where name = a.name) where name is not null;

Dadurch sollten Einbettungen für die zweite Quelle erstellt werden. Beachten Sie, dass wir das Feld „Embeddings“ in derselben Tabelle CITIBIKE_STATIONS_SOURCE2 erstellt haben.

  1. Führen Sie die folgende Abfrage aus, um die für die Quelldatentabellen 1 und 2 generierten Einbettungen zu visualisieren:
select name,address,embeddings_src from `mdm_gemini.CITIBIKE_STATIONS_SOURCE2`;
select name,content,ml_generate_embedding_result from `mdm_gemini.CITIBIKE_STATIONS_SOURCE1`;

Führen wir nun eine Vektorsuche durch, um Duplikate zu identifizieren.

10. Vektorsuche ausführen, um doppelte Adressen zu kennzeichnen

In diesem Schritt suchen Sie in der Spalte für die Adress-Embeddings ml_generate_embedding_result der Tabelle mdm_gemini.CITIBIKE_STATIONS_SOURCE1 nach den beiden besten Embeddings, die mit jeder Datenzeile in der Spalte embeddings_src der Tabelle mdm_gemini.CITIBIKE_STATIONS_SOURCE2 übereinstimmen.

Führen Sie dazu die folgende Abfrage aus:

select query.name name1,base.name name2,
/* (select address from mdm_gemini.CITIBIKE_STATIONS_SOURCE2 where name = query.name) content1, base.content content2, */
distance
from VECTOR_SEARCH(
 TABLE mdm_gemini.CITIBIKE_STATIONS_SOURCE1,
 'ml_generate_embedding_result',
 (SELECT * FROM mdm_gemini.CITIBIKE_STATIONS_SOURCE2),
 'embeddings_src',
 top_k => 2
) where query.name <> base.name
order by distance desc;

Abgefragte Tabelle: mdm_gemini.CITIBIKE_STATIONS_SOURCE1 nach dem Feld ml_generate_embedding_result

Als Basis verwendete Tabelle: mdm_gemini.CITIBIKE_STATIONS_SOURCE2 im Feld embeddings_src

top_k::Gibt die Anzahl der nächsten Nachbarn an, die zurückgegeben werden sollen. Der Standardwert ist 10. Ein negativer Wert wird als Unendlich behandelt. Das bedeutet, dass alle Werte als Nachbarn gezählt und zurückgegeben werden.

distance_type::Gibt den Messwerttyp an, der zum Berechnen der Entfernung zwischen zwei Vektoren verwendet wird. Unterstützte Entfernungstypen sind euklidisch und Kosinus. Der Standardwert ist Euklidisch.

Das Ergebnis der Abfrage sieht so aus:

Ergebnissatz

Wie Sie sehen, wurden hier die beiden nächsten Nachbarn (d. h. die ähnlichsten Duplikate) für die beiden Zeilen in CITIBIKE_STATIONS_SOURCE2 aus CITIBIKE_STATIONS_SOURCE1 aufgelistet. Da distance_type nicht angegeben ist, wird davon ausgegangen, dass es sich um den euklidischen Abstand handelt. Die Entfernung wird als die Entfernungen in den TEXT-Werten der Adressen zwischen den beiden Quellen gelesen. Der niedrigste Wert entspricht den am ähnlichsten klingenden Adressen.

Legen wir distance_type mit der folgenden Abfrage auf Cosine fest:

select query.name name1,base.name name2,
/* (select address from mdm_gemini.CITIBIKE_STATIONS_SOURCE2 where name = query.name) content1, base.content content2, */
distance
from VECTOR_SEARCH(
 TABLE mdm_gemini.CITIBIKE_STATIONS_SOURCE1,
 'ml_generate_embedding_result',
 (SELECT * FROM mdm_gemini.CITIBIKE_STATIONS_SOURCE2),
 'embeddings_src',
 top_k => 2,distance_type => 'COSINE'
) where query.name <> base.name
order by distance desc;

Das Ergebnis der Abfrage sieht so aus:

Ergebnissatz 2

Beide Abfragen (beider Entfernungstypen) werden nach Entfernung ABGESTIEGEN sortiert. Das bedeutet, dass die Ergebnisse in absteigender Entfernung aufgeführt werden sollen. Sie werden jedoch feststellen, dass die Reihenfolge der Entfernungen bei der zweiten Abfrage umgekehrt ist. Können Sie sich vorstellen, warum?

Ja!! Das ist richtig! Bei der Kosinusähnlichkeit bedeutet eine größere Zahl eine größere Ähnlichkeit und eine kleinere Distanz. Bei der euklidischen Distanz bedeutet ein größerer Wert einen größeren Abstand zwischen den Werten.

Weitere Informationen zu MDM und Tipps zum Unterschied und zu den Anwendungen von euklidischem und Kosinusabstand finden Sie im Blog.

11. Bereinigen

Mit den folgenden Schritten vermeiden Sie, dass Ihrem Google Cloud-Konto die in diesem Beitrag verwendeten Ressourcen in Rechnung gestellt werden:

  1. Rufen Sie in der Google Cloud Console die Seite Ressourcen verwalten auf.
  2. Wählen Sie in der Projektliste das Projekt aus, das Sie löschen möchten, und klicken Sie auf Löschen.
  3. Geben Sie im Dialogfeld die Projekt-ID ein und klicken Sie auf Beenden, um das Projekt zu löschen.
  4. Wenn Sie Ihr Projekt behalten möchten, überspringen Sie die oben genannten Schritte und löschen Sie die Cloud-Funktion. Rufen Sie dazu „Cloud Functions“ auf, setzen Sie in der Liste der Funktionen ein Häkchen neben die gewünschte Funktion und klicken Sie auf Löschen.

12. Glückwunsch

Glückwunsch! Sie haben gezeigt, wie Sie mit Gemini 1.0 Pro und Funktionsaufrufen einige MDM-Aktivitäten in vereinfachte, aber leistungsstarke, deterministische und zuverlässige Funktionen für die generative KI umwandeln können. Jetzt, da Sie es wissen, können Sie andere Möglichkeiten zur Implementierung desselben Anwendungsfalls oder anderer MDM-Funktionen finden. Gibt es Datensätze, die Sie validieren könnten, Informationslücken, die Sie schließen könnten, oder Aufgaben, die mithilfe von strukturierten Aufrufen in Ihren Antworten mit generativer KI automatisiert werden könnten? Weitere Informationen finden Sie in der Dokumentation zu Vertex AI, BigQuery-Remote-Funktionen, Cloud Functions, Embeddings und Vektorsuche. Hier ist das GitHub-Repository für dieses Projekt. Wir freuen uns, wenn du uns mitteilst, was du mit diesen neuen Kenntnissen erschaffen hast.