Rileva oggetti nelle immagini per creare una ricerca visiva dei prodotti con ML Kit: Android

1. Prima di iniziare

Hai visto la demo di Google Lens, dove puoi puntare la fotocamera del telefono verso un oggetto e scoprire dove è possibile acquistarlo online? Se vuoi scoprire come aggiungere la stessa funzionalità alla tua app, questo codelab è quello che fa per te. Fa parte di un percorso di apprendimento che ti insegna come creare una funzionalità di ricerca delle immagini dei prodotti in un'app mobile.

In questo codelab, imparerai il primo passaggio per creare una funzionalità di ricerca delle immagini del prodotto: come rilevare oggetti nelle immagini e consentire all'utente di scegliere gli oggetti che vuole cercare. Utilizzerai Rilevamento e monitoraggio degli oggetti ML Kit per creare questa caratteristica.

Per scoprire i passaggi rimanenti, incluso come creare un backend di ricerca dei prodotti con Product Search dell'API Vision, nel percorso di apprendimento.

Cosa creerai

In questo codelab, creerai un'app per Android con ML Kit. L'app utilizzerà l'API ML Kit Object Detection and Tracking per rilevare oggetti in una determinata immagine. Quindi l'utente sceglierà un oggetto che vuole cercare nel nostro database dei prodotti.
Alla fine dovresti vedere qualcosa di simile all'immagine a destra.

Cosa imparerai a fare

Come integrare l'SDK ML Kit nella tua applicazione Android
API ML Kit Object Detection and Tracking

Che cosa ti serve

Una versione recente di Android Studio (v4.1.2 o successiva)
Emulatore di Android Studio o un dispositivo Android fisico
Il codice campione
Conoscenza di base dello sviluppo Android in Kotlin

Questo codelab è incentrato su ML Kit. Altri concetti e blocchi di codice non vengono studiati, ma puoi semplicemente copiarli e incollarli.

2. Configurazione

Scarica il codice

Fai clic sul seguente link per scaricare tutto il codice per questo codelab:

Apri il file ZIP scaricato. Verrà aperta una cartella principale (odml-pathways-main) con tutte le risorse di cui hai bisogno. Per questo codelab, sono necessarie solo le sorgenti nella sottodirectory product-search/codelab1/android.

La sottodirectory di rilevamento degli oggetti nel repository mlkit-android contiene due directory:

comando iniziale: codice iniziale che crei per questo codelab.
final: codice completato per l'app di esempio completata.

3. Aggiungi l'API ML Kit Object Detection and Tracking al progetto

Importare l'app in Android Studio

Per iniziare, importa l'app iniziale in Android Studio.

Vai ad Android Studio, seleziona Importa progetto (Gradle, Eclipse ADT e così via) e scegli la cartella starter dal codice sorgente che hai scaricato in precedenza.

Aggiungere le dipendenze per il rilevamento e il monitoraggio degli oggetti ML Kit

Le dipendenze del kit ML consentono di integrare l'SDK ODT ML Kit nella tua app.

Vai al file app/build.gradle del tuo progetto e verifica che la dipendenza sia già presente:

build.gradle

dependencies {
  // ...
  implementation 'com.google.mlkit:object-detection:16.2.4'
}

Sincronizza il tuo progetto con i file Gradle

Per assicurarti che tutte le dipendenze siano disponibili per la tua app, a questo punto devi sincronizzare il progetto con i file Gradle.

Seleziona Sync Project with Gradle Files ( ) dalla barra degli strumenti di Android Studio.

(Se questo pulsante è disabilitato, assicurati di importare solo starter/app/build.gradle, non l'intero repository.)

4. Esegui l'app iniziale

Ora che hai importato il progetto in Android Studio e aggiunto le dipendenze per il rilevamento e il monitoraggio degli oggetti ML Kit, puoi eseguire l'app per la prima volta.

Collega il dispositivo Android tramite USB al tuo host o avvia l'emulatore Android Studio e fai clic su Esegui ( ) nella barra degli strumenti di Android Studio.

Corri ed esplora l'app

L'app dovrebbe avviarsi sul tuo dispositivo Android. Ha del codice boilerplate per consentirti di scattare una foto o selezionare un'immagine preimpostata e di alimentarla a una pipeline di rilevamento e monitoraggio degli oggetti che creerai in questo codelab. Esplora l'app un po' prima di scrivere il codice:

Innanzitutto, c'è un Button ( ) in basso per

avvia l'app della fotocamera integrata nel dispositivo/emulatore
scattare una foto nell'app fotocamera
Ricevi l'immagine acquisita nell'app iniziale
mostra l'immagine

Prova "Scatta foto" . Segui le istruzioni per scattare una foto, accetta la foto e osserva come viene visualizzata all'interno dell'app iniziale.

In secondo luogo, puoi scegliere tra 3 immagini preimpostate. Puoi utilizzare queste immagini in un secondo momento per testare il codice di rilevamento degli oggetti se utilizzi un emulatore Android.

Seleziona un'immagine tra le tre immagini preimpostate.
Guarda che l'immagine viene mostrata nella visualizzazione più grande.

5. Aggiungi rilevamento di oggetti sul dispositivo

In questo passaggio aggiungerai la funzionalità all'app iniziale per rilevare oggetti nelle immagini. Come hai visto nel passaggio precedente, l'app iniziale contiene il codice boilerplate per scattare foto con l'app Fotocamera sul dispositivo. Nell'app sono inoltre disponibili 3 immagini preimpostate su cui puoi provare il rilevamento degli oggetti se esegui il codelab su un emulatore Android.

Quando selezioni un'immagine (dalle immagini preimpostate o scattando una foto con l'app Fotocamera, il codice boilerplate decodifica l'immagine in un'istanza Bitmap), la mostra sullo schermo e chiama il metodo runObjectDetection con l'immagine.

In questo passaggio, aggiungerai codice al metodo runObjectDetection per rilevare gli oggetti.

Configurare ed eseguire il rilevamento di oggetti sul dispositivo su un'immagine

Bastano 3 semplici passaggi e 3 API per configurare ML Kit ODT

prepara un'immagine: InputImage
crea un oggetto rilevatore: ObjectDetection.getClient(options)
collega i 2 oggetti sopra: process(image)

Puoi farlo all'interno della funzione **runObjectDetection(bitmap: Bitmap)**nel file MainActivity.kt.

/**
 * ML Kit Object Detection Function
 */
private fun runObjectDetection(bitmap: Bitmap) {
}

Al momento la funzione è vuota. Procedi con i passaggi seguenti per integrare ML Kit ODT. Durante l'operazione, Android Studio ti chiederà di aggiungere le importazioni necessarie

com.google.mlkit.vision.common.InputImage
com.google.mlkit.vision.objects.ObjectDetection
com.google.mlkit.vision.objects.defaults.ObjectDetectorOptions

Passaggio 1: crea un'immagine di input

ML Kit fornisce una semplice API per creare un InputImage da un Bitmap. Poi potrai inserire un'InputImage nelle API ML Kit.

// Step 1: create ML Kit's InputImage object
val image = InputImage.fromBitmap(bitmap, 0)

Aggiungi il codice riportato sopra all'inizio di runObjectDetection(bitmap:Bitmap).

Passaggio 2: crea un'istanza del rilevatore

ML Kit segue il Builder Design Pattern, passerai la configurazione al builder e acquisirai un rilevatore. Ci sono 3 opzioni di configurazione (quella in grassetto è utilizzata nel codelab):

modalità rilevatore (immagine singola o stream)
modalità di rilevamento (singolo o più rilevamento di oggetti)
modalità di classificazione (attivata o disattivata)

Questo codelab è per una singola immagine - rilevamento di più oggetti e classificazione, procediamo nel seguente modo:

// Step 2: acquire detector object
val options = ObjectDetectorOptions.Builder()
   .setDetectorMode(ObjectDetectorOptions.SINGLE_IMAGE_MODE)
   .enableMultipleObjects()
   .enableClassification()
   .build()
val objectDetector = ObjectDetection.getClient(options)

Passaggio 3: fornisci le immagini al rilevatore

Il rilevamento e la classificazione degli oggetti prevedono l'elaborazione asincrona:

invii un'immagine al rilevatore (tramite process())
rilevatore si impegna a fondo
rilevatore ti segnala il risultato tramite callback

Il seguente codice fa esattamente questo (copialo e aggiungilo al codice esistente all'interno di fun runObjectDetection(bitmap:Bitmap)):

// Step 3: feed given image to detector and setup callback
objectDetector.process(image)
   .addOnSuccessListener {
       // Task completed successfully
        debugPrint(it)
   }
   .addOnFailureListener {
       // Task failed with an exception
       Log.e(TAG, it.message.toString())
   }

Al termine, il rilevatore ti avvisa

Numero totale di oggetti rilevati
Ogni oggetto rilevato viene descritto

trackingId: un numero intero utilizzato per monitorare i frame incrociati (NON utilizzato in questo codelab)
boundingBox: riquadro di delimitazione dell'oggetto
labels: elenco di etichette per l'oggetto rilevato (solo quando la classificazione è abilitata)
index (recupera l'indice di questa etichetta)
text (recupera il testo di questa etichetta, ad esempio "Articoli di moda", "Cibo", "Articoli per la casa", "Luogo", "Pianta")
confidence (un numero in virgola mobile compreso tra 0,0 e 1,0 con 1,0 indica il 100%)

Probabilmente avrai notato che la stampa del codice rileva i risultati in Logcat con debugPrint(). Aggiungilo a MainActivity corso:

private fun debugPrint(detectedObjects: List<DetectedObject>) {
   detectedObjects.forEachIndexed { index, detectedObject ->
       val box = detectedObject.boundingBox

       Log.d(TAG, "Detected object: $index")
       Log.d(TAG, " trackingId: ${detectedObject.trackingId}")
       Log.d(TAG, " boundingBox: (${box.left}, ${box.top}) - (${box.right},${box.bottom})")
       detectedObject.labels.forEach {
           Log.d(TAG, " categories: ${it.text}")
           Log.d(TAG, " confidence: ${it.confidence}")
       }
   }
}

Ora puoi accettare immagini per il rilevamento.

Esegui il codelab facendo clic su Esegui ( ) nella barra degli strumenti di Android Studio. Prova a selezionare un'immagine preimpostata o scatta una foto, quindi guarda la finestra logcat( ) all'interno dell'IDE. Il risultato dovrebbe essere simile a questo:

D/MLKit Object Detection: Detected object: 0
D/MLKit Object Detection:  trackingId: null
D/MLKit Object Detection:  boundingBox: (481, 2021) - (2426,3376)
D/MLKit Object Detection:  categories: Fashion good
D/MLKit Object Detection:  confidence: 0.90234375
D/MLKit Object Detection: Detected object: 1
D/MLKit Object Detection:  trackingId: null
D/MLKit Object Detection:  boundingBox: (2639, 2633) - (3058,3577)
D/MLKit Object Detection: Detected object: 2
D/MLKit Object Detection:  trackingId: null
D/MLKit Object Detection:  boundingBox: (3, 1816) - (615,2597)
D/MLKit Object Detection:  categories: Home good
D/MLKit Object Detection:  confidence: 0.75390625

il che significa che il rilevatore ha rilevato 3 oggetti:

sono Moda elegante e Va bene.
non viene restituita nessuna categoria per il 2° posto perché è una classe sconosciuta.
no trackingId (perché questa è la modalità di rilevamento di immagini singole)
posizione all'interno del rettangolo boundingBox (ad es. (481, 2021) - (2426, 3376))
rilevatore è abbastanza sicuro che il 1° sia un articolo alla moda (90%) (è un abito)

Tecnicamente è tutto ciò che serve per far funzionare il rilevamento degli oggetti ML Kit. In questo momento è tutto. Complimenti!

Sì, dal punto di vista dell'interfaccia utente sei ancora nella fase di inizio, ma potresti utilizzare i risultati rilevati nell'interfaccia utente, ad esempio disegnando il riquadro di delimitazione per creare un'esperienza migliore. Il passaggio successivo consiste nel visualizzare i risultati rilevati.

6. Post-elaborazione dei risultati del rilevamento

Nei passaggi precedenti, hai stampato il risultato rilevato in logcat: è semplice e veloce.

In questa sezione userai il risultato visualizzato nell'immagine:

disegna il riquadro di delimitazione sull'immagine
traccia il nome e l'affidabilità della categoria all'interno del riquadro di delimitazione

Informazioni sulle utilità di visualizzazione

All'interno del codelab è presente un codice boilerplate, che ti aiuta a visualizzare il risultato del rilevamento. Sfrutta queste utilità per semplificare il nostro codice di visualizzazione:

class ImageClickableView Si tratta di una classe di visualizzazione di immagini che fornisce alcuni utili utilità per la visualizzazione e l'interazione con il risultato del rilevamento.
fun drawDetectionResults(results: List<DetectedObject>) Questo metodo disegna cerchi bianchi al centro di ciascun oggetto rilevato.
fun setOnObjectClickListener(listener: ((objectImage: Bitmap) -> Unit)) Si tratta di un callback per ricevere l'immagine ritagliata contenente solo l'oggetto che l'utente ha toccato. Invierai questa immagine ritagliata al backend di ricerca immagini in un codelab successivo per ottenere un risultato visivamente simile. In questo codelab, non userai ancora questo metodo.

Mostra il risultato del rilevamento di ML Kit

Utilizza le utilità di visualizzazione per mostrare il risultato del rilevamento degli oggetti ML Kit sopra l'immagine di input.

Vai nella posizione in cui chiami debugPrint() e aggiungi il seguente snippet di codice sotto:

runOnUiThread {
    viewBinding.ivPreview.drawDetectionResults(it)
}

Esegui

Ora fai clic su Esegui ( ) nella barra degli strumenti di Android Studio.

Una volta caricata l'app, premi il pulsante con l'icona della fotocamera, inquadra con la fotocamera un oggetto, scatta una foto, accetta la foto (nell'app Fotocamera) oppure tocca facilmente le immagini preimpostate. Dovresti vedere il risultato del rilevamento. premi di nuovo il pulsante o seleziona un'altra immagine da ripetere un paio di volte e prova l'ultimo ML Kit ODT.

7. Complimenti

Hai utilizzato ML Kit per aggiungere funzionalità di rilevamento di oggetti alla tua app:

3 passaggi con 3 API
Crea immagine di input
Crea rilevatore
Invia immagine al rilevatore

Questo è tutto ciò che ti serve per renderlo operativo.

Argomenti trattati

Come aggiungere il rilevamento e il monitoraggio degli oggetti ML Kit alla tua app per Android
Come utilizzare il rilevamento e il monitoraggio degli oggetti on-device in ML Kit per rilevare oggetti nelle immagini

Passaggi successivi

Prova questo codelab su come inviare l'oggetto rilevato a un backend di ricerca dei prodotti e mostrare i risultati di ricerca
Esplora di più con ML Kit ODT con più immagini e video in diretta per sperimentare il rilevamento e accuratezza e prestazioni della classificazione
Consulta il percorso di apprendimento Scopri di più con il rilevamento di oggetti per scoprire come addestrare un modello personalizzato
Leggi i suggerimenti di Material Design per il rilevamento di oggetti live-camera e immagine statica
Applica il protocollo ML Kit ODT nella tua app per Android

Scopri di più

https://developers.google.com/ml-kit/vision/object-detection

Rileva oggetti nelle immagini per creare una ricerca visiva dei prodotti con ML Kit: Android Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.