1. Ringkasan
Translation API menyediakan antarmuka terprogram yang sederhana untuk menerjemahkan string arbitrer ke dalam bahasa apa pun yang didukung secara dinamis menggunakan Terjemahan Mesin Neural yang canggih. Model ini juga dapat digunakan untuk mendeteksi bahasa jika bahasa sumber tidak diketahui.
Dalam tutorial ini, Anda akan menggunakan Translation API dengan Python. Konsep yang dibahas mencakup cara mencantumkan bahasa yang tersedia, menerjemahkan teks, dan mendeteksi bahasa teks tertentu.
Yang akan Anda pelajari
- Cara menyiapkan lingkungan
- Cara mencantumkan bahasa yang tersedia
- Cara menerjemahkan teks
- Cara mendeteksi bahasa
Yang Anda butuhkan
Survei
Bagaimana Anda akan menggunakan tutorial ini?
Bagaimana penilaian Anda terhadap pengalaman dengan Python?
Bagaimana penilaian Anda terhadap pengalaman menggunakan layanan Google Cloud?
2. Penyiapan dan persyaratan
Penyiapan lingkungan mandiri
- Login ke Google Cloud Console dan buat project baru atau gunakan kembali project yang sudah ada. Jika belum memiliki akun Gmail atau Google Workspace, Anda harus membuatnya.
- Project name adalah nama tampilan untuk peserta project ini. String ini adalah string karakter yang tidak digunakan oleh Google API. Anda dapat memperbaruinya kapan saja.
- Project ID bersifat unik di semua project Google Cloud dan tidak dapat diubah (tidak dapat diubah setelah ditetapkan). Cloud Console otomatis membuat string unik; biasanya Anda tidak mementingkan kata-katanya. Di sebagian besar codelab, Anda harus merujuk Project ID-nya (umumnya diidentifikasi sebagai
PROJECT_ID
). Jika tidak suka dengan ID yang dibuat, Anda dapat membuat ID acak lainnya. Atau, Anda dapat mencobanya sendiri, dan lihat apakah ID tersebut tersedia. ID tidak dapat diubah setelah langkah ini dan tersedia selama durasi project. - Sebagai informasi, ada nilai ketiga, Project Number, yang digunakan oleh beberapa API. Pelajari lebih lanjut ketiga nilai ini di dokumentasi.
- Selanjutnya, Anda harus mengaktifkan penagihan di Konsol Cloud untuk menggunakan resource/API Cloud. Menjalankan operasi dalam codelab ini tidak akan memakan banyak biaya, bahkan mungkin tidak sama sekali. Guna mematikan resource agar tidak menimbulkan penagihan di luar tutorial ini, Anda dapat menghapus resource yang dibuat atau menghapus project-nya. Pengguna baru Google Cloud memenuhi syarat untuk mengikuti program Uji Coba Gratis senilai $300 USD.
Mulai Cloud Shell
Meskipun Google Cloud dapat dioperasikan dari jarak jauh menggunakan laptop Anda, dalam codelab ini, Anda akan menggunakan Cloud Shell, lingkungan command line yang berjalan di Cloud.
Mengaktifkan Cloud Shell
- Dari Cloud Console, klik Aktifkan Cloud Shell
.
Jika ini adalah pertama kalinya Anda memulai Cloud Shell, Anda akan melihat layar perantara yang menjelaskan apa itu Cloud Shell. Jika Anda melihat layar perantara, klik Lanjutkan.
Perlu waktu beberapa saat untuk penyediaan dan terhubung ke Cloud Shell.
Virtual machine ini berisi semua alat pengembangan yang diperlukan. VM ini menawarkan direktori beranda tetap sebesar 5 GB dan beroperasi di Google Cloud, sehingga sangat meningkatkan performa dan autentikasi jaringan. Sebagian besar pekerjaan Anda dalam codelab ini dapat dilakukan dengan browser.
Setelah terhubung ke Cloud Shell, Anda akan melihat bahwa Anda telah diautentikasi dan project telah ditetapkan ke project ID Anda.
- Jalankan perintah berikut di Cloud Shell untuk mengonfirmasi bahwa Anda telah diautentikasi:
gcloud auth list
Output perintah
Credentialed Accounts ACTIVE ACCOUNT * <my_account>@<my_domain.com> To set the active account, run: $ gcloud config set account `ACCOUNT`
- Jalankan perintah berikut di Cloud Shell untuk mengonfirmasi bahwa perintah gcloud mengetahui project Anda:
gcloud config list project
Output perintah
[core] project = <PROJECT_ID>
Jika tidak, Anda dapat menyetelnya dengan perintah ini:
gcloud config set project <PROJECT_ID>
Output perintah
Updated property [core/project].
3. Penyiapan lingkungan
Sebelum dapat mulai menggunakan Translation API, jalankan perintah berikut di Cloud Shell untuk mengaktifkan API:
gcloud services enable translate.googleapis.com
Anda akan melihat sesuatu seperti ini:
Operation "operations/..." finished successfully.
Sekarang, Anda dapat menggunakan Translation API.
Tetapkan variabel lingkungan berikut (untuk digunakan dalam aplikasi Anda):
export PROJECT_ID=$(gcloud config get-value core/project)
echo "PROJECT_ID: $PROJECT_ID"
Buka direktori utama Anda:
cd ~
Buat lingkungan virtual Python untuk mengisolasi dependensi:
virtualenv venv-translate
Aktifkan lingkungan virtual:
source venv-translate/bin/activate
Instal IPython dan library klien Translation API:
pip install ipython google-cloud-translate
Anda akan melihat sesuatu seperti ini:
... Installing collected packages: ..., ipython, google-cloud-translate Successfully installed ... google-cloud-translate-3.16.0 ...
Sekarang, Anda siap untuk menggunakan library klien Translation API.
Pada langkah berikutnya, Anda akan menggunakan penafsir Python interaktif yang disebut IPython, yang telah Anda instal pada langkah sebelumnya. Mulai sesi dengan menjalankan ipython
di Cloud Shell:
ipython
Anda akan melihat sesuatu seperti ini:
Python 3.10.12 (main, Jul 29 2024, 16:56:48) [GCC 11.4.0] Type 'copyright', 'credits' or 'license' for more information IPython 8.27.0 -- An enhanced Interactive Python. Type '?' for help. In [1]:
Salin kode berikut ke sesi IPython:
from os import environ
from google.cloud import translate
PROJECT_ID = environ.get("PROJECT_ID", "")
assert PROJECT_ID
PARENT = f"projects/{PROJECT_ID}"
Anda siap untuk membuat permintaan pertama dan mencantumkan bahasa yang didukung...
4. Menampilkan daftar bahasa yang tersedia
Di bagian ini, Anda akan mencantumkan semua bahasa yang tersedia di Translation API.
Untuk mencantumkan bahasa yang tersedia, salin kode berikut ke sesi IPython:
def print_supported_languages(display_language_code: str):
client = translate.TranslationServiceClient()
response = client.get_supported_languages(
parent=PARENT,
display_language_code=display_language_code,
)
languages = response.languages
print(f" Languages: {len(languages)} ".center(60, "-"))
for language in languages:
language_code = language.language_code
display_name = language.display_name
print(f"{language_code:10}{display_name}")
Memanggil fungsi:
print_supported_languages("en")
Anda akan mendapatkan tampilan seperti ini:
---------------------- Languages: 137 ---------------------- af Afrikaans sq Albanian am Amharic ar Arabic hy Armenian ... cy Welsh xh Xhosa yi Yiddish yo Yoruba zu Zulu
Lihat apa yang Anda dapatkan dengan bahasa tampilan dalam bahasa Prancis:
print_supported_languages("fr")
Anda akan mendapatkan daftar yang sama, yang diurutkan dengan nama Prancis, mirip dengan berikut ini:
---------------------- Languages: 137 ---------------------- af Afrikaans sq Albanais de Allemand am Amharique en Anglais ... vi Vietnamien xh Xhosa yi Yiddish yo Yoruba zu Zoulou
Anda dapat mencoba dengan kode bahasa lain.
Ringkasan
Pada langkah ini, Anda dapat mencantumkan semua bahasa yang tersedia di Translation API. Anda dapat menemukan daftar lengkap bahasa yang didukung di halaman dukungan bahasa.
5. Terjemahkan teks
Anda dapat menggunakan Translation API untuk menerjemahkan teks dari satu bahasa ke bahasa lain. Teks diterjemahkan menggunakan model Terjemahan Mesin Neural (NMT). Jika model NMT tidak didukung untuk pasangan terjemahan bahasa yang diminta, model Terjemahan Mesin Berbasis Frasa (PBMT) akan digunakan. Untuk mengetahui informasi selengkapnya tentang Google Terjemahan dan model terjemahannya, lihat postingan pengumuman NMT.
Untuk menerjemahkan teks, salin kode berikut ke sesi IPython Anda:
def translate_text(text: str, target_language_code: str) -> translate.Translation:
client = translate.TranslationServiceClient()
response = client.translate_text(
parent=PARENT,
contents=[text],
target_language_code=target_language_code,
)
return response.translations[0]
Panggil fungsi untuk menerjemahkan teks yang sama dalam bahasa yang berbeda:
text = "Hello World!"
target_languages = ["tr", "de", "es", "it", "el", "zh", "ja", "ko"]
print(f" {text} ".center(50, "-"))
for target_language in target_languages:
translation = translate_text(text, target_language)
source_language = translation.detected_language_code
translated_text = translation.translated_text
print(f"{source_language} → {target_language} : {translated_text}")
Anda akan mendapatkan hal berikut:
------------------ Hello World! ------------------ en → tr : Selam Dünya! en → de : Hallo Welt! en → es : ¡Hola Mundo! en → it : Ciao mondo! en → el : Γεια σου Κόσμο! en → zh : 你好世界! en → ja : 「こんにちは世界」 en → ko : 안녕하세요!
Ringkasan
Pada langkah ini, Anda dapat menggunakan Translation API untuk menerjemahkan teks ke dalam beberapa bahasa. Baca selengkapnya tentang menerjemahkan teks.
6. Mendeteksi bahasa
Anda juga dapat menggunakan Translation API untuk mendeteksi bahasa string teks.
Salin kode berikut ke sesi IPython:
def detect_language(text: str) -> translate.DetectedLanguage:
client = translate.TranslationServiceClient()
response = client.detect_language(parent=PARENT, content=text)
return response.languages[0]
Panggil fungsi untuk mendeteksi bahasa dari berbagai kalimat:
sentences = [
"Selam Dünya!",
"Hallo Welt!",
"¡Hola Mundo!",
"Ciao mondo!",
"Γεια σου Κόσμο!",
"你好世界!",
"「こんにちは世界」",
"안녕하세요!",
]
for sentence in sentences:
language = detect_language(sentence)
confidence = language.confidence
language_code = language.language_code
print(
f"Confidence: {confidence:4.0%}",
f"Language: {language_code:5}",
sentence,
sep=" | ",
)
Anda akan mendapatkan hal berikut:
Confidence: 100% | Language: tr | Selam Dünya! Confidence: 81% | Language: de | Hallo Welt! Confidence: 100% | Language: es | ¡Hola Mundo! Confidence: 100% | Language: it | Ciao mondo! Confidence: 100% | Language: el | Γεια σου Κόσμο! Confidence: 100% | Language: zh-CN | 你好世界! Confidence: 100% | Language: ja | 「こんにちは世界」 Confidence: 100% | Language: ko | 안녕하세요!
Ringkasan
Pada langkah ini, Anda dapat mendeteksi bahasa dari sebuah teks menggunakan Translation API. Baca selengkapnya tentang mendeteksi bahasa.
7. Selamat!
Anda telah mempelajari cara menggunakan Translation API menggunakan Python.
Pembersihan
Untuk membersihkan lingkungan pengembangan, dari Cloud Shell:
- Jika Anda masih berada di sesi IPython, kembali ke shell:
exit
- Berhenti menggunakan lingkungan virtual Python:
deactivate
- Hapus folder lingkungan virtual Anda:
cd ~ ; rm -rf ./venv-translate
Untuk menghapus project Google Cloud, dari Cloud Shell:
- Ambil project ID Anda saat ini:
PROJECT_ID=$(gcloud config get-value core/project)
- Pastikan ini adalah project yang ingin Anda hapus:
echo $PROJECT_ID
- Menghapus project:
gcloud projects delete $PROJECT_ID
Pelajari lebih lanjut
- Dokumentasi Cloud Translation: https://cloud.google.com/translate/docs
- Python di Google Cloud: https://cloud.google.com/python
- Library Klien Cloud untuk Python: https://github.com/googleapis/google-cloud-python
Lisensi
Karya ini dilisensikan berdasarkan Lisensi Umum Creative Commons Attribution 2.0.