使用 Google Dataproc 创建 Spark ML 模型
关于此 Codelab
subject上次更新时间:10月 12, 2022
3. 创建并连接到 Vertex AI Workbench 实例
在本部分中,您将创建一个 Vertex AI Workbench 实例。然后,您将连接到该代码库、克隆 GitHub 代码库并运行笔记本。
如需创建 Vertex AI Workbench 实例,您可以按照相关说明操作,也可以按照以下说明操作。
- 转到代管式笔记本控制台页面。
- 点击新建笔记本。
- 提供名称并选择区域,例如 us-central1(爱荷华)。理想情况下,此区域应与此 Codelab 前面选择的区域相匹配,但并非强制性要求。
- 在权限下方,选择仅限单个用户。
- 打开高级设置下拉菜单。
- 在安全性下,选择启用 nbconvert,然后选择启用终端。
- 点击创建。
该实例应该会在大约五分钟内完成预配。实例准备就绪后,您会在笔记本名称旁边看到一个绿色对勾标记。
实例准备就绪后,点击打开 JUPYTERLAB。在系统提示您执行该操作时进行身份验证,并启用所有权限。
4. 在笔记本中使用 Spark ML 构建模型
JupyterLab 实例加载后,您将进入启动器标签页。在此标签页中,在 Other 下,点击 Terminal 以打开新终端。
在终端中,克隆 Vertex AI Samples 代码库。
git clone https://github.com/GoogleCloudPlatform/vertex-ai-samples.git
在文件浏览器标签页中,前往 vertex-ai-samples/notebooks/official/workbench/spark。双击笔记本 spark_ml.ipynb 将其打开。当系统提示您选择内核时,请选择 Python (local)。
请在操作过程中执行每个单元,了解笔记本的各个步骤。按照单元格中的说明进行操作。