Pycharm
 
获取 PyCharm

自定义 Spark 集群

最后修改时间:2023 年 12 月 1 日

Spark Submit 运行配置中,您可以使用 AWS EMR 或 Dataproc 作为远程服务器来运行应用程序。除了这两个选项之外,您还可以配置自己的自定义 Spark 集群:设置 SSH 配置以连接到远程服务器,并且可以选择配置与 Spark 历史记录服务器的连接和 SFTP 连接。

如果您已设置 Spark 历史记录和 SFTP 连接,则它们将在大数据工具工具窗口中的自定义 Spark 集群下可用。

选择 Spark 提交

您现在可以在Spark Submit 运行配置中选择该集群作为远程目标。当您启动此运行配置时,您将能够通过单击应用程序输出中的链接在“服务”工具窗口中打开 Spark 作业。