Spark 1.0 开发环境构建：maven/sbt/idea

410次阅读

共计 3020 个字符，预计需要花费 8 分钟才能阅读完成。

因为我原来对 maven 和 sbt 都不熟悉，因此使用两种方法都编译了一下。下面记录一下编译时候遇到的问题。然后介绍一下如果使用 IntelliJ IDEA 13.1 构建开发环境。

首先准备 Java 环境和 scala 环境：

1. jdk 1.7

2. scala 2.11.1

首先安装 maven，我安装的是 3.2.3，可以直接下载 binary。解压即可用。需要设置一下环境变量：

export MAVEN_HOME=/project/spark_maven/spark/apache-maven-3.2.3
export MAVEN_OPTS="-Xmx4096m -XX:MaxPermSize=4096m"
export PATH=$PATH:$MAVEN_HOME/bin

由于我的笔记本有 16G 内存，因此可以给 maven 比较大的内存。如果 MAVEN_OPTS 设置的不合理，那么会导致 OOM 的错误，具体信息可以看这里。

使用以下命令编译：

mvn -X -Pyarn -PHadoop-2.2 -Dhadoop.version=2.2.0 -DskipTests clean package

这里使用的是 Apache Hadoop 2.2，如果使用比如其他的商业发行版，可以参照官网的信息去编译。

————————————– 分割线 ————————————–

Spark1.0.0 部署指南 http://www.linuxidc.com/Linux/2014-07/104304.htm

CentOS 6.2(64 位) 下安装 Spark0.8.0 详细记录 http://www.linuxidc.com/Linux/2014-06/102583.htm

Spark 简介及其在 Ubuntu 下的安装使用 http://www.linuxidc.com/Linux/2013-08/88606.htm

安装 Spark 集群 (在 CentOS 上) http://www.linuxidc.com/Linux/2013-08/88599.htm

Hadoop vs Spark 性能对比 http://www.linuxidc.com/Linux/2013-08/88597.htm

Spark 安装与学习 http://www.linuxidc.com/Linux/2013-08/88596.htm

Spark 并行计算模型 http://www.linuxidc.com/Linux/2012-12/76490.htm

————————————– 分割线 ————————————–

等待一段时间，如果没有 error 的话，恭喜你编译成功。下面是编译成功的结果：

sbt 编译过程比较慢。如果运行 sbt 说 sbt-launch.jar 的错误，那么需要手动的安装以下，可以看这里。

实际上使用以下命令既可以开始编译了：

./sbt/sbt assembly

有时候由于网络问题可能导致编译 hang 在某个地方，或者你重启了，那么下次开始变异前需要删除 $HOME/.ivy2/

.sbt.ivy.lock

。然后重启开始。sbt 会进行增量编译。

将 sbt 导入 idea，先做以下准备工作：

./sbt/sbt gen-idea

如果发生了错误，再次进行。现在应该不需要设置代理即可完成了。如果要等待 lock，那么参照上述的方法删除 lock 即可。

然后打开 IDEA，点击 Import Project：

Spark 1.0 开发环境构建：maven/sbt/idea

选择工程的默认路径后，选择 SBT Project

Spark 1.0 开发环境构建：maven/sbt/idea

选择 auto 即可：

Spark 1.0 开发环境构建：maven/sbt/idea

点击 Finish 即完成了工程的导入。

下面可以使用 IDEA 编译以下整个工程：

Spark 1.0 开发环境构建：maven/sbt/idea

command + B：跳到变量 / 函数定义处。

command + N：查找类

command + Shift + N：查找文件

Spark 的详细介绍 ：请点这里
Spark 的下载地址 ：请点这里

因为我原来对 maven 和 sbt 都不熟悉，因此使用两种方法都编译了一下。下面记录一下编译时候遇到的问题。然后介绍一下如果使用 IntelliJ IDEA 13.1 构建开发环境。

首先准备 Java 环境和 scala 环境：

1. jdk 1.7

2. scala 2.11.1

首先安装 maven，我安装的是 3.2.3，可以直接下载 binary。解压即可用。需要设置一下环境变量：

export MAVEN_HOME=/project/spark_maven/spark/apache-maven-3.2.3
export MAVEN_OPTS="-Xmx4096m -XX:MaxPermSize=4096m"
export PATH=$PATH:$MAVEN_HOME/bin

由于我的笔记本有 16G 内存，因此可以给 maven 比较大的内存。如果 MAVEN_OPTS 设置的不合理，那么会导致 OOM 的错误，具体信息可以看这里。

使用以下命令编译：

mvn -X -Pyarn -PHadoop-2.2 -Dhadoop.version=2.2.0 -DskipTests clean package

这里使用的是 Apache Hadoop 2.2，如果使用比如其他的商业发行版，可以参照官网的信息去编译。

————————————– 分割线 ————————————–

Spark1.0.0 部署指南 http://www.linuxidc.com/Linux/2014-07/104304.htm

CentOS 6.2(64 位) 下安装 Spark0.8.0 详细记录 http://www.linuxidc.com/Linux/2014-06/102583.htm

Spark 简介及其在 Ubuntu 下的安装使用 http://www.linuxidc.com/Linux/2013-08/88606.htm

安装 Spark 集群 (在 CentOS 上) http://www.linuxidc.com/Linux/2013-08/88599.htm

Hadoop vs Spark 性能对比 http://www.linuxidc.com/Linux/2013-08/88597.htm

Spark 安装与学习 http://www.linuxidc.com/Linux/2013-08/88596.htm

Spark 并行计算模型 http://www.linuxidc.com/Linux/2012-12/76490.htm

————————————– 分割线 ————————————–

等待一段时间，如果没有 error 的话，恭喜你编译成功。下面是编译成功的结果：

sbt 编译过程比较慢。如果运行 sbt 说 sbt-launch.jar 的错误，那么需要手动的安装以下，可以看这里。

实际上使用以下命令既可以开始编译了：

./sbt/sbt assembly

有时候由于网络问题可能导致编译 hang 在某个地方，或者你重启了，那么下次开始变异前需要删除 $HOME/.ivy2/

.sbt.ivy.lock

。然后重启开始。sbt 会进行增量编译。

正文完

星哥玩云-微信公众号

发表至：服务器应用

2022年1月20日

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

登录Tomcat管理页面配置实例

Flume官方文档翻译——Flume 1.7.0 User Guide （unreleased version）

利用Nginx搭建HTTP访问的Git服务器

CentOS 7单机部署ELK

Nginx图片剪裁模块探究 http_image_filter_module

虚拟机如何访问Tomcat

RabbitMQ集群部署简述

从Linux telnet到Exchange邮件服务器来测试发送邮件

Sqoop1.4.4原生增量导入特性探秘

Spark 1.0 开发环境构建：maven/sbt/idea

1. maven

2. sbt

3. IDEA

4. IDEA 的常用快捷键：

1. maven

2. sbt

150元打造低成本NAS小钢炮，捡一块3865U工控板

星哥带你玩飞牛NAS-11：咪咕视频订阅部署全攻略

星哥带你玩飞牛 NAS-10：备份微信聊天记录、数据到你的NAS中!

星哥带你玩飞牛NAS-13：自动追番、订阅下载 + 刮削，动漫党彻底解放双手！

星哥带你玩飞牛NAS-14：解锁公网自由！Lucky功能工具安装使用保姆级教程

每年0.99刀，拿下你的第一个顶级域名，详细注册使用

星哥带你玩飞牛NAS-16：飞牛云NAS换桌面，fndesk图标管理神器上线！

300元就能买到的”小钢炮”？惠普7L四盘位小主机解析

Prometheus：监控系统的部署与指标收集

免费获得大模型的Api-Key的方法：英伟达提供GLM-4.7、Minimax M2.1模型和GitHub的AI大模型API申请

免费图片视频管理工具让灵感库告别混乱

告别Notion焦虑！这款全平台开源加密笔记神器，让你的隐私真正“上锁”

最新OpenClaw使用手册：安装、卸载命令、换大模型等，新手也能上手

安装并使用谷歌AI编程工具Antigravity（亲测有效）

告别付费漏扫！开源免费新手也能一键搞定漏洞扫描

快速实现25G永久存储！InfiniCloud网盘+Webdav搭建详解