Apache Spark-ERROR RetryingBlockFetcher：开始获取1个未完成块时出现异常

提问者：小点点

Apache Spark-ERROR RetryingBlockFetcher：开始获取1个未完成块时出现异常

我正在使用以下配置在集群中运行Spark Job：

--master yarn --deploy-mode client
--executor-memory 4g 
--executor-cores 2 
--driver-memory 6g 
--num-executors 12

当我在驱动程序中采集数据样本时，问题发生在作业中。运行的命令如下：

rddTuplesA.sample(false, 0.03, 261).collect().forEach((tuple) ->
                    //build histogram...
            );

rddTuplesA对象是JavaRDD

作业抛出以下错误：

然而，当我得到一个较小的样本时，这项工作非常完美。

rddTuplesA.sample(false, 0.01, 261).collect().forEach((tuple) ->
                        //build histogram...
                );

是否有任何配置参数需要更改以使作业运行？看来问题与网络有关。此外，如果这是由于内存问题而发生的，那么Driver上不会出现与内存相关的错误吗？类似于：

java. lang.OutOfMemoryError：超过GC开销限制




             共1个答案


                        

                
                    匿名用户

                




                
					
终于解开了谜团。这个问题与集群网络有关。具体来说，我在每台机器（节点）的 /etc/hosts文件中添加了它们的本地ip映射到它们的主机名（作为别名），如下所示：
192.168.0.1 snf-1234
192.168.0.2 snf-1235
...
看起来，当样本很大时，驱动程序试图建立一个由于ipv4和主机名之间缺少匹配而无法实现的连接。


		      
                相关问题
                

																                
					
										   线程“main”java. lang.NoClassDefFoundError中的异常：org/apache/log4j/ProvisionNode
										   log4j2 java. lang.NoClassDefFoundError：org/apache/log/log4j/LogManager
										   在Angular中获取路由参数的有效方法
										   获取API获取415不支持的媒体类型使用POST
										   获取x86-64指令的大小
										   jpack构建的MacOS应用启动器未完成启动
										   线程“main”java. lang.NoClassDefFoundError中的异常：org/apache/Commons/csv/CSVFormat
										   运行为Groovy脚本时的NoClassDefFoundError… org/apache/Commons/cli/Command dLineParser
										   线程“main”java. lang.NoClassDefFoundError中的异常：org/apache/log4j/LogManager[重复]
										   如何从mongoDB查询中获取表结果
										   ApacheHTTP客户端每个请求4.3个凭据
										   使用启用缓存的Apache HttpClient作为泽西2客户端
										   如何在Apache httpclient下面使用jersey-client？
										   我们可以将jersey客户端用于Apache CXF网络服务吗？
										   泽西-客户端安全和Apache HttpClient
										   Apache HttpClient连接管理
										   如果锁可以动态获取，强制锁排序并不能保证防止死锁。这是什么意思？
										   无法保证锁的获取顺序时避免死锁
										   “获取”和“消耗”内存顺序如何不同，什么时候“消耗”更可取？
										   JavaFX：按行和列获取节点

Apache Spark-ERROR RetryingBlockFetcher：开始获取1个未完成块时出现异常

共1个答案

相关问题

热门标签

微信关注