博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
rdd的元素打印
阅读量:4929 次
发布时间:2019-06-11

本文共 227 字,大约阅读时间需要 1 分钟。

在集群上运行spark程序时,rdd的操作都在worker机上,因此输出rdd的元素将在worker机的标准输出上进行,驱动节点上不会运行,故直接才程序中写如下代码

 rdd.foreach(println(_))

并不能产生期望的结果。此时应该先收集数据,再进行打印,即可得到预期结果

 rdd.collect().foreach(println(_))

转载于:https://www.cnblogs.com/timlong/p/9939460.html

你可能感兴趣的文章
[APIO2015]巴厘岛的雕塑
查看>>
使用Code First模式开发如何更新数据库(转载)
查看>>
Mybatis实例增删改查(二)
查看>>
android:inputType参数类型说明
查看>>
使用泛型迭代Map集合
查看>>
Cut 'em all! CodeForces - 982C(贪心dfs)
查看>>
sqoop导出工具
查看>>
Codeforces Round #376 (Div. 2)
查看>>
Codeforces 607D Power Tree 线段树 (看题解)
查看>>
【LeetCode 33】Search in Rotated Sorted Array
查看>>
Promise超时情况
查看>>
IndexOf、IndexOfAny 、Remove
查看>>
转载-asp.net id 和name的区别
查看>>
sqlsever 科学计数法e 问题
查看>>
F问题3-7:以太网使用载波监听多点接入碰撞检测协议CSMA/CD。频分复用FDM才使用载波。以太网有没有使用频分复用?...
查看>>
2015年蓝桥杯省赛A组c++第1题
查看>>
解决CentOS缺少共享库
查看>>
写在人生的路上——2016年上半年总结
查看>>
解决okHttp使用https抛出stream was reset: PROTOCOL_ERROR的问题
查看>>
(linux自学笔记)linux驱动并发控制、阻塞/非阻塞IO、异步通知
查看>>