为什么Hadoop Mapper对数据进行排序？

提问者：小点点

为什么Hadoop Mapper对数据进行排序？

我意识到的是，创建一个键排序列表发送到减速器是映射器的主要目标。然后，如果列表非常大，它需要在映射器中分区，以便它可以由减速器处理（我的意思是对于一个唯一的键，值列表是巨大的，那么它需要被分区），但是为什么hadoop需要在映射器中对键进行排序呢？有人问我这个问题，我不能完全说服他。我只是一个初学者，有点好奇。任何帮助都很感激。

共1个答案

匿名用户

排序发生在映射器阶段之后和执行还原器作业之前，您不需要显式执行。

请参考类似的问题

相关问题

JavaHashMap内部数据结构在重新散列期间如何变化？
共享可观察数据的正确方式和地点是什么
RxJava：防止一个可观察对象发射，直到另一个可观察对象的数据被发射
Angular2/4：实时刷新数据
Visual C关系运算符重载const正确性（使用std::排序）
是否对参与部分排序的类型进行实例化
部分排序时，成员函数模板的原始类型是什么
类模板特化部分排序和功能合成
如果锁可以动态获取，强制锁排序并不能保证防止死锁。这是什么意思？
如何使用selenium WebDrive（java）抓取表中的数据？
ggplot：子集使用管道传递数据的层
如何在R中读取utf-8格式的数据？
如何在PHP中通过ODBC为普适数据库设置编码？
Apache FOP使用Service中的数据进行PDF
重新排序消息-Artemis
AMQ214013：解码数据包失败：java. lang.IllegalArgumentException：AMQ119032：无效类型：1
关于开源项目的不同数据记录
获取数据帧结果中的未知字符
从谷歌文档获取数据。， read.csv，readLines和编码
将数据帧转换为强类型数据集？

为什么Hadoop Mapper对数据进行排序？

共1个答案

相关问题

热门标签

微信关注