为什么将Mapper和Reducer类声明为静态?


问题内容

这可能表明我缺乏Java理解,但是我想知道为什么在大多数MapReduce程序中,映射器和reducer类都声明为静态的?


问题答案:

当将mapper和reducer类声明为另一个类的内部类时,必须将它们声明为静态的,以便它们不依赖于父类。

Hadoop使用反射为每个映射创建该类的实例或减少运行的任务。创建的新实例需要一个零参数构造函数(否则它将如何知道要传递的内容)。

通过声明内部映射器或reduce类而不使用static关键字,java编译器实际上创建了一个构造函数,该构造函数希望在构造时传递父类的实例。

通过对生成的类文件运行javap命令,您应该能够看到此信息

另外,当在父类声明中使用static关键字时无效(这就是为什么您永远不会在顶级看到它,而仅在子类中看到它的原因)