潜在无限流的功能解压缩实现

提问者：小点点

潜在无限流的功能解压缩实现

我实现了函数式unzip（）操作，如下所示：

public static <T, U, V> Tuple2<Stream<U>, Stream<V>> unzip(
        Stream<T> stream, 
        Function<T, Tuple2<U, V>> unzipper) {

    return stream.map(unzipper)
        .reduce(new Tuple2<>(Stream.<U>empty(), Stream.<V>empty()),
            (unzipped, tuple) -> new Tuple2<>(
                Stream.concat(unzipped.$1(), Stream.of(tuple.$1())),
                Stream.concat(unzipped.$2(), Stream.of(tuple.$2()))),
            (unzipped1, unzipped2) -> new Tuple2<>(
                Stream.concat(unzipped1.$1(), unzipped2.$1()),
                Stream.concat(unzipped1.$2(), unzipped2.$2())));
}

这可以正常工作，因为输入流没有很多元素。这是因为访问深度连接流的元素可能会导致StackOverflow Exception。根据Stream. contat（）的文档：

实施说明：

从重复连接构造流时要小心。访问深度连接流的元素可能会导致深度调用链，甚至StackOverflow Exception。

对于少数元素，我的unzip实现有效。给定一个类Person：

class Person {

    public final String name;

    public final int age;

    Person(String name, int age) {
        this.name = name;
        this.age = age;
    }
}

如果我有一群人：

Stream<Person> people = Stream.of(
    new Person("Joe", 52), 
    new Person("Alan", 34), 
    new Person("Peter", 42));

我可以这样使用我的unzip（）实现：

Tuple2<Stream<String>, Stream<Integer>> result = StreamUtils.unzip(people, 
        person -> new Tuple2<>(person.name, person.age));

List<String> names = result.$1()
    .collect(Collectors.toList()); // ["Joe", "Alan", "Peter"]
List<Integer> ages = result.$2()
    .collect(Collectors.toList()); // [52, 34, 42]

这是正确的。

所以我的问题是：unzip（）有没有办法处理许多元素（可能是无限的）？

注意：为了完整起见，这是我的不可变Tuple2类：

public final class Tuple2<A, B> {

    private final A $1;

    private final B $2;

    public Tuple2(A $1, B $2) {
        this.$1 = $1;
        this.$2 = $2;
    }

    public A $1() {
        return $1;
    }

    public B $2() {
        return $2;
    }
}

共1个答案

匿名用户

您的解决方案不仅容易出现潜在的StackOverflow Error，而且远离处理潜在的无限流，即使StackOverflow Error的风险不存在。关键是，您正在构造一个流，但它是一个连接的单元素流的流，一个用于源流的每个元素。换句话说，在unzip方法返回时，您有一个完全物化的数据结构，它将消耗比收集到ArrayList或简单的toArray（）操作的结果更多的内存。

但是，当您想在之后执行收集时，支持潜在无限流的想法无论如何都是没有实际意义的，因为收集意味着在不短路的情况下处理所有元素。

一旦你放弃了支持无限流的想法，专注于收集操作，就有了一个更简单的解决方案。从这个解决方案中获取代码，用Tuple2替换Pair，并将累加器逻辑从“条件”更改为“两者”，我们得到：

public static <T, A1, A2, R1, R2> Collector<T, ?, Tuple2<R1,R2>> both(
    Collector<T, A1, R1> first, Collector<T, A2, R2> second) {

    Supplier<A1> s1=first.supplier();
    Supplier<A2> s2=second.supplier();
    BiConsumer<A1, T> a1=first.accumulator();
    BiConsumer<A2, T> a2=second.accumulator();
    BinaryOperator<A1> c1=first.combiner();
    BinaryOperator<A2> c2=second.combiner();
    Function<A1,R1> f1=first.finisher();
    Function<A2,R2> f2=second.finisher();
    return Collector.of(
        ()->new Tuple2<>(s1.get(), s2.get()),
        (p,t)->{ a1.accept(p.$1(), t); a2.accept(p.$2(), t); },
        (p1,p2)->new Tuple2<>(c1.apply(p1.$1(), p2.$1()), c2.apply(p1.$2(), p2.$2())),
        p -> new Tuple2<>(f1.apply(p.$1()), f2.apply(p.$2())));
}

这可以像

Tuple2<List<String>, List<Integer>> namesAndAges=
    Stream.of(new Person("Joe", 52), new Person("Alan", 34), new Person("Peter", 42))
        .collect(both(
            Collectors.mapping(p->p.name, Collectors.toList()),
            Collectors.mapping(p->p.age,  Collectors.toList())));
List<String> names = namesAndAges.$1(); // ["Joe", "Alan", "Peter"]
List<Integer> ages = namesAndAges.$2(); // [52, 34, 42]

链接答案的语句在这里也成立。您可以在收集器中作为流操作执行几乎所有可以表达的操作。

如果你想用一个函数更接近你的原始代码，从流元素映射到Tuple2，你可以像这样包装上面的解决方案

public static <T, T1, T2, A1, A2, R1, R2> Collector<T, ?, Tuple2<R1,R2>> both(
    Function<? super T, ? extends Tuple2<? extends T1, ? extends T2>> f,
    Collector<T1, A1, R1> first, Collector<T2, A2, R2> second) {

    return Collectors.mapping(f, both(
            Collectors.mapping(Tuple2::$1, first),
            Collectors.mapping(Tuple2::$2, second)));
}

并像

Tuple2<List<String>, List<Integer>> namesAndAges=
    Stream.of(new Person("Joe", 52), new Person("Alan", 34), new Person("Peter", 42))
        .collect(both(
            p -> new Tuple2<>(p.name, p.age), Collectors.toList(), Collectors.toList()));

您可能会认识函数p-

public static <T, U, V> Tuple2<Stream<U>, Stream<V>> unzip(
    Stream<T> stream,  Function<T, Tuple2<U, V>> unzipper) {

    return stream.map(unzipper)
        .collect(Collector.of(()->new Tuple2<>(Stream.<U>builder(), Stream.<V>builder()),
            (unzipped, tuple) -> {
                unzipped.$1().accept(tuple.$1()); unzipped.$2().accept(tuple.$2());
            },
            (unzipped1, unzipped2) -> {
                unzipped2.$1().build().forEachOrdered(unzipped1.$1());
                unzipped2.$2().build().forEachOrdered(unzipped1.$2());
                return unzipped1;
            },
            tuple -> new Tuple2<>(tuple.$1().build(), tuple.$2().build())
        ));
}

这可以作为您基于concat的解决方案的替代品。它还将完全存储流元素，但它将使用Stream. Builder，它针对增量填充和使用一次（在Stream操作中）的用例进行了优化。这甚至比收集到ArrayList中更有效（至少在参考实现中），因为它使用了一个“旋转缓冲区”，在增加容量时不需要复制。对于大小可能未知的流，这是最有效的解决方案（对于大小已知的流，toArray（）的性能会更好）。


		      
                相关问题
                

																                
					
										   如何在角单元测试退订功能
										   C 20概念需要运算符重载结合用户自定义模板运算符重载功能
										   取地址上下文中最专业的功能模板是哪个？
										   类模板特化部分排序和功能合成
										   Python-延迟后运行异步功能，不阻塞其他代码
										   与其他特定机器人在公会中时，不和谐机器人功能停止工作
										   在JAR中包含解压缩的资源-Maven
										   如何使用C#在Selenium WebDriver代码中指定ENTER按钮功能
										   JavaVisualVM缺少的功能
										   SpringIDE插件vs STS：3.3.0版本的功能比较
										   什么是libc？它包括哪些功能？我们如何获取它的源代码？
										   Quarkus CDI是否有一个功能，以类似于Guice的模块绑定的方式支持依赖解析？
										   带有ERROR“功能未实现”的fseek endup（ENOSYS）
										   点击功能在对话框中查看图像时出现此错误
										   Tomcat：获取要解压缩的WAR文件 
										   未找到功能渠道服务提供商。尝试添加对grpc-okhttp、grpc-netty或grpc-netty-shaded工件的依赖
										   为hadoop设计“映射器”和“还原器”函数的功能？
										   enpe-data和get功能挖掘异步模型不起作用
										   车把功能|助手或？
										   在TransformerFactory中设置功能访问ExternalDTD

潜在无限流的功能解压缩实现

共1个答案

相关问题

热门标签

微信关注