引言
java 8已经发行好几年了,前段时间java 12也已经问世,但平时的工作中,很多项目的环境还停留在java1.7中。而且java8的很多新特性都是革命性的,比如各种集合的优化、lambda表达式等,所以我们还是要去了解java8的魅力。 今天我们来学习java8的Stream,并不需要理论基础,直接可以上手去用。 我接触stream的原因,是我要搞一个用户收入消费的数据分析。起初的统计筛选分组都是打算用sql语言直接从mysql里得到结果来展现的。但在操作中我们发现这样频繁地访问数据库,性能会受到很大的影响,分析速度会很慢。所以我们希望能通过访问一次数据库就拿到所有数据,然后放到内存中去进行数据分析统计过滤。 一. Stream理解 在java中我们称Stream为『流』,我们经常会用流去对集合进行一些流水线的操作。stream就像工厂一样,只需要把集合、命令还有一些参数灌输到流水线中去,就可以加工成得出想要的结果。这样的流水线能大大简洁代码,减少操作。 二. Stream流程 原集合 —> 流 —> 各种操作(过滤、分组、统计) —> 终端操作Stream流的操作流程一般都是这样的,先将集合转为流,然后经过各种操作,比如过滤、筛选、分组、计算。最后的终端操作,就是转换成我们想要的数据,这个数据的格式一般还是集合,有事也会按照需求输出count计数。下文会意义举例。 三. API功能举例 首先,定义一个用户对象,包含姓名、年龄、性别和籍贯四个成员变量: [Java] 纯文本查看 复制代码 import lombok.AllArgsConstructor;
import lombok.Builder;
import lombok.Data;
import lombok.NoArgsConstructor;
import lombok.extern.log4j.Log4j;
@Data
@NoArgsConstructor
@AllArgsConstructor
@Log4j
@Builder
public class User {
//姓名
private String name;
//年龄
private Integer age;
//性别
private Integer sex;
//所在省市
private String address;
} 这里用lombok简化了实体类的代码。 然后创建需要的集合数据,也就是源数据: [Java] 纯文本查看 复制代码 //1.构建我们的list
List<User> list= Arrays.asList(
new User("钢铁侠",40,0,"华盛顿"),
new User("蜘蛛侠",20,0,"华盛顿"),
new User("赵丽颖",30,1,"湖北武汉市"),
new User("詹姆斯",35,0,"洛杉矶"),
new User("李世民",60,0,"山西省太原市"),
new User("蔡徐坤",20,1,"陕西西安市"),
new User("葫芦娃的爷爷",70,0,"山西省太原市")
); 3.1 过滤1)创建流 stream() / parallelStream()- stream() : 串行流
- parallelStream(): 并行流
2)filter 过滤(T-> boolean)比如要过滤年龄在40岁以上的用户,就可以这样写: [Java] 纯文本查看 复制代码 List<User> filterList = list.stream().filter(user -> user.getAge() >= 40)
.collect(toList()); filter里面,->箭头后面跟着的是一个boolean值,可以写任何的过滤条件,就相当于sql中where后面的东西,换句话说,能用sql实现的功能这里都可以实现 打印结果: 3)distinct 去重和sql中的distinct关键字很相似。为了看到效果,此处在原集合中加入一个重复的人,就选择钢铁侠吧,复联4钢铁侠不幸遇害,大家还是比较伤心的。 [Java] 纯文本查看 复制代码 List<User> list= Arrays.asList(
new User("钢铁侠",40,0,"华盛顿"),
new User("钢铁侠",40,0,"华盛顿"),
new User("蜘蛛侠",20,0,"华盛顿"),
new User("赵丽颖",30,1,"湖北武汉市"),
new User("詹姆斯",35,0,"洛杉矶"),
new User("李世民",60,0,"山西省太原市"),
new User("蔡徐坤”,18,1,"陕西西安市"),
new User("葫芦娃的爷爷",70,0,"山西省太原市")
); [Java] 纯文本查看 复制代码 //distinct 去重
List<User> distinctList = filterList.stream().distinct()
.collect(toList()); 打印结果: 4)sorted排序如果流中的元素的类实现了 Comparable 接口,即有自己的排序规则,那么可以直接调用 sorted() 方法对元素进行排序,如: [Java] 纯文本查看 复制代码 Comparator.comparingInt 反之, 需要调用 sorted((T, T) -> int) 实现 Comparator 接口。 [Java] 纯文本查看 复制代码 //sorted()
List<User> sortedList = distinctList.stream().sorted(Comparator.comparingInt(User::getAge))
.collect(toList()); 打印结果: 结果按照年龄从小到大进行排序。 5)limit() 返回前n个元素如果想知道这里面年龄最小的是谁,可作如下操作: [Java] 纯文本查看 复制代码 //limit 返回前n个元素
List<User> limitList = sortedList.stream().limit(1)
.collect(toList()); 6)skip()与limit恰恰相反,skip的意思是跳过,也就是去除前n个元素。 打印结果: 果然,前两个人都被去除了,只剩下最老的葫芦娃爷爷。 3.2 映射1)map(T->R)map是将T类型的数据转为R类型的数据,比如我们想要设置一个新的list,存储用户所有的城市信息。 [Java] 纯文本查看 复制代码 //map(T->R)
List<String> cityList = list.stream().map(User::getAddress).distinct().collect(toList()); 打印结果: 2)flatMap(T -> Stream<R>)将流中的每一个元素 T 映射为一个流,再把每一个流连接成为一个流。 [Java] 纯文本查看 复制代码 //flatMap(T -> Stream<R>)
List<String> flatList = new ArrayList<>();
flatList.add("唱,跳");
flatList.add("rape,篮球,music");
flatList = flatList.stream().map(s -> s.split(",")).flatMap(Arrays::stream).collect(toList()); 打印结果: 这里原集合中的数据由逗号分割,使用split进行拆分后,得到的是Stream<String[]>,字符串数组组成的流,要使用flatMap的 [Java] 纯文本查看 复制代码 Arrays::stream 将Stream<String[]>转为Stream<String>,然后把流相连接,组成了完整的唱、跳、rap、篮球和music。 3.3 查找1)allMatch(T->boolean)检测是否全部满足参数行为,假如这些用户是网吧上网的用户名单,那就需要检查是不是每个人都年满18周岁了。 [Java] 纯文本查看 复制代码 boolean isAdult = list.stream().allMatch(user -> user.getAge() >= 18); 打印结果: 2)anyMatch(T->boolean)检测是否有任意元素满足给定的条件,比如,想知道同学名单里是否有女生。 [Java] 纯文本查看 复制代码 //anyMatch(T -> boolean) 是否有任意一个元素满足给定的条件
boolean isGirl = list.stream().anyMatch(user -> user.getSex() == 1); 打印结果: 说明集合中有女生存在。 3)noneMatch(T -> boolean)流中是否有元素匹配给定的 T -> boolean 条件。 比如检测有没有来自巴黎的用户。 [Java] 纯文本查看 复制代码 boolean isLSJ = list.stream().noneMatch(user -> user.getAddress().contains("巴黎")); 打印结果: 打印true说明没有巴黎的用户。 4)findFirst( ):找到第一个元素
[Java] 纯文本查看 复制代码 Optional<User> fristUser = list.stream().findFirst();
打印结果:
[Java] 纯文本查看 复制代码 User(name=钢铁侠, age=40, sex=0, address=华盛顿)
5)findAny():找到任意一个元素
[Java] 纯文本查看 复制代码 Optional<User> anyUser = list.stream().findAny();
打印结果:
[Java] 纯文本查看 复制代码 User(name=钢铁侠, age=40, sex=0, address=华盛顿)
这里我们发现findAny返回的也总是第一个元素,那么为什么还要进行区分呢?因为在并行流 parallelStream() 中找到的确实是任意一个元素。
[Java] 纯文本查看 复制代码 Optional<User> anyParallelUser = list.parallelStream().findAny();
打印结果 :
[Java] 纯文本查看 复制代码 Optional[User(name=李世民, age=60, sex=0, address=山西省太原市)]
3.4 归纳计算1)求用户的总人数
[Java] 纯文本查看 复制代码 long count = list.stream().collect(Collectors.counting());
我们可以简写为:
[Java] 纯文本查看 复制代码 long count = list.stream().count();
运行结果:
2)得到某一属性的最大最小值
[Java] 纯文本查看 复制代码 // 求最大年龄
Optional<User> max = list.stream().collect(Collectors.maxBy(
Comparator.comparing(User::getAge)));
// 求最小年龄
Optional<User> min = list.stream().collect(Collectors.minBy(
Comparator.comparing(User::getAge)));
运行结果:
3)求年龄总和是多少
[Java] 纯文本查看 复制代码 // 求年龄总和
int totalAge = list.stream().collect(Collectors.summingInt(User::getAge));
运行结果:
我们经常会用BigDecimal来记录金钱,假设想得到BigDecimal的总和:
[Java] 纯文本查看 复制代码 // 获得列表对象金额, 使用reduce聚合函数,实现累加器
BigDecimal sum = myList.stream() .map(User::getMoney)
.reduce(BigDecimal.ZERO,BigDecimal::add);
4)求年龄平均值
[Java] 纯文本查看 复制代码 //求年龄平均值
double avgAge = list.stream().collect(
Collectors.averagingInt(User::getAge));
运行结果:
39.125
5)一次性得到元素的个数、总和、最大值、最小值
[Java] 纯文本查看 复制代码 IntSummaryStatistics statistics = list.stream().collect(
Collectors.summarizingInt(User::getAge));
运行结果:
|