Streams in Java 8
Bài đăng này đã không được cập nhật trong 3 năm
Streams là một bổ sung mới trong thư viện Collections API của Java 8. Streams là cách thức mới để xử lý tập hợp dữ liệu - Collections data bên cạnh các cách thức thông thường là vòng lặp - for, bộ lặp - iterator.
Stream trong Java 8 có hai chế độ là tuần tự - sequential, và song song - parallel.
Sequaltial Stream
Tạo Stream từ List như thế nào?
Rất đơn giản, ta chỉ việc gọi hàm stream() giống như gọi hàm iterator() khi tạo bộ lặp Iterator.
List<String> items = new ArrayList<String>();
items.add("one");
items.add("two");
items.add("three");
items.add("fore");
items.add("five");
Stream<String> stream = items.stream();
Các phase xử lý của Stream
Stream xử lý các phần tử của tập hợp theo 2 bước.
- Cấu hình - configuration
- Xử lý - processing
Cấu hình gồm một tác vụ hoặc cả hai là filter và map. Trong quá trình cấu hình thì không có phần tử tập hợp nào thực sự bị tác động, chúng chỉ thực sự được xử lý khi quá trình xử lý thực hiện, tức là phương thức xử lý được gọi.
Phương thức cấu hình của Stream
Stream.filter()
Chúng ta lọc các phần tử của tập hợp bằng cách gọi phương thức filter()
của Stream.
stream.filter(item -> item.startsWith("t");
Khi phương thức filter()
được gọi thì chỉ có tham số của bộ lọc được khởi tạo, còn việc lọc (filter) chưc được thực hiện, tức là danh sách trả về nếu có chưa được tạo ra.
Stream.map()
Là phương thức mạnh hỗ trợ việc map từng phần tử của danh sách với đối tượng khác.
items.stream().map(item -> item.toUperCase());
Cũng giống filter, lúc này chỉ có việc cấu hình cho việc mapping được được hiện chứ việc map chưa diễn ra chừng nào phương thức xử lý chưa được gọi.
Phương thức xử lý của Stream
Stream.collect()
Phương thức collect()
làm một trong những phương thức xử lý tiêu biểu của interface Stream. Khi phương thức này được gọi thì việc filter hay mapping ở hai ví dụ trên mới thực sự được thực hiện.
List<String> filtereds = items.stream()
.filter( item -> item.startsWith("t") )
.collect(Collectors.toList());
// filtereds = ("two","three")
List<String> mappeds = items.stream()
.map( item -> item.toUpperCase())
.collect(Collectors.toList());
// mappeds = ("ONE", "TWO", "THREE", "FORE", "FIVE")
Stream.count()
Phương thức count()
là phương thức xử lý của Stream. Ở ví dụ sau nó trả về số lượng phần tử khi thực hiện filter của stream collection.
long countNum = items.stream()
.filter(item -> item.startsWith("f"))
.count();
// countNum = 2
Stream.reduce()
Phương thức reduce()
là phương thức xử lý nó giúp làm giảm các phần tử của stream về một giá trị đơn lẻ.
String reduceds = items.stream()
.reduce((acc, item) -> acc + " " + item)
.get();
// reduceds = "one two three fore five"
Nếu stream không có phần tử nào thì phương thức get()
sẽ throw exception NoSuchElementException.
Parallel Stream
Là dạng thức song song của Stream. Tức là nó chia các phần tử của Stream thành nhiều khối, xử lý giống nhau trên từng khối phần tử ấy rồi xử lý một lần cuối với kết quả xử lý của từng khối hợp lại.
Ta xét một ví dụ đơn giản là thực hiện tính tổng giá trị các phần tử của một danh sách gồm 9 phần tử.
List<Integer> ints = new ArrayList<Integer>(1,2,4,5,6,7,8,9);
Integer total = ints.parallelStream()
.reduce(0, Integer::sum);
Kết luận
- Streams là một Collections API mới của Java 8 hỗ trợ xử lý dữ liệu dạng collection.
- Điểm mạnh của Streams so với bộ lặp là nó được thiết kế làm việc với lambda nên cú pháp ngắn gọn. Với parallenStream thì tăng tốc độ xý đối với những tập hợp dữ liệu lớn.
Tài liệu tham khảo
- Tutorial Jenkov
- Oracle Architect streams part2
- Ebook Java 8 in Action.
All rights reserved