( aba 113 r 0 ;) { }: Java Streams

Hace ya bastante tiempo que JDK 8 está en la calle, pero muchas veces surgen dudas de las nuevas funcionalidades que podemos encontrarnos en cada nueva versión.

Sobre todo para aquellos desarrolladores y compañeros de profesión que solo ven nuevas versiones, como nuevas opciones que hacen funcionar las cosas por arte de magia, pero nada más lejos de la realidad.

Por tanto, dentro de este artículo vamos a analizar la funcionalidad del Stream API en Java 8. También veremos cómo crear y utilizar streams en acción. Y además la diferencia de rendimiento que se produce con su uso, algo que cuando hablamos en un mundo gobernado por millones de datos, se hace más que interesante.

Vamos!

Entorno

Para la realización del ejercicio se ha utilizado el siguiente entorno:

- Hardware: Portatil MSI Prestige 15 (Intel Core 11th Gen 4 CPU 3 GHz, 32 GB Ram)

- SO: Windows 11 Pro

- Entorno de desarollo: VSCode

- Wsl2 con Ubuntu 20.04.6 LTS (Focal Fossa)

- Java 17

- Maven 3.9.x

¿Qué son los Streams?

Como hemos comentado el API de Stream en Java se agregó en JDK 8 para proporcionar un enfoque funcional para procesar una colección de objetos. El Stream de Java no almacena datos y no es una estructura de datos. Además, el origen de datos subyacente no se modifica.

El Stream de Java utiliza interfaces funcionales y admite operaciones en estilo funcional en flujos de elementos mediante el uso de expresiones lambda.

Los Streams de Java 8 son un envoltorío alrededor de un origen de datos (Array, List, etc.) que nos permite operar con la fuente de datos y realizar un procesamiento en bloque de manera rápida y conveniente.

Es un flujo de datos que procesa los datos desde la fuente original y envía los datos procesados a la fuente de datos de destino.

Definición de la API

Configuración del entorno

Creamos un proyecto maven.

Para este objetivo sencillo usamos el propio arquetipo que nos proporciona Maven, descrito aqui:

Maven 5 min

Gist Maven

Para facilitarnos la vida a la hora de ejecutarlo, vamos a instalar el plugin de codehaus.mojo y Lombok.

De esta forma podremos ejecutarlo:

$ mvn exec:java

Manos la obra

Para no cansarnos antes de empezar, vamos a crear un Stream rápido y así podemos ver de qué estamos hablando.

Como podemos ver es algo sencillo, no deja de ser una colección de objetos. No almacenan info, la reserva de memoria se hace en el Array strArr, y las operaciones que ejecutes sobre el Stream no afectarán al origen de los datos.

Espera, ¿Operaciones? De qué estamos hablando ....

Operaciones

Las operaciones que tenemos para trabajar con Streams, las vamos a dividir en 2:

Intermediate operations. Aquellas que devuelven un new Stream. Son operaciones que son enviadas a la siguiente operacion normalmente. Ejemplos:

filter()
map()
flatMap()
distinct()
sorted()
peek()
limit()
skip()

Terminal operations. Aquellas que NO devuelven un new Stream. Son operaciones que una vez que las llamamos, el Stream se consume y por tanto no pueden ser enviadas a la siguiente operacion. Ejemplos:

toArray()
collect()
count()
reduce()
forEach()
forEachOrdered()
min()
max()
anyMatch()
allMatch()
noneMatch()
findAny()
findFirst()

Si lo vemos por código:

Creamos un Service para que nos devuelva 2 tipos de Streams diferentes:

Y ahora algunas operaciones para ver como se comporta:

Rendimiento

Hasta ahora nada nuevo que no hiciéramos antes con unas cuantas líneas más de código. Pero no creo que la gente que evoluciona un JDK piense solo en ahorrarnos 2 líneas de código, que también, sino que esto realmente ¿Será más óptimo?

Vamos a verlo

En un pensamiento clásico, podríamos creer que para filtrar un elemento, vamos a recorrer toda la lista, y desde ahí hacemos el filtrado y búsqueda.

Podemos ver, que usando PEEK, como operación que veíamos anteriormente, esto se ejecuta UNA sola vez. ¿Cómooooo? ¿No hemos recorrido la lista N veces? pues no, porque la primera iteración ya me cumple la condición.

Resumen

En una forma clásica, habríamos ejecutado la operación N veces. Al principio es difícil de entender pero básicamente los Streams diseñan un flujo de trabajo que se ejecuta de forma unitaria item a item, así que cuando cumplo la condición, simplemente paro, el flujo termina.

Como hemos podido repasar, las mejoras en las diferentes versiones, sean JDKs, Frameworks, etc ... debemos repasarlas, pero no por que sea más "moderno" sino porque traen mejoras, corrigen errores, mejoran el rendimiento etc.

Os dejo el repo en GitHub por si queréis ampliarlo:

https://github.com/jfcaballerop/Tutoriales-JavaStreams1.git

8 jun 2023

Java Streams - Parte I