Notasbit

Las mejores noticias de tecnología en un sólo lugar

Publicado por: Software Gurú

Publicado en: 07/04/2021 13:36

Escrito por: Ivett Sanchez

Taller: Paso a paso para nuestro primer pipeline con Apache Beam y Dataflow

Taller: Paso a paso para nuestro primer pipeline con Apache Beam y Dataflow

Taller: Paso a paso para nuestro primer pipeline con Apache Beam y Dataflow

Evento

Data Day(s) Virtual 2021

Ivett Sanchez
Wed, 04/07/2021 - 13:36

Conferencista(s)

Israel Herraiz


Apache Beam es un SDK para pipelines de datos, en streaming y batch, que soporta varios lenguajes de programación, y diferentes plataformas para ejecutar los pipelines (Dataflow, Flink, Spark, etc). La gran ventaja de Beam es que una vez escrito el pipeline, se puede ejecutar en cualquier plataforma.

Conoce como usar Python para escribir un pipeline de proceso de datos en batch, ejecutandolo en local, y en Dataflow. Para terminar, veremos qué cambios serían necesarios para aprovechar el código que vamos a escribir para transformar ese mismo pipeline para trabajar en streaming.




Fecha de sesión
Wed, 04/07/2021 - 12:00

Top noticias del 7 de Abril de 2021