Estamos inmersos en una revolución de datos que está transformando la manera en que algunas empresas desarrollan sus negocios. De un tiempo a esta parte, los datos han empezado a ser abundantes, rápidos y baratos. Sin embargo, esta revolución no tiene que ver únicamente con el asombroso ritmo al que generamos esta información, sino con las nuevas tecnologías que cambian la forma en que la producimos, recopilamos, procesamos, almacenamos y analizamos.
Con la creación de nuevos flujos de datos todos los días, y con la Industria 4.0 y el "internet de las cosas", cobra cada vez más importancia la idea de adoptar un enfoque estratégico para el llamado Big Data. Convertir números e información en conocimientos prácticos es un factor clave. De hecho, las empresas pueden obtener una ventaja competitiva al tener acceso instantáneo a sus datos y al analizarlos, comprenderlos y administrarlos en tiempo real. Tanto los Macrodatos (Big Data) como la tecnología de transmisión de los mismos, juegan un papel fundamental en la consecución de estos objetivos.
¿Qué es la transmisión de datos?
Los dispositivos, sensores y sistemas interconectados generan continuamente enormes cantidades de datos. Al utilizar la tecnología de transmisión de datos, es posible recopilarlos aunque provengan de diversas fuentes e integrarlos en una sola plataforma.
Para comprender el funcionamiento, es importante entender la diferencia entre el procesamiento por lotes y el procesamiento de transmisión de datos. El procesamiento por lotes es una forma eficiente de manejar grandes volúmenes de datos, pero no es adecuado para manejar datos mientras aún se están generando. La transmisión de datos, por el contrario, permite procesar y analizar los números y la información en tiempo real y obtener resultados inmediatos.
Transmisión de datos en Porsche
El reciente aumento de la transmisión de datos ha abierto nuevas posibilidades para el análisis en tiempo real. En Porsche, las tecnologías de transmisión de datos se utilizan cada vez más en diferentes áreas, entre otras, fabricación, ventas, garantía, cadena de suministro, vehículos conectados y estaciones de carga. Si tomamos como ejemplo el Porsche Taycan, sus numerosos sensores escanean continuamente el entorno del vehículo. Gracias a la tecnología de transmisión de datos, este automóvil conectado es capaz de procesar la información proporcionada por los sensores y ayudar al conductor en tiempo real.
Los datos recopilados a bordo en un automóvil moderno se pueden clasificar como datos de comportamiento o de diagnóstico:
- Los datos de comportamiento son generados como respuesta al uso del vehículo por parte del conductor. Por ejemplo, la información relativa a la velocidad, la dirección, la frenada o la eficiencia de conducción se transmiten a un sistema central seguro y protegido. Del resultado de analizar todo esto, los algoritmos de aprendizaje automático pueden determinar si el conductor tiene fatiga y emitir una alerta de aviso.
- Los datos de diagnóstico son el resultado de la capacidad de acceder a la información de un vehículo; esto podría, por ejemplo, permitir a los fabricantes evaluar el estado de un auto y notificar al usuario cuando se requiere un servicio de mantenimiento.
Como Gestor de Plataformas de Transmisión de Datos en Porsche, además de definir una estrategia, mi trabajo ha sido construir y desarrollar una solución central de transmisión de datos altamente disponible y segura, a la que llamamos Streamzilla.
Streamzilla: una ventana única para la transmisión de datos
Streamzilla aspira a ser un elemento central para cubrir todas las necesidades de transmisión de datos dentro de Porsche. Es un servicio administrado internamente, que permite a diferentes equipos de ingeniería de producto crear y ejecutar aplicaciones que aprovechan las capacidades de baja latencia, alto rendimiento y tolerancia del sistema Apache Kafka. También se utiliza Apache NiFi para automatizar y administrar el flujo de datos entre sistemas. Ambas son plataformas de código abierto altamente escalables, que permiten canalizaciones y aplicaciones de transmisión de datos en tiempo real.
¿Por qué necesitamos Streamzilla?
Con Streamzilla, los equipos de Porsche pueden utilizar las interfaces de programación de aplicaciones (API) nativas, Apache Kafka y Apache NiFi, para crear lagos de datos, transmitir cambios hacia y desde bases de datos y potenciar el aprendizaje automático y las aplicaciones de análisis.
Apache Kafka y Apache NiFi son difíciles de configurar, escalar y administrar en producción. Cuando los equipos individuales ejecutan estos complejos sistemas por su cuenta, necesitan hacer uso de servidores, configurar manualmente una tecnología de código abierto, reemplazar los servidores cuando fallan, gestionar las actualizaciones, garantizar que el almacenamiento de datos sea seguro y duradero, configurar la monitorización y las alarmas y planificar cuidadosamente posibles cambios en la escala de datos soportados.
Streamzilla hace que sea fácil para nuestros equipos de ingeniería ejecutar aplicaciones de producción sin necesidad de contar con experiencia en administración de infraestructura de código abierto. Esto significa que pueden dedicar más tiempo a afinar los automóviles, con mejoras en la navegación a tiempo real, la eficiencia de conducción, el mantenimiento predictivo, la conectividad o los sistemas de asistencia. Y, lo más importante, significa que en la marca pueden dedicarse a alcanzar el más importante de todos los objetivos: poner una sonrisa en los rostros de sus clientes cuando conducen un Porsche.
Información
Autor: Sridhar Mamella, Gestor de Plataformas de Transmisión de Datos en Porsche.