Compartir

Para ampliar la profundidad y amplitud de la gestión de datos dentro de un Apache™ Hadoop® data lake,  Teradata Corp. (NYSE:TDC), compañía de análisis de grandes datos y aplicaciones de marketing, lanzó el día de hoy Teradata Loom® 2.4. Esta solución incrementa drásticamente la productividad de data scientists and analysts ya que reduce el tiempo y esfuerzo necesarios para encontrar y utilizar los datos precisos para un análisis avanzado.

Es común que los data lakes estén saturados con cantidades masivas de datos no estructurados, ingobernables e inaccesibles”, dijo Scott Gnau, Presidente de Teradata Labs. “Teradata Loom aumenta la capacidad de los usuarios de negocio de maximizar el valor del data lake gracias a herramientas automatizadas que reducen la curva de aprendizaje, disminuyen la complejidad y aceleran la generación de grandes ideas. Los proyectos de Big Data Analytics ahora pueden desarrollarse en sólo unas horas en lugar de tomarse largos meses”, concluye.

Teradata Loom ahora ofrece linaje de datos, metadatos integrados y data wrangling para Java Script Obj0065ct Notation (JSON), el formato primario de datos para el Internet de las Cosas (loT por sus siglas en inglés), dispositivos móviles, sensores, y navegadores web. Además, Teradata Loom permite realizar consultas más ágilmente usando particiones para organizar mejor los datos en Apache™ Hive. Asimismo, se ha añadido soporte para formatos de datos internacionales para hacer más sencillo trabajar con datos sobre fechas y monedas.

Los data lake, por tanto, conllevan riesgos sustanciales. El más importante es la incapacidad para determinar la calidad o el linaje de los datos resultados de los hallazgos que realizan otros analistas o usuarios que hayan encontrado previamente algún valor utilizando los mismos datos en el date lake. Por su definición, un data lake acepta cualquier dato, sin supervisión o gobierno. Sin un metadato descriptivo y un mecanismo para mantenerlo, existe peligro de convertirse en un conjunto de datos sin control. Y sin metadatos, cualquier uso posterior de los mismos supone que los analistas tengan que empezar desde cero“, según señala Gartner.

14_teradata

Sin una herramienta inteligente de gestión de datos, las organizaciones pierden mucho tiempo en averiguar la ubicación de sus datos, el tipo de datos almacenados, su formato, el contenido y la forma en que se preparan para su análisis. Así, es casi imposible mantener el ritmo de las frecuentes actualizaciones ya que la incorporación de nuevos datos requiere que el análisis vuelva a comenzar desde cero.

Teradata Loom® Community Edition 2.3 es gratuita y ya se puede descargar en http://bit.ly/1DcUGuI. Teradata Loom® 2.4 la cual estará disponible a partir del 31 de Marzo de 2015, a un precio competitivo de suscripción. Todas las ediciones estarán disponibles a nivel mundial en idioma inglés.

Teradata Loom se ejecuta en las siguientes plataformas: Teradata Open Distribution para Hadoop (TDH 1.3 y TDH 2.0, Hortonworks Data Platform (1.3, HDP 2.1 y HDP 2.2), Cloudera Distribution incluyendo Apache Hadoop (CDH 5.1 y CDH 5.2) y MapR Apache Hadoop Distribution (MapR 4.0.2).

Teradata_ADW_Cloud