lunes, 29 de mayo de 2017

¿Para qué utilizar una herramienta ETL?

   Comenzando un poco a hablar del tema que nos compete, entramos en la consulta que muchos desarrolladores natos nos hacen... ¿Para qué usar una herramienta ETL?.

   Claro que siempre está el que lo va a mencionar, y va a comentar que es mejor hacer procesos PL-SQL. Claramente estas personas deberían investigar un poco mas.
  Estas herramientas están diseñadas exclusivamente para mover información en forma masiva. Estamos hablando que no se procesa la información registro por registro, sino que se realiza por bloques de información. Las herramientas levantan la información en memoria, utilizan ficheros en forma de índices y una base de datos propia, esto lo realizan internamente de la mejor forma posible.
  Les detallo los puntos que considero los que lo hacen ventajoso y luego las contras:

Ventajas de una herramienta ETL:

  1. Son más performantes.
  2. Son herramientas gráficas que se configuran fácilmente. (lenguaje de quinta generación.)
  3. Requiere poca lógica del desarrollador (generalmente puede incluir poco código de bd).
  4. Puede visualizarse el progreso de las ejecuciones mediantes monitores.
  5. Es fácil explicarle al  usuario final los procesos por su facilidad gráfica (expresado generalmente con cajitas y flechas).
  6. Si la sabes usar, son fuentes de conocimiento importante para ingresar a grandes empresas.
  7. Mueven miles de millones de registros en pocos segundos (no estoy exagerando el número).
  8. Se aprenden rápido, por lo que la curva de aprendizaje es muy óptima.

Desventajas de una herramienta ETL:

  1. Las buenas herramientas son muy pero muy caras (Costos por distintas licencias de servidor y a usuarios, aunque también hay herramientas Open Source).
  2. Las buenas herramientas sólo son usadas por grandes empresas por su gran coste (generalmente empresas de consumo masivo, o de servicios telefónicos, empresas de cable, petroleras, etc.).
  3. Dependencia sobre la empresa creadora del software en cuanto a parches, actualizaciones, correcciones del software.

Gartner Magic Quadrant Data Integration Tools:

Gartner es una empresa que investiga las herramientas que están en el mercado y las compara, entrega cuadros muy útiles como el siguiente:
PowerCenter Informatica Gartner Quadrant ETL

En el caso que nos compete, herramientas de Integraciones de Datos (ETL), la mejor en 2016 corresponde a Informatica (PowerCenter, que oportunamente es la que más conozco) y muy cerca IBM Data Stage, el resto de las empresas mas conocidas del mercado: SAP, Oracle, Microsoft, etc.




1 comentario: