Ciclo de vida de la analítica
Contenidos
Tanto si gestiona iniciativas de datos, como si trabaja con profesionales de los datos o es empleado de una organización que lleva a cabo proyectos de datos con regularidad, un conocimiento firme de cómo es el proyecto de datos medio puede resultar muy beneficioso para su carrera. Este conocimiento, junto con otras habilidades de datos, es lo que muchas organizaciones buscan a la hora de contratar.
No hay dos proyectos de datos idénticos; cada uno conlleva sus propios retos, oportunidades y posibles soluciones que afectan a su trayectoria. Sin embargo, casi todos los proyectos de datos siguen el mismo ciclo de vida básico de principio a fin. Este ciclo de vida puede dividirse en ocho etapas, pasos o fases comunes:
El ciclo de vida de los datos se describe a menudo como un ciclo porque las lecciones aprendidas y las ideas recogidas de un proyecto de datos suelen informar al siguiente. De este modo, la última etapa del proceso se retroalimenta de la primera.
La generación de datos se produce independientemente de que usted sea consciente de ello, especialmente en nuestro mundo cada vez más online. Algunos de estos datos son generados por su organización, otros por sus clientes y otros por terceros de los que puede o no ser consciente. Cada venta, compra, contratación, comunicación, interacción… todo genera datos. Si se les presta la debida atención, estos datos a menudo pueden dar lugar a poderosos conocimientos que le permitirán servir mejor a sus clientes y ser más eficaz en su función.
En la fase de análisis del ciclo de vida de los datos, ¿qué podría hacer un analista de datos?
Algunas actividades de investigación pueden utilizar sólo una parte del ciclo de vida; por ejemplo, un proyecto que implique un meta-análisis podría centrarse en las etapas de Descubrir, Integrar y Analizar, mientras que un proyecto centrado en la recogida y el análisis de datos primarios podría obviar las etapas de Descubrir e Integrar. Además, otros proyectos pueden no seguir el camino lineal descrito aquí, o pueden ser necesarias múltiples revoluciones del ciclo. Además, algunos científicos o equipos (por ejemplo, los que se dedican a la modelización y la síntesis) pueden crear nuevos datos en el proceso de descubrimiento, integración, análisis y síntesis de los datos existentes.
Ciclo de vida de los datos Dcc
Estamos en la era de la información. Esa información son datos creados, recopilados y cotejados a un ritmo extraordinario. Cada hora, Walmart recoge 2,5 petabytes de datos no estructurados de un millón de clientes, y ha surgido toda una ciencia para transformar esos bits de información en bruto en valor.
A medida que la recopilación de datos ha aumentado, también lo ha hecho la conciencia de la gente sobre lo que se recopila y a quién pertenece esa información. La mayoría de las personas creen hoy que los datos que generan sobre sí mismos son de su propiedad, y han surgido normativas que confirman esta idea respaldadas por el poder de la ley. Ahora mismo, el 10% de la población mundial está regulada por algún tipo de legislación, y se prevé que esa cifra aumente hasta más del 60% en 2023.
Por lo tanto, las organizaciones modernas deben equilibrar la extracción de valor de los datos con la preocupación por la privacidad, guiada por una ética que tenga en cuenta cada fase del ciclo de vida de los datos. Al hacerlo, las organizaciones obtienen visibilidad y conocimiento de los datos que recopilan, incluyendo de dónde proceden los datos, quién tiene acceso a ellos y qué normativas deben cumplirse. Esto impulsa la eficiencia empresarial y reduce el riesgo, al tiempo que posiciona a su organización de forma proactiva para adaptarse a la evolución de la normativa.
Gestión del ciclo de vida de los datos
En los años 80, las bases de datos se crearon para hacer que los datos fueran accesibles y manejables, pero con esta creación llegaron los desafíos en torno a la recopilación, el almacenamiento, la seguridad y la eliminación de los datos. Con el tiempo, los expertos en datos y TI han teorizado y compartido las mejores prácticas para ofrecer un modelo conocido como gestión del ciclo de vida de los datos (DLM).
La comprensión de los principios de la DLM puede ayudar a cualquier negocio -desde las empresas hasta las pequeñas y medianas empresas- a establecer una estructura por la que fluyan sus datos, o a actualizar una ya existente. Profundicemos en este tema a continuación.
La gestión del ciclo de vida de los datos (DLM) es un modelo para gestionar los datos a lo largo de su ciclo de vida, de manera que se optimice desde su creación hasta su eliminación. La gestión del ciclo de vida de los datos se divide en etapas que suelen comenzar con la recopilación de los datos y terminar con su destrucción o reutilización.
Un objetivo principal de la gestión del ciclo de vida de los datos es mantenerlos seguros. Al crear protocolos para gestionar los datos desde el momento en que se crean hasta el momento en que se eliminan, se está ayudando a evitar que los actores de amenazas y otros usuarios no autorizados accedan a esos datos o que se corrompan con malware y otras infecciones.