datos de retención

5 formas de desarrollar una mentalidad basada en datos

No es necesario ser un científico de datos para convertirse en alfabetizado en datos.

A medida que los datos continúan creciendo en importancia para las organizaciones en todas las industrias, la alfabetización de datos (la competencia de uno en la interpretación y comunicación de datos y actividades relacionadas con datos) se ha convertido en una habilidad cada vez más crucial , incluso para aquellos que no son analistas de datos, ingenieros de datos o científicos de datos

Desarrollar tal competencia en la interpretación y comunicación de datos ciertamente requiere tiempo y esfuerzo, pero una cierta mentalidad para abordar los datos y los problemas relacionados con los datos también ayuda a facilitar el desarrollo de la alfabetización de datos. A continuación se presentan cinco formas en que cualquier persona, incluso los profesionales que no son de datos, pueden desarrollar (y mejorar) una mentalidad basada en datos.

Esfuércese por ser un experto en sus datos

Probablemente trabaje con al menos algunos datos en su trabajo diario actual. Tal vez sea una hoja de cálculo de Excel que contiene información sobre clientes, informes financieros trimestrales o una lista de transacciones de un sistema de punto de venta. De todos modos, comprender los datos que son relevantes para su dominio puede brindarle una oportunidad para ser un colaborador valioso en proyectos que usan sus datos.

Como mínimo, debe saber qué medidas (también conocidas como columnas, variables y campos) se incluyen en los datos, los filtros aplicados a los datos (¿un conjunto de datos de interés dado incluye todos los puntos de datos relevantes o solo un subconjunto de ¿puntos de datos que satisfacen algunos criterios?) y los mecanismos utilizados para recopilar los datos (¿son los datos generados por actividad en línea, cuestionarios, compras en tiendas o algún otro proceso?). Conocer estas facetas de sus datos lo ayuda a comprender qué preguntas pueden y qué preguntas no pueden ser abordadas por dichos datos.

Este conocimiento también puede colocarlo en una posición para brindar asesoramiento sobre qué medidas pueden ser relevantes para un proyecto en particular y qué registros, si corresponde, deben incluirse o excluirse de los datos para un proyecto determinado, lo que lo convierte en un recurso invaluable.

Relacionado: Los analistas de datos no son conserjes

Comprender para qué sirven los datos

Suena trivial, pero las empresas emergentes pequeñas y las empresas Fortune 500 a menudo se saltan el análisis antes de formar una comprensión central de lo que están buscando. Simplemente es más sexy hablar sobre las ideas que obtendrá de esa nueva y elegante herramienta de aprendizaje automático que hacer el arduo trabajo de preguntarse críticamente: «¿Por qué es importante?» La mayoría de las veces, con este enfoque, terminas gastando toneladas de tiempo y recursos analizando todos tus datos antes de darte cuenta de que no tienes nada que mostrar y que tienes que empezar de nuevo. Si no sabes lo que estás buscando, ¿cómo vas a saber cuándo lo encuentras?

Antes de comenzar, hágase las siguientes preguntas:

  • ¿Qué estamos buscando?
  • ¿Qué pregunta buscas resolver?
  • ¿Por qué eso importa?
  • ¿Qué impacto tiene esta información?
  • ¿Qué información necesito para responder a esa pregunta?
  • ¿Dónde encuentro esa información?

Si no te has hecho estas preguntas, probablemente deberías parar y empezar de nuevo. Lo has hecho todo mal. Detente antes de que pierdas más tiempo y el dinero de tu empresa.

Si puede comenzar haciendo una pregunta simple (¿cómo puedo obtener más usuarios?), luego divida eso en qué elementos impulsan el crecimiento de los usuarios en su empresa (como en qué canales se registran, quiénes componen una pluralidad de usuarios, y así sucesivamente), luego identifique qué datos necesita para responder esa pregunta. Al pasar por este proceso, ya ha logrado dos partes muy importantes para configurar su iniciativa de datos para el éxito. En primer lugar, ha reducido la cantidad de datos que eventualmente necesitará analizar, ya que sabe lo que está buscando y lo que no necesita. En segundo lugar, ha establecido un punto final, lo que facilita proporcionar información a las partes interesadas sobre esa pregunta específica.

Prepárate para ensuciarte

En Promotable, enseñamos una variedad de temas relacionados con los datos, y en nuestras clases enfatizamos a los estudiantes que gran parte de los datos con los que trabajarán en sus carreras estarán desordenados. Para ilustrar, supongamos que está mirando una hoja de cálculo que muestra la duración del tiempo que cada visitante pasa en el sitio web de su empresa y ve que algunos usuarios tienen números negativos registrados en la columna de duración. O supongamos que obtiene un conjunto de datos con respuestas de una encuesta de satisfacción del cliente, solo para descubrir que una parte sustancial de las respuestas a varias preguntas están en blanco.

Los errores de recopilación y procesamiento de datos pueden ocurrir, y ocurren. Desafortunadamente, la falta de datos es un lugar común en varios conjuntos de datos. Comprender que los datos del mundo real a menudo no están limpios es importante por dos razones. En primer lugar, la conciencia de la posibilidad de puntos de datos anómalos y/o faltantes es una parte crucial del enfoque de los datos con un ojo crítico hacia la calidad de los datos. Recuerde, los resultados significan poco si los datos subyacentes no son confiables; basura dentro basura fuera.

En segundo lugar, es importante tener en cuenta el hecho de que el trabajo de limpieza de datos generalmente debe realizarse antes de que se pueda realizar un análisis significativo o un modelo predictivo para apreciar la verdadera cantidad de tiempo y esfuerzo necesarios para llevar a buen término un proyecto. Para ayudar a garantizar la precisión y la integridad, se debe presupuestar el tiempo para analizar los datos y realizar tareas de limpieza de datos según sea necesario.

Aplique un sano escepticismo a las decisiones relacionadas con los datos

Si bien dividir una palabra con datos (como «basado en datos») puede usarse para transmitir cierta autoridad a un resultado o proceso, la verdad es que los datos por sí solos no otorgan credibilidad a nada.

Más bien, los datos solo se vuelven útiles y valiosos a través de varias decisiones tomadas por humanos. Desde decisiones sobre filtrado (¿los puntos de datos con ciertas características son irrelevantes para mi análisis?) y estadísticas descriptivas (¿debo usar la media o la mediana para resumir esta variable?), hasta decisiones sobre modelado (¿debo usar un árbol de decisión o un bosque aleatorio? ) e interpretación (¿es un modelo que hace una predicción con un 95 por ciento de precisión lo suficientemente bueno como para ponerlo en producción?), hay una serie de etapas en la vida de un producto basado en datos, o inspirado en datos, o cualquier tipo de producto donde el juicio humano es necesario.

¿Significa esto que deberíamos suspender automáticamente la confianza en los productos y los conocimientos que los datos posibilitan? Ciertamente no. En la medida en que los datos son el resultado final de los procesos que miden eventos, comportamientos y percepciones en el mundo real, el uso científico de los datos tiene el potencial de proporcionar predicciones y conocimientos derivados de algo más que la voz más fuerte en la habitación o el instinto de alguien. sentimiento.

Dicho esto, es importante tener en cuenta que todo lo que tenga datos delante de su nombre es el resultado de la actividad humana y, por lo tanto, está sujeto a errores e ineficiencias. Además, es probable que el examen crítico de los procedimientos de recopilación de datos, las prácticas de almacenamiento de datos, los análisis estadísticos y el modelado predictivo motive a otros, y/o a usted mismo, a identificar puntos ciegos operativos y evaluar si un enfoque existente para un problema basado en datos es realmente la mejor práctica. en comparación con las alternativas existentes.

A su vez, este pensamiento crítico sobre los datos y los resultados basados ​​en datos tiene el potencial de mejorar la calidad de los datos, generar modelos predictivos y estadísticos más sólidos y garantizar que los datos se recopilen y utilicen de manera ética.

Acepte que las respuestas que obtiene pueden no ser las respuestas que desea

Un aspecto de trabajar con datos que es a la vez emocionante y aterrador es que no sabes lo que mostrarán los resultados. Es posible que tenga una idea de lo que podrían mostrar los resultados de un análisis estadístico o un modelo de aprendizaje automático, claro, pero hasta que los datos no se analicen realmente, no hay forma de estar seguro. A veces, de hecho, los datos incluso le darán resultados inesperados o incluso no deseados.

Por ejemplo, supongamos que está ejecutando un experimento para probar si una nueva función de interfaz de usuario (IU) en la aplicación móvil de su empresa genera mayores ingresos en comparación con la versión actual de la aplicación que no incluye esta función. Después de realizar el análisis de un experimento cuidadosamente diseñado, descubre que la nueva función de interfaz de usuario no tiene una diferencia significativa en los ingresos. ¿Significa eso que el experimento fue un fracaso? Absolutamente no. En este caso, pudo llegar a una conclusión basada en datos y tener más información que antes del análisis.

Fomentar una cultura basada en datos

Es posible que se pregunte por qué ponemos tanto énfasis en que los empleados tengan una mentalidad basada en datos en toda la organización. Después de todo, ¿no se les paga a los profesionales de datos para que manejen y piensen en todo lo relacionado con los datos?

Es cierto que una organización no debe esperar que sus asociados de recursos humanos creen canalizaciones de datos o que su departamento de contabilidad cree modelos de aprendizaje automático. Sin embargo, tener personas en varios roles que puedan interpretar y comunicar procesos relacionados con datos es una ventaja competitiva. Cuando los tomadores de decisiones pueden interpretar diferentes visualizaciones de datos y estadísticas básicas, pueden transformar el trabajo de los profesionales de datos en estrategias sólidas de forma más rápida y sencilla. Por ejemplo, cuando los gerentes poseen una comprensión básica de todos los pasos involucrados en la creación de un modelo de aprendizaje automático utilizable, esto permite una mejor planificación, ayuda a establecer expectativas razonables y, en última instancia, conduce a un mejor producto y resultado.

En resumen, las organizaciones que hacen de una mentalidad basada en datos una parte central de su cultura tendrán más éxito en maximizar el valor de sus datos que las organizaciones que piensan que solo son relevantes para los profesionales de datos.

Relacionado: ¿Cuándo debería la calidad reemplazar a la velocidad?