ratios del equipo de datos

¿Cuál es la proporción ideal de científicos de datos junior a senior?

Inclinar demasiado la balanza hacia un lado u otro tiene consecuencias para la calidad y el desarrollo.

A veces, una proporción simplemente funciona. La llamada proporción áurea, o proporción divina, se repite una y otra vez en la naturaleza, apareciendo en todas partes, desde pétalos de flores hasta espirales de conos de pino . En los equipos de tecnología, no hemos encontrado nada tan cósmicamente alineado, pero la búsqueda del equilibrio sigue siendo una preocupación permanente. Considere la pregunta: ¿Cuál es la mejor proporción de contribuyentes junior a senior?

Es un tema muy discutido en la ingeniería de software, pero menos en la ciencia de datos . Hay, por supuesto, consejos de mejores prácticas en torno a la construcción de equipos para equipos de datos, aunque evolucione para siempre. Pero eso tiende a girar en torno a consideraciones como la cantidad de ingenieros de datos por científico de datos . Como el CEO y fundador de dbt Labs, Tristan Handy, señaló a principios de este año, la consideración de junior a senior es más un tema abierto para los equipos de datos.

“Es un poco un acto de equilibrio”.

Aún así, vale la pena considerarlo seriamente. Lyndsey Padden, vicepresidenta de ciencia de datos de 84.51°, una firma de análisis de marketing afiliada a Kroger, dijo a Built In que no mantener un equilibrio adecuado puede sofocar el desarrollo profesional o disminuir la calidad general del trabajo.

“[Tener] demasiados científicos de datos sénior crea una organización de alto nivel y no necesariamente brinda a las personas las responsabilidades correctas ni la oportunidad de extenderse a la gestión del talento, o incluso a áreas de desarrollo de habilidades técnicas”, dijo Padden.

Por otro lado, “si tiene demasiados jóvenes, no necesariamente tiene el sistema de apoyo adecuado”, agregó. “O no le está dando a sus científicos de datos senior suficiente espacio para el liderazgo de pensamiento estratégico” y un amplio control sobre los flujos de trabajo. “Así que es un poco un acto de equilibrio”.

Entonces, ¿cuál es la proporción ideal, suponiendo que exista una? ¿Y qué tan importante es mantenerlo?

¿Cómo se asignan los roles y responsabilidades?

Antes de explorar los números, analicemos lo que entendemos por científicos de datos junior, de nivel medio y senior más allá del simple tiempo en la industria. Tener una definición clara y una distribución de responsabilidades ayuda mucho cuando se piensa en la dotación de personal.

A continuación se muestra un gráfico de cómo los equipos de ciencia de datos abordan la gestión de tareas, desglosado por nivel de antigüedad, según una investigación de personal publicada el año pasado por Gartner. Las responsabilidades principales de Junior incluyen preparar y refinar datos (incluida la ingeniería de características), explorar y comprender datos y construir modelos de aprendizaje automático . Mientras tanto, las tareas principales principales incluyen guiar y contar historias, es decir, identificar oportunidades de modelado que encajen de manera realista con enfoques comerciales más amplios, y formular y priorizar proyectos.

relación de equipo de datos de desglose de antigüedad
Cómo los equipos de ciencia de datos abordan la gestión de tareas, desglosado por nivel de antigüedad. | Imagen: Gartner

Maureen Kalas, directora de ciencias de datos, descubrimiento y decisiones de Allstate, dijo que el desglose de Gartner concuerda aproximadamente con la forma en que opera su empresa, incluida la priorización de la preparación de datos, pero también la construcción de modelos, para los jóvenes.

“Esperamos que nuestros jóvenes construyan modelos”, dijo. «Realmente no es muy divertido para ellos si entran y solo juegan con la limpieza de datos».

Dicho esto, a pesar de que los candidatos tienden a llegar directamente de bootcamps o programas universitarios con una sólida comprensión de cómo construir modelos en un entorno de espacio aislado, aprender cuándo y dónde aplicar ese conocimiento en el mundo real a menudo lleva tiempo.

“Puede que le entusiasme construir un modelo para predecir esto, aquello y lo otro, que ha simulado en un entorno de clase”, dijo Padden, de 84.51°. “Pero hasta que haya tenido la oportunidad de entrar y preguntar: ‘¿Es eso realmente necesario para resolver este problema comercial y cuál es la mejor manera de hacerlo?’ — ahí es donde entra en juego cierta antigüedad y experiencia profesional”.

En Allstate, los científicos de datos de nivel medio interactúan más con otros departamentos dentro de la empresa para ayudar a definir claramente el problema en cuestión.

Por ejemplo, cuando la empresa actualizó recientemente su función de análisis avanzado para recursos humanos, fueron los científicos de datos de nivel medio los que trabajaron con recursos humanos para iniciar el trabajo. Además de la visión general, los seniors de Allstate también buscan oportunidades de automatización y, a menudo, se enfocan en mantener los modelos en producción observando la deriva.

“Es una rendición de cuentas cada vez más amplia”, dijo Kalas.

Relacionado: Cómo ser un gerente técnico efectivo (que no renuncia al trabajo técnico)

Mi proporción ideal podría diferir de la suya

A 84,51°, la proporción históricamente ha estado entre tres o cuatro científicos de datos junior por cada científico de datos senior, según Padden. A medida que la organización ha madurado, ha intentado mantener la proporción más cerca de 3 a 1.

Tener menos informes directos significa que los científicos de datos senior pueden continuar desarrollando sus habilidades técnicas y de elaboración de mapas de ruta, y no dedicarse por completo a la gestión de personas, dijo. Pero un equipo completo de talento de alto nivel, además de ser costoso, plantea problemas de crecimiento y avance.

“Tener demasiados adultos mayores también puede limitar las oportunidades de desarrollo para las personas en ese espacio”, dijo Padden. «Es beneficioso para las personas en la pista de un director tener talento que puedan entrenar, crecer y desarrollar».

Si bien 84,51° parece haber encontrado su número, Kalas, en Allstate, se contenta con permitir que la proporción fluctúe como sea posible. En este momento, la proporción de junior a senior de la compañía de seguros en ciencia de datos es de aproximadamente 1 a 1, pero factores como la estrategia de crecimiento y la naturaleza del panorama del talento han afectado esa cifra en el pasado y pueden volver a hacerlo en el futuro. futuro.

Hace unos cuatro años, por ejemplo, Kalas supervisó un equipo que tenía más talento junior, pero eso se debió en parte a que la organización estaba realizando un gran esfuerzo de contratación y el grupo de prospectos en ese entonces simplemente tenía más prospectos de nivel de entrada que candidatos avanzados.

“En ese momento, la oferta de científicos de datos era bastante pequeña, en términos relativos”, dijo Kalas. “Eso ha mejorado significativamente a lo largo de los años, ya que las escuelas están produciendo más personas. … Ahora hay más adultos mayores por ahí”. En el pasado, era más fácil encontrar candidatos con dos o menos años de experiencia “y capacitarlos”, agregó. “Ahora podemos traer una mezcla”.

Allstate se encuentra ahora en medio de otro impulso de contratación de ciencia de datos y, sin embargo, la combinación de niveles de experiencia que se produzcan después no estará estrictamente predeterminada. No hay una proporción objetivo y Kalas no está seguro de que exista una proporción «adecuada», «al menos para nosotros». Esto no quiere decir que solo estén empujando hacia un lado o hacia el otro. 

“Tener un equilibrio, una combinación de juniors y seniors, ayuda a garantizar que tenga un buen grupo de líderes que puedan administrar organizacionalmente, pero que también brinden mucha orientación técnica”, dijo.

Relacionado: Los secretos para ser mentor de ingenieros de software júnior

Es más importante mantener el oleoducto funcionando

Las opiniones pueden diferir en cuanto a si vale la pena mantener una proporción establecida de junior a senior, pero un elemento relacionado es probablemente universal: es importante mantener las tuberías en cualquiera de los niveles funcionando sin problemas. Kalas y Padden enfatizaron la importancia de fomentar el talento, independientemente del nivel de experiencia, y asegurarse de que todos tengan espacio para avanzar.

Para ello, en 84.51°, el departamento de ciencia de datos ofrece una pasantía de tres meses. Las proyecciones de crecimiento dictan a cuántos pasantes se les ofrecen puestos de tiempo completo cada año, pero la conversión es confiablemente «fuerte», dijo Padden. La firma también se asocia con universidades para atraer personal de nivel de entrada cada otoño.

“La libertad de crecer a su propio ritmo y tener oportunidades de aprendizaje profundo, eso es de vital importancia y termina influyendo en el aspecto de una proporción”.

Para los puestos de nivel superior, existe la llamada pista técnica, que permite a los científicos de datos de nivel superior dedicar una cantidad significativa de tiempo al trabajo técnico. Aproximadamente el 30 por ciento de los científicos de datos senior están en el camino técnico, dijo Padden.

Kalas mencionó un esfuerzo en Allstate, a finales de este año, que apuntará a candidatos de entornos subrepresentados que no tuvieron acceso a programas de posgrado. Aquellos que sean contratados se someterán a un minucioso proceso de capacitación rotativa que tiene como objetivo reforzar cualquier brecha de habilidades en ciencia de datos. Todas las nuevas contrataciones de ciencia de datos también reciben un proyecto de incorporación, que dura entre dos y cuatro meses, antes de «graduarse para trabajar por su cuenta».

“La libertad de crecer a su propio ritmo y tener oportunidades de aprendizaje profundo, eso es de vital importancia y termina influyendo en cómo se ve una proporción”, dijo Kalas.