ciencia de los datos matemáticas hed

Los muchos caminos hacia una carrera de ciencia de datos

Desde la zoología y la física hasta el diseño de algoritmos.

El camino hacia la ciencia de datos no siempre comienza con un título en informática. Muchos aspirantes a científicos de datos comienzan en campos centrados en las matemáticas como la física, la química, la ingeniería o las estadísticas. Incluso donde los títulos de ciencia de datos actualmente existen como especializaciones independientes, a menudo se encuentran en los departamentos de matemáticas o ingeniería . Otros son programas interdisciplinarios que abarcan las ciencias físicas o son opciones complementarias a (generalmente) las carreras de matemáticas.

El valor de los campos enfocados en las matemáticas en la ciencia de datos

Muchas personas que terminan en la ciencia de datos comienzan en campos centrados en las matemáticas como la física, la química o las estadísticas. Estos orígenes pueden brindar a los científicos de datos habilidades y experiencias únicas y valiosas que se aplican a su trabajo de ciencia de datos.

Hablamos con cinco científicos de datos que comenzaron en campos centrados en las matemáticas. A pesar de diferentes lugares de partida, comparten algunas experiencias comunes. Su curiosidad y su impulso por encontrar respuestas los llevaron a sus campos originales, luego la practicidad cambió su dirección hacia la ciencia de datos. Una vez allí, descubrieron que sus experiencias centradas en las matemáticas complementaron sus esfuerzos actuales de maneras únicas y potencialmente sorprendentes.

De los misterios de la cosmología a las personas detrás de los datos

Briana Brownell, fundadora y directora ejecutiva de PureStrategy , una empresa de análisis impulsada por IA, dijo que su camino de las matemáticas a la ciencia de datos fue extraño y complicado. Comenzó con la física teórica en la licenciatura. Quería “comprender por qué el universo estaba hecho de cosas tan extrañas”, como escribió en su blog . Pero fueron las clases de matemáticas requeridas para la especialización las que capturaron su curiosidad. En lugar de la monotonía de obtener respuestas en matemáticas de la escuela secundaria, los cursos universitarios de matemáticas fueron interesantes.

“De repente, se trataba de pruebas y de comprender la estructura real del mundo”, dijo Brownell a Built In.

Luego encontró su primer trabajo en finanzas. Como comerciante en la Bolsa de Valores de Nueva York, estaba fascinada por los patrones que vio que subyacen por qué algunas empresas tienen éxito mientras que otras tienen dificultades.

«La antropología, por supuesto, tiene que ver con el comportamiento humano… Eso terminó siendo más valioso para crear buenos modelos de ciencia de datos y sacar conclusiones de lo que hubiera sido cualquier cantidad de matemáticas e informática».

Las experiencias de Brownell en física y matemáticas se han traducido bien en la ciencia de datos, tanto como comerciante como en su trabajo actual con PureStrategy. El diseño de algoritmos en su trabajo anterior la ayudó a diseñar sistemas de IA porque la capacitó para ver el funcionamiento interno de la metodología de resolución de problemas, por ejemplo.

Pero se trata más de mentalidad que de matemáticas. La ciencia de datos se trata de obtener información útil a partir de datos que (por lo general) describen cómo se comportan las personas, por lo que identificar patrones y comprender a las personas es mucho más importante, dijo Brownell. El científico de datos del que más había aprendido, por ejemplo, tenía un título en antropología.

“La antropología, por supuesto, tiene que ver con el comportamiento humano”, dijo. «Eso terminó siendo más valioso para crear buenos modelos de ciencia de datos y sacar conclusiones de lo que hubiera sido cualquier cantidad de matemáticas e informática».

Como comerciante, Brownell tuvo que aprender sobre la inteligencia emocional y cómo las motivaciones impulsadas por las emociones de las personas impulsan su comportamiento. Esa capacitación centrada en las personas también le ha resultado útil en su trabajo como científica de datos.

“Porque todas las suposiciones que hago y los pasos de procesamiento previo que tomo, todas esas cosas que hago antes de construir el modelo, impactan el éxito del modelo y cómo impacta a otras personas”, dijo.

Una apreciación de las matemáticas más un deseo de tener un impacto

Brownell no está sola en su interés por el lado humano de los datos. Ian Wong, cofundador y CTO de la plataforma de bienes raíces digitales Opendoor , se sintió atraído por la ingeniería eléctrica por su fascinación por la tecnología y cómo puede afectar las experiencias de las personas. También como Brownell, las matemáticas subyacentes del campo capturaron su imaginación al principio de su carrera.

“Había algo elegante y atemporal en las matemáticas, y quería combinar eso con un impacto en el mundo”, dijo. Esto finalmente lo llevó a estudiar estadística, en la que recibió su maestría. Sin embargo, mientras trabajaba en su doctorado, Wong se dio cuenta de que la vanguardia en matemáticas aplicadas estaba en la industria y no en la academia, y que la academia se estaba quedando atrás.

“Combinado con mi deseo de crear tecnologías que puedan crear un impacto más inmediato, decidí abandonar y buscar un trabajo en ciencia de datos”, dijo.

“El mejor regalo que me dieron mis estudios de posgrado fue la habilidad y la disciplina de [la investigación]: el viaje de aprendizaje y descubrimiento continuos, que es una necesidad dado el panorama rápidamente cambiante de la ciencia de datos”.

Ese trabajo llegó «por casualidad», dijo. “Como estudiante de posgrado aburrido, me encontraba mucho en Quora, respondiendo preguntas técnicas. Asistí a una fiesta de usuarios avanzados de Quora y terminé hablando con Keith Rabois, el director de operaciones de Square en ese momento. Como un divertido rompehielos, casualmente le pregunté si tenía un trabajo para mí, sin esperar que dijera que sí. Lo siguiente que supe fue que estaba entrevistando a Jack Dorsey”.

Desde entonces, Wong ha creado aplicaciones de aprendizaje automático para Square y, posteriormente, para Prismatic. En 2014, cofundó Opendoor. Dijo que sus experiencias académicas en estadística, especialmente, le dieron una sólida base teórica en análisis y predicción. También ayudó a entrenarlo cómo aprender.

“El mejor regalo que me dieron mis estudios de posgrado fue la habilidad y la disciplina de [la investigación]: el viaje de aprendizaje y descubrimiento continuos, que es una necesidad dado el panorama rápidamente cambiante de la ciencia de datos”, dijo.

Más sobre carreras en ciencia de datosLas tutorías son la clave para el avance de la ciencia de datos

Academia e industria combinadas por Big Data

No todos los que comenzaron su camino hacia la ciencia de datos en un campo centrado en las matemáticas lo han dejado. Jed Macosko, quien tiene un doctorado en química y es profesor en la Universidad de Wake Forest y presidente de AcademicInfluence.com , tiene un pie en la academia y otro en la industria. Su viaje comenzó en la infancia, donde el amor por las matemáticas animó su vida académica. 

Aunque disfrutaba de las matemáticas, no creía que fuera lo suficientemente bueno para convertirse en profesor de matemáticas. Pero sabía que quería hacer algo que aprovechara sus habilidades para hacer todo a través del cálculo y el álgebra lineal. Eso significaba física o química.

El pragmatismo lo llevó a la química. Consideró que podría completar una licenciatura en química más rápido que una licenciatura en física, ahorrando así los gastos de matrícula.

“Un gran aspecto de la ciencia de datos es comprender qué es lo que está tratando de preguntar, qué preguntas está haciendo, dónde los datos lo ayudarán a responder esas preguntas y la alegría de descubrir cosas de los datos que ni siquiera sabía. sé que estaban allí.

La química se convirtió en química biofísica, luego en biofísica, a medida que avanzaba en su carrera académica. Después de convertirse en profesor de física, el trabajo en un libro de texto electrónico llevó a Macosko a los grandes datos. Esto lo enganchó. Comenzó a dar clases de big data dentro del departamento de física. Aunque inicialmente los estudiantes tardaron en inscribirse en la clase, ahora es una de las primeras en completarse, “porque la gente sabe que si aprende ciencia de datos, puede conseguir un buen trabajo”, dijo. Hoy, sus estudiantes en esa clase provienen de las carreras de negocios, informática y matemáticas.

Aunque su viaje a la ciencia de datos comenzó con un amor por las matemáticas, Macosko señaló que la ciencia de datos y los grandes datos van más allá de los números. Las habilidades que uno aprende en las ciencias pueden ser igual de importantes, si no más.

“Un gran aspecto de la ciencia de datos es comprender qué es lo que está tratando de preguntar, qué preguntas está haciendo, dónde los datos lo ayudarán a responder esas preguntas y la alegría de descubrir cosas de los datos que ni siquiera sabía. sé que estaban allí”, dijo.

Más sobre habilidades de ciencia de datos: 10 habilidades clave de ciencia de datos que te sorprenderán

Mariposas, Big Data y Metodologías de Diseño Experimental

Malcolm Chisholm, quien tiene un doctorado en ecología de campo experimental, fue una de las personas que ayudó a Macosko a iniciarse en la ciencia de datos y lo convenció de que las habilidades interdisciplinarias son un gran beneficio para el campo. Chisholm, presidente de Data Millennium , una consultora de datos, comenzó su carrera académica como zoólogo. Aunque no es un campo tradicionalmente centrado en las matemáticas como la física, la zoología implica mucha metodología estadística. 

Chisholm estudió la dinámica de la población de insectos durante su investigación doctoral después de una infancia atrapando mariposas y polillas. Rápidamente acumuló grandes volúmenes de datos en este trabajo. Cómo organizar todos esos datos le hizo sentir curiosidad por la ciencia de datos y, finalmente, trabajar en ella.

El pragmatismo también desvió la atención de Chisholm de sus raíces académicas a la ciencia de datos. Después de completar su doctorado, necesitaba un trabajo.

“Es poder implementar metodologías rigurosas que le brinden cierto grado de confianza en los resultados de su ciencia de datos”.

“Le pregunté a todos los otros Ph.D. gente lo que estaban haciendo. Dijeron que iban a [convertirse] en programadores y que trabajarían con tecnología de la información”, dijo, hablando de la década de 1980. “Así que me di cuenta, ‘Oh, bueno, será mejor que haga eso también. Si todos los demás lo están haciendo y pueden obtener un buen dinero, yo también lo haré’”.

Desde entonces, Chisholm ha estado trabajando en el gobierno de datos, la gestión de datos y los datos en general. Al igual que Macosko, las raíces científicas de Chisholm son invaluables para su trabajo de ciencia de datos. La aplicación de metodologías estadísticas, cómo aplicar las estadísticas correctas a los datos, es un ejemplo clave. Comprender las metodologías de diseño experimental, fundamentales para las ciencias físicas, es aún más importante.

“No se trata solo de saber matemáticas”, dijo. “Es poder implementar metodologías rigurosas que le brinden cierto grado de confianza en los resultados de su ciencia de datos”.

Dado que gran parte de su trabajo en zoología involucraba ecología experimental, el diseño experimental fue «un gran problema» para Chisholm.

“Y eso me ayuda mucho en mi trabajo actual”, dijo.

Más sobre crecimiento profesionalCrecimiento profesional y desarrollo profesional: ¿cuál es la diferencia?

Física y Amor por el Lenguaje al Procesamiento del Lenguaje Natural

Thomas Wood, director de Fast Data Science , una consultora, descubrió que los intereses de su niñez y su aptitud para las matemáticas finalmente lo llevaron al subcampo de inteligencia artificial del procesamiento del lenguaje natural

Wood siempre estuvo interesado en la ciencia y era bueno en matemáticas cuando era niño. Pero también jugó con la programación de computadoras en la escuela secundaria, incluso aprendiendo BASIC por sí mismo. La mayoría de los programas que construyó tenían un tema muy similar: hacer que una computadora generara oraciones. Esto fue mucho antes de que hubiera oído hablar del procesamiento del lenguaje natural.

Dado su interés por la ciencia y el hecho de que provenía de una familia con un buen número de físicos, estudió la licenciatura en física. El título involucró muchas matemáticas y aprendió Fortran, lo que llamó el lenguaje de programación favorito de los físicos en ese momento. Pero su interés por el lenguaje persistió.

“Ambos requieren buenas habilidades de programación, aunque la programación no es el enfoque del trabajo. Y ambos requieren que uses datos y álgebra para representar procesos y fenómenos del mundo real”.

“Durante la carrera de física, tomé varios cursos electivos de idiomas y clases nocturnas, incluidos árabe, ruso, alemán y croata”, dijo. Empezó a considerar estudiar idiomas o lingüística para obtener su maestría. Un tutor de admisiones del departamento de lingüística de la Universidad de Cambridge sugirió en su lugar el procesamiento del lenguaje natural, “que resultó ser una excelente recomendación”, dijo Wood.

Si bien el interés por el lenguaje lo inició en el camino hacia la ciencia de datos, Wood dijo que su capacitación en física ha sido invaluable.

“Tanto [la física como la ciencia de datos] requieren una buena idea de los números y la capacidad de procesar grandes conjuntos de datos”, dijo. “Ambos requieren buenas habilidades de programación, aunque la programación no es el enfoque del trabajo. Y ambos requieren que uses datos y álgebra para representar procesos y fenómenos del mundo real”.