Pular para o conteúdo principal

· Leitura de 10 minutos
Alejandro Coca-Castro

alt=Línea de tiempo

Hola mundo

En la anterior entrega describí en mi trayectoria desde el pregrado a doctorado, la cual fue sin duda una etapa satisfactoria con bastante crecimiento personal y con innumerables logros académicos y profesionales. Para la segunda entrega compartiré lo vivido durante la pandemia, un periodo muy difícil para toda la humanidad, pero que nos recuerda lo frágiles que somos como cualquier otra especie viviente en la tierra.

¡Continuemos!

Etapa 3 Pandemia e incertidumbres

Comenzamos en marzo de 2020, cuando las restricciones por COVID-19 iniciaron en la mayoría de los países y coincidieron con el plazo límite para entregar mi tesis de doctorado. Aún más, era el mes de finalización de los fondos del crédito-beca otorgado por mi patrocinador. No teniendo muchas opciones, decidimos con mi esposa dejar Londres y regresar a Bogotá (mi ciudad natal). A pesar de todas las presiones posibles, cumplí con el propósito de enviar mi tesis el día 30 de marzo de 2020 ¡un día muy memorable! Posteriormente en mayo de 2020 defendí mi tesis de manera remota celebrando por videollamada con mi familia, supervisores y amigos. Luego recibí mi diploma de doctor de Geografía en King’s College London en septiembre de 2020.

Dentro del periodo de correcciones de mi tesis y búsqueda de opciones laborales fui seleccionado en un programa de capacitación virtual de ciencias de datos del gobierno de Colombia organizado por Correlation One. Como parte del programa, con otros participantes aplicamos lo aprendido en un proyecto enfocado al desarrollo de modelos y tablero de datos para predecir la reincidencia en el sistema penal colombiano (ver detalles aquí). Posteriormente en agosto de 2020, me vinculé como contratista del Instituto Geográfico Agustín Codazzi, una entidad del gobierno colombiano conocida por su rol en la cartografía y ordenamiento territorial. En mi contrato de 5 meses tuve la oportunidad de ser el líder técnico de grupos de 5 a 6 investigadores y publicar en revistas científicas resultados de dos proyectos relacionados con tecnologías de ciencias de datos e inteligencia artificial para el mapeo de construcciones en ámbitos rurales (ver detalles aquí) y el mapeo digital de suelos (ver detalles aquí). Asimismo, coordiné un reto del programa de ciencia de datos de Correlation One que buscaba desarrollar modelos predictivos a partir de una base de datos de suelos del IGAC (ver repositorio aquí).

Con la culminación de mi contrato en el IGAC y no teniendo mucho éxito en la búsqueda de opciones en la academia, decidí tomar el camino de emprender. En este camino cabe resaltar que fueron valiosos los aprendizajes que recibí en un programa extracurricular ofrecido por el instituto de emprendimiento de mi universidad durante el doctorado. De esta manera, registré GeoMagic Labs, una empresa consultora de tecnologías de la geolocalización, en la Cámara de Comercio de Bogotá. Con mi emprendimiento quedé seleccionado en un concurso de consultoría con Solidaridad Network, una ONG enfocada en facilitar el desarrollo de cadenas de suministro socialmente responsables, ecológicamente sólidas y rentables. En mi propuesta desarrollé una metodología para el mapeo de sistemas productivos de café usando imágenes satelitales de acceso abierto (ver detalles aquí).

Oportunidad 4 - Entrenamiento en Ciencias de Datos
La ciencia de datos ha ganado sin duda un rol importante en los diferentes dominios del conocimiento con impacto en todos los sectores. Debido a esto, un sin número de programas de capacitación y recursos se encuentran disponibles. En mi caso, aprovechando el periodo de incertidumbre y la virtualidad, me puse en la tarea de buscar cómo mejorar mis habilidades en la ciencia de datos. De esta manera encontré el programa de Data Science for All (DS4A) de CorrelationOne. Con recursos del gobierno de Colombia, este programa ofrece 13 semanas de entrenamiento abierto a todos los ciudadanos colombianos que estén interesados en fortalecer sus habilidades en ciencia de datos y unirse al creciente ecosistema de inteligencia artificial en Colombia. Para participar se debe pasar un examen de admisión que evalúa conocimientos generales de estadística, programación y razonamiento lógico. El programa es muy interesante, ya que no solo se recibe entrenamiento, si no que se tienen charlas con profesionales de la industria y la academia contando cómo usan la ciencia de datos en su día a día. Puedo describir el programa como de nivel básico a intermedio con ejemplos muy prácticos y la posibilidad de trabajar en equipo para poner en práctica todos los conocimientos a través de un proyecto aplicado propuesto por instituciones del gobierno, del sector privado o ONGs. CorrelationOne ofrece otros programas de entrenamiento enfocados en mujeres, empoderamiento, ingeniería, entre otros que están abiertos a cualquier nacionalidad.

Etapa 4 La ciencia abierta, Mayo 2021 - a la fecha

En noviembre de 2020 el reglamento de condonación del patrocinador de mi doctorado tuvo un cambio que abrió puertas a nuevas oportunidades. Ya no era obligatorio demostrar vinculación a una institución en Bogotá por el tiempo que recibí financiación (¡ósea 4 años!). El nuevo reglamento era flexible con otros tipos de productos incluyendo la publicación de artículos y/o iniciar un emprendimiento relacionado con el tema de doctorado. Bajo este nuevo panorama, apliqué a una plaza postdoctoral en el instituto de Alan Turing en Reino Unido en diciembre de 2020. Yo ya estaba familiarizado con el entorno del Turing por una anterior oportunidad de hackathon colaborativo que había participado en diciembre de 2019 (ver el reporte aquí). La plaza postdoctoral se ajustaba a mi perfil, y me llamó la atención la posibilidad de aprender de modelación probabilística, mejorar las habilidades en el desarrollo de software y contribuir a Pangeo, una comunidad que promulga la ciencia abierta para el análisis de grandes datos en la geociencia.

En el mes de febrero de 2021 recibí una comunicación para una entrevista la cual incluía una presentación de 5 min, seguido de una explicación de código de mi autoría y preguntas por parte del panel de la entrevista. Era mi primera entrevista de postdoctorado por lo que era natural tener un poco de nervios. No obstante, ofrecí respuestas acertadas resaltando mi experiencia colaborando en diversos grupos de investigación. En el momento de mostrar mi código logré demostrar cómo este había sido usado o visitado en Zenodo (una plataforma para registrar cualquier objeto digital de investigación). A las pocas semanas recibí la comunicación de oferta de la plaza iniciando remotamente desde mayo de 2021. Posteriormente, con mi esposa dejamos nuestra vida en Bogotá y decidimos reiniciar nuestra vida en Londres a finales del mes de julio de ese mismo año.

Al ser parte del Turing, he tenido la oportunidad de colaborar con múltiples investigadores en Reino Unido y sus redes de colaboración, a continuación índico los proyectos o iniciativas que activamente colaboro:

  • Mi proyecto postdoctoral consiste en el desarrollo de herramientas basadas en la fusión inteligente de datos de sensores ambientales para mejorar el monitoreo de nuestro planeta cambiante (ver detalles aquí). En colaboración con investigadores del British Antarctic Survey y Met Office estamos desarrollando una herramienta basada en modelación probabilística que combina datos de diferentes modalidades (datos de grid, estaciones in situ y auxiliares) para tener observaciones más finas y locales de variables ambientales. En adición, con algoritmos greedy (o voraz) se plantea que la herramienta sugiera donde instalar sensores locales para reducir la incertidumbre de la variable ambiental modelada. Soy afortunado en poder aportar mi experiencia en el desarrollo de la herramienta, en mi caso trabajando con investigadores del Centro de Ecología e Hidrología del Reino Unido (UKCEH) para modelar la humedad del suelo.
  • Soy el fundador y líder del libro de Ciencias de Datos Ambientales (ver detalles aquí). Es un recurso liderado por la comunidad ambiental donde a partir de Jupyter notebooks se demuestran avances en datos, metodologías y otro tipo de investigación usando herramientas de código abierto. A través de esta iniciativa colaboro con otros integrantes de la comunidad de Pangeo en Europa para poder incrementar la democratización de herramientas escalables y de código abierto para geociencias.
  • Soy miembro y desarrollador en scivision (ver detalles aquí), una herramienta de código abierto desarrollada entre investigadores de diferentes dominios, entre ellos biología molecular, agricultura y medioambiente, así como profesionales del equipo de ingeniería de la Investigación del Turing. Mi rol en el proyecto es asegurar que la herramienta es generalizable para una variedad de imágenes (satelitales, drones, datos climáticos, entre otros) y modelos de la comunidad científica de las ciencias ambientales.
  • Soy miembro y colíder del equipo de traducción en The Turing Way, una iniciativa liderada por la comunidad para promover las buenas prácticas de ciencia abierta y reproducible (ver detalles aquí).
Oportunidad 5 - Comunidades y capacitación en ciencia abierta
Más allá de mejorar mis habilidades y buenas prácticas de programación para aplicaciones ambientales, la última etapa me ha permitido pertenecer y aportar a la comunidad de ciencia abierta. A pesar de haber pertenecido a grupos de investigación desde mi pregrado, pienso que las comunidades de ciencia abierta son las que mayor potencial tienen para tener impacto en nuestra sociedad a largo plazo. Ejemplo de estas comunidades son The Turing Way y Pangeo, la primera enfocada a una audiencia general y la otra a la comunidad de geociencias. Son comunidades que promueven una visión de la ciencia en la cual cualquier persona puede contribuir a una meta común, democratizar el conocimiento y buenas prácticas en los proyectos en diferentes sectores productivos. The Turing Way tiene un diverso canal de comunicaciones (ver detalles aquí), pero lo que aconsejo en primera instancia es unirse al Slack. Con cerca de 400 miembros, este es el espacio donde mayormente se pueden intercambiar ideas con todos los miembros y enterarse de las actividades de la comunidad. En el transcurso del año se organizan semanas `book dash` que son eventos tipo hackáthones en los cuales se proponen diversas actividades como proponer o revisar contenido del recurso online, charlas cortas en temas diversos de la ciencia abierta y espacios de socialización o networking entre los miembros. Diferente a los tradicionales hackáthones, no existe competencia por algún premio, cualquier contribución hace parte de una celebración común. A través The Turing Way, también conocí el programa Open Life Science (OLS). Es otra comunidad la cual ofrece 16 semanas de entrenamiento en liderazgo de ciencia abierta. Yo participé en la cuarta cohorte para validar la idea del libro de ciencias de datos ambientales por medio de reuniones con mi mentora. Posteriormente, fui co-mentor de un proyecto de conocimiento multi-lenguaje de ciencia abierta en Asia Central en la quinta cohorte. Ambas experiencias fueron valiosas, ya que en la primera pude aprender de las nociones básicas para liderar un proyecto de ciencia abierta, y posteriormente retorna lo aprendido mediante mi rol de mentoría. Recomiendo totalmente unirse a OLS, son abiertos a cualquier rama del conocimiento en el cual se quiera practicar la ciencia abierta.

Resumen

Hemos finalizado la segunda entrega de Alejandro 101. Es un gusto poder compartir mi desarrollo profesional y académico, así como algunas oportunidades para aquellos interesados en ciencia medioambiental abierta y tecnologías de la información.

Aprovecho para indicar que si mi contenido es relevante estaré publicando mensualmente (si lo permite mi actual carga laboral y familiar) diversos temas desde discusiones de herramientas (con código) así como conceptos o esquemas propuestos en temas de ciencia abierta, ambiental o tecnologías de la información. De vez en cuando compartiré uno que otro avance de mi vida personal o viajes que puedan ser enriquecedores para otros lectores de este blog.

Por una ciencia incluyente y transparente 🚀

· Leitura de 9 minutos
Alejandro Coca-Castro

alt=Línea de tiempo

Hola mundo

Motivado por la línea de tiempo con la cual participé en la reunión de fogón organizada por el Turing Way la primera entrada de mi blog es una reflexión de lo que ha sido mi recorrido en los últimos 11 años.

Contaré resumidamente mis experiencias más relevantes en la ciencia medioambiental abierta y tecnologías de la información mediante una serie de anécdotas por etapas. Dichas anécdotas van más allá de lo técnico e incluyen oportunidades que comparto para que sean aprovechadas por otros identificados con caminos similares.

¡Iniciemos!

Etapa 0 inicios, < 2011

Aunque no lo pude reflejar en mi línea de tiempo, desde mis estudios de pregrado en Ingeniería Agronómica obtuve mis primeros acercamientos en las tecnologías de la información espacial. Tuve la oportunidad de cursar materias relacionadas con modelos y datos espaciales como parte del programa de posgrado de Geomática en mi alma mater, la Universidad Nacional de Colombia. Igualmente, realicé un intercambio con la Universidad de São Paulo, Brasil, donde conocí una nueva cultura y participé en grupos de investigación usando las tecnologías de geoprocesamiento aplicadas para estudios del medio ambiente y agricultura. En este intercambio me entrené en varias herramientas de procesamiento de imágenes satelitales tanto de licencia cerrada entre ellas ERDAS y ENVI, y de licencia abierta como SPRING. Asimismo, mis conocimientos en SIG fueron principalmente en ArcGIS, y un poco en QGIS. Ya finalizando mis estudios, en el mes de Mayo de 2011 tuve la oportunidad de poner a prueba mis conocimientos con mi primera consultoría realizando una base de datos y cartografía para un catálogo de plantas medicinales en Colombia (ver detalles aquí).

Oportunidad 1 - Movilidad internacional
¿Sabías que la mayoría de programas de pregrado cuentan con programas de intercambio con universidades internacionales? Por ejemplo, la Oficina de Relaciones Interinstitucionales (ORI) de la Universidad Nacional de Colombia tiene una serie de convenios con múltiples universidades a nivel mundial. Gracias a estos convenios, yo pude estar durante 6 meses en Brasil, y asimismo recibí apoyo para participar en una conferencia en XV Simposio de Sensoriamento Remoto de Brasil, en la cual presente resultados de mi investigación de unos de los grupos de los que estuve involucrado (ver el artículo aquí). Si estas en pregrado o postgrado te invito mirar estos programas que muchas veces pasan desapercibidos, pero que son muy beneficiosos para conocer culturas y maneras de aplicar la ciencia en otros contextos.

Etapa 1 datos abiertos de deforestación, 2011-2014

Como parte de mi práctica profesional del pregrado ingresé al proyecto Terra-i en el Centro Internacional de Agricultura Tropical (CIAT), ahora conocido como la Alianza Bioversity-CIAT. Este proyecto tuvo un impacto muy positivo en mi desarrollo profesional. Terra-i es una iniciativa para el monitoreo global de la pérdida del hábitat generando alertas de deforestación de manera gratuita y abierta. Debido a la relevancia del proyecto con la agenda de la organización, participé en varios subproyectos que usaban los datos de la herramienta para cuantificar el estado de los ecosistemas en Latinoamérica y Caribe así como para pronosticar el impacto de proyectos de infraestructura vial en la región (ver detalles aquí).

Como investigador proactivo representé el proyecto en varios eventos internacionales en temas de conservación, bosques y tecnologías geoespaciales. Asimismo, promoví extensivamente el uso de los datos abiertos a través de estudios de caso en el blog del proyecto (ver por ejemplo). Fui autor y coordinador de un protocolo para la validación en campo de las alertas de deforestación en el Amazonas peruano el cual posteriormente fue replicado en otras regiones. En términos de comunidades, fui becario de la Sociedad para la Conservación SIG (SCGIS), un programa financiado por ESRI y organizaciones ambientales, que personalmente recomiendo para mejorar conocimientos en herramientas SIG y conocer otros investigadores a nivel mundial aplicando estas tecnologías para la conservación.

Oportunidad 2 - Programas de entrenamiento en SIG
Como lo comenté en la parte final, tuve la oportunidad de ser becario del programa SCGIS. La aplicación se abre anualmente y selecciona profesionales trabajando en el área de conservación para que mejoran su conocimientos en herramientas SIG, principalmente ArcGIS (ver detalles aquí). Asimismo, el programa permite que los becarios presenten su trabajo en la conferencia de usuarios ESRI así como en la conferencia anual de SCGIS. El proceso es bien competido pero con una buena motivación, preparación y evidencia del trabajo de conservación en el formulario de la aplicación es posible ser seleccionado. Es importante indicar que el programa cubre parcialmente los costos, y por tanto es necesario contar con apoyo externo de ciertos gastos como pasajes de avión y visa en caso de necesitar. Otros programas de capacitaciones o escuelas de verano pueden encontrarse en diferentes temáticas adicionales a la conservación. Mi consejo es buscar aquellas donde tengas una mayor afinidad, y donde ofrezcan la posibilidad de seguir conectado con los instructores y colegas que hacen parte de tu cohorte.

Etapa 2 MSc. y PhD en Geografía, 2014-2020

Como parte del proyecto Terra-i, conocí a Mark Mulligan, profesor de King’s College London con quien en colaboración con el proyecto Terra-i abordamos el estudio de las causas de deforestación en el bioma amazónico. Fue un periodo donde me capacité y apliqué la ciencia de datos, inteligencia artificial y computación en la nube. De esta manera, en mi maestría analicé los patrones espaciales de la deforestación mediante el uso de minería de datos y análisis fractal (ver detalles aquí). A partir del uso de dos fuentes de datos abiertos de deforestación, Terra-i y los mapas de Global Forest Change, mi investigación logró mapear la distribución espacial de patrones espaciales asociados con diferentes agentes de deforestación. En el doctorado tuve un abordaje más profundo con la aplicación de técnicas de análisis de las series de tiempo para extraer información de las coberturas y uso posterior a la deforestación a partir de imágenes satelitales (ver detalles aquí). En esta investigación se innovó en el uso de redes neuronales recurrentes convolucionales para la clasificación de series de tiempo de imágenes MODIS. Los modelos fueron entrenados usando recursos hardware del proyecto Terra-i así como créditos de computación de la nube de Google.

Más allá de los avances técnicos durante mis estudios, pienso que lo más emocionante fue maximizar la colaboración y movilidad (intercambios, pasantías, conferencias y grupos de investigación). Por ejemplo, en mi maestría hice un intercambio en Global Canopy, una ONG ambiental con sede en Oxford, Reino Unido en la cual hice un análisis de la seguridad hídrica en el Amazonas (ver detalles aquí). En el doctorado, hice intercambios en el año 2011 en HEIG-VD en Suiza y posteriormente en 2019 en la sede regional en Asia de CIAT en Vietnam. En la primera institución recibí entrenamiento en programación en Python, Big Data y Deep Learning en el laboratorio liderado por el profesor Andres Perez-Uribe, y en el segundo perfeccioné los análisis y modelos con mi co-supervisor en CIAT, Dr Louis Reymondin. También quiero destacar la pasantía en el verano de 2018 realizada en Satellite Application Catapult en el campus de ciencia e innovación de Harwell (Reino Unido) donde participé en la aceleradora Frontier Development Lab (FDL). En esta aceleradora participé con otros investigadores afiliados en instituciones de Europa para el mapeo de asentamientos ilegales a partir de imágenes de resolución media como Sentinel 2 y muy alta como WorldView-4 (ver detalles aquí).

Oportunidad 3 - Créditos gratuitos de investigación para la computación de la nube de Google y Microsoft
Adicional al apoyo de los recursos hardware del proyecto Terra-i, tuve la iniciativa de explorar la computación de la nube a través del programa de educación que tienen Google y Microsoft. Google cuenta con un programa de créditos para la investigación. Por otra parte, Microsoft tiene el programa AI for Earth en el cual se patrocina créditos de la plataforma Azure para investigaciones relacionadas con el medioambiente. A diferencia del programa generalizado de Google, los créditos del programa AI for Earth van más allá de prestar el servicio de la nube y pretenden conectar todos los investigadores e iniciativas proponiendo metodologías basadas en las ciencias de datos y IA para hacer impacto en sus proyectos medioambientales. No estoy a favor de ninguno de los dos programas ya que cada uno tiene sus ventajas de acuerdo a las necesidades de la investigación y comunidad a la que desean pertenecer. Para ambos programas, se requiere completar un formulario de aplicación donde se hacen una serie de preguntas de la investigación y un estimado del total de créditos requeridos. Para maximizar los chances de ser seleccionado, mi sugerencia es aprovechar la subscripción prueba de cada proveedor de la nube. De esta manera, pueden hacer un mejor estimativo de los créditos requeridos así como de servicios adicionales que pueden mencionar en la aplicación.

Resumen

En esta primera entrega de Alejandro 101 resumidamente conté mis experiencias desde mi pregrado hasta el doctorado. Fueron diferentes personas que me inspiraron y pude colaborar durante todos estos años. Fue un periodo lleno de muchos logros profesionales y personales con unas amistades muy valiosas que aún conservo, así como la satisfacción de poder iniciar la familia Coca Calderón durante el tercer año del doctorado.

En la próxima entrega continuaré con la segunda parte de la línea de tiempo, a partir de la cual considero estoy construyendo satisfactoriamente nuevas bases para el liderazgo de la ciencia ambiental abierta. Igualmente, comentaré oportunidades y experiencias que pueden resultar interesantes!

Por una ciencia incluyente y transparente 🚀