Ir para o conteúdo principal

· Leitura de 10 minutos
Alejandro Coca-Castro

alt=Linha do tempo

Olá mundo

Na prestação anterior descrevi a minha viagem de licenciatura para doutoramento, que foi sem dúvida uma etapa satisfatória com muito crescimento pessoal e inúmeras realizações académicas e profissionais. Para a segunda prestação eu vou partilhar o que vivi durante a pandemia, um período muito difícil para toda a humanidade, mas que nos lembra como somos frágeis como todas as outras espécies vivas na Terra.

Vamos a isto!

Etapa 3 Pandemia e incertezas

Começámos em Março de 2020, quando as restrições COVID-19 começaram na maioria dos países e coincidiram com o prazo para a apresentação da minha tese de doutoramento. Além disso, foi o mês em que os fundos da bolsa do meu patrocinador chegou ao fim. Não tendo muitas opções, eu e a minha mulher decidimos deixar Londres e regressar a Bogotá (a minha cidade natal). Apesar de todas as pressões possíveis, cumpri o objectivo de apresentar a minha tese em 30 de Março de 2020 - um dia muito memorável! Depois, em Maio de 2020, defendi a minha tese celebrando remotamente por videochamada com a minha família, supervisores e amigos. Recebi então o meu doutoramento em Geografia do King's College London em Setembro de 2020.

Durante o período da minha tese de correcção e procura de emprego, fui seleccionado para um programa de formação virtual em ciência de dados oferecido pelo governo colombiano e organizado pela Correlation One. Como parte do programa, com outros participantes aplicámos o que aprendemos num projecto centrado no desenvolvimento de modelos e de um painel de dados para prever a reincidência no sistema penal colombiano (ver detalhes aqui ). Posteriormente, em agosto de 2020, tornei-me contratante do Instituto Geográfico Agustín Codazzi, uma entidade governamental colombiana conhecida pelo seu papel na cartografia e planejamento do uso do solo. No meu contrato de 5 meses tive a oportunidade de ser o líder técnico de grupos de 5-6 investigadores e de publicar em revistas científicas os resultados de dois projectos relacionados com a ciência dos dados e tecnologias de inteligência artificial para cartografia de edifícios em zonas rurais (ver detalhes aqui) e cartografia digital do solo (ver detalhes aqui). Também coordenei um desafio do programa de ciência de dados Correlation One que procurou desenvolver modelos preditivos a partir de uma base de dados de solos IGAC (ver repositório aqui).

Com o fim do meu contrato no IGAC e não tendo muito sucesso na procura de opções na academia, decidi enveredar pelo caminho do empreendedorismo. Neste caminho, vale a pena notar que a aprendizagem que recebi num programa extracurricular oferecido pelo instituto de empreendedorismo da minha universidade durante o meu doutoramento foi valiosa. Assim, registei o GeoMagic Labs, uma empresa de consultoria tecnológica de geolocalização, na Câmara de Comércio de Bogotá. Com o meu empreendimento fui seleccionado num concurso de consultoria com a Solidaridad Network, uma ONG focada em facilitar o desenvolvimento de cadeias de fornecimento socialmente responsáveis, ambientalmente sãs e rentáveis. Na minha proposta desenvolvi uma metodologia para mapear sistemas de produção de café utilizando imagens de satélite de acesso aberto (ver detalhes aqui).

Oportunidade 4 - Formação em Ciência de Dados
A ciência de dados ganhou sem dúvida um papel importante nos diferentes domínios do conhecimento com impacto em todos os sectores. Por este motivo, estão disponíveis vários programas e recursos de formação. No meu caso, tirando partido do período de incerteza e virtualidade, estabeleci a tarefa de encontrar formas de melhorar as minhas competências em matéria de ciência de dados. Foi assim que encontrei o programa de Data Science for All (DS4A) de CorrelationOne. Financiado pelo governo colombiano, este programa oferece 13 semanas de formação abertas a todos os cidadãos colombianos que estejam interessados em reforçar as suas competências em matéria de ciência de dados e em aderir ao crescente ecossistema de inteligência artificial na Colômbia. Para participar, é necessário passar um exame de admissão que teste os conhecimentos gerais de estatística, programação e raciocínio lógico. O programa é muito interessante, pois não só recebe formação, mas também tem conversas com profissionais da indústria e do meio acadêmico, contando como eles utilizam a ciência dos dados no seu trabalho diário. Posso descrever o programa como básico ao nível intermédio com exemplos muito práticos e a possibilidade de trabalhar em equipa para pôr todo o conhecimento em prática através de um projecto aplicado proposto por instituições governamentais, pelo sector privado ou por ONG. CorrelationOne ofrece otros programas de entrenamiento enfocados en mujeres, empoderamiento, ingeniería, entre otros que están abiertos a cualquier nacionalidad.

Fase 4 Ciência Aberta, Maio 2021 - até à data

Em novembro de 2020, o regulamento de remissão do meu patrocinador de doutoramento mudou, abrindo as portas a novas oportunidades. Já não era obrigatório provar que eu estava ligado a uma instituição em Bogotá durante o tempo em que recebi financiamento (ou seja, 4 anos!). O novo regulamento foi flexível com outros APAGAR resultados, incluindo a publicação de artigos e/ou o início de um empreendimento relacionado com o tema do doutoramento. Neste novo contexto, candidatei-me a um lugar de pós-doutoramento no Alan Turing Institute no Reino Unido em dezembro de 2020. Já estava familiarizado com o ambiente Turing de uma anterior oportunidade de colaboração hackathon em que participei em dezembro de 2019 (ver o relatório aqui). A posição de pós-doutoramento adequou-se ao meu perfil, e fui atraído pela possibilidade de aprender modelação probabilística, melhorar as competências no desenvolvimento de software e contribuir para Pangeo, uma comunidade que promulga ciência aberta para grandes análises de dados em geociência.

Em fevereiro de 2021 recebi uma comunicação para uma entrevista que incluía uma apresentação de 5 minutos, seguida por uma explicação do código da minha autoria e perguntas do painel da entrevista. Foi a minha primeira entrevista pós-doutoramento, por isso foi natural estar um pouco nervoso. Contudo, dei boas respostas destacando a minha experiência de colaboração em vários grupos de investigação. Na altura de mostrar o meu código, consegui demonstrar como tinha sido utilizado ou visitado em Zenodo (uma plataforma para registar qualquer objecto de investigação digital). Algumas semanas mais tarde, recebi a oferta da posição que começou remotamente a partir de maio de 2021. Mais tarde, com a minha mulher, deixamos a nossa vida em Bogotá e decidimos recomeçar a nossa vida em Londres no final de julho do mesmo ano.

Fazendo parte da Turing, tive a oportunidade de colaborar com vários investigadores no Reino Unido e as suas redes de colaboração, abaixo estão os projetos ou iniciativas com os quais colaboro ativamente:

  • O meu projecto de pós-doutoramento envolve o desenvolvimento de ferramentas baseadas na fusão inteligente de dados de sensores ambientais para melhorar a monitorização do nosso planeta em mudança (ver detalhes aqui). Em colaboração com investigadores do British Antarctic Survey e do Met Office estamos a desenvolver uma ferramenta baseada na modelação probabilística que combina dados de diferentes modalidades (dados em grelha, in situ e estações auxiliares) para ter observações mais finas e mais locais das variáveis ambientais. Além disso, com algoritmos gananciosos, a ferramenta é proposta para sugerir onde instalar sensores locais de modo a reduzir a incerteza da variável ambiental modelada. Tenho a sorte de poder contribuir com os meus conhecimentos para o desenvolvimento da ferramenta, no meu caso trabalhando com investigadores do UK Centre for Ecology and Hydrology (UKCEH) para modelar a humidade do solo.
  • Sou o fundador e líder do livro "Environmental Data Science" (ver detalhes aqui). É um recurso ambiental liderado pela comunidade onde os cadernos de notas Jupyter são utilizados para demonstrar os avanços em dados, metodologias e outras investigações utilizando ferramentas de código aberto. Através desta iniciativa colaboro com outros membros da comunidade Pangeo na Europa, de modo a aumentar a democratização de ferramentas escaláveis e de código aberto para a geociência.
  • Sou membro e desenvolvedor em scivision (ver detalhes aqui), uma ferramenta de código aberto desenvolvida entre investigadores de diferentes domínios, incluindo biologia molecular, agricultura e ambiente, bem como profissionais da equipa de engenharia Turing Research. O meu papel no projecto é assegurar que a ferramenta seja generalizável a uma variedade de imagens (satélite, drones, dados climáticos, entre outros) e modelos da comunidade das ciências ambientais.
  • Sou membro e co-líder da equipa de tradução da The Turing Way, uma iniciativa liderada pela comunidade para promover boas práticas em ciência aberta e reprodutível (ver detalhes aqui).
Oportunidade 5 - Comunidades científicas abertas e formação
Para além de melhorar as minhas competências e melhores práticas na programação de aplicações ambientais, a última fase permitiu-me pertencer e contribuir para a comunidade científica aberta. Apesar de ter pertencido a grupos de investigação desde os meus anos de graduação, acredito que as comunidades científicas abertas têm o maior potencial para ter um impacto a longo prazo na nossa sociedade. Exemplos destas comunidades são The Turing Way e Pangeo, a primeira centrada numa audiência geral e a segunda na comunidade geocientífica. São comunidades que promovem uma visão da ciência em que qualquer pessoa pode contribuir para um objectivo comum, democratizando o conhecimento e as boas práticas em projectos em diferentes sectores produtivos. A Turing Way tem um canal de comunicação diversificado (ver detalhes aqui), mas o que aconselho em primeira instância é que se junte a Slack. Com cerca de 400 membros, este é o local onde se pode trocar ideias com todos os membros e conhecer as atividades da comunidade. Ao longo do ano, são organizadas, `, sessões de traço de livro` semanas, que são eventos do tipo hackathon em que são propostas várias actividades, tais como propor ou rever conteúdos do recurso em linha, pequenas conversas sobre vários tópicos científicos abertos e espaços de socialização ou de rede entre os membros. Ao contrário das tradicionais maratonas de hackathons, não há concurso para um prémio, qualquer contribuição faz parte de uma celebração comum. Através de The Turing Way, também tomei conhecimento do programa .Open Life Science (OLS). É outra comunidade que oferece 16 semanas de formação de liderança científica aberta. Participei na quarta coorte para validar a ideia do livro de ciência dos dados ambientais através de reuniões com o meu mentor. Subsequentemente, co-mentorei um projecto de conhecimento científico aberto multilingue na Ásia Central, no quinto coorte. Ambas as experiências foram valiosas, pois na primeira pude aprender os princípios básicos de liderar um projecto científico aberto, e depois devolver o que aprendi através do meu papel de mentor. Recomendo vivamente que se junte à OLS, eles estão abertos a qualquer ramo do conhecimento em que se queira praticar ciência aberta.

Resumo

Completamos a segunda prestação de Alejandro 101. Estou satisfeito por poder partilhar o meu desenvolvimento profissional e académico, bem como algumas oportunidades para aqueles interessados em ciência ambiental aberta e tecnologias da informação.

Gostaria de aproveitar esta oportunidade para indicar que, se o meu conteúdo for relevante, publicarei mensalmente (se a minha carga profissional e familiar actual o permitir) vários tópicos a partir de discussões de ferramentas (com código), bem como conceitos ou esquemas propostos em tópicos científicos, ambientais ou de tecnologia da informação abertos. De tempos a tempos partilharei uma visão ocasional da minha vida pessoal ou viagens que podem ser enriquecedoras para outros leitores deste blogue.

Para uma ciência inclusiva e transparente 🚀

· Leitura de 8 minutos
Alejandro Coca-Castro

alt=Linha do tempo

Olá mundo

Motivado pela linha do tempo com que participei na reunião da fogueira organizada pela Turing Way, a minha primeira entrada no blog é uma reflexão sobre a minha viagem ao longo dos últimos 11 anos.

Resumirei as minhas experiências mais relevantes em ciência ambiental aberta e tecnologia da informação através de uma série de anedotas por etapas. Tais anedotas vão para além das técnicas e incluem oportunidades que partilho para outros identificados com caminhos semelhantes para tirar partido.

Vamos começar!

Etapa 0 inícios, < 2011

Embora não o pudesse refletir na minha linha temporal, desde os meus estudos de graduação em Engenharia Agrícola obtive as minhas primeiras abordagens em tecnologias de informação espacial. Tive a oportunidade de tomar assuntos relacionados com dados espaciais e modelação como parte do programa de pós-graduação em Geoinformática na minha alma mater, a Universidade Nacional da Colômbia. Fiz também um intercâmbio para a Universidade de São Paulo, Brasil, onde conheci uma nova cultura e participei em grupos de investigação utilizando tecnologias de geoprocessamento aplicadas a estudos ambientais e agrícolas. Neste intercâmbio, recebi formação em várias ferramentas de processamento de imagem de satélite, tanto em ferramentas de licença fechada como ERDAS e ENVI, como aquelas de licença aberta como SPRING. Além disso, as minhas competências em SIG foram principalmente em ArcGIS, e um pouco em QGIS. Ya finalizando mis estudios, en el mes de Mayo de 2011 tuve la oportunidad de poner a prueba mis conocimientos con mi primera consultoría realizando una base de datos y cartografía para un catálogo de plantas medicinales en Colombia (ver detalles aquí).

Oportunidade 1 - Mobilidade internacional
Sabia que a maioria dos programas de licenciatura têm programas de intercâmbio com universidades internacionais? Por exemplo, o Gabinete de Relações Inter-institucionais (ORI) da Universidade Nacional da Colômbia tem uma série de acordos com múltiplas universidades em todo o mundo. Graças a estes acordos, pude passar 6 meses no Brasil, e também recebi apoio para participar numa conferência no XV Simpósio de Sensoriamento Remoto de Brasil, onde apresentei resultados de investigação de um dos grupos em que estive envolvido (ver o artigoaqui). Se é estudante de graduação ou pós-graduação, convido-o a dar uma vista de olhos a estes programas, que muitas vezes passam despercebidos, mas que são muito benéficos para a aprendizagem sobre culturas e formas de aplicar a ciência noutros contextos.

Etapa 1 dados abertos do desmatamento, 2011-2014

Como parte do meu programa de graduação juntei-me ao projecto Terra-i no Centro Internacional de Agricultura Tropical (CIAT), agora conhecido como a Aliança Bioversity-CIAT. Este projecto teve um impacto muito positivo no meu desenvolvimento profissional. Terra-i é uma iniciativa para a monitorização global da perda de habitats através da geração de dados livres e abertos das alertas de desmatamento. Debido a la relevancia del proyecto con la agenda de la organización, participé en varios subproyectos que usaban los datos de la herramienta para cuantificar el estado de los ecosistemas en Latinoamérica y Caribe así como para pronosticar el impacto de proyectos de infraestructura vial en la región (ver detalles aquí).

Como investigador proativo, representei o projecto em vários eventos internacionais sobre conservação, silvicultura e tecnologias geoespaciais. Também promovi extensivamente a utilização de dados abertos através de estudos de caso no blogue do projecto (ver, por exemplo ). Fui o autor e coordenador de um protocolo de validação no terreno de alerta de desmatamento na Amazônia peruana, que mais tarde foi replicado noutras regiões. Em termos de comunidades, fui bolseiro da Society for Conservation GIS (SCGIS), um programa financiado pela ESRI e organizações ambientais, que recomendo pessoalmente para melhorar os conhecimentos em ferramentas GIS e para me encontrar com outros pesquisadores de todo o mundo que aplicam estas tecnologias para a conservação.

Oportunidade 2 - Programas de formação GIS
Como mencionei no final, tive a oportunidade de ser um membro do programa SCGIS. A candidatura está aberta anualmente e selecciona profissionais que trabalham na área da conservação para melhorar os seus conhecimentos em ferramentas SIG, principalmente ArcGIS (ver detalhesaqui). O programa também permite aos bolseiros apresentar o seu trabalho na conferência de utilizadores da ESRI assim como na conferência anual SCGIS. O processo é muito competitivo, mas com boa motivação, preparação e provas de trabalho de conservação no formulário de candidatura é possível ser selecionado. É importante notar que o programa cobre parcialmente os custos, pelo ser necessário ter apoio externo para determinadas despesas, tais como bilhetes de avião e vistos, se necessário. Outros programas de formação ou escolas de verão podem ser encontrados sobre diferentes tópicos para além da conservação. O meu conselho é que procure aqueles em que tem uma forte afinidade, e onde oferecem a possibilidade de permanecer ligado aos instrutores e colegas que fazem parte da sua coorte.

Etapa 2 MSc. e doutoramento em Geografia, 2014-2020

Como parte do projecto Terra-i, conheci Mark Mulligan, professor no King's College London, com quem, em colaboração com o projecto Terra-i, estudamos as causas da desmatamento no bioma amazônico. Foi um período em que treinei e apliquei a ciência dos dados, a inteligência artificial e a computação em nuvem. De esta manera, en mi maestría analicé los patrones espaciales de la deforestación mediante el uso de minería de datos y análisis fractal (ver detalles aquí). Utilizando duas fontes de dados abertas sobre desmatamento, Terra-i e os mapas Global Forest Change, a minha investigação foi capaz de mapear a distribuição espacial dos padrões espaciais associados a diferentes agentes de desmatamento. En el doctorado tuve un abordaje más profundo con la aplicación de técnicas de análisis de las series de tiempo para extraer información de las coberturas y uso posterior a la deforestación a partir de imágenes satelitales (ver detalles aquí). Esta investigação inovou o uso de redes neurais recorrentes convolutivas para a classificação de séries temporais de imagens MODIS. Os modelos foram treinados utilizando recursos de hardware do projecto Terra-i, bem como créditos de computação em nuvem do Google.

Para além dos avanços técnicos durante os meus estudos, penso que o mais excitante foi maximizar a colaboração e a mobilidade (intercâmbios, estágios, conferências e grupos de investigação). Por ejemplo, en mi maestría hice un intercambio en Global Canopy, una ONG ambiental con sede en Oxford, Reino Unido en la cual hice un análisis de la seguridad hídrica en el Amazonas (ver detalles aquí). Como estudante de doutoramento, fiz intercâmbios em 2011 no HEIG-VD na Suíça e depois em 2019 na sede regional asiática do CIAT no Vietname. Na primeira instituição recebi formação em programação Python, Big Data e Deep Learning no laboratório dirigido pelo Professor Andres Perez-Uribe, e na segunda aperfeiçoei a análise e a modelação com o meu co-supervisor no CIAT, Dr Louis Reymondin. Gostaria também de destacar o estágio de verão de 2018 em Satellite Application Catapult no campus de pesquisa e inovação de Harwell (Reino Unido) onde participei no acelerador Frontier Development Lab (FDL). En esta aceleradora participé con otros investigadores afiliados en instituciones de Europa para el mapeo de asentamientos ilegales a partir de imágenes de resolución media como Sentinel 2 y muy alta como WorldView-4 (ver detalles aquí).

Oportunidade 3 - Créditos de pesquisa gratuitos para computação em nuvem da Google e da Microsoft
Além de recever os recursos de hardware do projecto Terra-i, tomei a iniciativa de explorar a computação em nuvem através do programa educativo da Google e da Microsoft. Google cuenta con un programa de créditos para la investigación. Por outro lado, a Microsoft tem o programa AI for Earth no qual patrocina os créditos da plataforma Azure para a investigação relacionada com o ambiente. Ao contrário do programa generalizado do Google, oAI for Earth vai além da prestação do serviço da nuvem e visa ligar todos os pesquisadoras e iniciativas, propondo metodologias baseadas na ciência dos dados e IA para ter impacto nos seus projectos ambientais. Não sou a favor de nenhum dos programas, pois cada um deles tem as suas vantagens de acordo com as necessidades da investigação e da comunidade a que desejam pertencer. Para ambos os programas, é necessário preencher um formulário de candidatura que coloque uma série de questões de investigação e uma estimativa do total de créditos necessários. Para maximizar as suas oportunidades de ser selecionado, a minha sugestão é tirar partido da subscrição experimental de cada fornecedor de nuvens. Desta forma, podem fazer uma melhor estimativa dos créditos necessários, bem como dos serviços adicionais que podem mencionar no pedido.

Resumo

Nesta primeira prestação de Alejandro 101 resumi as minhas experiências desde a graduação até ao doutoramento. Foram pessoas diferentes que me inspiraram e eu fui capaz de colaborar durante todos estes anos. Foi um período cheio de muitas realizações profissionais e pessoais com algumas amizades muito valiosas que ainda mantenho, bem como a satisfação de poder iniciar a família Coca Calderón durante o terceiro ano do doutoramento.

Na próxima prestação continuarei com a segunda parte da linha temporal, a partir da qual acredito estar a construir com sucesso novas fundações para uma liderança da ciência ambiental aberta. Também vou discutir oportunidades e experiências que possam ser de interesse!

Para uma ciência inclusiva e transparente 🚀