WildPixels: rotulagem densa de imagens de sensoriamento remoto “in the wild” é um projeto de pesquisa interdisciplinar e ousado para fazer mapeamentos geográficos em larga escala, por meio de aprendizagem supervisionada a partir de poucos pixels anotados. O estudo tem por objetivo desenvolver novas abordagens computacionais que preencham algumas lacunas que existem entre a literatura recente na área e o que aplicações do mundo real realmente necessitam. Dentre as aplicações, destacam-se três: detecção de estradas rurais na Amazônia e cerrado; mapeamento de áreas urbanas com potencial de infestação de Dengue, além do reconhecimento de espécies nativas e indicadores de mudanças climáticas.
O principal desafio para o uso efetivo do aprendizado supervisionado para rotulagem densa de pixels é a falta de robustez dos modelos quando aplicados na natureza. Já há grande avanço no deep learning, mas precisam de muitos dados anotados e, para aprender padrões para aplicação no mundo real, há a necessidade de anotações de especialistas ou fenômenos raros conjuntos à pesquisa, o que pode trazer problemas de desbalanceamento, escassez e/ou ruídos nos dados. Isto é algo de extrema complexidade de serem solucionados do ponto de vista de machine learning, ou seja, do ponto de vista da Ciência da Computação, o que estas pesquisas vencem e avançam.
Por meio do estudo e desenvolvimento de novas abordagens para aumentar a robustez dos modelos a essas restrições, os pesquisadores se concentraram em problemas críticos de aprendizado de máquina no nível do pixel: (1) desequilíbrio de classes; (2) classes sub-representadas (aprendizagem de poucos tiros); e (3) identificação de classes e objetos não vistos nos dados de treinamento (reconhecimento de conjunto aberto), trazendo resultados robustos e validados.