Pular para o conteúdo

A New Similarity Space Tailored for Supervised Deep Metric Learning

(in Portuguese: Um novo espaço de similaridade adaptado para aprendizado métrico profundo supervisionado)

Pedro Barros, Fabiane Queiroz, Flávio Figueiredo, Jefersson A. Dos Santos, and Heitor Ramos.

ACM Transactions on Intelligent Systems and Technology, vol. 14, issue 1, article 16, pp. 1–25.

http://dx.doi.org/10.1145/3559766

Resumo

Propomos um novo método de aprendizagem métrica profunda. Diferentemente de muitos trabalhos nesta área, definimos um novo espaço latente obtido através de um autoencoder. O novo espaço, nomeadamente espaço S, é dividido em diferentes regiões que descrevem posições onde pares de objetos são semelhantes/diferentes. Localizamos fabricantes para identificar essas regiões e estimar as semelhanças entre objetos por meio de uma distribuição Cauchy baseada em kernel para medir a distância dos marcadores e a nova representação dos dados. Em nossa abordagem, estimamos simultaneamente a posição dos marcadores no espaço S e representamos os objetos no mesmo espaço. Além disso, propomos uma nova função de regularização para evitar o colapso total de marcadores semelhantes. Nosso método enfatiza a propriedade do grupo (separabilidade) enquanto preserva a representatividade da instância. Apresentamos evidências de que nossa proposta pode representar espaços complexos, por exemplo, quando grupos de objetos semelhantes estão localizados em regiões disjuntas. Comparamos nossa proposta com nove abordagens diferentes de aprendizagem métrica à distância (quatro delas baseadas em aprendizagem profunda) em 28 conjuntos de dados heterogêneos do mundo real. De acordo com as quatro métricas quantitativas utilizadas, nosso método supera todas as nove estratégias da literatura.

Figura 3. O lado esquerdo representa o codificador com reconstrução, e o lado direito representa o processo de otimização da posição dos marcadores para M={μ+1,μ+2,μ−3} . Neste exemplo, usamos dois marcadores positivos e um marcador negativo. As cruzes verdes e vermelhas representam μ+1, μ+2 e μ−3, respectivamente, e os pontos verdes e vermelhos representam os pares de entrada semelhantes e diferentes. A seta verde mais à direita representa a etapa de otimização da posição dos marcadores usando divergência de entropia cruzada e algumas funções de regularização. Observe que o número de marcadores positivos e negativos é um hiperparâmetro.