Microsoft: nova inteligência artificial descreve imagens melhor que os humanos

Recentemente, a Microsoft anunciou o desenvolvimento de um novo modelo de Inteligência Artificial (IA) que consegue descrever conteúdos de imagens de uma forma mais precisa do que os humanos, ou até mesmo seus antecessores. 

Segundo um especialista em Inteligência Artificial, a descrição de uma imagem é uma das principais competências da visão computacional, e com isso é possível realizar uma ampla cartela de serviços. 

Com a descrição imediata de imagens é possível auxiliar todos usuários a acessar algum conteúdo importante, como uma imagem que surge em um resultado de uma pesquisa até uma imagem incluída em uma apresentação. 

Microsoft: nova inteligência artificial descreve imagens melhor que os humanos
Fonte: (Reprodução/Internet)

IA conseguiu superar humanos na descrições de imagens 

Além de diversas funcionalidades que o IA da Microsoft proporciona aos usuários, o mesmo também é extremamente importante aos deficientes visuais. Pois, os mesmos necessitam de uma descrição do que está acontecendo de forma otimizada, e o que a Microsoft propõe é um facilitador de pesquisas. 

Segundo Lijuan Wang, gerente de pesquisas no laboratório de pesquisa da Microsoft em Redmond, Estados Unidos, a descrição de uma imagem não é fácil, por isso deve ser precisa. Para descrever uma imagem o usuário deve entender o que está acontecendo, e relacionar os objetos da paisagem com as ações que estão ocorrendo. 

Lijuan Wang liderou a equipe que realizou testes com a Inteligência Artificial que avalia o sistema de IA e qual é a sua capacidade de gerar legendas para objetos em certo contexto. Com isso, o grupo concluiu que o cérebro artificial conseguiu superar os humanos em descrições. 

Nova versão do IA conseguiu superar a utilizada desde 2015 

Os testes feitos em Inteligência Artificial são padronizados e muita das vezes feitos em conjunto com dados que possuem imagens e frases que as descrevem. Porém, a Microsoft utilizou um conjunto de imagens com um objeto específico em um contexto relacionado a uma tag ou marcação. 

Segundo a empresa, o conjunto de imagens relacionadas à tags pode ser bem mais eficaz do que frases construídas. Com isso, a equipe de Wang conseguiu alimentar o modelo com grande quantidade de dados. Com esse seguimento, a companhia tecnológica consegui criar um ‘vocabulário visual’ ao modelo.

Em comparação, o método se iguala à ensinar uma criança ler associando uma palavra a uma imagem. Depois disso, a IA ainda foi exposta a outros testes com o intuito de construir frases coerentes. De acordo com a empresa, a versão que está sendo testada apresenta uma melhor performance comparada a versão utilizada desde 2015.