Total Security - totalsecurity.com.br
Internet
Quarta - 19 de Novembro de 2014 às 11:30
Por: Marcelo Gomes

    Imprimir


A gigante da buscas anunciou a criação de um sistema que utiliza tecnologia de aprendizado de máquina para gerar automaticamente descrições para fotos, que se mostram impressionantemente precisas.

A informação sobre novo sistema, batizado de Neural Image Caption (NIC), foram publicadas nesta terça-feira num post no Google Research Blog. A inovação poderá facilitar a busca por imagens no Google, ajudar pessoas com dificuldades visuais a entender o conteúdo de uma imagem ou até mesmo prover descritivos de imagens quando o usuário estiver numa conexão de internet lenta que não permite a exibição das mesmas.

Computador que vê

Os pesquisadores da Google, Oriol Vinyals, Alexander Toshev, Samy Bengio e Dumitru Erhan, publicaram um estudo no site arXiv no qual descrevem como chegaram ao desenvolvimento do NIC. A meta dos pesquisadores era treinar um sistema computacional para produzir legendas em som natural baseadas nos objetos que ele reconheceria numa imagem.

O sistema é baseado em técnicas derivadas do campo da visão computacional, que permite às máquinas "verem" o mundo, e do processamento em linguagem natural, que tenta tornar a linguagem humana compreensível para os computadores.

Os pesquisadores usaram dois tipos de redes neurais artificiais que são modelos computacionais inspirados em modelos biológicos. Uma das redes codifica a imagem numa representação compacta enquanto que a outra rede gerava uma frase para descrever a imagem.

Quase humano

O NIC gerou resultados precisos, como por exemplo a legenda "um grupo de pessoas fazendo compras em um mercado ao ar livre", escolhida pelo computador para descrever uma foto de uma feira. Mas também gerou várias legendas com pequenos erros, como ao descrever uma foto com três cachorros como tendo apenas dois animais; ou grandes erros, quando confundiu uma foto de uma estrada com um refrigerador.

A performance do modelo NIC foi avaliada usando um algorítimo de classificação que compara a qualidade do texto gerado pela máquina com a qualidade do texto gerado por seres humanos. Mesmo com alguns erros, NIC pontuou 59, numa escala de medição na qual a pontuação 25 é para resultados de estado da arte e pontuações maiores representam ainda mais precisão, até chegar a 69 que é a nota para seres humanos. 





Fonte: IDGNOW

Autor

Marcelo Gomes
marcelo@totalsecurity.com.br www.totalsecurity.com.br

Analista de sistemas e programador, atua profissionalmente com desenvolvimento desde 1993. Passou por diversas áreas com sistemas desktop até conhecer a web e, desde então, focou no desenvolvimento de projetos próprios nessa plataforma online.  Colaborador de várias revistas, teve alguns de seus maiores artigos publicados pela editora Digerati.

Comentários

Deixe seu Comentário

URL Fonte: https://totalsecurity.com.br/noticia/3130/visualizar/