Sistema implementado nesta segunda-feira vai tentar entender como as pessoas falam para melhorar compreensão da construção de frases; segundo empresa, 1 em cada 8 resultados de busca devem ser afetados
09/12/2019 | 05h00
Por Bruno Romani - O Estado de S. Paulo
Buscador do Google ganha algoritmo que tenta entender linguagem humana
Leia mais
É comum se ter a impressão de que o Google é uma espécie de oráculo da internet, com as respostas corretas para todas as pesquisas. Mas não é bem assim: o motor de buscas da empresa pode se atrapalhar mesmo que existam páginas na internet com bom material para atender às demandas dos usuários. Parte desse problema ocorre porque nem sempre o sistema entende direito o que deve procurar. É por isso que o Google anuncia nesta segunda-feira, 9, a implementação de uma nova inteligência artificial (IA) para auxiliar o seu motor de buscas. Segundo a gigante, o sistema traz a maior mudança em seus algoritmos de busca dos últimos cinco anos.
Chamado de Bidirectional Encoder Representations from Transformers (Bert), o novo sistema é uma inteligência artificial que tenta entender melhor o significado das palavras e seu contexto dentro de uma frase. Isso é importante pois nem sempre os usuários formulam buscas já conhecidas pelo sistema da companhia – segundo a empresa, 15% das pesquisas feitas em um dia trazem alguma formulação inédita.
Até a implementação do Bert, o Google entendia cada palavra de maneira sequencial, como se fosse uma fila. Para buscas como ‘banco de praça’ e ‘conta no banco’, o sistema antigo ‘leria’ até a palavra final para retornar os melhores resultados. Além disso, a palavra ‘banco’ era entendida pelo sistema exatamente como a mesma coisa, mesmo tendo significados diferentes.
Exemplo de resultados com e sem Bert; a busca foi "feliz dia de ação de graça em inglês"
Lição de casa
Com o Bert, os termos “de praça” e “conta no” criam o contexto necessário para cada uma das buscas – o novo sistema consegue olhar para o entorno de cada uma das palavras automaticamente. Para ser treinado, o Google alimentou o sistema com milhares de artigos da Wikipédia e livros de romance e ficção científica. A ideia era esconder da máquina algumas palavras de cada parágrafo e permitir que o sistema adivinhasse o que estava faltando.
No processo de calibragem e treinamento, o Bert desenvolveu capacidade para entender construções de frases, o que o permite ao sistema ser mais preciso quando o usuário recorre à ferramenta de buscas para iluminar os caminhos do seu próprio conhecimento. Em 2018, o algoritmo foi apresentado a especialistas da área e, a partir desta semana, funcionará em 70 idiomas diferentes, incluindo o português do Brasil. Em teleconferência com veículos de diferentes países, incluindo o Estado, o vice-presidente de buscas da empresa, Pandu Nayak, afirmou que o método pode ser reproduzido em qualquer idioma.
Dessa maneira, até preposições, conjunções e outros elementos do idioma, que parecem dispensáveis, ganham importância. Fazer buscas só com palavras chave, como muitas pessoas se acostumaram a fazer, pode não ser mais a melhor estratégia de busca a partir de agora. “Com o novo algoritmo, uma em cada 10 buscas no Google em inglês será impactada”, disse Nayak. Resultados preliminares indicam que, em português, esse número é ainda mais alto: uma a cada oito buscas é afetada.
Exemplo de pesquisa com e sem Bert; a busca foi "raiz em hebraico"
Na mão e na voz
Além da adoção de um novo algoritmo, o Google também vai colocar equipamentos diferentes à disposição das pesquisas. Segundo a empresa, esta será a primeira vez que ela colocará supercomputadores munidos de chips voltados para o processamento de inteligência artificial (conhecidos pela sigla TPU) para calcular e entregar resultados de buscas.
O Bert faz ainda parte de um esforço maior de cientistas e pesquisadores de IA para capacitarem máquinas a entender cada vez melhor como os humanos se comunicam – uma área da tecnologia chamada de processamento de linguagem natural. É algo que deve ganhar mais importância com a popularização de assistentes de voz, como o Google Assistant e a Alexa, da Amazon. A ideia é que os humanos não precisem mais “falar como robôs” quando precisarem da ajuda das máquinas. Pelo contrário: serão os computadores que deverão ser “mais humanos”, o que ajuda a reduzir barreiras na interação e impulsionar a adoção desses sistemas.
“O Bert está ganhando bastante atenção e será possível encontrá-lo em diferentes produtos nos próximos anos. Certamente, ele será importante para ferramentas como o Google Assistant, já que as pessoas estão usando cada vez mais voz para fazer buscas”, disse Nayak. É o tipo de pesquisa que não deve reduzir seu ritmo de avanço tão cedo. “Nos próximos anos, continuaremos a refinar as buscas e todos iremos nos beneficiar das pesquisas e desenvolvimentos em linguagem natural”, diz o executivo indiano, que também é professor de IA na Universidade Stanford.