Dirigente do Google defende relevância dos mecanismos de busca para a sociedade
De acordo com pesquisa divulgada em maio pelo Comitê Gestor da Internet no Brasil (CGI.br), mais de 92 milhões de brasileiros acessam a internet apenas por meio de telefones celulares, 62% dos cerca de 149 milhões de usuários da rede no país. Mas pouca gente se dá conta que essa preferência - que reflete um padrão internacional - é acompanhada por outra: a utilização de aplicativos e não a busca de informações em sites e portais da web.
A consequência dessa mudança de comportamento é "a estagnação da web", segundo Prabhakar Raghavan, vice-presidente sênior do Google. Para ele, no entanto, há muito o que explorar de informações confiáveis e de formas variadas fora do chamado "jardim murado" (walled garden) da internet, como é chamado o mundo dos aplicativos e plataformas extraweb.
Essa foi a visão que ele apresentou na conferência Mecanismos de Busca e Sociedade: Qualidade da Informação e Potencial da Inteligência Artificial, no dia 22 de agosto, evento organização pelo Google, IEA e Instituto de Matemática e Estatística (IME) da USP.
O maior desafio para essa exploração do conteúdo da web manter-se de grande relevância para os indivíduos e a sociedade, como tem sido até agora, é encontrar o equilíbrio ente os interesses dos anunciantes e a preservação da individualidade dos usuários dos mecanismos de busca, segundo Raghavan.
A estagnação da web depois de mais de 20 anos de crescimento exponencial na produção de conteúdo para sites e portais deve-se à maior facilidade de inclusão de conteúdo em aplicativos, explicou o conferencista. Apesar de o usuário ter o trabalho adicional de instalar o aplicativo, registrar-se nele e, eventualmente, atender a outros pré-requisitos (características que definem o "jardim murado"), tem maior facilidade para inserir conteúdo, ao contrário de todo o trabalho para registar, produzir, hospedar e atualizar um site web.
Melhorias do sistema
Raghavan afirmou que o Google tem se empenhado em diversas frentes para melhorar o acesso às informações e tentar garantir que elas tenham a qualidade desejável. Isso inclui ações como o aprimoramento dos sistemas de tradução de conteúdo em inglês para outras línguas.
Segundo ele, as equipes da empresa propõem milhares de melhorias todo ano, mas a maioria é rejeitada. "O processo de decisão do que será aproveitado constitui o centro de melhoria do sistema: há 60 mil avaliadores de alterações espalhados pelo mundo. Eles analisam o tratamento usual dado a uma busca e comparam com o resultado possível a partir de uma melhoria sugerida. A alteração é adotada quando há consenso entre os avaliadores sobre seus benefícios."
Os critérios a serem considerados pelos avaliadores estão num documento com 170 páginas disponível a todos os interessados. Raghavan defendeu a divulgação das políticas da empresa: "A norma é tornar as políticas públicas; cabe ao usuário decidir se confia ou não no mecanismo".
Ele exemplificou duas posturas básicas do mecanismo que o fazem apresentar uma resposta ou não. Se alguém pergunta se os EUA mantêm corpos de seres alienígenas, aparecerão muitas opiniões, mas o sistema não indicará uma resposta. Mas se alguém perguntar se o Brasil é maior que A Austrália, o sistema responderá que sim, pois há consenso sobre o fato e fontes confiáveis que certificam a informação.
Raghavan mencionou vários outros critérios para exclusão de conteúdos nas buscas, como a presença de abuso de crianças, informações extremamente pessoais, spams, entre outros. A inserção de publicidade é vetada em determinadas situações, como no caso de material de caráter nazista.
Ele destacou a importância de melhoria do letramento digital dos usuários para que obtenham informações mais confiáveis. Uma delas é o acesso a informações sobre a fonte, que pode ser visto ao clicar nos três pontos verticais do lado direito de cada URL indicada na pesquisa, bem como os alertas sobre informações duvidosas.
Não é verdade que o Google apresente resultados e anúncios direcionados por possuir um perfil detalhado do usuário, afirmou. “Não queremos personalizar resultados, a não ser que isso traga benefícios às pessoas.” Isso acontece, por exemplo, na busca de uma rota no Google Maps: "Com as informações de várias pessoas que utilizam o sistema, é possível evitar congestionamentos. Isso foi importante durante a pandemia, pois permitiu saber onde havia aglomerações de pessoas".
No caso da publicidade apresentada depois da manifestação do interesse em algum produto, explicou que o Google não tem um perfil armazenado sobre o usuário, como muitos pensam, trata-se apenas do reconhecimento de cookies implantadas no celular do usuário quando acessa um site. O sistema de anúncios reconhecerá, por exemplo, o cookie de um site de vestidos consultado e passará a apresentar publicidade de vestidos.
“Se for extinto esse reconhecimento de dados, acabará o sistema da web aberta”, disse. Então, o grande problema é como resolver a relação entre oportunidades para a publicidade e o nível de preservação da privacidade a ser assegurado aos usuários. O interesse do Google, segundo Raghavan, é que as pessoas tenham interesse por várias coisas e seja possível rastrear seus interesses.
Explicou que ao se fazer uma busca, no topo de relação de páginas web indicadas podem aparecem de um a quatro anúncios ou nenhum, de acordo com o tipo de pergunta. Os anúncios que aparecem primeiro não são necessariamente os que pagam mais ao Google. É feita uma correlação entre o valor pago pelo anunciante e a relevância de seu anúncio em outras buscas.
Inteligência artificial
Ele abordou também as aplicações de ferramentas de inteligência artificial nas buscas. Uma delas é a que permite a busca oral, quando o usuário fala o que quer pesquisar em vez de digitar. Para exemplificar a importância do recurso, comentou que esse tipo de busca representa 5% do total nos EUA, mas é de 30% na Índia. Daí o interesse em aprimorá-lo, uma vez que o sistema só reconhece adequadamente 80% do que é dito, disse.
No caso de imagens, há as possibilidades oferecidas pelo Google Lens, que pode identificar inúmeras coisas, como a espécie de uma planta fotografada e suas eventuais doenças. "Os estudantes usam esse recurso inclusive para resolver problemas matemáticos: basta fotografá-lo e virá uma a resposta, se é uma equação quadrática, por exemplo, e como solucioná-la."
Raghavan lembrou o desenvolvimento do Bert (Bidirectional Encoder Representations for Transformers), uma ferramenta baseada em rede neural para processamento de linguagem natural pré-treinada lançado pelo Google em 2018. "O Bert foi produzido para entender melhor os documentos nas buscas, mas com o passar dos anos ajudou a entender melhor as próprias buscas." O Bert reconhece os substantivos e a prioridade a ser dada a cada um. Este ano o Google lançou o Bard, um chatbot aberto aos usuários brasileiros em julho. No entanto, como alertou, as respostas apresentadas por chatbot como o Bard ainda devem ser avaliadas com cautela.
A principal dificuldade dos mecanismos de busca e outras ferramentas para a obtenção de informações consiste em conseguir uma regulagem fina que permita, ao mesmo tempo, nível elevado de factualidade (consistência da informação) e fluidez na experiência do usuário, afirmou o conferencista.
Raghavan encerrou sua conferência comentando recursos do Google que contribuem com a sustentabilidade. Em muitos países, as rotas indicadas pelo Google Maps, por exemplo, levam em consideração qual é o percurso mais verde, com menor emissão de gases efeito estufas pelo meio de transporte utilizado. Os cálculos indicam que isso permitiu a redução na emissão de gases correspondente ao que 250 mil automóveis produzem durante um ano. Nas pesquisas sobre voos e rotas aéreas também é possível escolher a opção com menor pegada de carbono.
Abertura
A abertura do evento com Raghavan foi prestigiada com a presença do reitor da USP, Carlos Gilberto Carlotti Junior, que lembrou as parcerias já mantidas pela Universidade com o Google, caso do serviço de e-mail de docentes, servidores e estudantes; de Liedi Bernucci, diretora presidente do Instituto de Pesquisas Tecnológicas (IPT) do Estado de São Paulo, que deverá sediar um Centro de Engenharia do Google; da vice-diretora do IEA, Roseli de Deus Lopes; e do presidente da Comissão de Pesquisa e Inovação do IME-USP, Alfredo Goldman.