O que é RAG na IA? Conheça o recurso que ajuda a reduzir alucinações

As “alucinações” acontecem quando modelos de IA geram respostas que parecem corretas, mas são inventadas. O RAG (Retrieval-Augmented Generation) ajuda a reduzir esse problema, pois permite que a IA busque informações em fontes externas e confiáveis antes de responder.

A seguir, tire suas dúvidas sobre:

  • O que é RAG?
  • Como o RAG funciona?
  • Dá para usar RAG no ChatGPT, Gemini e afins?
  • O RAG acaba com as alucinações?
  • Quais são os principais usos do RAG?

O que é RAG?

RAG é a sigla para Retrieval-Augmented Generation, ou Geração Aumentada por Recuperação, em português. É uma técnica que permite que modelos de linguagem consultem informações externas antes de responder, em vez de depender apenas do que aprenderam durante o treinamento.

-
Entre no Canal do WhatsApp do Canaltech e fique por dentro das últimas notícias sobre tecnologia, lançamentos, dicas e tutoriais incríveis.
-

Como o RAG funciona?

O funcionamento do RAG pode parecer técnico à primeira vista, mas a lógica é bastante intuitiva quando explicada passo a passo. Em vez de responder apenas com base no que “aprendeu” durante o treinamento, o modelo de IA consulta informações externas antes de formular a resposta.

Tudo começa com a criação de uma base de conhecimento, que pode incluir manuais, políticas internas, artigos, relatórios ou FAQs em diferentes formatos (textos, PDFs ou bancos de dados etc.). 

Para que o sistema processe esse conteúdo, os documentos são fragmentados em partes menores e convertidos em representações numéricas chamadas vetores, que representam o significado do texto e permitem que o sistema compreenda o contexto das informações, não apenas palavras isoladas.

Apps de IA
A técnica RAG ajuda a tornar as respostas da IA mais confiáveis. (Imagem: Solen Feyissa/Unsplash)

Quando você faz uma pergunta, ela é convertida em um vetor. O sistema compara essa representação com as armazenadas na base de conhecimento para encontrar os trechos mais relevantes. Em outras palavras, ele busca as informações que se relacionam com a dúvida do usuário, mesmo que não utilizem exatamente as mesmas palavras.

Os trechos recuperados são combinados à pergunta do usuário em um único prompt enriquecido com informações externas, processo conhecido como augmentação. Assim, o sistema produz a resposta com sua capacidade de geração de texto junto aos dados recebidos, o que torna o resultado mais preciso, atualizado e fundamentado em fontes reais, reduzindo o risco de informações inventadas.

Dá para usar RAG no ChatGPT, Gemini e afins?

Não. O RAG está disponível para desenvolvedores através da API da OpenAI, Google, Anthropic e afins, que permitem acesso aos modelos das companhias, mas não necessariamente nos apps como ChatGPT, Gemini e Claude, por exemplo.

Neste caso, os modelos são utilizados em soluções próprias, como chatbots corporativos e assistentes internos, para processar as informações de bases de dados externas. 

O RAG acaba com as alucinações?

Não. O RAG não elimina completamente as alucinações, mas ajuda a reduzir o risco.

Elas acontecem quando o modelo precisa responder a algo pouco representado em seu treinamento e, para não “ficar em silêncio”, acaba preenchendo as lacunas com informações inventadas, ainda que pareçam convincentes.

Com o RAG, o processo ocorre de outra forma: antes de responder, o sistema vai até uma base de dados mantida pelo usuário ou empresa e recupera trechos que tenham relação com a pergunta.

No entanto, o resultado depende da qualidade dessas fontes. Se os dados estiverem desatualizados, imprecisos ou mal organizados, a resposta gerada também pode apresentar problemas.

Quais são os principais usos do RAG?

A possibilidade de conectar modelos de IA a dados reais e atualizados abre espaço para:

  • Chatbots de suporte ao cliente, capazes de responder perguntas sobre produtos, garantias e políticas usando documentos oficiais da empresa;
  • Assistentes internos corporativos, que ajudam funcionários a encontrar informações em manuais, políticas de RH ou relatórios;
  • Pesquisa jurídica, médica e financeira, com possibilidade de analisar grandes volumes de documentos técnicos com mais precisão;
  • Resumo de textos longos e complexos, como contratos ou relatórios, com base no conteúdo real das fontes;
  • Sistemas de recomendação, que usam dados atualizados para sugerir produtos, conteúdos ou serviços de forma mais contextual.

Confira outros conteúdos do Canaltech:

VÍDEO: Por que tudo agora tem Inteligência Artificial gratuita? É de graça mesmo? E a paga?

Leia a matéria no Canaltech.