Notícias 24h no WhatsApp

Assine o Not Journal

Receba notícias em tempo real, análises profissionais e acesso ao Terminal Web.

Plano Básico
WhatsApp + Terminal básico
R$19,90 /mês
WhatsApp 24 Horas
Notícias por temas
Terminal Web básico
Começar Agora
Plano Completo
WhatsApp + Terminal Premium
R$299,90 /mês
Tudo do Básico
Terminal Web completo
Análises profissionais
Começar Agora

O ChatGPT é apenas um amontoado de dados do Reddit e da Wikipedia

Uma análise realizada pela Profound, empresa especializada em monitoramento de IA, revelou que o ChatGPT, modelo da OpenAI, baseia muitas de suas respostas em citações de fontes como a Wikipedia e o Reddit

Lucas Aranha 29 Sep 2025
Sam Altma

Sam Altma

O estudo analisou 30 milhões de citações extraídas de respostas geradas pelo ChatGPT, pelo Google AI Overviews e pelo Perplexity entre agosto de 2024 e junho de 2025. Os dados mostram que a Wikipedia responde por quase metade (47,9%) das citações entre as 10 fontes mais citadas pelo ChatGPT, refletindo preferência por materiais de referência autoritativos.

Comparação com outros modelos

Outros sistemas apresentam padrões distintos:

  • Google AI Overviews: o Reddit representa 21% das citações;

  • Perplexity: o Reddit chega a 46,7% das citações.
    Essas diferenças revelam contrastes na forma como cada sistema seleciona e prioriza fontes.

Confirmação pela Azoma.ai

Uma análise da Azoma.ai, publicada em 27 de agosto de 2025, confirma tendências semelhantes. Segundo o relatório, a Wikipedia constitui 43% das citações nas respostas gerais do ChatGPT, enquanto o Reddit contribui com 12%, subindo para 15% em consultas de caráter comercial.

Vantagens e riscos das fontes de origem colaborativa

A dependência de fontes produzidas pela comunidade garante rapidez e ampla cobertura temática, mas traz riscos: são plataformas sujeitas a viés e erros, eventuais manipulações e informação desatualizada. Especialistas alertam que isso pode gerar bolhas informacionais, limitando a IA a perspectivas populares e levantando preocupações sobre precisão e direitos autorais.

Posição da OpenAI

A OpenAI afirma estar investindo em melhorias na qualidade dos dados usados pelo ChatGPT. Ainda assim, as análises destacam vulnerabilidades em contextos especializados, onde informações incorretas podem ter maior impacto.

Conclusão

Os estudos convergem em um ponto: grande parte das citações que fundamentam respostas automatizadas provém de fontes colaborativas como Wikipedia e Reddit. Isso exige maior atenção à verificação, transparência sobre origem dos dados e políticas de direitos autorais para manter confiança e qualidade nas respostas geradas por IA.

Compartilhar