O plágio é um problema mundial que afeta todos os setores que produzem conteúdo escrito. De acordo com uma pesquisa publicada pelo Centro Internacional para a Integridade Acadêmica (ICAI), aproximadamente 68% dos estudantes de graduação admitiram ter se envolvido em alguma forma de fraude escrita, incluindo plágio, durante suas trajetórias acadêmicas. Esse número se manteve notavelmente consistente em diversas pesquisas realizadas ao longo de mais de duas décadas por Donald McCabe e seus colegas.
Uma meta-análise em larga escala publicada na PLOS ONE (Pupovac & Fanelli, 2015) examinou as taxas de plágio autodeclaradas em 54 estudos e encontrou uma prevalência agrupada de aproximadamente 30% dos estudantes que admitiram ter cometido pelo menos um caso de plágio. O estudo observou uma variação significativa por região, com alguns países relatando taxas acima de 50% e outros abaixo de 10%, refletindo diferenças em atitudes culturais, aplicação institucional e conhecimento das normas sobre plágio.
O problema vai além do meio acadêmico. Um relatório de 2019 da iThenticate (empresa da Turnitin), baseado em uma pesquisa com editores e pesquisadores, constatou que 1 em cada 6 manuscritos submetidos a periódicos acadêmicos continha sobreposição significativa de texto com material previamente publicado. Nos setores de jornalismo e editoração, escândalos de plágio continuam a surgir regularmente, com casos de grande repercussão envolvendo importantes veículos de comunicação nos últimos anos.
Pesquisas sobre desonestidade acadêmica revelam consistentemente que o plágio é generalizado em todos os níveis de ensino. O Centro McCabe para Integridade Acadêmica (antigo Centro Internacional para Integridade Acadêmica) coletou dados de mais de 71.000 estudantes de graduação e 17.000 estudantes de pós-graduação na América do Norte. Os resultados indicam que 39% dos estudantes de graduação admitiram ter parafraseado ou copiado algumas frases de uma fonte da internet sem citá-la, e 62% admitiram ter cometido pelo menos um ato grave de fraude em trabalhos escritos.
Uma pesquisa realizada pela Turnitin em 2023 relatou que, entre os trabalhos submetidos e processados por seu sistema, aproximadamente 11% dos trabalhos de estudantes continham sobreposição significativa de texto (acima de 25% de similaridade) proveniente de fontes não citadas. Um estudo separado, de Bretag et al. (2019), publicado na revista Studies in Higher Education, entrevistou 14.086 estudantes de oito universidades australianas e constatou que 6,5% admitiram ter comprado ou terceirizado trabalhos acadêmicos (fraude acadêmica por encomenda), uma forma particularmente grave de fraude acadêmica.
O plágio em nível de pós-graduação é menos estudado, mas não incomum. O Escritório de Integridade em Pesquisa (ORI, na sigla em inglês) dos Estados Unidos investigou centenas de casos de má conduta em pesquisa desde sua criação, sendo o plágio e a fabricação de dados as principais categorias. Um estudo de Heitman e Litewka (2011), publicado na revista Developing World Bioethics, constatou que o plágio em publicações científicas era mais prevalente em países em desenvolvimento, em parte devido a barreiras linguísticas e normas acadêmicas distintas.
O lançamento do ChatGPT em novembro de 2022 marcou um ponto de virada na integridade acadêmica. Uma pesquisa conduzida pelo grupo de pesquisa em Inteligência Artificial Centrada no Ser Humano da Universidade de Stanford revelou que aproximadamente 17% dos estudantes universitários entrevistados relataram ter usado ferramentas de IA para trabalhos acadêmicos no ano letivo de 2022-2023. Pesquisas subsequentes sugerem que esse número aumentou substancialmente.
Em 2024, a Turnitin relatou que seu sistema de detecção de IA sinalizou entre 6% e 11% dos trabalhos acadêmicos submetidos por estudantes como contendo conteúdo substancial gerado por IA (definido como 80% ou mais de texto escrito por IA). Uma pesquisa da BestColleges (2023) constatou que 56% dos estudantes universitários haviam utilizado ferramentas de IA em seus trabalhos, e cerca de metade deles reconheceu que suas instituições consideravam esse uso uma forma de fraude ou plágio.
O desafio do conteúdo gerado por IA vai além da educação. Uma análise de 2024 da Originality.AI estimou que uma porcentagem significativa e crescente de conteúdo recém-publicado na web apresenta indícios de geração por IA. Isso cria novos desafios para as ferramentas de detecção de plágio, que agora precisam distinguir entre texto original escrito por humanos, texto plagiado escrito por humanos e texto gerado por IA - três categorias distintas que exigem abordagens de detecção diferentes.
O plágio em publicações profissionais acarreta consequências que vão muito além das carreiras individuais. Um estudo de Fang, Steen e Casadevall (2012), publicado nos Anais da Academia Nacional de Ciências (Proceedings of the National Academy of Sciences), analisou 2.047 artigos biomédicos retratados e constatou que 9,8% das retratações foram atribuídas a plágio, enquanto fraude e publicação duplicada representaram a maioria. O estudo estabeleceu que as taxas de retratação na literatura científica aumentaram dez vezes desde 1975.
No jornalismo, o Instituto Poynter e outras organizações de ética na mídia documentaram um padrão de casos de plágio de grande repercussão em importantes veículos de comunicação. Os casos envolveram repórteres do The New York Times, The Washington Post, CNN e Der Spiegel, entre outros. Um estudo de 2014, realizado por Honeycut e Freberg, constatou que os casos de plágio envolvendo jornalistas aumentaram a desconfiança pública em relação aos veículos de comunicação afetados e à mídia em geral.
A publicação digital tornou o plágio mais fácil de cometer e de detectar. Ferramentas de extração de conteúdo podem replicar artigos em milhares de sites poucas horas após a publicação. Ao mesmo tempo, ferramentas de detecção de plágio facilitam para os editores a verificação do conteúdo recebido em bilhões de páginas da web indexadas e a identificação de possíveis problemas antes da publicação.
As consequências financeiras do plágio afetam indivíduos, instituições e setores. No meio acadêmico, estudantes flagrados cometendo plágio podem perder bolsas de estudo, arcar com custos relacionados a mensalidades devido a reprovações em disciplinas ou incorrer em despesas com processos judiciais. Um estudo de 2020 da Agência de Garantia da Qualidade para o Ensino Superior (QAA, na sigla em inglês) do Reino Unido estimou que o mercado global de plágio por encomenda - no qual estudantes pagam terceiros para escreverem seus trabalhos - movimentava mais de US$ 1 bilhão anualmente.
Para editoras e empresas, o plágio pode resultar em responsabilidade financeira direta. Processos por violação de direitos autorais nos Estados Unidos geralmente resultam em indenizações estatutárias de US$ 750 a US$ 30.000 por obra infringida, com penalidades por violação intencional chegando a US$ 150.000 por obra, de acordo com a Lei de Direitos Autorais. A Authors Guild e organizações similares relatam que o roubo de conteúdo custa a autores e editoras centenas de milhões de dólares anualmente em perda de receita.
As instituições também arcam com custos. As universidades investem recursos substanciais em infraestrutura de integridade acadêmica - licenças de software de detecção de plágio, responsáveis pela integridade, processos de investigação e programas educacionais. De acordo com as divulgações orçamentárias institucionais, grandes universidades podem gastar de US$ 50.000 a US$ 300.000 ou mais anualmente apenas com serviços de detecção de plágio, principalmente aquelas que utilizam modelos de preços por aluno baseados em assinatura.
Baixe uma versão de demonstração gratuita ou adquira uma licença para começar a verificar plágio e conteúdo gerado por IA.
A tecnologia de detecção de plágio tornou-se prática padrão na educação e no setor editorial. De acordo com uma pesquisa da Educause de 2022, mais de 90% das instituições de ensino superior nos Estados Unidos e no Reino Unido já utilizam algum tipo de software de detecção de plágio. As taxas de adoção estão crescendo rapidamente na Ásia, no Oriente Médio e na América Latina, à medida que a conscientização sobre integridade acadêmica aumenta globalmente.
A integração da detecção de conteúdo por IA nos fluxos de trabalho de verificação de plágio representa a mais recente evolução na tecnologia de prevenção. Instituições e editoras buscam cada vez mais ferramentas que combinem a detecção tradicional de plágio com a análise por IA em uma única plataforma. As ferramentas para desktop oferecem uma vantagem adicional para organizações preocupadas com a privacidade, pois permitem que os documentos sejam verificados sem a necessidade de carregá-los em servidores externos na nuvem.
A educação continua sendo a estratégia de prevenção mais eficaz a longo prazo. Uma pesquisa de McCabe, Butterfield e Trevino (publicada em seu livro Cheating in College, Johns Hopkins University Press, 2012) constatou que instituições com códigos de honra e programas ativos de educação para a integridade apresentaram taxas de fraude de 25% a 50% menores do que aquelas que dependiam apenas da detecção e punição. A abordagem mais eficaz combina políticas claras, divulgação educacional e tecnologia de detecção confiável.