Integridade artificial virou o teste definitivo da IA

Tudo sobre Inteligência Artificial

ver mais

Ao contratar alguém, devemos buscar integridade, inteligência e “energia”. Concordo bastante com esse raciocínio, muitas vezes atribuído a uma frase do investidor estadunidense Warren Buffett. Sem a integridade, a inteligência e a “energia”, ou entusiasmo, podem destruir valor. A frase, pelo visto, vai continuar muito tempo atual, mesmo ao tocar em um ponto incômodo.

Continua após a publicidade

O maior problema de profissionais contratados raramente está na competência. Está na competência sem freio moral. Agora, esse princípio avançou do recrutamento humano para o cerne dos sistemas de inteligência artificial.

Leia no AINotícia: Panorama da Tecnologia: IA, Eleições e Novidades em IA

A máquina mais perigosa já deixou de ser aquela que erra de forma evidente. É a que acerta a métrica, cumpre a ordem, satisfaz o usuário e, ainda assim, conduz a organização para uma decisão ruim. A armadilha da nova era está na otimização sem juízo.

Um modelo pode reduzir custo por consulta, elevar precisão aparente, responder com velocidade exemplar e conservar, por dentro, uma falha de caráter técnico. Chamo essa lacuna de integridade artificial. Trata-se da capacidade de um sistema manter consistência ética, moral e social sob ambiguidade, pressão adversária e ausência de regra explícita. Sem isso, inteligência vira potência desalinhada.

Além do compliance: por que regras tradicionais não bastam

O mercado ainda trata ética em inteligência artificial como um anexo de conformidade. Um documento, um comitê, uma política revisada por advogados, uma matriz de risco. Tudo isso importa. Pouco disso basta. Leia também: A IA que a Anthropic tem medo de lançar: o que você precisa entender sobre o

Compliance ético opera de fora para dentro. Integridade artificial exige algo mais profundo. Requer que o comportamento do sistema conserve valores sob mudança de contexto, sem depender de uma placa de trânsito em cada esquina da decisão.

A diferença parece filosófica. Na prática, compliance define se uma IA confiável discrimina por atalhos estatísticos, se uma ferramenta médica confirma a hipótese errada de um usuário influente ou se um assistente executivo suaviza a verdade para preservar a satisfação da conversa.

Mão humana e mão robótica se aproximam em imagem que representa a relação entre humanos e inteligência artificial. — *Imagem ilustra a interação entre humanos e sistemas de inteligência artificial.* – Imagem: Frame Stock Footage / Shutterstock

A pergunta, portanto, já deixou de ser “quão inteligente é o modelo”. O questionamento é outro. Que tipo de inteligência ele preserva quando a métrica pressiona contra o discernimento? A literatura recente sobre ética integrativa em IA reforça que sistemas desse tipo precisam se conectar a contextos sociais e normas existentes, em vez de tratar cada aplicação como território moral isolado. O ponto é decisivo. O sistema feito porque era possível pertence ao laboratório. O sistema feito porque deveria existir pertence à sociedade.

Os indicadores tradicionais contam apenas parte da história. Precisão, latência, custo por unidade de texto e taxa de acerto em testes padronizados ajudam a comparar máquinas. Eles dizem pouco sobre firmeza moral. Uma avaliação coerente deve medir consistência sob ambiguidade, resistência a manipulação, estabilidade de valores sob mudança de contexto, rastreabilidade de decisões e capacidade de recusar a resposta conveniente.

Continua após a publicidade

A avaliação holística de modelos já aponta nessa direção, ao ampliar métricas para dimensões como viés, toxicidade e eficiência, como propõe o HELM (Holistic Evaluation of Language Models), estrutura do Stanford Center for Research on Foundation Models. Ainda assim, a fronteira está além da medição. Está na arquitetura de incentivos. Mais de tecnologia

Os cinco riscos da inteligência sem eixo moral

O primeiro risco é o servilismo algorítmico. Modelos treinados para agradar aprendem depressa a validar o usuário. Em muitas aplicações, isso parece cordialidade. Em áreas críticas, vira negligência polida. Um sistema que confirma a convicção de um diretor em uma aquisição mal avaliada, ou que acompanha a suspeita clínica frágil de um profissional pressionado, presta um desserviço com excelente aparência.

Um estudo de abril de 2026 avaliou 1.000 itens do MMLU (Massive Multitask Language Understanding) em cinco domínios. Encontrou piora direcional de calibração sob ajuste fino indutor de sycophancy, com ECE (Expected Calibration Error) de +0,006 e MCE (Maximum Calibration Error) de +0,010, embora sem significância estatística no orçamento de treino usado, com p = 0,41. A cautela estatística importa. Mesmo assim, o sinal merece atenção. A IA que bajula com elegância pode errar sem parecer insegura.

Continua após a publicidade

O segundo risco é o reward hacking, a exploração da recompensa. O sistema descobre o atalho que maximiza a pontuação e abandona o objetivo humano real. Obedecer perfeitamente à métrica errada pode gerar comportamento ruim sem violar a regra formal. Leia também: Lenovo dobra valor em melhor mês desde 1999, impulsionada por IA

Uma pesquisa recente sobre aprendizado por reforço em produção afirma que, quando modelos aprendem reward hacking, o desalinhamento pode se espalhar para falsificação de alinhamento, cooperação com atores maliciosos, raciocínio sobre objetivos nocivos e tentativa de sabotagem. O detalhe assustador está no verbo espalhar. A falha deixa de ser local. Vira uma gramática de comportamento.

Pessoa com o ChatGPT aberto no celular — *Um usuário interagindo com uma ferramenta de inteligência artificial generativa em seu smartphone.* – Imagem: Yarrrrrbright/Shutterstock

O terceiro risco é a transferência entre domínios. Um sistema pode aprender a explorar recompensa em uma tarefa de programação e levar esse padrão para outro contexto, sem ordem direta para isso. Um estudo sobre auditoria adversária de recompensas mostrou que um agente treinado apenas em code gaming elevou a sycophancy em outro domínio de 36,2% para 58,7%, diferença de 22,5 pontos percentuais, sem recompensa explícita para esse comportamento. Esse dado deveria incomodar conselhos de administração. A empresa compra uma capacidade em uma área e herda uma deformação em outra. O risco viaja com o modelo.

Continua após a publicidade

O quarto risco é a homogeneização cognitiva. Quando milhões de pessoas consultam os mesmos sistemas, com os mesmos dados de base e as mesmas preferências de resposta, a diversidade intelectual perde espaço. A sociedade passa a receber conselhos com textura, vocabulário, prudência e vieses parecidos. O usuário imagina consultar uma inteligência externa. Muitas vezes, encontra a média estatística de decisões passadas, polida por um verniz de segurança. Para negócios, isso ameaça estratégia. Para consumidores, ameaça autonomia. A dependência excessiva de respostas plausíveis reduz o atrito que preserva o pensamento.

O quinto risco é a manipulação adversária. Sistemas sem integridade internalizada podem ser conduzidos por atores mal-intencionados, dados contaminados, instruções indiretas e incentivos de interface. A engenharia adversária explora justamente essa fragilidade. O modelo sem eixo moral vira um ótimo executor de intenções alheias. Por isso, guardrails externos ajudam, mas chegam tarde quando a lógica íntima do sistema já privilegia aprovação, recompensa e fluidez.

Continua após a publicidade

A nova agenda da liderança: medindo o que protege o futuro

A regulação percebeu o problema antes de boa parte do mercado. A Comissão Europeia informa que as obrigações para modelos de IA de propósito geral no AI Act passaram a valer em . Para modelos com risco sistêmico, há exigências de avaliação e mitigação de riscos, reporte de incidentes e cibersegurança.

Norberto Maraschin Filho

Ver todos os artigos →

Tags: Inteligência Artificial

Notícias relacionadas

Colunistas Seu Direito Digital: empresas vazam dados de funcionários para big techs Leandro Alvarenga Colunistas Olhar do Amanhã: NASA acelera nova corrida pela Lua Álvaro Machado Dias Colunistas FALA AI: NASA vai conseguir construir uma Base Lunar até 2032? Roberto "Pena" Spinelli Colunistas O legado de Ronaldo Mourão: da descoberta de asteroides à criação do Dia do Céu no Brasil Marcelo Zurita

Além do compliance: por que regras tradicionais não bastam

Os cinco riscos da inteligência sem eixo moral

A nova agenda da liderança: medindo o que protege o futuro

Notícias relacionadas

Leia também no AINotícia

Leia também