quinta-feira, 28 de maio de 2026

"Ilegal por Conceção" e Tóxica para o Planeta: A Amnistia Internacional Desmascara a IA

Global: Enormes pipelines de dados que alimentam os principais sistemas de IA generativa estão enraizados em invasões em massa da privacidade por conceção

As empresas estão a extrair vastas quantidades de dados online através de web scraping (extração de dados da web) ilegal para construir os seus produtos de inteligência artificial (IA) generativa, de uma forma que está a permitir uma invasão massiva da privacidade, tornando estes sistemas ilegais por conceção, afirmou hoje a Amnistia Internacional num novo relatório.

O relatório Unlawful by Design: Exposing the Human Rights Costs of Generative AI ("Ilegal por Conceção: Expondo os Custos dos Sistemas de IA Generativa para os Direitos Humanos") documenta riscos graves na extração e processamento de dados em grande escala utilizados para construir e treinar estes sistemas, incluindo violações do direito à privacidade por conceção e consequências adversas para o ambiente e para comunidades historicamente marginalizadas.

"Empresas em todo o mundo estão a fornecer produtos de IA generativa sob uma capa de eficiência e sofisticação, mas, na realidade, estes sistemas perpetuam invasões em massa da privacidade através de web scraping ilegal: um processo automatizado para extrair dados de websites, incluindo dados pessoais, como imagens e atividade em redes sociais, para treinar modelos de IA", afirmou Likhita Banerji, Diretora do Laboratório de Responsabilidade Algorítmica da Amnistia Internacional.

"O pipeline de dados extrativo, as escolhas inerentes de conceção feitas pelas empresas tecnológicas e as cadeias de abastecimento exploratórias para construir sistemas de IA generativa permitiram um paradigma de desenvolvimento tecnológico que abre caminho ao risco de abusos em massa dos direitos humanos."

A Amnistia Internacional investigou os modelos que alimentam algumas das ferramentas independentes de IA generativa mais populares e publicamente disponíveis, incluindo o GPT-3 da OpenAI, o Gemini da Google, o Llama da Meta, o DeepSeek e ferramentas da Midjourney.

Estes sistemas dependem da extração de informações de milhares de milhões de publicações e imagens públicas online, frequentemente sem o consentimento explícito dos indivíduos que nelas aparecem ou que as criaram. Isto não só infringe a privacidade por conceção, mas, à medida que as bases de dados que alimentam os modelos de IA aumentam, a presença de conteúdos de ódio e discriminatórios nos seus resultados também é amplificada, juntamente com estereótipos negativos e preconceitos, especialmente de cariz racial e de género.

"Estas escolhas não são inevitáveis. Devemos contestar as opções de conceção adotadas pelas empresas que constroem sistemas de IA generativa baseando-se em dados de treino, incluindo dados pessoais, que são extraídos sem consentimento e a uma escala monumental", disse Likhita Banerji.

Os preconceitos raciais, de género e culturais são características persistentes nos sistemas de IA generativa, um produto dos dados de treino que são maioritariamente retirados da web e, portanto, poluídos com os preconceitos do mundo real que prejudicam as comunidades historicamente marginalizadas. Adicionalmente, os sistemas de IA generativa representam riscos para o direito à liberdade de pensamento, uma vez que são capazes de influenciar os pensamentos dos utilizadores e moldar as suas crenças pessoais através de sugestões preditivas. Isto aplica-se especialmente a modelos maiores que dependem de dados de treino expansivos.

Elevados custos ambientais
À medida que a escala e a velocidade de desenvolvimento aumentaram nas empresas de IA generativa, aumentaram também os requisitos de infraestruturas e os custos ambientais associados.

As maiores necessidades de processamento dos modelos de maior dimensão exigem chips com maior consumo energético, centros de dados maiores e, consequentemente, mais energia e água para a sua operacionalização. A produção de IA generativa resulta frequentemente num impacto negativo nas comunidades historicamente marginalizadas, uma vez que as terras e os recursos pertencentes a estas comunidades são explorados para construir centros de dados e satisfazer os requisitos de processamento.

O próprio relatório de sustentabilidade da Google de 2024 observou um aumento impressionante de 48% nas emissões de gases com efeito de estufa da empresa desde 2019, atribuível às emissões dos centros de dados e da cadeia de abastecimento. Da mesma forma, as emissões da Microsoft aumentaram 29% entre 2020 e 2024, atribuíveis aos centros de dados que realizam processos de suporte à IA.

A produção de IA generativa resulta frequentemente num impacto negativo para as comunidades historicamente marginalizadas, visto que as terras e os recursos que pertencem a estas comunidades são explorados para construir centros de dados (data centres) e cumprir os requisitos de processamento.

O uso intensivo de recursos na produção de IA generativa levou a que comunidades desde Cerrillos, no Chile, e Querétaro, no México, até ao Arizona, nos Estados Unidos da América, resistissem à instalação de centros de dados em áreas que já são fortemente afetadas por secas e escassez de eletricidade.

Como parte do seu processo de investigação, a Amnistia Internacional contactou por escrito a Google, OpenAI, Meta, Stability AI, Midjourney e DeepSeek, dando-lhes a oportunidade de responder às conclusões do relatório, que afirma que os seus modelos dependem de web scraping ilegal, entre muitas outras preocupações relacionadas com direitos humanos.

A Amnistia Internacional apela aos Estados para que proíbam os sistemas independentes de IA generativa que foram construídos com recurso a web scraping ilegal, definido como a recolha massiva e em larga escala de dados de treino através da web. As empresas devem cessar imediatamente a prática de extração ilegal e não consensual de dados pessoais na web para fins de treino de IA, e os Estados devem responsabilizar as empresas pelo seu envolvimento em quaisquer abusos de direitos humanos ligados às suas escolhas comerciais e de conceção.

Contexto
O relatório fornece uma análise de direitos humanos sobre o 'pipeline de dados' que alimenta os produtos de IA generativa, incluindo as fases de captura, análise e processamento de dados que são críticas para o funcionamento geral destes sistemas. Especificamente, isto envolve focar a atenção nos parâmetros e nas implicações das escolhas de conceção feitas em relação aos dados de treino dos modelos de IA generativa, com especial incidência nos métodos e fontes de recolha de dados, processamento de dados, escala dos modelos e resultados de dados (outputs).


A Amnistia Internacional define ferramentas independentes de IA generativa como produtos que são desenvolvidos, implementados e comercializados única e especificamente pelas suas capacidades de IA generativa, tais como chatbots de IA, geradores de imagem/vídeo/áudio/texto, entre outros.

Sem comentários: