O avanço da IA generativa intensificou debates sobre o uso de obras protegidas no treinamento dessas tecnologias, especialmente quanto à necessidade de consentimento e compensação aos titulares, além da viabilidade dessas exigências. Como sistemas já foram treinados com grandes volumes de obras, reverter esse cenário é praticamente impossível. À vista disso, busca-se, um equilíbrio regulatório que permita a inovação tecnológica e proteja os direitos dos criadores.
Conheça o JOTA PRO Poder, plataforma de monitoramento que oferece transparência e previsibilidade para empresas
Nesse contexto, o Escritório de Direitos Autorais dos Estados Unidos (Copyright Office), em cumprimento ao seu dever legal de realizar estudos e aconselhar o Congresso em matéria de direitos autorais, publicou, em agosto de 2023, um Aviso de Consulta Pública (Notice of Inquiry – NOI), com o objetivo de colher subsídios técnicos, jurídicos e fáticos sobre o tema.
Este artigo propõe-se a examinar o relatório norte-americano, analisando os desafios e as alternativas jurídicas para o tratamento do uso de obras protegidas no desenvolvimento de sistemas de IA generativa, com especial atenção às discussões sobre fair use, à viabilidade de novos regimes de licenciamento e à necessidade de proteção dos interesses públicos e privados envolvidos.
A Questão Jurídica: Consentimento e Compensação
A Copyright Act, nos Estados Unidos, confere aos titulares de direitos autorais um conjunto de direitos exclusivos: reproduzir, distribuir, executar publicamente e exibir publicamente suas obras, bem como o direito de preparar obras derivadas. Para estabelecer um caso de violação, são necessários dois elementos: “(i) a titularidade de um direito autoral válido e (ii) a cópia de elementos constitutivos da obra que sejam originais.”
O relatório analisa o uso de obras protegidas no treinamento de IA, explicando como redes neurais aprendem padrões e geram novos conteúdos. Embora não seja reprodução direta, há dúvidas sobre a necessidade de consentimento e compensação aos titulares. O debate jurídico centra-se na doutrina do fair use, especialmente nos EUA, considerando quatro fatores: (i) propósito e caráter do uso; (ii) natureza da obra; (iii) quantidade e substancialidade utilizada; e (iv) impacto no mercado da obra original.
Conforme a jurisprudência norte-americana, esses fatores legais não devem ser aplicados de forma automática. Pelo contrário, eles estabelecem princípios gerais, cuja aplicação exige um equilíbrio judicial, dependendo das circunstâncias relevantes. O fair use é, fundamentalmente, uma “regra equitativa de razoabilidade. Trata-se de uma defesa afirmativa, cabendo ao réu o ônus da prova. Ao analisar alegações de fair use envolvendo novas tecnologias, os tribunais buscam promover o “objetivo básico” do direito autoral, que é fomentar o progresso, equilibrando a proteção dos direitos exclusivos dos autores sobre suas obras com a possibilidade de que outros construam sobre essas criações.
Finalmente, o relatório conclui que o arcabouço jurídico atual pode lidar com isso, como ocorreu em outras revoluções tecnológicas. A lei autoral dos EUA historicamente se adaptou, equilibrando progresso e proteção criativa, o que fortaleceu as indústrias cultural e tecnológica.
A discussão, contudo, envolve aspectos econômicos e concorrenciais: impor licenciamento estrito pode inviabilizar o treinamento de IA, mas o uso não autorizado pode prejudicar criadores e fragilizar o ecossistema cultural. O relatório analisa alternativas regulatórias, destacando o licenciamento voluntário, que preserva autonomia, mas é difícil de implementar, e o compulsório, ou modelos coletivos, vistos como mais eficazes para garantir compensação justa e permitir o avanço tecnológico sem entraves excessivos.
Tendências Internacionais
Outros países também estão enfrentando as questões jurídicas relacionadas ao uso de obras protegidas por direitos autorais no treinamento de modelos de inteligência artificial. Vários deles já aprovaram exceções que permitem a mineração de textos e dados (“Text and Data Mining” – TDM), potencialmente aplicáveis ao treinamento de IA. Os métodos de TDM são anteriores às formas atuais de IA generativa.
Na União Europeia, a Diretiva do Mercado Único Digital de 2019 criou exceções para mineração de texto e dados (TDM). O Artigo 3 permite TDM por instituições de pesquisa para fins científicos, enquanto o Artigo 4 amplia para qualquer entidade com acesso legal, respeitando opt-outs dos titulares. O Ato de IA da UE, de 2024, reforçou essa estrutura, exigindo transparência e respeito aos opt-outs, mas ainda há controvérsias sobre sua aplicação ao treinamento de IA generativa e a implementação pelos estados-membros.
Informações direto ao ponto sobre o que realmente importa: assine gratuitamente a JOTA Principal, a nova newsletter do JOTA
O Reino Unido, por sua vez, enfrenta dilema similar: a lei atual permite cópias apenas para pesquisas não comerciais, mas há proposta de ampliar com sistema de opt-out como na UE. Contudo, criadores criticam por ser insuficiente, e empresas alegam que os opt-outs geram custos excessivos.
Israel, cuja lei de direitos autorais é inspirada no sistema norte-americano, emitiu um parecer em 2022 afirmando que o uso de obras protegidas em datasets de machine learning geralmente se qualifica como fair use, desde que o processo seja transformativo e não prejudique o mercado original. No entanto, o governo israelense ressaltou que essa conclusão não se estende aos produtos da IA, que devem ser analisados individualmente sob as regras tradicionais de direitos autorais.
No Japão, foca-se na intenção por trás do uso: sua exceção legal não se aplica se o objetivo for “desfrutar” da expressão criativa da obra original, como reproduzir estilos artísticos ou literários. Recentemente, o governo japonês esclareceu que até mesmo um propósito parcial de “desfrute” pode invalidar a exceção, criando uma barreira significativa para o treinamento de IA generativa que imite obras protegidas.
A China adota uma abordagem cautelosa e em evolução sobre o uso de obras protegidas no treinamento de IA generativa. Embora sua Lei de Direitos Autorais não preveja uma exceção específica para mineração de dados, uma cláusula aberta pode permitir futuras interpretações. Recentemente, tribunais chineses começaram a julgar casos sobre IA, como uma decisão de 2024 que responsabilizou um provedor por infrações cometidas por usuários. Além disso, o governo emitiu regulações administrativas exigindo respeito aos direitos de propriedade intelectual e, em 2025, reforçou seu apoio estratégico ao desenvolvimento da IA.
Por fim, cabe ressaltar que a matéria ainda não foi regulada no Brasil, em debate no Projeto de Lei 2338/2023. A proposta sugere modelos alternativos de compensação financeira, em que empresas de IA paguem aos titulares pelos usos de suas obras no treinamento, com valores ajustados conforme o porte do modelo e seu impacto no mercado.
Conclusões
O relatório “Copyright and Artificial Intelligence, Part 3: Generative AI Training” contribui ao debate sobre direitos autorais e IA, ao analisar aspectos técnicos, jurídicos e econômicos, servindo de inspiração para o debate no Brasil. O desafio central é equilibrar a inovação tecnológica com a proteção aos criadores. Conclui-se pela necessidade de regulações flexíveis e adaptáveis, que acompanhem o progresso, garantindo benefícios sociais sem prejudicar os direitos dos autores.