Os desenvolvimentos no domínio da inteligência artificial (IA) apresentam uma série de oportunidades interessantes para as GLAM (galerias, bibliotecas, arquivos e museus) no mundo digital. Estes vão desde o desenvolvimento de modelos ou algoritmos aperfeiçoados através do processamento de dados, até a mineração, análise e enriquecimento de conjuntos de dados com novos metadados. Embora estas oportunidades sejam suscetíveis de impulsionar as GLAM através da sua transformação digital, também suscitam questões no domínio dos direitos de autor, especialmente no que diz respeito à utilização das coleções digitais das GLAM para treinar a IA e ao tratamento dos resultados gerados pela IA ao abrigo da legislação em matéria de direitos de autor.
Na Creative Commons (CC), estamos atualmente a refletir sobre algumas das questões e, neste post, partilhamos a nossa perspetiva sobre três pontos-chave: A utilização de coleções por GLAM para treino em IA; O estado dos direitos de autor/domínio público dos conteúdos gerados por IA; e os obstáculos, para além dos direitos de autor, à abertura e partilha de coleções GLAM, tendo em conta a falta de clareza em torno da IA.
Utilização de coleções GLAM como contributo para o treino da IA
A CC apoia plenamente as GLAM na utilização das enormes quantidades de dados nas suas coleções digitais para fins de formação em IA (incluindo aprendizagem automática), a fim de cumprir as suas missões de interesse público. Do ponto de vista jurídico, subsiste uma incerteza significativa quanto à questão de saber se as limitações e exceções em matéria de direitos de autor permitem a utilização de conteúdos de direitos de autor para o treino no domínio da IA. É provável que esta incerteza tenha um efeito dissuasor nos GLAM que pretendam tirar partido das tecnologias de IA. Esta é uma das razões pelas quais, na CC, defendemos que a utilização de obras protegidas por direitos de autor para treinar a IA deve ser considerada não infratora por defeito. No que diz respeito aos conteúdos licenciados em CC, sempre que seja necessária uma autorização de direitos de autor para treinar sistemas de IA, as licenças concedem essa autorização em termos e condições diferentes, dependendo da licença CC específica. Um fluxograma ajuda a visualizar se as licenças são acionadas e, em caso afirmativo, que condições podem ser aplicadas.
Ausência de direitos de autor sobre conteúdos «criativos» de IA
Verificou-se que a IA gera conteúdos «criativos» através de processos como as cadeias de Markov e redes neurais artificiais como o GPT-3 (Generative Pre-trained Transformer 3, um modelo de aprendizagem profunda que pode produzir texto). Esse conteúdo pode muito bem tornar-se parte das coleções da GLAM, uma vez que começa a ser apreciado como uma nova forma de expressão «criativa». Do mesmo modo, é provável que os conteúdos gerados pelos GLAM que utilizam a tecnologia de IA (como conjuntos de dados enriquecidos) se tornem abundantes à medida que cada vez mais instituições exploram as oportunidades oferecidas pela IA.
Embora o estatuto desses conteúdos em matéria de direitos de autor não seja claro ao abrigo da legislação em vigor, a CC é da firme opinião de que não devem existir direitos de autor sobre conteúdos gerados por IA e que estes devem ser do domínio público. Os materiais do domínio público podem ser amplamente acedidos, utilizados e reutilizados pelos GLAM no cumprimento da sua missão de interesse público, bem como pelo público em geral. Afirmámos recentemente que todos beneficiamos quando o conhecimento, a cultura e a história são tornados acessíveis e partilháveis. É por esta razão que, em consonância com os princípios proclamados na Carta da Europeana para o Domínio Público, devemos continuar a defender o acesso aberto ao conhecimento e à cultura e resistir a novos confinamentos do nosso domínio público comum.
Barreiras para além dos direitos de autor
Para além dos direitos de autor, é necessário avaliar vários obstáculos à partilha e utilização de coleções GLAM relacionados com a ética, a privacidade e a proteção de dados, a fim de clarificar o papel em rápida evolução que a IA está a desempenhar no setor GLAM. Se estiver interessado em juntar-se à conversa sobre IA e conteúdo abertamente licenciado com especialistas em políticas de todo o mundo, torne-se membro da Plataforma de Direitos de Autor da CC juntando-se à nossa Lista de Correio de Políticas da CC.
Para saber mais sobre a IA e o património cultural, explore a nossa ênfase na IA na Europeana Pro. Se estiver interessado em saber mais sobre os temas debatidos neste post e em trabalhar com os seus pares em toda a Europa, saiba mais sobre como aderir à EuropeanaTech e às Comunidades de Direitos de Autor.
