Professor do DEI contribui para o desenvolvimento de ferramenta para deteção de violação de copyright em LLMs

Arlindo Oliveira, professor do DEI, participou no desenvolvimento do modelo DE-COP: Detecting Copyrighted Content in Language Models Training Data, que permite detetar infrações de direitos de autor (copyright) em Large Language Models (LLMs).

O DE-COP pretende abordar uma das questões mais relevantes e difíceis no campo da ética e transparência da Inteligência Artificial (IA): como podemos detectar se conteúdos protegidos por direitos de autor foram utilizados nos dados de treino de um modelo, quando esses dados não são divulgados publicamente? Para o efeito, o DE-COP testa LLMs com perguntas de escolha múltipla, onde a resposta correta está incluída tanto em citações exatas como em versões parafraseadas dos conteúdos suspeitos de terem sido utilizados no treino. 

Notícia original AQUI.

(imagem: INESC-ID)

Tópicos: