Proposta de Trabalho
Possíveis violações de licença de software por ferramentas geradoras de código com inteligência artificial
Aluno: Vinicius Pereira Ximenes Frota
Orientadores: Alfredo Goldman Vel Lejbman e Rafael Serapilha Durelli
Introdução
Em junho de 2021, o GitHub com a parceria do OpenAI lança o Copilot, uma ferramenta baseada em inteligência artificial cuja função é auxiliar programadores, completando código por meio de instruções (ou apenas comentários) escritos pelo programador previamente. Além do GitHub Copilot, surgiram outras ferramentas em inteligência artificial que cumprem o mesmo objetivo: CodeWhisperer, lançado pela Amazon em junho de 2022 e ChatGPT, lançado também pela OpenAI em novembro de 2022.
Embora facilite a vida do programador, um aspecto é pouco discutido acerca dessas ferramentas: a licença de software. Essas linhas de código, usadas nos treinamentos dos modelos, podem ter sido retiradas de determinadas licenças que possuem restrições quanto ao seu uso. Como consequência, é possível ocorrer o caso em que uma dessas inteligências artificiais tenha como saída um código com licença GPL. O desenvolvedor, por sua vez, sem saber da licença desse código, pode acabar modificando este trecho e mudando a licença dele, ferindo a GPL (códigos com essa licença modificados precisam continuar com a mesma licença).
Objetivo
Este trabalho tem como objetivo investigar as licenças dos códigos gerados pelas inteligências artificiais como GitHub Copilot, ChatGPT, CodeWhisperer, etc.. Também será investigado se essas licenças não são devidamente explicitadas pelas ferramentas durante o uso. Inclusive, o trabalho se propõe a responder a seguinte questão: em caso de quebra de licença de software, o usuário ou a ferramenta deve ser penalizado pela quebra da licença de software?
Atividades
- Pesquisa/estudo sobre licenças de software. - Maio
- Pesquisa sobre o histórico de ferramentas que completam código (inclusive aquelas que não envolvem inteligência artificial). - Junho
- Pesquisa sobre as diferenças entre as ferramentas geradoras de código com inteligência artificial - Julho até Agosto
- Verificar a quantidade de artigos que discutem acerca da licença de software e ferramentas geradoras de código com inteligência artificial - Setembro
- Experimentação: interagir com essas ferramentas, buscando reproduzir o cenário em que a quebra de licença é feita - Outubro
- Escrita da monografia, compilando as atividades e o histórico das experimentações.- Maio até Dezembro