Proposta de Trabalho

Possíveis violações de licença de software por ferramentas geradoras de código com inteligência artificial

Aluno: Vinicius Pereira Ximenes Frota

Orientadores: Alfredo Goldman Vel Lejbman e Rafael Serapilha Durelli

Introdução

Em junho de 2021, o GitHub com a parceria do OpenAI lança o Copilot, uma ferramenta baseada em inteligência artificial cuja função é auxiliar programadores, completando código por meio de instruções (ou apenas comentários) escritos pelo programador previamente. Além do GitHub Copilot, surgiram outras ferramentas em inteligência artificial que cumprem o mesmo objetivo: CodeWhisperer, lançado pela Amazon em junho de 2022 e ChatGPT, lançado também pela OpenAI em novembro de 2022.

Embora facilite a vida do programador, um aspecto é pouco discutido acerca dessas ferramentas: a licença de software. Essas linhas de código, usadas nos treinamentos dos modelos, podem ter sido retiradas de determinadas licenças que possuem restrições quanto ao seu uso. Como consequência, é possível ocorrer o caso em que uma dessas inteligências artificiais tenha como saída um código com licença GPL. O desenvolvedor, por sua vez, sem saber da licença desse código, pode acabar modificando este trecho e mudando a licença dele, ferindo a GPL (códigos com essa licença modificados precisam continuar com a mesma licença).

Objetivo

Este trabalho tem como objetivo investigar as licenças dos códigos gerados pelas inteligências artificiais como GitHub Copilot, ChatGPT, CodeWhisperer, etc.. Também será investigado se essas licenças não são devidamente explicitadas pelas ferramentas durante o uso. Inclusive, o trabalho se propõe a responder a seguinte questão: em caso de quebra de licença de software, o usuário ou a ferramenta deve ser penalizado pela quebra da licença de software?

Atividades