Proposta - Práticas de Aprendizado de Máquina usando Previsão de Consumo de Cimento como Estudo de Caso.
Introdução
O modelos preditivos baseados em inteligência artificial ganham exponencial espaço em diversos ramos de ação humana, sejam comerciais ou acadêmicos.
Eles possuem grande aplicabilidade e acessibilidade favorecidas pelo constante investimento na área. Entretanto, o desenvolvimento desses modelos devem ser acompanhadas por profundas análises, típicas da ciência de dados, ou seja, matemáticas e estatísticas. Caso isso não acontecer, podemos correr o risco de gerar modelos de baixa generalização, interpretar resultados de forma errada, tanto na entrada quanto na saída, ou simplesmente, cairmos em uma situação cujo o baixo entendimento do processo resulte na impossibilidade de evolução do mesmo.
Este trabalho final de graduação busca usar a demanda de cimento em escala nacional como um estudo de caso para se buscar um modelo de alta qualidade preditiva, mas sem perder: tanto os conceitos teóricos que permitiram isso; quanto a análises de proeminência dos dados de entrada no resultado final. Para garantia disso, serão usados os chamados métodos de explicabilidade de inteligência artificial.
Objetivo
O objetivo deste trabalho é o desenvolvimento de modelos de alta qualidade para previsão do consumo de cimento, utilizando-o como estudo de caso. Esse processo envolve alcançar um bom conhecimento do dóminio do problema, aplicação de técnicas avançadas de pré-processamento de dados e métodos recomendados para a criação de modelos com boa capacidade de generalização
Metodologia
Inicialmente, haverá foco em entendimento teórico: nos modelos de aprendizado de máquina, boas práticas de treinamento desses modelos, metodologias de pré-processamento de dados e ferramentas de explicabilidade e interpretabilidade de modelos. Como todo esforço de generação de , no estudo de caso por sí, que é a produção e demanda de cimento. Haverá uma busca por dados com potencial de serem dados de entrada significativos para o aumento da qualidade preditiva do modelo em espaço amostral externo. Este último ocorrerá em boa parte do desenvolvimento do projeto.
A busca por um modelo de alta qualidade preditiva, tem metodológico que se assemelha a um algoritmo recursivo. Cada estado terá seu modelo treinado seguindo etapas como.
- Análise e, posteriormente, processamento de dados de entrada.
- Estruturação do modelo e execução (treinamento).
- Análise dos resultados, e posteriormente uso de explicabilidade
Esses métodos de aplicabilidade com base em análises matemáticas levam em consideração os dados como recursos e buscam métricas para indicar a contribuição de cada recurso para a previsão. Esse trabalho usará a biblioteca SHAP de python1.
Isso será repetido em diversas vezes sempre ajustando hiperparamêtros em busca de melhor resultado. Quando houver uma grande mudança de procedimento, seja pela introdução de um novo tipo de pré-processamento ou novos tipo de dados de entrada a nova bateria de testes será dividia como um fase nova.
Cronograma
Fase/Meses | Fev | Mar | Abr | Mai | Jun | Jul | Ago | Set | Out | Nov | Dez |
---|---|---|---|---|---|---|---|---|---|---|---|
Estudos de aprendizado de máquina e seus modelos | X | X | X | X | X | X | X | ||||
Coleta de dados a serem paramêtros significativos | X | X | X | X | X | ||||||
Estudos de métodos de explicabilidade de IA. | X | X | X | X | X | ||||||
Processamento e análise de dados | X | X | X | X | X | X | |||||
Criação dos modelos e seus treinamentos | X | X | X | X | |||||||
Produção da monografia | X | X |
Bibliografia
- Abu-Mostafa et al. Learning from Data, AMLBook.com.
- Charu C. Aggarwal. Neural networks and deep learning. Springer, 2018.
- Chris Chatfield. Time-series forecasting. CRC press, 2000.
- Ian Goodfellow, Yoshua Bengio e Aaron Courville. Deep Learning. 22ª ed. The MIT Press, 2017.
- Scott M. Lundberg e Su-In Lee. “A unified approach to interpreting model predictions”. Advances in neural information processing systems v.30, 2017.
- SHAP (values) - SHapley Additive exPlanations. (link)