Página TCC | Luís Davi

MAC0499 - Trabalho de Formatura Supervisionado (2023)


Estratégias para a avaliação automática da competência III da Redação do ENEM utilizando BERTimbau

Aluno:

Luís Davi Oliveira de Almeida Campos

Orientadores:

Prof. Denis Deratani Mauá
Igor Cataneo Silveira

Resumo:

A tarefa de Avaliação Automática de Redações já é estudada há algum tempo na área de Processamento de Linguagem Natural. Nos últimos anos, abordagens clássicas da área vêm sendo amplamente superadas por modelos como o BERT, porém seu uso ainda foi pouco explorado em trabalhos em língua portuguesa. Este trabalho propõe o uso do BERTimbau para avaliação da competência III da Redação do ENEM. A abordagem utilizada foi de refinamento do BERTimbau a partir de um dataset contendo 6577 redações avaliadas. Três estratégias foram aplicadas para tentar melhorar o desempenho do modelo. Na primeira, o título do tema foi concatenado à redação antes da etapa de tokenização. Na segunda, além do tema, foram também concatenadas com a redação cinco características extraídas da redação e transformadas em texto. Na terceira, as características foram colocadas em um tensor, o qual foi concatenado à representação gerada pelo BERTimbau antes da entrada na camada de classificação. Os melhores resultados foram alcançados pela primeira estratégia, com um QWK superior a 0,57. O acréscimo de informações sobre as características nas estratégias seguintes não contribuiu para a melhora desses resultados. É proposto ao final o desenvolvimento de novos trabalhos que estudem outras formas de incrementar ou melhorar os dados passados para o BERTimbau.

Documentos:

Proposta do TCC Monografia Código