Trabalho de Conclusão de Curso - Bacharelado em Ciência da Computação:
Correção automática de redações do ENEM usando aprendizado de máquina


Autor: Mateus Latrova Stephanin1

Orientador: Prof. Dr. Dênis Deratani Mauá1

Co-orientador: Igor Cataneo Silveira1

1Instituto de Matemática e Estatística - Universidade de São Paulo (IME-USP)


Resumo

Avaliadores automáticos de redações são softwares que anotam textos escritos em linguagem natural com pontuações que refletem objetivos educacionais. Eles portanto fornecem uma maneira barata e eficiente de assistir na aprendizagem, especialmente para o caso de redações em exames padronizados, como o caso do ENEM ou do TOEFL. Tal tarefa pode ser enxergada pela lente da classificação automática de textos e abordada por técnicas de aprendizado de máquina. Este projeto de conclusão de curso visa a investigação de modelos de linguagem baseados em redes neurais profundas para a avaliação automática de redações do ENEM. Mais especificamente, o foco da avaliação foi a segunda competência cobrada na redação do ENEM: "Compreender o tema e não fugir do que é proposto". Nesse sentido, foram implementados dois modelos de linguagem para tal avaliação: um para detectar se a redação foge ao tema proposto, e outro para detectar se a redação é ou não um aglomerado de palavras.


Abstract

Automatic essay evaluators are software that annotates texts written in natural language with a score that reflects educational goals. Thus, they bring an efficient and cheap way of assisting in learning, especially in the case of essays in standardized exams, as in the case of ENEM or TOEFL. Such a task can be seen through the lens of automatic text classification and approached by machine learning techniques. This capstone project aims to investigate language models based on deep neural networks for the automatic correction of ENEM essays. More specifically, the correction focus was the second competence demanded in ENEM essays: "Understand the topic and do not deviate from what is proposed". In that regard, two language models were implemented for such evaluation: one to detect if an essay deviates from the proposed topic, and another one to detect if it is or not a cluster of words.


Monografia

Clique aqui para acessar


Pôster

Clique aqui para acessar


Repositório de código

Clique aqui para acessar