O DataUSP-PósGrad é um conjunto de serviços analíticos RESTful cujo propósito é auxiliar a Pró-reitoria de Pós-graduação da Universidade de São Paulo na tomada de decisões.

Aluno

Bruno Padilha

Supervisor

João Eduardo Ferreira
Aluno:
Lucas Ikeda França
Ano:
2011
Nota obtida:
Não disponível
Resumo:
Este trabalho tem o objetivo de integrar um detector de plágio ao ambiente de desenvolvimento colaboratibo AdessoWiki. Isto é feito utilizando-se um algoritmo de detecção de similaridades locais, que são propriedades especificas do documento, uma vez que tarefas de mesmo tema compartilham a mesma estrutura geral ( similaridade global). Foi utilizáda uma ferramenta chamada MOSS que implementa o algoritmo Winnowing, que tem a funcão de separar valores chave de um texto, para a finalidade de comparação.
Parte técnica:
O texto é bem claro no que diz respeito ao objetivo final do trabalho, e está escrito de forma simples no geral, ou seja, é de facil compreenção até mesmo por quem não é da área, embora alguns pontos chaves da integração e do funcionamento específico dos algoritmos utilizados estejam um pouco superficiais. Está dentro dos padrões exigidos, destacando claramente os topicos centrais da monografia e, há referência de praticamente todas as fontes utilizadas.
Parte subjetiva:
O autor conta brevemente sobre os desafios encontrados e de maneira um pouco superficial, assim como sobre a contribuição do curso para a realização do trabalho. Não deixa claro a intenção de continuar com o trabalho bem como expandir seus conhecimentos nesta área.
Aluno:
Edson Kiyohiro Miyahara
Ano:
2011
Nota obtida:
Não disponível
Resumo:
Este trabalho tem como propósito o desenvolvimento de uma árvore genealógica de pesquisadores que mantém um curriculo Lattes. Através da minereção destes dados e a respectiva filtragem, um grafo de interrelaçoes pesquisador- orientador e vice-versa é construído, possibilitando a aplicação de filtros para extrair relações específicas. Também foi tomado o cuidado de eliminar redundâncias de nomes (como abreviações) e de não processar mais de uma vez um mesmo currículo. Além disso a ferramenta gera também um mapa da localização geográfica dos pesquisadores e possui um cache para diminuir a quantidade de informação a ser obtida do site do Lattes.
Parte técnica:
O texto é razoavelmente claro e compreensível, a despeito de alguns erros de concordância verbal, o que nao afeta a compreensão. A estrutura em geral segue o que foi proposto para uma monografia, embora a subdivisão dos topicos não é tao clara (poderia ter identado melhor o texto) e no final há uma pequena mistura da parte subjetiva com a objetiva ( os desafios enfrentados sao relatados antes dos resultados obtidos, porém o conteúdo está de acordo. Descreve bem os algoritmos principais, mesmo omitindo alguns detalhes interessantes, como por exemplos o processo de "filtragem" de um grafo, para mostrar informações relevantes.
Parte subjetiva:
A parte subjetiva aparece um pouco misturada com a parte de testes. O autor não vai muito a fundo no relato de suas experiências e desventuras no decorrer das atividades. A carga de aprendizado do curso de ciência da computação poderia ter sido descrita com mais detalhes, uma vez que o trabalho utiliza muito do que se aprende com tal formação. Em linhas gerais é um trabalho bastante interessante mas que poderia ter sido documentado ( ao menos na monografia ) de maneira mais consistente.

 

 

 

 

  Projeto e implementação de serviços analíticos para o DataUSP-PósGrad

  Em meados de 2012 surgiu a idéia de se criar um data warehouse com os dados dos cursos de pós-graduação da Universidade de São Paulo, que nada mais é do que a integração de bases de dados diferentes com o objetivo de se homogeneizar os dados e possibilitar a análise de dados de maneira mais consistente. A partir disso surge a necessidade de se criar um sistema robusto de serviços analíticos para analisar tais dados e gerar relatórios em tempo real. Nasce então o DataUSP-Pósgrad, um conjunto de serviços analíticos construido sobre a arquitetura REST e implementando os recursos do protocolo HTTP (uma api RESTful).

  Criar um conjunto de serviços web usando a arquitetura REST (Mais especificamente RESTful) para gerar relatórios analíticos ad-hoc com base em um data warehouse. Tal sistema tem por objetivo apoiar as unidades com cursos de pós-graduação da USP com informações essenciais no que diz respeito à qualidade dos cursos, como quantidade de egressos em um determinado período, titulações por docentes, estatísticas de produção intelectual, análise em tempo real de dados da coleta Capes, dentre outros serviços. Além disso haverá também a integração com o scriptLattes, uma ferramenta que analisa, sumariza e relaciona informações de produção acadêmica de pesquisadores cadastrados na plataforma Lattes. Cada unidade terá ainda acesso a um cubo olap para fazer análises pertinentes aos seu cursos de pós-graduação

  • Estudo das tecnologias e serviços a serem utilizados no projeto ( Arquitetura REST, RESTful em java, HTML5, javascript, JQuery, bancos de dados Sybase, etc ...);
  • Desenvolvimentos de queries SQL para extrair as informações necessárias para diferentes tipos de relatórios;
  • Implementação do conjunto de recursos web;
  • Desenvolvimento de uma interface interativa para mostrar os dados, com gráficos animados e tabelas;
  • Integração com o sistema de login único da USP;
  • Controle e restrição de acesso a recursos online;
  • Geração de cubos offline para uso com o Microsoft Excel;
  • Geração de cubos online e integração com o visualizador Saiku;
  • Integração com o scriptLattes;
  • Web Crawler de citações.
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
Pesquisa xxxxxx
Desenvolvimento xxxxxxx
Implementação xxxxxxx
Pôster xxxx
Apresentação xxxx
  • Introdução;
  • Conceitos e tecnologias estudadas;
  • Atividades realizadas;
  • Resultados e produtos obtidos;
  • Conclusões;
  • Bibliografia;
  • Parte Subjetiva.

 

 

 

 

No meu blog do stoa há uma lista das atividades realizadas no projeto ao longo do ano

Baixar a monogafia:

 

Baixar a apresentação:

 

pdf

Baixar a pôster:

 

  O sistema pode ser acessado clicando aqui aqui.

  Por disponibilizar informações sensíveis dos programas e dos docentes da USP, o sistema pode ser acessado apenas por um grupo restrito de usuários (Dirigentes de unidades e seus secretários, Reitor, Pró-reitores e alguns outros). Além disso as bases de dados são acessíveis somente de alguns endereços ip específicos, administrados pelo Departamento de Informática da USP.

  Pelos motivos descritos acima e também por direitos de produção intelectual, o código do DataUSP-PósGrad pertencente à Pró-Reitoria de Pós-Graduação e pela Diretoria de Informática da Universidade de São Paulo está ainda em fase de registro. Após o registro o software deverá ser disponibilizado publicamente em forma de serviços.