Introdução

A cinética química é o estudo das alterações de concentração das espécies químicas de uma reação ao longo do tempo. Para estudar tais reações, existem tanto métodos tradicionais de baixo rendimento (e.g. Western blot) como instrumentações modernas de alto rendimento (e.g. Espectrometria de Massas); todos eles medem a concentração de uma espécie química em um determinado instante de tempo. Por outro lado, modelos matemáticos da cinética de uma reação química podem ser utilizados para: i) simular a cinética da reação; ii) fazer previsões para além do experimento realizado, por consequência possibilitando um melhor entendimento do fenômeno estudado.

Enquanto já existem ferramentas para avaliação de modelos cinéticos [1], geralmente estas têm proposta excessivamente genérica para que levem em conta detalhes fundamentais de modelos específicos. Um caso específico é a modelagem de redes de sinalização celular; essas redes constituem um complexo sistema de comunicação celular baseado em interações entre espécies químicas, principalmente entre proteínas, frequentemente envolvendo reações enzimáticas. Reações químicas podem ser mapeadas para sistemas de equações diferenciais ordinárias (EDOs), cujas constantes de velocidade e concentrações iniciais (i.e., os parâmetros do modelo) devem ser ajustados de acordo com as medidas obtidas experimentalmente. Como muitas possibilidades devem ser testadas, esse ajuste de fato é um problema de otimização.

No Instituto Butantan (IBU), os Drs. Marcelo Reis e Vincent Noël vêm desenvolvendo um arcabouço para desenho de modelos cinéticos de redes de sinalização molecular para suprir as necessidades de Biologia Computacional do IBU, o SigNetSim [2]. Este arcabouço lê modelos que são constituídos de listas de reações químicas em formato Systems Biology Markup Language (SBML) [3], mapeia esses modelos em sistemas de EDOs e faz a otimização dos parâmetros utilizando dados experimentais.

No entanto, devido principalmente à imprecisão de medida e à ruídos biológicos, os dados experimentais, quando repetidos, possuem um desvio considerável. Atualmente o ajuste de parâmetros leva em consideração apenas as medidas médias, deixando de levar em consideração a informação proporcionada pelo desvio de cada ponto medido em um dado experimento. Dessa forma, seria desejável melhorar o arcabouço através de um melhor aproveitamento das informações fornecidas pelos experimentos.

Proposta de trabalho e Objetivos

O trabalho proposto consiste em construir um componente para o SigNetSim para que o arcabouço possa fornecer medidas de confiança dos parâmetros estimados. Com essas medidas, é possível escolher um conjunto de valores para os parâmetros de tal maneira que maximize a confiança nos mesmos. Este objetivo pode ser atingido com a implementação do método de Monte Carlo para gerar múltiplas diferentes entradas, que sejam variações contidas na margem de erro das medições experimentais do problema; para cada uma dessas variações, utilizaremos o arcabouço SigNetSim para otimização e guardaremos o conjunto de parâmetros otimizado. Com esses conjuntos de parâmetros, produzimos, para cada parâmetro, histogramas de frequência de valores; tais histogramas representam a distribuição de valores possíveis que cada parâmetro pode assumir levando-se em consideração os erros observados nos experimentos. Os histogramas, por sua vez, podem ser empregados para selecionar um conjunto de valores para os parâmetros considerando como critério maximizar a confiança média dos parâmetros.

Como cada rodada do Monte Carlo e posterior otimização é independente, vem ao caso criar um algoritmo paralelo para aumentar a eficiência de processamento e consequentemente a rapidez de sua execução. A implementação do componente será feita utilizando a linguagem de programação Python, que é a mesma empregada por parte do arcabouço.

Tarefas e cronograma de atividades (cronograma ambicioso para que possíveis atrasos caibam no prazo do TCC)

  • 1) Preparação do ambiente e familiarização com a ferramenta - Abril
  • 2) Escolha das tecnologias a serem utilizadas - Abril
  • 3) Elaboração de versão sequencial do componente. - Maio e Junho
  • 4) Elaboração de versão paralela do componente. - Maio e Junho
  • 5) Criação das ferramentas de avaliação dos intervalos de confiança dos parâmetros. - Julho e Agosto
  • 6) Utilização dos intervalos de confiança dos parâmetros para escolha de um conjunto de parâmetros ótimo. - Julho e Agosto
  • 7) Versão Preliminar da Monografia. -Setembro
  • 8) Poster. - Novembro
  • 9) Monografia Final. -Novembro

Referências


[1] Bevc S, Konc J, Stojan J, Hodošček M, Penca M, Praprotnik M, Janežič D. 2011. ENZO: A Web Tool for Derivation and Evaluation of Kinetic Models of Enzyme Catalyzed Reactions.
[2] Reis MS, Dias MHS, Albuquerque LL, Nakano F, Noël V, Barrera J, and Armelin HA. Mathematical modeling of the Ras/MAPK and PI3K/Akt signaling networks in the K-Ras-driven mouse Y1 adrenocortical tumor cells. 43rd Brazilian Society for Biochemistry and Molecular Biology (SBBq) Congress 2014, Foz do Iguaçu, PR, Brazil. Poster Presentation C-35. Web page: http://f1000.com/posters/browse/summary/1095753.
[3] Hucka M, Bergmann F, Hoops S, Keating S, Sahle S, Schaff J, Smith L, and Wilkinson D. 2011. SBML specifications.