Medidas de Entropia com a Utilização do Banco de Dados de Famílias de Proteínas (PFAM)
Autores
7236 |
3162,385
|
|
7237 |
3162,385
|
Informações:
Publicações do PESC
Com o avanço da tecnologia houve a necessidade de obter um sequenciamento e a catalogação de proteínas, quando identificadas em famílias reunidas em clãs. Os Domínios de Proteínas são representados pela homologia em suas sequências, cuja estrutura e funções podem ser confirmadas por técnicas de Cadeias Ocultas de Markov e Machine Learning. Este trabalho tem como propósito verificar de forma introdutória esse alinhamento através de métodos estáticos alternativos interligados à distribuição de valores de funções (Medidas de Entropia) de variáveis aleatórias (probabilidade de ocorrência de aminoácidos nos domínios de proteínas) que mostram a existência das famílias e clãs extraídos de blocos retangulares (m linhas e n colunas).
With the advancement of technology there was the need to obtain a sequencing and cataloging of proteins, when identified in families gathered in clans. Protein Domains are represented by homology in their sequences, whose structure and functions can be confirmed by Hidden Markov Chains and Machine Learning techniques. This work aims to verify in an introductory way this alignment through alternative static methods linked to the distribution of values of functions (Entropy Measures) of random variables (probability of occurrence of amino acids in protein domains) that show the existence of families and clans extracted from rectangular blocks (m rows and n columns).