@PHDTHESIS{ 2021:1714403209, title = {Identifica??o de microprote?nas codificadas por pequenas ORFs em mycolicibacterium smegmatis (mycobacterium smegmatis) por meio de an?lise proteogen?mica}, year = {2021}, url = "http://tede2.pucrs.br/tede2/handle/tede/9772", abstract = "A tuberculose ? uma doen?a infecciosa causada principalmente pelo Mycobacterium tuberculosis. Apesar da disponibilidade de tratamento e vacina, ela ? respons?vel por milh?es de mortes anualmente. Al?m disso, o surgimento de cepas resistentes aos medicamentos de primeira linha vem em constante crescimento. Portanto, o entendimento da biologia micobacteriana ? essencial para o desenvolvimento de novas estrat?gias terap?uticas que reduzam a preval?ncia da tuberculose no mundo. Desde o primeiro sequenciamento de DNA procari?tico, h? mais de vinte e cinco anos, tornou-se poss?vel desvendar os mist?rios dos genomas bacterianos e compreender melhor a organiza??o e a regula??o de seus genes. Tradicionalmente, as pipelines de anota??o incluem apenas em seu fluxo de trabalho ORFs (do ingl?s Open Reading Frame) com pelo menos 300 nucleot?deos ou 100 c?dons. As ORFs inferiores a 100 c?dons, conhecidas como pequenas ORFs (small ORFs - smORFs), s?o exclu?das por um corte arbitr?rio, uma vez que um grande n?mero de smORFs podem ser encontradas em qualquer genoma apenas ao acaso, com uma alta probabilidade de serem biologicamente sem sentido e n?o codificarem prote?nas. Neste trabalho, investigamos o universo oculto de microprote?nas codificadas por smORFS em Mycolicibacterium smegmatis mc?155 (Mycobacterium smegmatis), normalmente utilizado como modelo de M. tuberculosis devido ?s suas caracter?sticas n?o patog?nicas e de r?pido crescimento, por meio de uma abordagem proteogen?mica. Combinando gen?mica, transcript?mica e prote?mica, fomos capazes de identificar e anotar com precis?o smORFs em M. smegmatis. Conseguimos aumentar a efici?ncia de identifica??o de microprote?nas por meio de diferentes m?todos de enriquecimento de prote?nas de baixo peso molecular, pois elas, normalmente, s?o consideradas prote?nas de baixa abund?ncia em uma amostra biol?gica complexa. Identificamos 16 ORFs n?o anotadas, uma delas possuindo 23 par?logos espalhados por c?pias do elemento de inser??o IS1096, um conhecido transposon de M. smegmatis. Desse modo, descrevemos a exist?ncia de uma terceira ORF funcional do elemento IS1096, al?m das duas j? conhecidas e caracterizadas. Nosso trabalho tamb?m nos permitiu estender a sequ?ncia de uma prote?na previamente anotada e identificar a menor sequ?ncia codificadora j? encontrada no genoma de M. smegmatis. Mostramos que o c?don de in?cio mais frequente nessas sequ?ncias ? o GTG, seguido pelo ATG can?nico e posteriormente pelos c?dons alternativos ATT e TTG. Muitas dessas novas ORFs possuem tanto sequ?ncias ort?logas anotadas quanto n?o anotadas em micobact?rias e em outras bact?rias pr?ximas. Al?m disso, mostramos como a combina??o de diferentes bancos de dados de proteomas podem excluir adequadamente prote?nas conhecidas que, de outra forma, seriam consideradas novas. Esperamos que este estudo ir? contribuir para a compreens?o dos genomas e proteomas micobacterianos. Ainda, acreditamos que a descoberta dessas prote?nas ir? proporcionar novos estudos dedicados ? elucida??o de suas estruturas, fun??es e avalia??o de essencialidade.", publisher = {Pontif?cia Universidade Cat?lica do Rio Grande do Sul}, scholl = {Programa de P?s-Gradua??o em Biologia Celular e Molecular}, note = {Escola de Ci?ncias} }