Navegando por Autor "Alves Sobrinho, Pitágoras de Azevedo"
Agora exibindo 1 - 3 de 3
- Resultados por página
- Opções de Ordenação
TCC Applying optimized hierarchical NCM classification to public purchases of products in Brazil(Universidade Federal do Rio Grande do Norte, 2022-06-15) Alves Sobrinho, Pitágoras de Azevedo; Xavier Júnior, João Carlos; http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4758203U5; http://lattes.cnpq.br/0435510237375618; Oliveira, Marcel Vinicius Medeiros; http://lattes.cnpq.br/1756952696097255; Santos, Ilueny Constâncio Chaves dos; http://lattes.cnpq.br/8930351118408164The use of free text to categorize any type of entity causes, in most cases, difficulties related to the identification of such entities. In the Electronic Fiscal Receipt (“Nota Fiscal Eletrônica”, NF-e), issued for all public purchases in Brazil, products are categorized within the Mercosul Common Nomenclature (NCM). Such an identifier is necessary to calculate taxes, but it is often filled in wrongly, which makes it difficult to detect irregularities in prices and monitor public expenditures. In this context, an automatic product categorization system was developed based on the textual descriptions present in the NF-e. It consists of a categorization tree that follows the NCM product hierarchy, using the Local Classifier per Parent Node pattern. Each node in the tree is trained to encode the textual descriptions in Document Embeddings and then use a supervised classification algorithm to decide the NCM code. Tree nodes are optimized by selecting classification algorithms as well as parameters, testing the performance of various random configurations. In the results, the hierarchical classification presented a higher F1 score than the flat classification experiments and the error propagation problem was mitigated.Dissertação RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes(Universidade Federal do Rio Grande do Norte, 2021-01-29) Alves Sobrinho, Pitágoras de Azevedo; Figuerola, Wilfredo Blanco; Souza, Jorge Estefano Santana de; ; ; ; http://lattes.cnpq.br/0435510237375618; Santos, Ândrea Kely Campos Ribeiro dos;RNAs não-codificantes são moléculas que desempenham papéis decisivos na regulação de genes, então identificá-los é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Recentemente, novas estratégias de bioinformática vem tentando vencer esses desafios usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar quais são suas funções. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever funções. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não-codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co-expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não-lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.Artigo Whole genome sequencing of the Pirarucu (Arapaima gigas) supports independent emergence of major teleost clades(2018-07-05) Vialle, Ricardo Assunção; Souza, Jorge Estefano Santana de; Lopes, Katia de Paiva; Teixeira, Diego Gomes; Alves Sobrinho, Pitágoras de Azevedo; Ribeiro-dos-Santos, André M.; Furtado, Carolina; Sakamoto, Tetsu; Silva, Fábio Augusto Oliveira; Oliveira, Edivaldo Herculano Corrêa de; Hamoy, Igor Guerreiro; Assumpção, Paulo Pimentel; Ribeiro-dos-Santos, Ândrea; Lima, João Paulo Matos Santos; Seuánez, Héctor N.; Souza, Sandro José de; Santos, SidneyThe Pirarucu (Arapaima gigas) is one of the world's largest freshwater fishes and member of the superorder Osteoglossomorpha (bonytongues), one of the oldest lineages of ray-finned fishes. This species is an obligate air-breather found in the basin of the Amazon River with an attractive potential for aquaculture. Its phylogenetic position among bony fishes makes the Pirarucu a relevant subject for evolutionary studies of early teleost diversification. Here, we present, for the first time, a draft genome version of the A. gigas genome, providing useful information for further functional and evolutionary studies. The A. gigas genome was assembled with 103 Gb raw reads sequenced in an Illumina platform. The final draft genome assembly was approximately 661 Mb, with a contig N50 equal to 51.23 kb and scaffold N50 of 668 kb. Repeat sequences accounted for 21.69% of the whole genome, and a total of 24,655 protein-coding genes were predicted from the genome assembly, with an average of 9 exons per gene. Phylogenomic analysis based on 24 fish species supported the postulation that Osteoglossomorpha and Elopomorpha (eels, tarpons and bonefishes) are sister groups, both forming a sister lineage with respect to Clupeocephala (remaining teleosts). Divergence time estimations suggested that Osteoglossomorpha and Elopomorpha lineages emerged independently in a period of approximately 30 million years in the Jurassic. The draft genome of A. gigas provides a valuable genetic resource for further investigations of evolutionary studies and may also offer a valuable data for economic applications.