PPGBIONF - Mestrado em Bioinformática
URI Permanente para esta coleçãohttps://repositorio.ufrn.br/handle/123456789/24562
Navegar
Navegando PPGBIONF - Mestrado em Bioinformática por Autor "Araújo, Gilderlanio Santana de"
Agora exibindo 1 - 2 de 2
- Resultados por página
- Opções de Ordenação
Dissertação Easylayout: pacote R integrado à IDE para dispor grafos usando simulações de força(Universidade Federal do Rio Grande do Norte, 2024-10-11) Imparato, Danilo Oliveira; Dalmolin, Rodrigo Juliani Siqueira; https://orcid.org/0000-0002-1688-6155; http://lattes.cnpq.br/4065178015615979; https://orcid.org/0000-0001-6979-4951; http://lattes.cnpq.br/8680042030819838; Gysi, Deisy Morselli; Costa, César Renno; Araújo, Gilderlanio Santana deA visualização de redes é uma etapa crítica para a comunicação eficaz em várias áreas do conhecimento, especialmente nas ciências da vida. Atualmente, uma lacuna separa a manipulação da visualização de redes em ambientes de programação. Usuários constantemente enfrentam a inconveniência de exportar dados de rede para serem manipulados em softwares externos, como Cytoscape e Gephi. Propomos o easylayout, um pacote que une amigavelmente manipulação e visualização ao integrar-se à IDE do usuário (por exemplo, RStudio, VSCode e Jupyter Notebook). Não se trata de uma nova biblioteca para visualização de grafos, mas sim uma tentativa de padronização e intercomunicação de bibliotecas existentes. O pacote easylayout recebe um objeto igraph e o serializa para dentro de uma aplicação web integrada com a interface do RStudio por meio de um servidor Shiny. Esta aplicação web oferece um ambiente para dispor a rede simulando forças de atração e repulsão. Um modo de edição permite que os usuários movam e rotacionem vértices. O desenvolvimento do pacote visa desempenho computacional, de modo que dispositivos de baixo custo sejam capazes de trabalhar com redes relativamente grandes. Para atingir esse objetivo, utilizamos bibliotecas performáticas, como VivaGraphJS e d3-force e renderização em WebGL. Uma vez ajustado, o layout é enviado de volta ao ambiente de programação, podendo ser visualizado com bibliotecas populares como ggplot2 e a própria biblioteca base. A implementação atual foca em refinar a experiência no ecossistema R, mas o uso de tecnologias web torna-o facilmente portável para ambientes similares, como Jupyter Notebooks. Esperamos que esta ferramenta reduza o tempo gasto visualizando redes e também permita que pesquisadores gerem figuras melhores. Está disponível gratuitamente sob licença MIT no GitHub (https://github.com/dalmolingroup/easylayout). O pacote é implementado em R/Shiny e JavaScript/Svelte.Dissertação Pareador de termos para pesquisa clínica: integrate paired toll - IPT(2018-12-18) Damasceno, Thaynã Nhaara Oliveira; Barbosa, Eusébio Guimarães; ; ; Araújo, Gilderlanio Santana de; ; Martins, Rand Randall; ; Sakamoto, Tetsu;Big Data é um termo utilizado para caracterizar o crescente volume de dados existentes sobre os mais diversos temas, sejam eles de cunho biomédico ou não. Devido ao enorme volume de dados biológicos e biomédicos gerados diariamente, uma das principais barreiras encontradas será a análise desses dados. É crescente o desenvolvimento e uso de ferramentas computacionais que permitam a análise desses dados através de técnicas como o Text Mining. O Text Mining, vertente do Data Mining, pode ser definido como um método que permite a extração de informações relevantes contidas em textos. Buscando permitir uma análise diferenciada dos dados, sejam esses dados clínicos ou não, foi desenvolvido um algoritmo, que permite a análise desses dados sem a necessidade de correlação com bancos de dados existentes, nem a criação de novos bancos de dados. O algoritmo da ferramenta Integrate Paired Tool (IPT) foi escrito em linguagem de programação R e utiliza técnicas de Data Mining e Text Mining para análise de dados clínicos, não restringindo suas análises apenas à estes dados específicos. O IPT promove o pareamento de termos analisando a frequência existente entre pares de dados, a partir de um arquivo .csv fornecido pelo usuário. Além disso, a ferramenta WEB foi desenvolvida a partir das linguagens JavaScript, HTML5, CSS e PHP. O algoritmo lê o arquivo .csv, e o percorre por inteiro, fazendo o pareamento de seus termos, dois a dois, independente se as colunas possuem tamanhos diferentes, ou se estão incompletas, até que todas as colunas sejam pareadas. Após todos os agrupamentos, é atribuído um valor para cada par agrupado, somando os pares de iguais frequências e gerando um outro arquivo .csv contendo as interações existentes e suas respectivas frequências. Após as relações e suas frequências de aparecimento serem formadas, um grafo de interações (em R) é mostrado na tela da ferramenta WEB para que o usuário possa então realizar suas análises, além do arquivo .csv com todas as interações e frequências. A obtenção desse grafo e dessa tabela pode conter informações variáveis, a depender da porcentagem que o usuário escolha na ferramenta IPT. Esse arquivo .csv com os dados das interações e frequências pode ser utilizado pelo usuário em outras ferramentas de visualização de redes, como o Gephi, por exemplo. Para fins de testagem da ferramenta, dados de uma UTI neonatal. O IPT demonstrou funcionar bem e atingiu os objetivos da pesquisa, e como metas futuras, teremos a hospedagem da ferramenta na página do Programa de Pós-Graduação em Bioiformática da UFRN, a análise de outros dados e uma possível integração do pré-processamento dos dados dentro do próprio IPT. A partir desse algoritmo, uma ferramenta WEB foi desenvolvida, pra que qualquer pessoa consiga ter acesso ao algoritmo (mesmo sem o conhecimento de técnicas computacionais) e promover a análise dos seus dados.