Please use this identifier to cite or link to this item: https://repositorio.ufrn.br/handle/123456789/50812
Title: Um estudo para identificar e classificar ambiguidades em histórias de usuário usando aprendizagem de máquina
Other Titles: A study to identify and classify ambiguities in user stories using machine learning
Authors: Guimarães, Eltoni Alves
Advisor: Lucena, Márcia Jacyntha Nunes Rodrigues
Keywords: Engenharia de software;Ambiguidade em linguagem natural;Histórias de usuário;Aprendizagem de máquina
Issue Date: 29-Sep-2022
Publisher: Universidade Federal do Rio Grande do Norte
Citation: GUIMARÃES, Eltoni Alves. Um estudo para identificar e classificar ambiguidades em histórias de usuário usando aprendizagem de máquina. Orientador: Márcia Jacyntha Nunes Rodrigues Lucena. 2022. 97f. Dissertação (Mestrado em Sistemas e Computação) - Centro de Ciências Exatas e da Terra, Universidade Federal do Rio Grande do Norte, Natal, 2022.
Portuguese Abstract: Ambiguidade na escrita de requisitos é um dos defeitos mais encontrados nos documentos de requisitos. Existe uma variedade de conceitos sobre o que é ambiguidade em requisitos e para identificar os tipos de ambiguidade deve-se entender melhor cada conceito. A ambiguidade pode comprometer a qualidade das Histórias de Usuário e pode estar presente em requisitos escritos em linguagem natural. Na literatura, há poucos estudos que investigam o potencial dos algoritmos de Aprendizagem de Máquina para classificar ambiguidade em Histórias de Usuários. Esta dissertação tem como objetivo identificar e classificar ambiguidade em Histórias de Usuários através do uso de algoritmos de Aprendizado de Máquina. Dessa forma, foi elaborado um formulário baseado da literatura para ajudar na identificação da ambiguidades nas Histórias de Usuário e foi usada uma abordagem de Aprendizagem de Máquina utilizando dois algoritmos: (i) Support Vector Machine; (ii) Random Forest. Para o estudo foram utilizadas 1002 Histórias de Usuário e aplicadas técnicas (oversampling e undersampling) para balancear os dados desbalanceados, pois notou-se o desbalanceamento dos dados. Como resultados o tipo de ambiguidade mais identificado nas Histórias de Usuário foi adjetivos e advérbios ambíguos e o algoritmo que obteve o modelo de melhor desempenho ao classificar as Histórias de Usuário foi Random Forest.
Abstract: Ambiguity in requirements writing is one of the most common defects found in requirements documents. There are a variety of concepts about what is ambiguity in requirements and to identify the types of ambiguity one should better understand each concept. Ambiguity can compromise the quality of User Stories and may be present in requirements written in natural language. In the literature, there are few studies that investigate the potential of Machine Learning algorithms to classify ambiguity in User Stories. This dissertation aims to identify and classify ambiguity in User Stories through the use of Machine Learning algorithms. Thus, a literature-based form was elaborated to help identify ambiguities in User Stories and a Machine Learning approach was used using two algorithms: (i) Support Vector Machine; (ii) Random Forest. For the study, 1,002 User Stories were used and techniques (oversampling and undersampling) were applied to balance the unbalanced data, because the data was unbalanced. As results, the type of ambiguity most identified in User Stories was ambiguous adjectives and adverbs, and the algorithm that obtained the best performance model when classifying User Stories was Random Forest.
URI: https://repositorio.ufrn.br/handle/123456789/50812
Appears in Collections:PPGSC - Mestrado em Sistemas e Computação

Files in This Item:
File SizeFormat 
Estudoidentificarclassificar_Guimaraes_2022.pdf2.29 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.