Análisis comparativo de arquitecturas de NLP para detectar similitudes entre escenarios en español
cic.institucionOrigen | Laboratorio de Investigación y Formación en Informática Avanzada (LIFIA) | |
cic.isFulltext | SI | |
cic.isPeerReviewed | SI | |
cic.lugarDesarrollo | Laboratorio de Investigación y Formación en Informática Avanzada (LIFIA) | |
cic.parentType | Objeto de conferencia | |
cic.version | Aceptada | |
dc.date.accessioned | 2025-08-25T12:21:32Z | |
dc.date.available | 2025-08-25T12:21:32Z | |
dc.identifier.uri | https://digital.cic.gba.gob.ar/handle/11746/12542 | |
dc.title | Análisis comparativo de arquitecturas de NLP para detectar similitudes entre escenarios en español | es |
dc.type | Documento de conferencia | |
dcterms.abstract | La ingeniería de requerimientos es una fase crítica en el desarrollo de software, ya que permite identificar y definir los requerimientos del sistema. Involucra clientes y desarrolladores, quienes deben comunicarse de manera efectiva a pesar de manejar vocabulario diferente. Uno de los artefactos utilizado para este propósito es el escenario, ya que permite especificar el conocimiento de un dominio utilizando lenguaje natural. La especificación de requerimientos implica un trabajo colaborativo, por lo tanto, es esencial detectar tempranamente escenarios similares, con el fin de evitar la duplicación de esfuerzos. Una técnica comúnmente utilizada para identificar similitudes entre oraciones es el uso de LLMs para generar representaciones vectoriales que capturan el significado semántico de las frases en un espacio de alta dimensionalidad. Sin embargo, tienden a generar falsos positivos cuando dos oraciones emplean términos similares con significados distintos, debido a la proximidad superficial de sus embeddings en el espacio vectorial. En este trabajo, se analizan arquitecturas de modelos de procesamiento de lenguaje natural basadas en modelos encoder-decoder para detectar similitudes entre escenarios escritos en español. Para abordar las limitaciones de los encoders tradicionales, se analizan otras estrategias que combinan eficientemente arquitecturas de codificación y decodificación. Esta investigación busca determinar si estas aproximaciones pueden aumentar la precisión y reducir la tasa de falsos positivos en escenarios con terminología diversa. | es |
dcterms.creator.author | Pérez, Gabriela Alejandra | |
dcterms.creator.author | Mostaccio, Catalina Alba | |
dcterms.creator.author | Antonelli, Leandro | |
dcterms.identifier.url | https://werpapers.dimap.ufrn.br/proceedings/WER2025/wer202502.html | |
dcterms.isPartOf.series | 28th Workshop on Requirements Engineering (WER2025) (Brasil, 20 al 22 de agosto de 2025) | |
dcterms.issued | 2025-08 | |
dcterms.language | Español | |
dcterms.license | Attribution-NonCommercial-ShareAlike 4.0 International (BY-NC-SA 4.0) | |
dcterms.subject | Requerimientos | es |
dcterms.subject | NLP | es |
dcterms.subject | LLM | es |
dcterms.subject | Similaridad Semántica | es |
dcterms.subject.materia | Ciencias de la Computación e Información |
Archivos
Bloque original
1 - 1 de 1
Cargando...
- Nombre:
- Análisis comparativo de arquitecturas de NLP.pdf-PDFA.pdf
- Tamaño:
- 386.59 KB
- Formato:
- Adobe Portable Document Format
Bloque de licencias
1 - 1 de 1
Cargando...
- Nombre:
- license.txt
- Tamaño:
- 3.46 KB
- Formato:
- Item-specific license agreed upon to submission
- Descripción: