Pascual Research: sistema inteligente de generación y análisis de información académica basado en modelos de lenguaje.

dc.contributor.advisorFonnegra Tarazona, Rubén Darío
dc.contributor.authorJaramillo Méndez, Juliana
dc.date.accessioned2026-03-05T20:30:31Z
dc.date.available2026-03-05T20:30:31Z
dc.date.issued2025
dc.description.abstractEl presente trabajo surgió ante la necesidad de optimizar el acceso a la información científica perteneciente a los diversos documentos dentro de la Institución Universitaria Pascual Bravo (IUPB), donde la dispersión de la información y el creciente volumen de publicaciones representan un reto para la reutilización de las fuentes académicas para estudiantes e investigadores de la institución. Dado el auge, la gran comunidad y la expansión acelerada de la inteligencia artificial y, en particular, de los Grandes Modelos de Lenguaje Natural (LLM), se identificó la oportunidad de aprovechar estas herramientas como apoyo en la centralización y consulta de conocimiento académico de manera ágil y confiable. Para lo anterior, se entrenó un modelo de lenguaje tipo chat con bases de datos generadas a partir de documentos académicos propios de la IUPB, orientado a responder preguntas con contenido relevante y verídico. Este proceso incluyó la recopilación y estructuración de un dataset institucional por medio de un proceso de generador y juez con apoyo de otras LLM existentes; las selección y fine-tuning del modelo más adecuado basado en el costo de recursos-beneficio; la evaluación de su desempeño mediante pruebas adaptadas al español del Benchmark GLUE; y la implementación de una interfaz conversacional en el servicio de Telegram que permitió una interacción práctica y gratuita con el modelo. A pesar de los retos encontrados, se logró cumplir con los objetivos propuestos, pues el modelo demostró coherencia en sus respuestas, utilidad práctica y potencial para fortalecer procesos de investigación institucional lo que deja en evidencia el rápido avance del campo de la inteligencia artificial y deja abiertas las posibilidades a futuras mejoras relacionadas con la ampliación del presente proyecto. Abstract: The current work arose from the need to optimize the access to scientific information contained in various documents within the Pascual Bravo University Institution (IUPB), where the dispersion of information and the growing volume of publications represent a challenge for the reuse of academic sources by students and researchers at the institution. Given the peak, the big community and the fast expansion of artificial intelligence and, particularly, of the Large Language Models (LLMs), an opportunity was identified to leverage these tools to support the centralization and consultation of academic knowledge in an agile and reliable way. To this end, a chat-type language model was trained with databases generated from the IUPB’s own academic documents, aimed at answering questions with relevant and accurate content. This process included the collection and structuring of an institutional dataset through a generator and judge pipeline with the support of other existing LLMs; the selection and fine-tuning of the most appropriate model based on the cost-benefit; the evaluations of its performance through tasks adapted to spanish from the GLUE Benchmark; and the implementation of a conversational interface in the Telegram service that allowed the practical and free interaction with the model. Despite the challenges encountered, the proposed objectives were achieved, because the model demonstrated coherence on its responses, practical usefulness and potential to strengthen institutional research processes which highlights the fast progress in the field of artificial intelligence and opens up possibilities for future improvements related to the growth of this project.
dc.format.extent42
dc.format.mimetypeapplication/pdf
dc.identifier.urihttps://repositorio.pascualbravo.edu.co/handle/pascualbravo/3155
dc.language.isospa
dc.publisherInstitución Universitaria Pascual Bravospa
dc.publisher.facultyFacultad de ingeniería
dc.publisher.placeMedellín, Colombia
dc.publisher.programIngeniería de Software
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.creativecommonsAtribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
dc.rights.urihttps://creativecommons.org/licenses/by-nc-nd/4.0/
dc.subject.proposalModelos de Lenguaje Grande (LLM)spa
dc.subject.proposalAcceso a la informaciónspa
dc.subject.proposalFuentes académicasspa
dc.subject.proposalAccess to informationeng
dc.subject.proposalDeep Learningeng
dc.subject.proposalInteligencia artificialspa
dc.subject.proposalChatbotsspa
dc.thesis.grantorInstitución Universitaria Pascual Bravospa
dc.thesis.levelPegrado
dc.thesis.nameIngeniero (a) de Softwarespa
dc.titlePascual Research: sistema inteligente de generación y análisis de información académica basado en modelos de lenguaje.
dc.type.coarhttp://purl.org/coar/resource_type/c_46ec
dc.type.coarversionhttp://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.localTesis/Trabajo de grado - Monografía - Pregrado
dc.type.redcolhttps://purl.org/redcol/resource_type/TP
dc.type.versioninfo:eu-repo/semantics/publishedVersion
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2

Files

Original bundle

Now showing 1 - 2 of 2
No Thumbnail Available
Name:
Rep_IUPB_Ing_Sof_Sistema_Inteligente.pdf
Size:
3.81 MB
Format:
Adobe Portable Document Format
No Thumbnail Available
Name:
Autorización de derecho de publicación (27).pdf
Size:
64 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.71 KB
Format:
Item-specific license agreed upon to submission
Description: