dc.rights.license | Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0) | spa |
dc.contributor.advisor | Uribe Sandoval, Carmen Constanza | |
dc.contributor.author | Alarcón, Carlos Manuel | |
dc.contributor.author | Torres Pedraza, Yhon Fredy | |
dc.date.accessioned | 2024-09-26T15:10:23Z | |
dc.date.available | 2024-09-26T15:10:23Z | |
dc.date.issued | 2022-10-03 | |
dc.identifier.uri | https://repositorio.uniboyaca.edu.co/handle/uniboyaca/794 | |
dc.description.abstract | La historia ha demostrado, como la ingeniería de sistemas trabaja a diario en la resolución de problemas, y como la rama de Inteligencia Artificial en las últimas décadas ha evolucionado permitiendo mejorar la vida de las personas; esta investigación pretende dar un aporte en la traducción de expresiones de la Lengua de Señas Colombiana. Inicialmente se verifica la necesidad de disminuir la brecha comunicacional de los médicos con personas con discapacidad auditiva, así como se sondean las expresiones más usadas en el ambiente de una consulta médica. Al mismo tiempo, se establecen las aplicaciones que otros investigadores han desarrollado en esta línea, apoyándose en medios como GitHub YouTube y Google Académico, entre otros. Posteriormente se selecciona un modelo de red neuronal recurrente, que se apoya en bibliotecas nativas de Python como Tensor Flow, Open Pose, Cv2, Matplotlib y Media Pipe con lo que se adecua un desarrollo propio que permite clasificar algunas expresiones de la Lengua de Señas Colombiana, red neuronal artificial que arrojó una precisión aceptable y un error bajo, cuya medida hizo uso de la biblioteca Tensor Board.
De esta forma, se logra alcanzar el objetivo general de entrenar un modelo de Redes Neuronales, que realice la traducción de la Lengua de Señas Colombiana a texto, enfocado en mejorar la comunicación de los estudiantes de medicina de la universidad de Boyacá y sus pacientes con discapacidad auditiva.
La metodología utilizada en este proyecto fue de tipo aplicada, ya que se hace énfasis en la solución de un problema. soportado en un enfoque mixto, ya que tiene resultados cualitativos, ya que se describe el funcionamiento de la aplicación y, así mismo, cuantitativos por que se estiman la precisión del reconocimiento de las señas y el error del modelo, representados en graficas donde se puede observar que alcanza el nivel más alto de precisión.
En el desarrollo de este proyecto se ha notado falta de información y su difusión con respecto a Lengua de Señas Colombiana (LSC), a pesar de los esfuerzos gubernamentales y de entidades como el Instituto Nacional para Sordos, así mismo, no se evidencian muchos aportes tecnológicos en la traducción de diferentes lenguas de señas, y específicamente en la traducción de la Lengua de Señas Colombiana. Con el desarrollo que se presenta en este trabajo, se ha evidenciado que la Red Neuronal Recurrente LSTM tiene una gran precisión, gracias a que permite procesar grandes cantidades de datos en la detección y seguimiento de acciones por medio de video. Finalmente, es importante que los investigadores continúen trabajando en el área de la Lengua de Señas Colombiana, explorando técnicas de Inteligencia Artificial para conseguir modelos que sean más flexibles y que generen menos carga de trabajo, contribuyendo a los procesos de inclusión en nuestro entorno. | spa |
dc.description.abstract | History has shown how systems engineering works daily in the resolution of problems, and how the branch of Artificial Intelligence in the last decades has evolved allowing to improve people's lives; this research intends to give a contribution in the translation of expressions of the Colombian Sign Language. Initially, the need to reduce the communication gap between doctors and hearing-impaired people is verified, as well as the most used expressions in a medical office environment are surveyed. At the same time, the applications that other researchers have developed in this line are established, relying on media such as GitHub YouTube and Google Scholar, among others. Subsequently, a recurrent neural network model is selected, which is supported by native Python libraries such as Tensor Flow, Open Pose, Cv2, Matplotlib and Media Pipe, with which an own development is adapted to classify some expressions of the Colombian Sign Language, artificial neural network that yielded an acceptable accuracy and a low error, whose measurement made use of the Tensor Board library.
In this way, the general objective of training a Neural Network model, which performs the translation of Colombian Sign Language to text, focused on improving the communication of medical students of the University of Boyacá and their patients with hearing impairment, is achieved.
The methodology used in this project was of applied type, since it emphasizes the solution of a problem, supported in a mixed approach, since it has qualitative results, since it describes the operation of the application and, likewise, quantitative because it estimates the accuracy of sign recognition and the error of the model, represented in graphs where it can be observed that it reaches the highest level of accuracy.
In the development of this project, it has been noticed the lack of information and its diffusion with respect to Colombian Sign Language (CSL), in spite of the governmental efforts and entities such as the National Institute for the Deaf, likewise, there are not many technological contributions in the translation of different sign languages, and specifically in the translation of Colombian Sign Language. With the development presented in this work, it has been evidenced that the Recurrent Neural Network LSTM has a great precision, thanks to the fact that it allows processing large amounts of data in the detection and tracking of actions by means of video. Finally, it is important that researchers continue working in the area of Colombian Sign Language, exploring Artificial Intelligence techniques to achieve models that are more flexible and generate less workload, contributing to the processes of inclusion in our environment. | eng |
dc.description.tableofcontents | Introducción 25 -- Modelos de redes neuronales estudiados para este proyecto 26 11 -- Modelo two-way sign language translator 28 -- Modelo detección y clasificación de manos 29 -- Modelo ASL alphabet translation 30 -- Modelo sign-language 30 -- Modelo real time face expression recognition 30 -- Modelo action detection for sign language 31 -- Implementación del modelo más adecuado 32 -- Instalación de librerías necesarias 32 -- Descripción del modelo 35 --
Importación de paquetes 36 -- Inicialización del modelo mediapipe 38 -- Ajuste de parámetros, estilos en puntos de referencia y conexiones 39 -- Mapeo de puntos de referencia. 41 -- Extracción de puntos de referencia 43 -- Creación de directorios y almacenamiento de valores de puntos de referencia en matrices 45 -- Etiquetado de datos (data labeling) 49 --
Establecimiento de la red neuronal de tipo LSTM y ajuste de parámetros 50 -- Predicción, almacenamiento del modelo y evaluación 53 -- Conclusiones 62 -- Referencias 64 | spa |
dc.format.extent | 67 páginas | spa |
dc.format.mimetype | application/pdf | spa |
dc.language.iso | spa | spa |
dc.publisher | Universidad de Boyacá | spa |
dc.rights.uri | https://creativecommons.org/licenses/by-nc-sa/4.0/ | spa |
dc.title | Inteligencia artificial (IA) en la traducción de algunas expresiones corporales de la lengua de Señas Colombiana en la atención médica a pacientes | spa |
dc.type | Trabajo de grado - Pregrado | spa |
dc.description.degreelevel | Pregrado | spa |
dc.description.degreename | Ingeniero(a) de Sistemas | spa |
dc.description.program | Administración de Empresas | spa |
dc.identifier.barcode | 4627 | |
dc.identifier.instname | Universidad Boyacá | spa |
dc.identifier.reponame | Repositorio Universidad de Boyacá | spa |
dc.identifier.repourl | https://repositorio.uniboyaca.edu.co | spa |
dc.publisher.faculty | Facultad de Ciencias e Ingeniería | spa |
dc.publisher.place | Colombia | spa |
dc.publisher.place | Boyacá | spa |
dc.publisher.place | Tunja | spa |
dc.relation.indexed | LaReferencia | spa |
dc.relation.references | Abadi M., Agarwal A., Barham P., Brevdo E., Chen Z., Citro C., Corrado G., Davis A., Dean J., Devin M., Ghemawat S., Goodfellow I, Harp A., Geoffrey I., Isard M., Jia Y., Jozefowicz R., Kaiser L., Kudlur M., … Zheng X. (2015). TensorFlow: Aprendizaje automático a gran escala en sistemas distribuidos heterogéneos. https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45166.pdf | spa |
dc.relation.references | Anaconda (s.f.). The world’s most popular data science platform. https://www.Anaconda.com/ | spa |
dc.relation.references | Anaconda Documentation (s.f.). Anaconda documentation. https://docs.Anaconda.com/ | spa |
dc.relation.references | Aniketdhole07. (2021, 25 abril). Two-way sign language translator. https://github.com/aniketdhole07/two-way-sign-language-translator | spa |
dc.relation.references | Aprende Ingeniería. (s.f.). Detección y clasificación de manos. https://github.com/AprendeIngenia/Deteccion-y-Clasificacion-de-Manos | spa |
dc.relation.references | Amazon Web Services Inc. (s. f). ¿Qué es una red neuronal?. https://aws.amazon.com/es/what-is/neural-network/#:%7E:text=Una%20red%20neuronal%20es%20un,lo%20hace%20el%20cerebro%20humano | spa |
dc.relation.references | Amazon Web Services. (s.f.). ¿Qué es la inteligencia artificial (IA)?. https://aws.amazon.com/es/machine-learning/what-is-ai/ | spa |
dc.relation.references | Amazon Web Services. (s.f.). ¿Qué es el etiquetado de datos para el aprendizaje automático?. https://aws.amazon.com/sagemaker/data-labeling/what-is-data-labeling/ | spa |
dc.relation.references | Bobadilla, J. B. (2020). Machine learning y deep learning: usando python, scikit y keras. Ediciones de la U. | spa |
dc.relation.references | Calvo, D. (2017, 20 de julio). Definición de red neuronal convolucional. https://www.diegocalvo.es/red-neuronal-convolucional/ | spa |
dc.relation.references | Carvajal F., Aguilar M., Agüera F., Aguilar F. (2022). Clasificación de una imagen multiespectral del satélite de alta resolución espacial mediante redes neuronales. https://docplayer.es/70443569-Clasificacion-de-una-imagen-multiespectral-de-satelite-de-alta-resolucion-espacial-mediante-redes-neuronales-artificiales.html | spa |
dc.relation.references | Cifuentes, A. C. Mendoza, E. M., Lizcano, M. L., Santrich, A. S. y Moreno, S. M. (2018). Desarrollo de una red neuronal convolucional para reconocer patrones en imágenes. Investigación y Desarrollo en Tic, 10(2), 7-17. https://revistas.unisimon.edu.co/index.php/identic/article/download/4007/4359 | spa |
dc.relation.references | Congreso de la República de Colombia. (2002, 31 de Julio). Convención interamericana para la eliminación de todas las formas de discriminación contra las personas con discapacidad. [Ley 762 de 2002]. DO: 44.889. https://www.funcionpublica.gov.co/eva/gestornormativo/norma.php?i=8797 | spa |
dc.relation.references | Congreso de la República de Colombia. (2005, 2 de Agosto). Por la cual se establecen normas tendientes a la equiparación de oportunidades para las personas sordas y sordociegas y se dictan otras disposiciones. [Ley 982 de 2005]. DO: 45.995. http://www.secretariasenado.gov.co/senado/basedoc/ley_0982_2005.html | spa |
dc.relation.references | Congreso de la República de Colombia. (2009, 31 de Julio). Por medio de la cual se aprueba la "convención sobre los derechos de las personas con discapacidad", adoptada por la Asamblea General de la Naciones Unidas el 13 de diciembre de 2006. [Ley 1346 de 2009]. DO: 47.427. http://www.secretariasenado.gov.co/senado/basedoc/ley_1346_2009.html | spa |
dc.relation.references | EvilPort2. (s.f.). Sign-language. https://github.com/EvilPort2/Sign-Language/blob/master/README.md | spa |
dc.relation.references | GitHub (s.f). Deep learning for humans. https://github.com/keras-team/keras | spa |
dc.relation.references | GitHub (s.f.) Tensors and dynamic neural networks in python with strong gpu acceleration. https://github.com/pytorch/pytorch | spa |
dc.relation.references | Github (s.f.). Face mesh mediapipe. https://google.github.io/mediapipe/solutions/face_mesh.html | spa |
dc.relation.references | Github (s.f.). Mediapipe hands. https://google.github.io/mediapipe/solutions/hands.html | spa |
dc.relation.references | Github (s.f.) Mediapipe pose. https://google.github.io/mediapipe/solutions/pose.html | spa |
dc.relation.references | Hicheri, L. (2011). Traducción e interpretación en instituciones públicas. https://cvc.cervantes.es/lengua/esletra/pdf/04/027_hicheri.pdf | spa |
dc.relation.references | IBM. (2021, 7 abril). Recurrent neural networks. https://www.ibm.com/cloud/learn/recurrent-neural-networks | spa |
dc.relation.references | Immune Technology Institute. (2022, 7 septiembre). Librerías de python, ¿qué son y cuáles son las mejores?. https://immune.institute/blog/librerias-Python-que-son/#:%7E:text=Librer%C3%ADas%20de%20Python%3A%20definici%C3%B3n&text=Es%20decir%2C%20las%20librer%C3%ADas%20de,de%20crear%20una%20interfaz%20independiente | spa |
dc.relation.references | Instituto Nacional del Cáncer. (s.f.). Diccionario de cáncer del NCI. https://www.cancer.gov/espanol/publicaciones/diccionarios/diccionario-cancer/def/neurona | spa |
dc.relation.references | Matplotlib (s.f.). Visualization with python. https://matplotlib.org/ | spa |
dc.relation.references | Ministerio de Educación Nacional, Instituto Nacional para Sordos (INSOR) y Instituto Caro y Cuervo. (2006). Diccionario básico de la Lengua de Señas Colombiana. https://www.colombiaaprende.edu.co/sites/default/files/files_public/2022-04/Diccionario-lengua-de-senas.pdf | spa |
dc.relation.references | Ministerio de Salud y Protección Social. (2017 31 de mayo). Por medio de la cual se adopta el reglamento en cumplimiento de lo ordenado en la orden décima primera de la sentencia T-573 de 2016 de la Corte Constitucional y se dictan otras disposiciones. [Resolución número 1904 de 2017] T-573. https://www.minsalud.gov.co/sites/rid/Lists/BibliotecaDigital/RIDE/DE/DIJ/resolucion-1904-de-2017.pdf | spa |
dc.relation.references | Munisht06. (s.f.). ASL-alphabet-recognition. https://github.com/munisht06/ASL-Alphabet-Recognition | spa |
dc.relation.references | MediaPipe. (s.f.). ml en vivo en cualquier lugar. https://mediapipe.dev/ | spa |
dc.relation.references | MediaPipe Pose. (2020.). Mediapipe pose. https://google.github.io/mediapipe/solutions/pose.html | spa |
dc.relation.references | NumPy.org (s.f.). Manual. NumPy Documentación. https://numpy.org/doc/stable/ | spa |
dc.relation.references | OpenCV. (2020). Sobre https://opencv.org/about/ | spa |
dc.relation.references | Pérez, D., Hurtado. N. (2014). Estudio difuso de isótopo de carbono 13 e isotopo de oxígeno 18 en el límite Triásico-Jurásico/Tesis. (Trabajo de grado, Universidad Central de Venezuela). ResearchGate. https://www.researchgate.net/publication/316741449_Estudio_Neuro_difuso_de_isotopo_de_carbono_13_e_isotopo_de_oxigeno_18_en_el_limite_Triasico-Jurasico | spa |
dc.relation.references | Renotte, N. R. (s.f.). Action Detection for Sign Language. https://github.com/nicknochnack/ActionDetectionforSignLanguage | spa |
dc.relation.references | Real Academia Española. (2021). Diccionario de la lengua española. https://dle.rae.es/se%C3%B1a | spa |
dc.relation.references | Rishabhjainps. (s.f.). Facial expression recognition. https://github.com/rishabhjainps/Facial-Expression-Recognition | spa |
dc.relation.references | Sotaquira, M. S. (2019, 20 julio). ¿Qué son las redes LSTM?. https://www.codificandobits.com/img/posts/2019-07-20/actualizacion-estado-oculto.gif | spa |
dc.relation.references | Solano, G. S. (2021, 11 agosto). Detecta 543 puntos del cuerpo con mediapipe holistic. https://omes-va.com/mediapipe-holistic-mediapipe-Python/ | spa |
dc.relation.references | Visus, A. (2020). ¿Para qué sirve python? Razones para utilizar este lenguaje de programación. https://www.esic.edu/rethink/tecnologia/para-que-sirve-Python#:%7E:text=El%20lenguaje%20de%20programaci%C3%B3n%20Python,aplicaciones%20empresariales%20fiables%20y%20escalables | spa |
dc.rights.accessrights | info:eu-repo/semantics/closedAccess | spa |
dc.subject.lemb | Inteligencia artificial - Estudio de casos - Investigaciones | |
dc.subject.lemb | Traducción mecánica - Investigaciones | |
dc.subject.lemb | Lenguas de señas - Traducciones - Aplicaciones informativas - Colombia - Investigaciones | |
dc.subject.lemb | Sordos - Estudio de casos - Investigaciones | |
dc.subject.lemb | Personas con discapacidades - Investigaciones | |
dc.subject.proposal | Inteligencia Artificial | spa |
dc.subject.proposal | Lengua de señas | spa |
dc.subject.proposal | Lengua de Señas Colombiana (LSC) | spa |
dc.subject.proposal | Red Neuronal Convolucional (CNN). | spa |
dc.subject.proposal | Artificial Intelligence | eng |
dc.subject.proposal | Sign language | eng |
dc.subject.proposal | Lengua de Señas Colombiana (LSC) | eng |
dc.subject.proposal | Convolutional Neural Network (CNN). | eng |
dc.title.translated | Artificial Intelligence (AI) in the translation of some body expressions of Colombian Sign Language in medical attention to patients | |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | spa |
dc.type.coarversion | http://purl.org/coar/version/c_970fb48d4fbd8a85 | spa |
dc.type.content | Text | spa |
dc.type.driver | info:eu-repo/semantics/bachelorThesis | spa |
dc.type.redcol | https://purl.org/redcol/resource_type/TP | spa |
dc.type.version | info:eu-repo/semantics/publishedVersion | spa |
dc.rights.coar | http://purl.org/coar/access_right/c_14cb | spa |