Diplomado
Inteligencia Artificial Aplicada al Análisis de Texto y a la Organización de la Información
SOMOS
EDUCACIÓN
CONTINUA

La inversión en tecnología que han realizado las empresas en los últimos 20 años ha propiciado la recolección de amplias y variadas colecciones y recursos de información de diversos tipos que deben ser organizados a través de diferentes procesos y sistemas, con el fin de facilitar su recuperación y posterior uso en las operaciones de la compañía y, en general, para la toma de decisiones a diferentes niveles. Las estrategias clásicas de organización de la información están quedando obsoletas y se han venido complementando y enriqueciendo con modelos tecnológicos más robustos generados a partir del procesamiento de lenguaje natural - NLP y soportados por herramientas de inteligencia artificial que permiten modelar la realidad de las unidades de información (organizaciones) de una manera más precisa y que complementan las iniciativas habituales de analítica e inteligencia del negocio basados en datos estructurados. Este diplomado tiene como propósito promover en los participantes una actitud analítica basada en datos no estructurados, específicamente texto, para resolver problemas organizacionales generando algoritmos de inteligencia artificial, tanto descriptivos como predictivos, que les permitan a las empresas fortalecer sus capacidades para organizar y recuperar la información para la toma de decisiones.
Este diplomado le permitirá obtener las competencias y habilidades para diseñar e implementar soluciones de inteligencia artificial aplicadas al análisis de texto como herramienta fundamental en la organización de la información y del conocimiento en las organizaciones. Al final del diplomado el participante podrá utilizar diferentes técnicas de procesamiento automático de texto para el desarrollo laboral.
Objetivos
El objetivo general se concreta a partir del desarrollo de los siguientes objetivos específicos:
- Fortalecer la capacidad de identificar necesidades y oportunidades para la organización de la información y del conocimiento y traducirlas en términos de técnicas y métodos de inteligencia artificial.
- Presentar los diferentes métodos y técnicas de inteligencia artificial, tanto predictivas como descriptivas, que facilitan el procesamiento de lenguaje natural y la organización y recuperación de los recursos de información.
- Reconocer los mecanismos de comunicación efectiva y privacidad asociados al análisis de datos narrativos.
Dirigido a
- Experiencia en manejo de tecnologías de información.
- Disponibilidad de tiempo durante 3 meses.
- Nivel de inglés básico.
Metodología
El programa se va a desarrollar con una metodología dinámica y participativa, a través de procesos de aprendizaje que integren la adquisición de conocimientos y desarrollo de habilidades, a través de laboratorios, conferencias magistrales, análisis de casos reales de unidades de información de diversos sectores y discusiones intergrupales guiadas por los conferencistas de cada tema.
Herramientas
Durante el desarrollo de las sesiones, se utilizarán algunas herramientas como:
- Python (última versión disponible) con librerías NLTK, pandas, matplotlib, mpl_toolkits, numpy, seaborn, warnings, spacy instaladas, tensorflow.
- Google Colab
- PowerBI/Tableau
- Excel
Durante el desarrollo de cada uno de los módulos se realizarán múltiples sesiones prácticas usando herramientas de tipo open source (Python) o con versión demostrativa. No obstante, el objetivo del diplomado no es la formación en el uso de estas herramientas sino en los fundamentos de cómo diseñar la estrategia de analítica de datos narrativos y cómo las herramientas disponibles en el mercado pueden aportar en ella.
Modalidad on-line (sincrónico)
clases online sincrónicas con los docentes especializados de cada módulo. Los participantes se conectan desde cualquier lugar mediante su computador a una hora específica y asisten a la clase on-line con el conferencista. El material utilizado en las clases sincrónicas, así como el resto de los materiales de apoyo de cada actividad de formación es publicado en la plataforma LMS.
Actividades pedagógicas durante el proceso
- Actividades de apropiación conceptual, dirigidas por el docente y conducentes a la apropiación de cada uno de los conceptos teóricos y prácticos vistos durante el curso.
- Análisis de casos de estudio para orientar y contextualizar las diferentes temáticas.
- Desarrollo de talleres prácticos en cada módulo para la aplicación de los conceptos vistos en el curso.
Contenidos académicos
Modulo 1: Fundamentos de programación y estadística para el análisis de texto – 18 horas
- Conceptos básicos sobre Python (elementos básicos, estructuras y librerías, entre otros)
- Conceptos básicos sobre Estadística (modelos, estimación, correlación, entre otros)
Modulo 2: Contexto de la analítica de datos en las unidades de información – 9 horas
- Conceptos principales de la ciencia de datos y la inteligencia artificial
- Relación entre analítica, minería, ciencia de los datos e Inteligencia artificial
- Principios de la ciencia de datos y de la inteligencia artificial
- Metodologías para el desarrollo de proyectos de inteligencia artificial
Modulo 3: Organización de la información en la era de la inteligencia artificial – 9 horas
- Introducción a la gestión y organización de la información y del conocimiento
- Procesos y sistemas de organización de la información y del conocimiento
- Aplicaciones de la inteligencia artificial en la organización de la información y del conocimiento
Modulo 4: Extracción y preprocesamiento de datos no estructurados– 18 horas
- Captura y almacenamiento de datos textuales: Introducción a minería de texto, aplicación de web scraping, extracción de datos de las redes sociales. Taller de extracción.
- Preprocesamiento de texto: preprocesamiento, reconocimiento de entidades, N-grams con modelos de lenguaje). Taller de preprocesamiento.
Modulo 5: Inteligencia artificial aplicada a la organización y análisis de la información – 33 horas
- Clasificación de texto/documentos usando NLP:
- Regresión logística como modelo automático de clasificación de texto. Taller aplicado.
- Relaciones semánticas y embeddings para entender el contexto del texto. Taller aplicado.
- Naive bayes y clasificación de sentimientos de texto. Taller aplicado.
- Redes profundas y arquitecturas para la clasificación automática de texto o documentos. Taller aplicado.
- Etiquetado automático:
- Fundamentos de clustering para el etiquetado automático. Modelamiento de tópicos. Taller aplicado.
- Técnicas de ML para etiquetado (K-means. KNN, PCA). Taller aplicado.
- Resumen y generación automática de texto.
- Ingeniería de peticiones (Prompt Engineering) para el análisis de la información
Modulo 6: Storytelling con datos – 6 horas
- Identificación de requerimientos de la audiencia
- Construcción narrativa del storytelling / Narrativa transmedia y para los negocios
Modulo 7: Privacidad y confidencialidad – 3 horas
- Riesgos y consideraciones legales al realizar proyectos de análisis de datos
Conferencistas
Juan Pablo Pájaro Hernández
Científico de datos. Experiencia en la aplicación de modelos de aprendizaje automático para la extracción de información, modelos de predicción y representación del aprendizaje. Ingeniero industrial, Maestro en ingeniería de sistemas y estudiante de Doctorado en ingeniería de la Pontificia Universidad Javeriana. Consultor e investigador de la Alianza Caoba (Centro de Excelencia y Apropiación en Big Data y Analytics) en áreas de negocio asociadas a la salud, petróleo y finanzas. Docente de la maestría en analítica para la inteligencia de negocios, y del programa de ciencia de la información de la Pontificia Universidad Javeriana. Docente en diplomados de formación en análisis de datos e inteligencia artificial de unidad de Educación Continua de la Pontificia Universidad Javeriana.
Luis Gabriel Moreno Sandoval
Investigador, académico y profesional en temas relacionados con sistemas de información, análisis de datos, minería de texto y redes sociales. Cuenta con amplios conocimientos en temas como lingüística computacional, sociolingüística y semiótica computacionales como temas principales en sus investigaciones. Ha participado en múltiples congresos de lingüística computacional internacionales otorgando reconocimiento a los estudios presentados. Obtuvo el segundo lugar en la conferencia PAN@CLEF 2019, sobre la competencia en lingüística computacional para determinar estilos sociolingüísticos y variables demográficas, psicográficas y conductuales de un grupo muestra de celebridades utilizando modelo de perfilamiento de autor, en Lugano Suiza. Finalmente, entre los trabajos más destacados está el análisis de subjetividad colectiva en redes sociales digitales con el desarrollo de un modelo propio denominado “Collective Subjectivity Communities in Onion Layers (COSSOL)”, análisis del lenguaje en redes sociales digitales para escenario de alimentación y estilos de vida saludable, la conformación de comunidades a través de elementos lingüísticos como resultado emergente de la homofilia en textos de redes sociales digitales.
Edwin Alexander Puertas Del Castillo
Edwin Puertas es un profesor asociado en la Universidad Tecnológica de Bolívar (UTB) y miembro senior de IEEE. El Dr. Puertas está apasionado por mantenerse actualizado con las últimas tendencias y desarrollos en procesamiento del lenguaje natural, lingüística computacional, analítica de datos, aprendizaje automático, minería de datos e ingeniería de software. El Dr. Puertas obtuvo su título de pregrado en Ingeniería de Sistemas y su maestría en ingeniería de la Universidad Tecnológica de Bolívar. Luego completó un doctorado en ingeniería en la prestigiosa Pontificia Universidad Javeriana. Con casi 15 años de experiencia en el mundo académico, ha enseñado una variedad de materias de ciencias de la computación, incluyendo Inteligencia Artificial, Procesamiento de Lenguaje Natural, Big Data y Análisis de Datos, Ingeniería de Software y Lenguajes de Programación. El Dr. Puertas es un prolífico investigador y ha publicado ampliamente en revistas y actas de conferencias arbitradas. También es un orador muy solicitado en conferencias y seminarios internacionales. Está comprometido con inspirar y guiar a la próxima generación de científicos de datos.
Néstor Armando Nova Arévalo
Doctor en Ingeniería de la Pontificia Universidad Javeriana, Magister en Ingeniería Industrial e Ingeniero de Control Electrónico de la Universidad Distrital Francisco José de Caldas en Colombia. Profesor de planta del Departamento de Ciencia de la Información de la Pontificia Universidad Javeriana en temas de gestión del conocimiento y gobierno de datos. Consultor en áreas de sistemas de información, transformación digital y gestión del conocimiento. Investigador por más de 10 años en áreas relacionadas con la investigación basada en el diseño y centrados en problemas de colaboración organizacional, colaboración científica y la interacción entre TICs y Sociedad. Docente y Coordinador académico de los diplomados de formación en análisis de datos de la unidad de la Dirección de Educación Continua de la Pontificia Universidad Javeriana, para empresas del sector salud, finanzas y petróleo (producción y transporte de hidrocarburos).
Alexandra Pomares Quimbaya
Profesora Titular de la Pontificia Universidad Javeriana. A lo largo de su carrera ha estado involucrada en las áreas de inteligencia de negocios, analítica e integración de datos tanto a nivel académico, como de investigación y consultoría. Actualmente trabaja en el análisis de datos no estructurados utilizando técnicas de procesamiento de lenguaje natural y algoritmos de aprendizaje de máquina. Alexandra hace parte de una iniciativa colombiana que busca mejorar la calidad de la información disponible en el ámbito de la investigación médica para promover la medicina basada en el valor. Así mismo, pertenece al equipo de investigación de la Pontificia Universidad Javeriana en CAOBA, el Centro de Excelencia y Apropiación en Big Data y Data Analytics de Colombia y fue investigadora invitada en la Universidad Médica de Graz (Austria). Alexandra estudió Ingeniería de Sistemas en la Pontificia Universidad Javeriana (Colombia), Maestría en Ingeniería de Sistemas y Computación en la Universidad de los Andes, Doctorado en Ingeniería de la Universidad de los Andes (Colombia), Doctorado en Informática de la Universidad de Grenoble (Francia).
Jorge Andrés Alvarado
Ingeniero Industrial, Master of Science en análisis masivo de datos (Analytics) de North Carolina State University y Doctor en Ingeniería de la Pontifica Universidad Javeriana. Miembro del centro nacional de Excelencia en Big Data y Data Analytics (CAOBA) en donde hace parte del comité técnico de todos los proyectos y lideró el proyecto Textolítica del servicio para Bancolombia. Profesor Asociado del departamento de Ingeniería Industrial de la Pontificia Universidad Javeriana. Consultor en análisis de datos para comportamiento del consumidor. Anteriormente fue Director de planeación y desarrollo de LOJACK durante cinco años donde fue responsable de los proyectos de tecnología de información y desarrollo de bases de datos en Colombia, Venezuela y Brasil, para cerca de 200 usuarios, y del desarrollo de indicadores de gestión mediante modelos estadísticos. 25 artículos y conferencias en revistas científicas con 115 citaciones (Scopus h-index=7)
Sus áreas de interés son el procesamiento automático del lenguaje natural (NLP- text mining). los sistemas de soporte a la toma de decisiones(DSS), la analítica predictiva (predictive analytics) y los pronósticos que integran el juicio humano (judgmental forecasting).
**El comité académico se reserva el derecho de modificar la asignación de conferencistas
4% por pronto pago: Este descuento es el único acumulable y aplica si pago es realizado un mes antes de iniciar el programa.
10% por ser egresado o estudiante (activo) en pregrado o posgrado de la Universidad Javeriana.
10% por afiliación a la caja de compensación Cafam.
15% para grupos de 3 a 5 participantes en el mismo programa.
20% para grupos de 6 participantes en el mismo programa y en el tercer diplomado realizado consecutivamente.
Apertura y fecha de inicio: la apertura y la fecha de inicio del
programa dependerá del mínimo número de inscritos,
establecido por la Universidad.
Certificación: se otorgará certificación a quien haya
cumplido como mínimo con el 80% de las actividades
programadas en el aula.
Forma de pago: efectivo, cheque de gerencia, tarjeta de
crédito (recibimos todas las tarjetas, cuenta de cobro).
Válido para Colombia:
**Art. 92 Ley 30 de 1992 - Las Instituciones de
Educación Superior no son responsables del
I.V.A.
**Numeral 6 del Art. 476 Estatuto Tributario
(ET) - Servicios excluidos del impuesto sobre
las ventas.