Código y Nombre de la Asignatura: ELP 8124 - MINERIA DE DATOS |
División Académica:
División de Ingenierías
Departamento Académico: Dpto. Ingeniería de Sistemas IST 7111 Calificación mínima de 3.0 Número de créditos: Intensidad horaria (semanal para nivel pregrado y total para nivel postgrado): 3.000 Horas de Teoría 0.000 Horas de Laboratorio Niveles: Educación Superior Pregrado Tipos de Horario: Teoría El tema de minería de datos tiene como objetivo desarrollar en los estudiantes los fundamentos y las habilidades que le permitan poner en práctica un conjunto de técnicas, herramientas y tecnologías de sistemas de gestión de base de datos (DBMS) para la extracción, procesamiento, implícito en las bases de datos. Minería de datos (DM, Data Mining) es la extracción no trivial de la información que se encuentra implícita en los datos. 3. JUSTIFICACIÓN La minería de datos está orientada al diseño de aplicaciones que faciliten la selección de un conjunto de datos, el análisis de las propiedades utilizando herramientas estadísticas, la aplicación de modelos de predicción (de clasificación o de segmentación), extracción de conocimiento y evaluación de los resultados. El curso comprende los temas: El proceso de descubrimiento de conocimientos, preparación de datos para la minería, las técnicas básicas de minería de datos: (árbol de decisión e inducción, la reglas de inducción, aprendizaje basado en instancias, redes neuronales, aprendizaje bayesiano, máquinas de soporte vectorial, técnicas ensamble, agrupación, reglas de asociación) 4. OBJETIVOS DEL CURSO Ser capaces de abordar la minería de datos como un proceso de gestión de conocimientos, mediante la demostración de competencias en diferentes áreas de aplicación, el uso de normas de la industria, la investigación, la innovación, la ciencia y otros para la minería de datos, incluida la fase de entendimiento de negocios, la fase de comprensión de datos, la exploración y la fase de análisis de datos, modelado de la fase, la fase de evaluación, y la fase de despliegue. La comprensión de las diversas técnicas de minería de datos se refiere a un conjunto de técnicas que están diseñadas para encontrar interesantes piezas de manera eficiente de la información o conocimiento en los grandes volúmenes de datos. Las reglas de asociación, por ejemplo, son una clase de patrones que indican que los productos tienden a ser comprados junto con otros en una aplicación comercial, por parte de algunos clientes. Adicionalmente Analizar y comprender en este curso, ¿cómo en este campo interdisciplinario se reúne las técnicas de bases de datos, estadísticas, sistema de aprendizaje y de recuperación de información. 5. RESULTADOS DE APRENDIZAJE DEL CURSO Listado de los Course Outcomes(CO): C[1.] Comprender las diferentes técnicas de modelado de datos OLAP, MOLAP, HOLAP, integrando los diferentes paradigmas de modelado de datos C[2.] Aprender a diseñar estructuras de Data Warehouse C[3.] Comprender el proceso de minería de datos, extracción, carga y transformación. C[4.] Identificar, conocer y aplicar las diferentes técnicas de minería de datos C[5.] Aplicar las técnicas y tareas de minerías de datos a problemas reales y en diferentes contextos. 6. CONTENIDO No. TOPICO HORAS DE CLASE HORAS DE LABORATORIO NUMERO DE SEMANA 1 Introducción Minería de datos 3 1 2 Pre-procesamiento de Datos Data Cleaning Data Integración y transformación Data Reducción Data Discretización 3 2 3 Procesos de Minería de datos y exploración conocimiento 3 1 3 4 Data Warehouse y tecnologías OLAP Que es un datawarehouse Modelo Multidimensional Arquitectura de Dw Implementación de DW Del Dw a la Datamining Introducción BigData Introducción Data Analitycs PRIMER PARCIAL 6 4 4-5 5 El proceso de Minería de datos 3 2 6 6 Clasificación y predicción 3 1 7 7 Análisis de clustering y segmentación 3 3 8 8 Algoritmos Árboles de decisión 3 3 9 9 Redes Neuronales 2DO PARCIAL 3 3 10 10 Algoritmos de regresión lineal, polinomial, regresión logística 3 3 11 11 Clasificación basado en reglas, clasificación bayesiana Maquinas de soporte vectorial 3 3 12 12 Reglas de asociación 3 2 13 13 Modelos y técnicas de evaluación 3 2 14 14 Sustentación de proyectos 6 15 y 16 15 3ER PARCIAL 7. METODOLOGIA Se conformarán grupos de trabajo de tres estudiantes los cuales desarrollarán las actividades de clase como son las evaluaciones o control de lecturas desde el texto guía, los talleres en el laboratorio y los exámenes programados de acuerdo al esquema de evaluación propuesto debajo de este documento. El desarrollo del curso se efectuará por medio de explicaciones dadas por el profesor con respecto a los diferentes tópicos del contenido, a su vez los estudiantes consultarán temas complementarios que reforzarán su aprendizaje. Los temas de mayor actualidad serán tratados en discusiones de grupo y se realizarán ejercicios a manera de talleres. Los estudiantes deben abordar el proceso de desarrollo de software, el cual debe definirse desde inicio del semestre e ir presentando informes de avance de las diferentes fases que requieren para construirlo. Estos avances deben cumplir con las especificaciones establecidos de acuerdo al método que se utilice y en la última semana de clases deben entregar el software con su documentación. En el catalogo del curso permitirá interactuar con el estudiante a través de Chats, foros virtuales, trabajos en grupo, dirigidos. Etc. Los estudiantes conformaran grupos para realizar un trabajo de investigación sobre las tendencias de la Ingeniería del Software. 8. MEDIOS Además de los medios tradicionales para el desarrollo de las clases, se utilizarán los siguientes recursos: Texto de referencia UML, RUP y Scrum La página Web de la asignatura y un módulo virtual de apoyo a las clases. La herramienta CASE Enterprise Architect. Los recursos computacionales con que cuenta la Universidad del Norte y las Redes locales, nacionales e internacionales con las que se encuentra conectada. Se pueden utilizar los recursos propios del estudiante si le es favorable. Los recursos Audiovisuales disponibles en la Universidad del Norte para el ejercicio de la docencia. 9. EVALUACIÓN TIPO % FECHA TEMA I Parcial 25 6ª semana . Tópicos 1,2 ,3 y 4 II Parcial 25 10ª Semana Tópicos 5, 6,7 y 8 Trabajos Laboratorio 25 Durante el semestre Diferentes contenidos Examen Final 25 Programación de registro Acumulativo HERRAMIENTAS DE TRABAJO Enterprise Architect Rapid Miner SQL-SERVER MYSQL PHPMYADMIN 10. BIBLIOGRAFÍA Introducción a la Mineria de Datos, José Hernandez Orellano, Ma José Ramirez Quintana y Cesar Ferri Ramirez, Pearson Prentice Hall (005.74 H557) Olson, David Louis. Introduction to business data mining Conceptos y tecnicas de Datamining, Jiaweir Han and Micheline Kamber, 2da edición. Manual de Rapid Miner 5.0 www.rapidminer.co |
Regresar a Anterior | Nueva búsqueda |