Ir a Contenido Principal

AURORA - Sistema de Información Académico

 

AYUDA | SALIR

Información detallada de curso

 

Primer semestre 2017
Mar 28, 2024
Imagen transparente
1. IDENTIFICACION DEL CURSO

Código y Nombre de la Asignatura: ELP 8123 - MINERÍA DE DATOS
División Académica: División de Ingenierías
Departamento Académico: Dpto. Ingeniería de Sistemas
Número de créditos:
Intensidad horaria (semanal para nivel pregrado y total para nivel postgrado):
3.000 Horas de Teoría
0.000 Horas de Laboratorio
Niveles: Educación Continua, Educación Superior Pregrado
Tipos de Horario: Teoría

La asignatura de Minería de Datos tiene como intención educativa proveer al estudiante de los conocimientos necesarios para que aproveche las oportunidades que se presentan al tomar decisiones correctas de manera eficiente. Para ello, se le instruye en la obtención de información relevante que le ayude a dicha toma de decisiones a partir de grandes volúmenes de datos. En el curso aprenderás las diferentes formas de representar información y las técnicas para extraer el conocimiento.
Las bases de datos y la ingeniería de Software se han presentado hasta ahora como el gran aporte de la Ingeniería de Sistemas a las necesidades del negocio; con la ayuda de estas disciplinas se puede almacenar grandes cantidades de información y presentarlas de forma resumida y entendible al usuario. El siguiente paso es extraer de ese gran volumen de información patrones estructurales que permitan no sólo entender los datos sino el comportamiento del mismo negocio, para ello se utiliza la Minería de Datos, en donde se abordaran temas para alcanzar éste fin tales como: Conceptos, instancias y atributos; Representación del conocimiento; Clasificación, Asociación y Agrupamiento; Bodega de Datos.


3. JUSTIFICACIÓN
La convergencia de la computación y las comunicaciones ha producido una sociedad que se alimenta de información. Mucha de esta información esta aún en su forma original de registros, lo cual es solo datos. Si se entiende que los datos son hechos grabados, entonces información es el conjunto de patrones ocultos en los datos. Existe una gran cantidad de información encerrada en las bases de datos, información que es potencialmente importante pero que no ha sido descubierta o inteligible. La misión de la Minería de Datos es precisamente extraer esta información con el fin de apoyar las actividades del negocio.
El aprendizaje automático provee las técnicas básicas de la minería de datos. Es usado para extraer información desde los registros de una base de datos, información que es luego expresada en forma comprensible y puede ser usada para una variedad de propósitos. Es un proceso de abstracción: se toman los datos, incluso los deteriorados, y se deduce si existe algún patrón estructural. Esta asignatura trata de las herramientas y técnicas de aprendizaje automático que se utilizan en la práctica de la minería de datos para encontrar y describir patrones estructurales en los datos.


4. OBJETIVOS

4.1. OBJETIVO GENERAL
Que el estudiante aprenda el ciclo de vida del descubrimiento del conocimiento, específicamente la etapa de minería de datos y los diferentes algoritmos de aprendizaje automático y los aplique en un proyecto de investigación.

4.2 OBJETIVOS ESPECÍFICOS

El estudiante estará en capacidad de:
- Listar las diferentes formas de representar el conocimiento
- Precisar en que consiste cada una de las técnicas desarrolladas para el descubrimiento de patrones y reglas generales a partir de las bases de datos.
- Determinar el tipo de proceso que debe realizar sobre los datos para obtener la información válida, novedosa, comprensible y potencialmente útil que le sea requerida. Esto implica la selección adecuada del método para representar el conocimiento y la aplicación apropiada de la técnica para obtenerlo.


5. METODOLOGÍA

El desarrollo del curso se efectuará por medio de explicaciones dadas por el profesor con respecto a los diferentes tópicos del contenido, a su vez los estudiantes consultarán temas complementarios que reforzarán su aprendizaje.
Se asignarán actividades diseñadas para ayudar al estudiante en la comprensión de los temas vistos, las cuales se deberán realizar de manera individual o grupal, según se les indique.

Algunas de las actividades a realizar serán:
- Solución de ejercicios, Programación, Ensayo, Investigación y Participación en el foro de discusión

Los estudiantes deben aplicar los conceptos aprendidos en la asignatura en un proyecto de investigación de la vida real, el cual deben definir a partir de la segunda semana de clases e ir presentando informes de avance de las diferentes fases que requieren para construirlo, al finalizar las clases se debe entregar el software con sus respectivos manuales.
La pagina Web de la asignatura se encuentra disponible en el catalogo WEB de la Universidad y permitirá interactuar con el estudiante a través de chats, foros virtuales y trabajos en grupo.


6. MEDIOS. Además de los medios tradicionales para el desarrollo de las clases, se utilizarán los siguientes recursos:
- Las publicaciones especializadas y los medios disponibles en la biblioteca de la Universidad del Norte.
- La página Web de la asignatura
- Los recursos computacionales con que cuenta la Universidad del Norte y las redes locales, nacionales e internacionales con las que se encuentra conectada. Se pueden utilizar los recursos propios del estudiante si le es favorable.
- Los recursos Audiovisuales disponibles en la Universidad del Norte para el ejercicio de la docencia.

7. CONTENIDO

NÚMERO, TÓPICOS NÚMERO HORAS.
1. FUNDAMENTOS 9
1.1. El Proceso de descubrir conocimiento
1.2. Aprendizaje automático
1.3. Minería de datos
1.4. Tipos de minería de datos

2. REPRESENTACIÓN DEL CONOCIMIENTO 12
2.1. Conceptos, Instancias y Atributos
2.2. Tablas
2.3. Árboles
2.4. Reglas
2.5. Casos

3. CLASIFICACIÓN 12
3.1. Árboles de Clasificación
3.2. Reglas de Clasificación
3.3. Reglas con Excepciones

4. ASOCIACIÓN Y AGRUPAMIENTO 9
4.1. Reglas de Asociación
4.2. K-Means

5. FUTURO DE LA MINERÍA DE DATOS 6
5.1. Aplicaciones de la Minería de Datos
5.2. Visualización del Aprendizaje Automático
5.3. Minería de Texto
5.4. Minería de la World Wide Web

8. EVALUACIÓN
TIPO % FECHA TEMA
I Parcial 20 6ª semana Tópicos 1.1 2.3
II Parcial 20 12ª Semana Tópicos 2.3 3.3
I+D 20 Entregas Parciales 7ª y 11ª Semanas.
Entrega final 16ª semana. Aplicación real de la minería de datos
Actividades 20 Durante el semestre Diferentes contenidos
Examen Final 20 Programación de registro Acumulativo

9. BIBLIOGRAFÍA
10.1. Texto guía: IAN H, Witten & EIBE, Frank. DATA MINING: Practical Maching Learning Tools and Techniques with java implementations. Morgan Kaufmann, 1999.

10.2 otras referencias.
FAYYAD, et al. ADVANCES IN KNOWLEDGE DISCOVERY AND DATA MINING. AAAI Press / The MIT Press, 1996.
DORIAN Pyle. DATA PREPARATION FOR DATA MINING. Morgan Kaufmann, 1999.

Direcciones de interés
http://www.ietf.org
http://www.ieee.org
http://www.omg.org

10.2.1 REVISTAS ESPECIALIZADAS
Computer THE INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS Society. IEEE Software. Los Alamitos. California.

10.2.2. INDICES DE TEMAS
INSTITUTE FOR SCIENTIC INFORMATION. CURRENT CONTENS ON DISKETTE. ENGINEERING, TECHNOLOGY & APPLIED SCIENCES. Philadelphia
ENGINEERING INDEX. New York. SIDES ALERTA. Tablas de contenido Ingenierías. Icfes, Bogotá.

Regresar a Anterior Nueva búsqueda
Imagen transparente
Versión: 8.7.2 [BSC: 8.10]