6 abril, 2019

Diplomado Diseño de Investigación y Análisis de Datos con Software R

DIPLOMADO DE ACTUALIZACIÓN PROFESIONAL

NÚMERO REGISTRO – 17DAP57319
DE FECHA 06 DE DICIEMBRE DE 2019
SECRETARÍA DE EDUCACIÓN DEL ESTADO DE MORELOS

%cocid%

Convertirse en un científico de datos profesional con el software R, aprendiendo la potencialidad de R para el procesamiento de datos, interpretando de forma correcta los resultados obtenidos y así innovar en sus proyectos de investigación.

 

 

  • Licenciados, 
  • Maestros, 
  • Doctores e Investigadores de las Ciencias Experimentales, 
  • Psicológicas, 
  • Biológicas, 
  • Médicas,
  • y todo aquel interesado, (independiente del campo científico), en conocer el Diseño de Investigación así como la Ciencia de Datos y la interpretación de resultados, y el trabajo de bases de datos con estrategias ETL y cubos OLAP.

 

 Diseñar investigación práctica desde su metodología.


 Trabajar de forma profesional con el software R, aprendiendo
su potencialidad de R para el procesamiento de datos.


 Realizar e interpretar todas las técnicas estadísticas de clásicas a avanzadas, análisis multivariante y machine  learning.


 Diseñar bases de datos grandes (Big Data) en R con
estrategias ETL.

MÓDULO I. DISEÑO DE INVESTIGACIÓN (40 hrs)

TEMA 1. FUNDAMENTOS Y BASES EMPÍRICAS.

TEMA 2. ELECCIÓN DEL TEMA, OBJETIVOS E HIPÓTESIS.

TEMA 3. MUESTREOS, TIPOS, DATOS Y CONTROLES.

TEMA 4. TIPOS DE DISEÑOS DE INVESTIGACIÓN.

 

 

MÓDULO II. TÉCNICAS CLÁSICAS (40 hrs)

TEMA 1. R SOFTWARE.

1.1.- Descripción.

1.2.- Historia.

1.3.- Características

1.4.- Instalación

1.5.- Formatos.

1.6.- Transponer datos de hoja de cálculo.

1.7.- Cargado de archivos.

1.8.- Trabajo de bases de datos.

 

TEMA 2. ESTADÍSTICA DESCRIPTIVA I.

2.1.- Gráficos de barras.

2.2.- Gráficos de sectores.

2.3.- Histograma.

2.4.- Nubes de puntos.

2.5.- Gráficos de cajas.

2.6.- Gráficos para tablas de doble entrada.

2.7.- Conclusión.

 

TEMA 3. ESTADÍSTICA DESCRIPTIVA II.

3.1.- Medidas de posición y dispersión.

3.1.1.- Media.

3.1.2.- Mediana.

3.1.3.- Cuasivarianza.

3.1.4.- Cuasidesviación típica.

3.1.5.- Cuantiles.

3.1.6.- Resumen.

3.2.- La distribución normal.

3.3.- Medidas para investigación.

3.4.- Conclusión.

 

TEMA 4. PRUEBAS NO PARAMÉTRICAS.

4.1.- Test de Wilcoxon.

4.2.- Test de Wilcoxon – Mann-Whitney.

4.3.- Test de Kolmogorov – Smirnov.

4.4.- Test de Kruskal – Wallis.

4.5.- Conclusión.

 

TEMA 5. CHI-CUADRADO Y T DE STUDENT.

5.1.- Chi- cuadrado de Pearson.

5.1.1.- Introducción.

5.1.2.- Formulación.

5.1.3.- Resolución con R.

5.1.4.- Conclusión.

5.2.- T-Student.

5.2.1.- Distribución t-Student.

5.2.3.- conclusión.

 

TEMA 6. ANÁLISIS DE VARIANZA. DISEÑO COMPLETAMENTE ALEATORIZADO.

6.1.- Un factor clásico. HSD Tukey.

6.2.- Un factor robusto. HSD Tukey.

6.3.- Dos factores clásico.

6.4.- Dos factores robusto.

 

TEMA 7. ANÁLISIS DE VARIANZA. MEDIDAS REPETIDAS.

7.1.- Introducción.

7.2.- Formulación.

7.3.- Análisis de Varianza. Medidas Repetidas con R.

7.4.- Conclusión.

 

TEMA 8. REGRESIÓN Y CORRELACIÓN LINEAL SIMPLES.

8.1.- Regresión lineal simple.

8.1.1.- Introducción.

8.1.2.- Modelo.

8.1.3.- Contraste.

8.1.4.- Tabla de análisis de varianza.

8.1.5.- Regresión con R.

8.1.6.- Conclusión.

8.2.- Correlación simple.

8.2.1.- Introducción.

8.2.2.- Coeficiente de correlación de Pearson.

8.2.3.- Correlación lineal con R.

8.2.4.- Conclusión.

 

TEMA 9. REGRESIÓN MÚLTIPLE.

9.1.- Modelo.

9.2.- Contraste de la regresión lineal múltiple.

9.3.- Tabla de análisis de la varianza para la regresión lineal múltiple.

9.4.- Estimación de la varianza común.

9.5.- Contraste de hipótesis sobre los coeficientes de regresión.

9.6.- Regresión múltiple con R.

9.7.- Selección secuencial de variables por pasos.

 

TEMA 10. CORRELACIÓN MÚLTIPLE.

10.1.- Introducción.

10.2.- Cálculo con R.

10.3.- Representaciones gráficas.

10.4.- Conclusión.

 

 

MÓDULO III. TÉCNICAS AVANZADAS (40 hrs)

TEMA 1. TÉCNICAS ACTUALES EN REGRESIÓN. TRATAMIENTO DE DATOS ANÓMALOS.

1.1.- Introducción.

1.2.- Bibliotecas.

1.3.- Formulación.

1.4.- Ejemplo completo:

1.4.1.- Regresión lineal por mínimos cuadrados.

1.4.2.- Técnicas actuales en Regresión (tratamiento de datos anómalos).

1.4.2.1.- Recta de Huber.

1.4.2.2.- LTS-Least Trimmed Squares.

1.4.2.3.- LMS-Least Median of Squares.

1.4.2.4.- Recta MM.

1.5.- Conclusión.

 

TEMA 2. REGRESIÓN POISSON.

2.1.- Introducción.

2.2.- Cálculo con R.

2.3.- Conclusión.

 

TEMA 3. MODELOS DE REGRESIÓN LOGÍSTICA. LOGIT Y PROBIT.

3.1.- Introducción.

3.2.- Modelos logit y probit.

3.3.- Modelos de regresión logit con R.

3.4.- Modelos de regresión probit con R.

3.5.- Conclusión.

 

TEMA 4. REGRESIÓN SUAVIZADA.

4.1.- Introducción.

4.2.- Formulación.

4.3.- Regresión suavizada con R.

4.4.- Conclusión.

 

TEMA 5. REGRESIÓN MÚLTIPLE ROBUSTA.

5.1.- Introducción.

5.2.- Regresión de Huber.

5.3.- Regresión múltiple robusta de Huber.

5.4.- MM-estimadores.

5.5.- Regresión múltiple M-estimadores.

5.6.- Conclusión.

 

TEMA 6. CORRELACIÓN SIMPLE Y MÚLTIPLE ROBUSTAS.

6.1.- Introducción.

6.2.- Correlación robusta para dos variables.

6.2.1.- Correlación de porcentaje ajustado.

6.2.2.- Correlación winsorizada.

6.2.3.- M-estimadores de Goldberg e Iglewicz.

6.3.- Correlación robusta para p variables.

6.3.1.- Correlación de porcentaje ajustado entre p variables.

6.3.2.- Correlación winsorizada entre p variables.

6.4.- Conclusión.

 

TEMA 7. MODELOS LINEALES GENERALIZADOS UNIVARIANTES.

7.1.- Desarrollo.

7.2.- Conclusión.

 

TEMA 8. MODELOS LINEALES MIXTOS GENERALIZADOS. DISEÑO POR BLOQUES ALEATORIOS.

8.1.- Introducción.

8.2.- Formulación.

8.3.- Modelos lineales generalizados y mixtos generalizados con R. Diseño por bloques aleatorios.

8.4.- Conclusión.

 

TEMA 9. ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN (CARTS).

9.1.- Introducción.

9.2.- Árboles de regresión con R.

9.3.- Prunned o podado del Árbol.

9.4.- Árboles de clasificación con R.

9.5.- Conclusión.

 

TEMA 10. MODELOS ADITIVOS GENERALIZADOS GAM.

10.1.- Introducción.

10.2.- Formulación.

10.3.- Modelos GAM con R.

10.4.- Conclusión.

 

TEMA 11. ANÁLISIS DE SUPERVIVENCIA.

11.1.- Introducción.

11.2.- Cálculo completo en R. Uno y dos grupos.

 

TEMA 12. MODELOS SARIMA DE SERIES TEMPORALES.

12.1.- Introducción.

12.2.- Objetivos y usos en las diferentes ciencias.

12.3.- Paquetes a instalar en R.

12.4.- Bibliotecas a abrir en R.

12.5.- Cómo introducir los datos en R.

12.6.- Ejemplo completo:

12.6.1.- Cálculo con R.

12.6.2.- Filtrado lineal.

12.6.3.- Modelos SARIMA:

12.6.3.1.- Identificación del modelo.

12.6.3.2.- Estimación de los parámetros.

12.6.3.3.- Diagnosis.

12.6.3.4.- Predicción.

12.6.3.5.- Test de serie estacionaria.

12.6.4.- Cointegración de Series.

12.7.- Conclusión.

 

TEMA 13. PARÁMETROS GRÁFICOS.

13.1.- Gráfico plot. Función legend.

13.2.- Recta de regresión.

13.3.- Histograma.

13.4.- Gráfico de cajas.

13.5.- Gráficos de barras con barras de error.

 

 

MÓDULO IV. TÉCNICAS DE ANÁLISIS MULTIVARIANTE (40 hrs)

TEMA 1. ANÁLISIS DE CORRESPONDENCIAS.

1.1.- Introducción.

1.2.- Análisis de correspondencias bidimensional con R.

1.3.- Análisis de correspondencias múltiple con R.

1.4.- Conclusión.

 

TEMA 2. ANÁLISIS FACTORIAL.

2.1.- Introducción.

2.2.- Formulación.

2.3.- Análisis factorial con R.

2.4.- Conclusión.

 

TEMA 3. ANÁLISIS DE COMPONENTES PRINCIPALES.

3.1.- Introducción.

3.2.- Formulación.

3.3.- Análisis de componentes principales con R.

3.4.- Representaciones gráficas

3.5.- Conclusión.

 

TEMA 4. ANÁLISIS DISCRIMINANTE.

4.1.- Introducción.

4.2.- Formulación.

4.3.- Análisis discriminante con R.

4.4.- Validación cruzada.

4.5.- Método de los k vecinos más próximos.

4.6.- Método de los k vecinos más próximos. Validación cruzada.

4.7.- Análisis discriminante. K grupos y clasificación desconocida.

4.8.- Conclusión.

 

TEMA 5. ESCALADO MULTIDIMENSIONAL.

5.1.- Introducción.

5.2.- Formulación.

5.3.- Escalado multidimensional con R. Métrico y no métrico.

5.4.- Cálculo de matrices.

5.5.- Conclusión.

 

TEMA 6. ANÁLISIS CLUSTERS.

6.1.- Introducción.

6.2.- Formulación.

6.3.- Análisis clusters con R.

6.4.- Elección del número de clusters.

6.5.- Conclusión.

 

 

MÓDULO V. BASES DE DATOS. BIG DATA Y ETL (40 hrs)

TEMA 1. TRABAJO DE BIG DATA Y CUBOS OLAP.

1.1.- OLAP (On-Line Analytical Processing – Procesamiento analítico en línea)

1.1.1.- Los Cubos OLAP

1.1.2.- Gestores de bases de datos con OLAP

1.1.3.- Hechos y dimensiones

1.1.4.- Operaciones OLAP

1.1.4.1.- «Rebanada»

1.1.4.2.- «Dados»

1.1.4.3.- Enrollar

1.1.4.4.- Profundizar

1.1.4.5.- Pivote

Diploma emitido por la

Secretaría de Educación del Estado de Morelos con número de registro

17DAP5319

de fecha 06 de diciembre de 2019%cocid%

En el caso de que el estudiante no sea de la República Mexicana deberá pagar el costo de envío del Diploma.  
  • Llenar el formulario de la opción Registro de esta página.
  • Una vez registrado nos pondremos en contacto con usted para que nos haga entrega de la siguiente documentación:
  1. 1 copia de credencial de elector.
  2. 1 copia de cédula profesional de licenciatura, maestría o doctorado o copia de título en su caso.
  3. 1 copia de comprobante de domicilio.
  4. CURP

En caso de no tener uno de estos documentos deberá ponerse en contacto con COCID

La siguiente documentación será solicitada al estudiante al final del diplomado:

  1. 3 fotografías tamaño infantil.
  2. 3 fotografías tamaño diploma con las siguientes especificaciones:
    – recientes e iguales
    – blanco y negro
    – de frente
    – papel fotográfico, con retoque, no brillante, áspero en el reverso
    y con adhesivo.
  • MUJERES
    Recogerse el cabello (peinado sencillo).
    Frente y orejas completamente descubiertas.
    Aretes pequeños y sin collares.
    Ropa blanca.
    Poco maquillaje.
  • HOMBRES
    Camisa blanca, corbata.
    Saco color gris o beige (color claro).
    Bigote recortado, sin barba.
    Pelo corto.
    Ningún tipo de arete o collar.

 

*Las anteriores especificaciones para las fotografías son dictadas desde la DIRECCIÓN GENERAL DE COLEGIO CIENTÍFICO DE DATOS para la Expedición de Diploma oficial por la SECRETARÍA DE EDUCACIÓN DEL ESTADO DE MORELOS (SEEM) con número de registro 17DAP5319 de fecha 06 de diciembre de 2019.

 

*En el caso de que el estudiante no se encuentre en México le indicaremos personalmente para el envío de documentación.

Número de horas: 200 hrs.

Modalidad de aprendizaje: 

Puede usted elegir la modalidad educativa que guste:

En la modalidad híbrida. Cada sábado se estudiará en horario de tarde de forma presencial las técnicas en las instalaciones del CITPsi. Tendrá las ventajas de poder asistir e ir replicando cada técnica en su propia lap top con el apoyo y explicación de personal experto en el tema. Aparte, durante la semana podrá ir trabajando a su ritmo en la plataforma virtual donde encontrará más material complementario, apoyo del profesor continuo y las actividades a realizar.

– En la modalidad virtual. Comenzará a trabajar a su ritmo, en las horas que usted disponga con el apoyo personalizado del tutor experto. Contará con todo el material (pdf, bases de datos, guía didáctica, tareas, video-tutoriales, etc) para sacar el mayor rendimiento a su aprendizaje.

Inicio: 07 Marzo 2020

Fin: 25 de Julio 2020

Horario en modalidad  Presencial

Sábados de 10:00 am  a 2:00 pm

 

 

  1. Evaluación diagnóstica 10%
  2. Ejercicios en clase (Evaluación continua)  10%
  3. Problemas y ejercicios en casa (Evaluación continua)   20%
  4. Actitud (Evaluación continua) 10%
  5. Examen escrito (Evaluación final) 50%
  • Temario Oficial en pdf

Data Scientist. Software R. De las técnicas clásicas a las avanzadas.
Autor/editor: Tomás Alberto Salmerón Enciso
pp: 600
ISBN: 978-84-608-7178-1
DEP. LEGAL: GR-681-2016

  • Bases de datos propias.
  • Software R.
  • Resolución de mayoría de técnicas en SPSS.
  • Paquetes adicionales para técnicas avanzadas.
  • Guía Didáctica.
  • Material complementario en R.
  • Acceso a multitud de material de licencia libre en R en Biblioteca Virtual de COCID.
  • Acceso a más de 60 video-tutoriales.
  • Cafetería en modalidad presencial (café,té y galletas)

Costo del Diplomado

$ 15,000.00 MXN 

Opciones de pago:

 Puede realizarlo en un solo pago antes del comienzo del diplomado o en cinco pagos diferidos.

  1. Antes del día comienzo de diplomado 3,000.00
  2. 1-5 de abril 3,000.00
  3. 1-5 de mayo 3,000.00
  4. 1-5 de junio 3,000.00
  5. 1-5 de julio 3,000.00

En el caso de que el estudiante no sea de la República Mexicana deberá pagar el costo de envío del Diploma.  


Número de cuenta para depósito

BBVA

PROMOTORA DE FORMACIÓN ASML, S.C.

CUENTA 0113456544

CLABE 012542001134565445

 

 

 

 

 

1.-Aprobar todas las tareas, evaluaciones.

2.-Entrega de proyecto final de diplomado.

3.-No presentar adeudos, habiendo realizado los pagos en los plazos señalados.

TOMÁS ALBERTO SALMERÓN ENCISO.

Maestro en Técnicas Actuales de Estadística Aplicada, con una Especialización en Técnicas Robustas y Avanzadas de Estadística Aplicada y Licenciado en Psicopedagogía por la Universidad Nacional de Educación a Distancia (UNED – Madrid, España –). Trabajó para el Dpto. de Protección de Cultivos del Instituto de Formación Agraria y Pesquera de Andalucía (IFAPA – Gobierno de Andalucía, España) desarrollando la tarea de asesor en estadística e investigación. Fue jefe del dpto. de estadística operativa de High Quality Statistics (Granada, España). Impartió formación en estadística avanzada y realizó estudios para universidades y centros del Consejo Superior de Investigaciones Científicas (CSIC, España), así como para entidades privadas de investigación biomédica y financiera (Tigenix, Quintiles, Bowbuy). También ha realizado estudios en colaboración con el Comisionado de Energía de la Unión Europea y sus políticas Medioambientales en el año 2014. Especialista en software R, ha realizado publicaciones y desarrollado varios libros de estadística avanzada con software R y temarios para universidades como el Máster de Estadística Aplicada con Software R de la Universidad Rey Juan Carlos de Madrid (España). Actualmente, radica en México, donde imparte formación de posgrado en estadística avanzada con software R para universidades, expone en congresos nacionales e internacionales y realiza estudios de investigación.

 

MÓNICA LIMA VELA

De nacionalidad mexicana. Maestra en Tecnologías de la Información, especialista en tratamiento de bases de datos con MySQL, Big Data y cubos OLAP, programación JAVA, paquetería de Microsoft Office, Corel Draw, Sony Vega, Plataformas Virtuales en la nube, conocimientos en Audio Visual, ha tomado un diplomado en en Desarrollo y Asesoría de cursos en Modalidad no convencionales de aprendizaje, así mismo es asesora en formación. 

Realiza tu registro al Diplomado Diseño de Investigación y Análisis de datos con Software R

Sede módalidad presencial

Pico de Orizaba 1, Los Volcanes, 62350 Cuernavaca, Mor.

Contacto

Vía WattsApp  +52 1 735 339  2795

Correo: administracion@cocid.mx 

Encuéntranos en nuestras redes sociales