Minería de Datos
🇪🇸
In Spanish
In Spanish
Practice Known Questions
Stay up to date with your due questions
Complete 5 questions to enable practice
Exams
Exam: Test your skills
Test your skills in exam mode
Learn New Questions
Manual Mode [BETA]
Select your own question and answer types
Specific modes
Learn with flashcards
Complete the sentence
Listening & SpellingSpelling: Type what you hear
multiple choiceMultiple choice mode
SpeakingAnswer with voice
Speaking & ListeningPractice pronunciation
TypingTyping only mode
Minería de Datos - Leaderboard
Minería de Datos - Details
Levels:
Questions:
45 questions
🇪🇸 | 🇪🇸 |
Que observas en la imagen? | Estructura XML |
Elemento XML que en conjunto permite crear un cubo para realizar análisis | <schema>, <cube>, <physicalSchema> |
En el análisis del diseño de los cubos, ¿cuáles son los puntos importantes? | *Hechos: Actividad objeto del análisis *Indicadores: Métricas o variables a analizar *Dimensiones: Perspectiva de análisis |
Qué representa la imagen? | Bosque aleatorio |
Num 2 | Dos |
Hola | Hola |
A que pertenece la definición? | Bosque aleatorio |
Requisitos para el diseño de los cubos OLAP | Requerimientos Análisis Determinar Jerarquías de dimensiones Diseño multidimensional |
¿Cuál es el objetivo principal de SVM? | Es maximizar el margen entre las clases y minimizar los errores de clasificación |
¿Cuáles son Los tipos de servidores en los cubos? | OLAP-ROLAP:Está basado en los modelos relacionales DBMS. OLAP-MOLAP: Está basado en DBMS multidimensionales para su almacenamiento y acceso a los datos. |
¿Cuál es el objetivo principal de SVM? | Es maximizar el margen entre las clases y minimizar el error de clasificación |
Pregunta audio | Bits |
¿Cuál es el primer paso que se debe de hacer en Spoon? | Hacer una conexión a la base de datos Origen y a la Destino |
Se le conoce como... | Transformación |
¿Para qué se definen los dos tipos de elementos: Transformations y Jobs en Spoon? | Se define Transformations para transformar los datos, describiendo flujos de datos para ETL. Se definen Jobs para organizar tareas y transformaciones estableciendo su orden y condiciones de ejecución |
¿Qué representa? | Las etapas del proceso de Descubrimiento de Conocimiento en Bases de Datos (Knowledge Discovery in Databases, KDD) |
Con la imagen nos referimos a... | La Metodología CRISP-DM |
¿Cuáles con las actividades de la etapa de Procesamiento de Datos en el KDD? (Knowledge Discovery in Databases, KDD) | Las actividades de esta etapa son: - Limpieza de datos (data cleaning) - Transformación de los datos - Reducción de dimensionalidad |
Usa el enfoque de divide y vencerás | Árboles de decisión |
Límite de decisión que separa puntos de datos en diferentes clases en un espacio de alta dimensión | Hiperplano |
¿Qué significa SVM por sus siglas en inglés? | Support Vector Machine |
¿Cuáles son las diferencias entre OLTP y OLAP? | OLTP es un sistema de modificación de datos online, mientras que OLAP es un sistema de recuperación de datos multidimensionales históricos en línea |
¿Qué representa la imagen? | Bosque aleatorio |
¿Cómo se define un boque aleatorio? | Conjunto de árboles de decisión dónde cada árbol se entrena en una muestra aleatoria de datos y contribuye a la predicción final |
¿Cómo se decide la predicción final en los bosques aleatorios? | Para clasificación: Votación Para regresión: Promedio |
¿Qué es la minería de datos? | Técnicas para el descubrimiento automatizado eficiente de patrones previamente desconocidos, válidos, novedosos, útiles y comprensibles en grandes bases de datos. |
¿A qué se refiere la siguiente imagen? | Proceso de la minería de datos |
Técnica de la minería de datos | Modelado predictivo |
Técnica que se basa en el concepto de agrupación de datos y se incluye en el aprendizaje no supervisado, donde los datos no están etiquetados. | Segmentación de bases de datos |
¿Cuál es la estructura de una función en R y describe brevemente cada una de sus partes ? | Entradas o argumentos: sirven para ingresar información Cuerpo: está formado por un conjunto de instrucciones Salidas: son los resultados de la función. Toda función debe tener al menos un resultado. |
Tu cliente que en este caso es una escuela privada te pide analizar su base de datos, al comenzar de lo primero que te percatas es que gay un campo que posee valores categóricos lo que significa que esos valores no están ordenados, qué harías para que ese campo sea útil a la hora de extraerlo y usarlo en un algoritmo | Utilizar la funcion revalue y con ello reemplaza valores en la variable dada en la entrada x, de acuerdo con las reglas dadas en la entrada de reemplazo. |
¿De que tipo es la siguiente grafica? | Gráficos de barras con una superposición de respuesta para explorar la relación entre un predictor categórico. |
El cliente o el analista pueden no tener nociones a priori destacadas sobre lo que los datos podrían revelar. En tales casos,¿Qué es lo que le permite hacer el análisis exploratorio de datos (EDA) o el análisis gráfico de datos? | Gráficas para explorar la relación entre las variables predictoras y la variable objetivo |
¿Qué es un árbol de decisión? | Crea modelos de regresión o clasificación en forma de estructura de árbol. |
En los árboles de decisión, ¿para qué se utiliza está fórmula? | La desviación estándar se utiliza para calcular la homogeneidad de una muestra numérica. |
¿Cuáles son algunas métricas comunes utilizadas para evaluar la calidad de los modelos de regresión? | R-squared MSE MAE RMSE |
En la matriz de confusión, ¿qué representan los verdaderos positivos? | Esto representa casos que se pronostican como Sí y en realidad, los casos son Sí. |
El resultado a predecir no es una clase discreta sino una cantidad numerica | Predicción numérica |