CMIN — a CRISP-DM-based case tool for supporting data mining projects

CMIN — a CRISP-DM-based case tool for supporting data mining projects

This paper introduces CMIN, an integrated computer aided software engineering (CASE) tool based on cross-industry standard process for data mining (CRISP-DM) 1.0 designed to support carrying out data mining projects. It is “integrated” in the sense that it supports all phases of a process. A general...

Saved in:
Journal Title: Ingeniería e Investigación
First author: Carlos Cobos
Other Authors: Jhon Zuñiga;
Juan Guarin;
Elizabeth León;
Martha Mendoza
Palabras clave:
Traslated keyword:
Language: English
Spanish
Get full text: https://revistas.unal.edu.co/index.php/ingeinv/article/view/18177
Resource type: Journal Article
Source: Ingeniería e Investigación; Vol 30, No 3 (Year 2010).
DOI:
Publisher: Universidad Nacional de Colombia
Usage rights: Reconocimiento (by)
Categories: Physical/Engineering Sciences --> Engineering, Multidisciplinary
Abstract: This paper introduces CMIN, an integrated computer aided software engineering (CASE) tool based on cross-industry standard process for data mining (CRISP-DM) 1.0 designed to support carrying out data mining projects. It is “integrated” in the sense that it supports all phases of a process. A general overview of how CMIN works is presented first, including a treatment of processes, templates and project management. CMIN’s capacity for easily and intuitively monitoring projects is highlighted, as is the manner in which CMIN allows a user to increase knowledge regarding using CRISP-DM or any other process defined in the CASE tool through the help and information presented in each step. Next, it is shown how CMIN can bind new data mining algorithms in runtime (without the need to recompile the tool) to support modelling tasks (based on a Workflow) and evaluate data mining projects. Finally, the results of two evaluations of the tool, some conclusions and suggestions for future work are presented.
Translated abstract: En este artículo se presenta la CMIN, una herramienta CASE (Computer Aided Software Engineering) integrada (que soporta todas las fases de un proceso) basada en CRISP-DM 1.0 (Cross – Industry Standard Process for Data Mining) para soportar el desarrollo de proyectos de minería de datos.Primero se expone la funcionalidad general de CMIN, lo que incluye la gestión de procesos, plantillas y proyectos, y se destaca la capacidad de CMIN para realizar el seguimiento de los proyectos de una forma fácil e intuitiva y la manera como CMIN posibilita que el usuario incremente su conocimiento en el uso de CRISP-DM o de cualquier otro proceso que se defina en la herramienta a través de las ayudas e información que se ofrece en cada paso del proceso. Después, se detalla cómo CMIN permite enlazar en tiempo de ejecución (sin necesidad de volver a compilar la herramienta) nuevos algoritmos de minería de datos que apoyen la labor de modelado (basada en un flujo de trabajo o workflow) en un proyecto de minería de datos. Finalmente, se ofrecen los resultados de dos evaluaciones de la herramienta, las conclusiones y el trabajo futuro.