Description
En todo el mundo se recopila y almacena una enorme cantidad de datos en bases de datos. Estos datos se acumulan y siguen aumentando cada año. La extracción de información oculta en estas bases de datos y la clasificación de la información extraída son las tareas más importantes de la minería de datos. Si estos conjuntos de datos están desequilibrados, resulta difícil manejarlos. La predicción del futuro es una de las tareas fundamentales de la minería de datos. Trabajar con conjuntos de datos desequilibrados para predecir los posibles resultados es una tarea muy tediosa. El conjunto de datos está desequilibrado cuando no se clasifica correctamente, cuando una clase contiene más instancias que otra. Suelen representarse como una clase positiva (minoritaria) y otra negativa (mayoritaria). La clase que tiene menos muestras se denomina minoritaria y la que tiene más, mayoritaria. Los conjuntos de datos desequilibrados causan muchos problemas graves en la minería de datos, sobre todo porque el algoritmo de clasificación estándar considera el conjunto de datos como equilibrado, lo que a su vez es parcial hacia la clase mayoritaria. Para aplicaciones como el diagnóstico médico, esto tiene un efecto muy grave. Por lo tanto, equilibrar el conjunto de datos es fundamental para muchas aplicaciones en tiempo real.
Dharmendra Singh Rajput a obtenu son doctorat dans le domaine du regroupement de documents à l'Institut national de technologie de Bhopal, en Inde. Il a plus de 6 ans d'expérience dans l'enseignement, la recherche et l'industrie. Il travaille actuellement comme professeur associé à l'École des technologies de l'information et de l'ingénierie, à l'Université VIT, à Vellore, en Inde.