One-Hot Encoding

ONE-HOT ENCODING


Debido a que los datos categóricos no se pueden representar o no son aplicables en los algoritmos de aprendizaje automático, estos deben ser convertidos a valores de tipo numérico, de echo esto no es suficiente ya que los modelos definirán un orden natural entre las categorías esto implicaría un rendimiento deficiente para dar solución a esto se debe agregar una nueva variable binaria a cada valor entero, en si se debe hacer una representación de variables categóricas como vectores binarios, por consiguiente, se debe tener una correlación entre los valores categóricos y los valores enteros.

Fuente: https://www.slideshare.net/SergiiGavrylov/kpi-summer-school-2015-word-embeddings-and-neural-language-modeling


Muchos algoritmos de aprendizaje automático no pueden funcionar directamente con datos categóricos. Las categorías se deben convertir en números. Esto es necesario para las variables de entrada y salida que son categóricas.


Bibliografía


Machine Learning Mastery BLOG. (2017). Why One-Hot Encode Data in Machine Learning?. Recuperado el 15 de noviembre de 2017 de: https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/

Comentarios

Entradas populares de este blog

Machine Learning

Inteligencia Artificial Aplicada a la Detección de Cambios en el Territorio