One-Hot Encoding
ONE-HOT ENCODING
Debido a que los datos categóricos no se pueden representar o no son
aplicables en los algoritmos de aprendizaje automático, estos deben ser
convertidos a valores de tipo numérico, de echo esto no es suficiente ya que
los modelos definirán un orden natural entre las categorías esto implicaría un
rendimiento deficiente para dar solución a esto se debe agregar una nueva
variable binaria a cada valor entero, en si se debe hacer una representación de
variables categóricas como vectores binarios, por consiguiente, se debe tener
una correlación entre los valores categóricos y los valores enteros.
Fuente: https://www.slideshare.net/SergiiGavrylov/kpi-summer-school-2015-word-embeddings-and-neural-language-modeling
Muchos algoritmos de aprendizaje automático no pueden funcionar
directamente con datos categóricos. Las categorías se deben convertir en
números. Esto es necesario para las variables de entrada y salida que son
categóricas.
Bibliografía
Machine Learning
Mastery BLOG. (2017). Why One-Hot Encode Data in Machine Learning?. Recuperado el 15 de noviembre de 2017 de:
https://machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/
Comentarios
Publicar un comentario