Actualmente estamos viendo cambios en el comportamiento del cliente debido a la pandemia COVID-19 y uno de los problemas más grandes que se ha generado en el rubro hotelero son las cancelaciones en las reservas. A lo largo de los años ya se había visto un alarmante crecimiento de cancelaciones en diversas OTAS, tan solo en el 2018 en Booking.com se cancelaron el 49,8% de las reservas hoteleras en el mercado europeo y para el 2020 las cifras se incrementaron dramáticamente.
Tomando en cuenta esta problemática el portal web Tecnohotel desarrolló un artículo en el que enseñan el enfoque de un proyecto de Machine Learning que ayuda a predecir la cancelación de reservas hoteleras y que sería muy beneficioso que los hoteleros lo tomen en cuenta.
Uno de los problemas más grandes que genera las cancelaciones de reservas es tratar de entender cuántas habitaciones debe vender un hotel y qué técnicas de overbooking se debe aplicar. Los huéspedes indirectamente son incitados a cancelar cuando en las OTAS se les brinda la opción de “reservar ahora y cancelar más tarde, de forma gratuita, cuando quieras”. Como resultado, los clientes tienen la libertad de hacer reservaciones en más de un hotel y decidir luego cual escogen. Entre los impactos que esto genera para los hoteles están:
- Pérdida de ingresos cuando no pueden revender la habitación
- Costos adicionales de los canales de distribución mediante el aumento de comisiones o el pago de publicidad para ayudar a vender estas habitaciones
- Bajar los precios a última hora, para que puedan revender una habitación, lo que resulta en la reducción del margen de beneficio.
No obstante, el machine learning es un recurso que puede ser útil para predecir con precisión qué reservas individuales y específicas se van a cancelar. Debido a la ciencia de datos y el aprendizaje automático o machine learning se puede obtener una solución viable a este problema ya que puede llegar a predecir con precisión qué reservas individuales y específicas se van a cancelar.
A continuación, se muestra cómo se puede usar el aprendizaje automático, seleccionando los mejores modelos para los datos y analizando sus resultados desarrollados en los siguientes puntos:
- Lead time
- ADR
- Presentación de la puntuación de predicción de potencia o Predictive Power Score (PPS)
- Modelado
- Limpieza de datos
- Selección de los mejores modelos
- ¿Qué es CatBoost?
- Interpretación del modelo
- Predecir en prueba / muestra