Tengo un conjunto de datos de precios de viviendas y sus correspondientes características (habitaciones, metros cuadrados, etc). Una característica adicional es la fecha de venta de la casa. El objetivo es crear un modelo que pueda estimar el precio de una casa como si se vendiera hoy. Por ejemplo, una casa con un conjunto específico de características (5 habitaciones, 100 metros cuadrados) y la fecha de hoy (28-1-2020), ¿a qué precio se vendería? El tiempo es un componente importante, porque los precios aumentan (se inflan con el tiempo). Estoy luchando por encontrar una manera de incorporar la fecha de venta como una característica en el modelo de impulso de gradiente.
Creo que hay varios enfoques:
- Convertir los datos en un entero, e incluirlos directamente en el modelo como una característica.
- Crear un modelo separado para modelar la evolución del precio de la vivienda a lo largo del tiempo. Pensemos en esto como una especie de modelo AR(1). I podría ajustar todas las observaciones para la inflación, de modo que obtendríamos obtener un precio ajustado a la inflación para hoy. Estos precios ajustados a la inflación precios ajustados a la inflación se entrenarían en el conjunto de características.
¿Qué opina de estas dos opciones? ¿Existen métodos alternativos?
0 votos
Ayudaría a entender un poco mejor el montaje. ¿Está diciendo que sólo quiere estimar los precios de las fechas que ya están incluidas en la muestra? (De lo contrario, parece que el enfoque nº 1 fallaría). ¿Tiene un número de observaciones de ventas en cada casa de su muestra (datos de ventas repetidas) o sólo un precio?
0 votos
Gracias por la respuesta. He actualizado la pregunta, creo que ahora es un poco más clara.