Si el proceso de generación de datos fue fijo a lo largo del tiempo, se elegiría la muestra de datos más larga disponible para la prueba de cointegración, ya que una muestra más grande proporciona una mayor potencia para la prueba.
Si el proceso de generación de datos es cambiando a lo largo del tiempo, entonces se identificaría el período de interés y se utilizaría sólo la submuestra correspondiente para probar la cointegración, porque los resultados de la prueba diferirían entre períodos/submuestras.
Si los resultados de la prueba cambian en función del periodo/submuestra ( su caso ), es probable que el proceso de generación de datos esté cambiando con el tiempo (a través de las submuestras). Entonces hay que elegir la submuestra de interés y hacer pruebas e inferencias para esa submuestra en particular, siendo conscientes de que la inferencia podría no ser válida para otros períodos/submuestras.
Editar abordando el comentario
Busco la cointegración porque quiero poder operar con un par de acciones que estén (1) cointegradas en mi backtest y (2) que probablemente estén cointegradas en los próximos meses.
Se trata de una tarea muy difícil, y nunca se puede garantizar que el proceso de generación de datos sea el mismo a lo largo del tiempo, especialmente cuando se trata de series temporales financieras. Esencialmente, no hay forma de saber si la cointegración estará o no presente en el futuro. Pero se puede intentar una argumentación teórica, como que si las acciones de una empresa se negocian en dos bolsas, los precios en las dos bolsas no deberían desviarse mucho entre sí.