Probablemente no tenga ni media ni varianza. Las variables de ratio no suelen tenerlas. Al tratarse de ratios contables, hay varias distribuciones candidatas y sus ratios no tendrían un primer momento.
Hay que recordar un par de cosas. Si ninguna de las variables de un ratio puede ser negativa, entonces es probable que tengas una distribución truncada.
En la práctica, esto excluye absolutamente las fórmulas relacionadas con los mínimos cuadrados en la mayoría de los casos. La excepción es si una variable dependiente tiene un rango restringido, como en el probit o el logit.
Aunque la transformación logarítmica permitiría utilizar algoritmos del tipo de los mínimos cuadrados, hay dos cuestiones que no se pueden ignorar. La primera es la interpretación. No se puede transformar algo sin más porque es lamentablemente inconveniente. El segundo es que las distribuciones probablemente transformadas en logaritmos carecerán de una matriz de covarianza. Esto crea un problema evidente. Después de todo, si $$\beta=\frac{\text{cov}(x,y)}{\text{var}(x)}$$ y $\text{cov}(x,y)$ es una cantidad indefinida, ¿qué significa?
No hay una solución estándar porque al campo le gusta fingir que las cosas se distribuyen normalmente. Sin embargo, el campo general de la estadística tiene soluciones.
En primer lugar, si se va a utilizar en una regresión lineal o polinómica, la mejor opción es utilizar la regresión de Theil.
Ver
Theil, H. (1950), "A rank-invariant method of linear and polynomial regression analysis. I, II, III", Nederl. Akad. Wetensch., Proc., 53: 386-392, 521-525, 1397-1412
Está íntimamente relacionado con los métodos de bootstrapping y remuestreo.
La siguiente mejor opción sería la regresión cuantílica en torno a la mediana. Véase
Koenker, Roger (2005). Quantile Regression. Cambridge: Cambridge University Press.
Si estuvieras haciendo un trabajo científico, entonces cualquiera de ellos sería la mejor opción.
Si estuvieras haciendo un trabajo aplicado, ninguno de los dos sería una buena opción. En su lugar, deberías derivar la distribución y resolverla con un método bayesiano. De nuevo, depende de la intención. Si el propósito fuera utilizarlo en finanzas, por ejemplo, deberías utilizar una distribución a priori subjetiva adecuada o podrías ser Dutch Booked.
Ver
Vineberg, Susan, "Dutch Book Arguments", The Stanford Encyclopedia of Philosophy (Spring 2016 Edition), Edward N. Zalta (ed.), URL = https://plato.stanford.edu/archives/spr2016/entries/dutch-book/ .
No se puede utilizar la estadística frecuencial en ninguna forma de fijación de precios o basada en el riesgo porque la estadística frecuencial da lugar a un Libro Holandés automáticamente. Hay un choque entre el tercer axioma de Kolmogorov y el Teorema del Libro Holandés de de Finetti. Savage y de Finetti argumentaron, y yo estoy de acuerdo, que los métodos probabilísticos o estadísticos construidos sobre la aditividad contable darán lugar a Dutch Books, obligando al creador de mercado a asumir pérdidas seguras. Los métodos frecuentistas se basan en la aditividad contable. Los axiomas de De Finetti dan lugar a la probabilidad y la estadística bayesianas, pero no pueden ser contablemente aditivas, sino sólo finitamente aditivas.
Para entender la diferencia, un estadístico frecuentista, si quisiera, podría cortar la distribución normal estándar en conjuntos disjuntos en cada número entero, como de 0 a 1, de 1 a 2, de 2 a 3 y así sucesivamente para un número infinito de conjuntos. Un estadístico bayesiano no puede hacer eso. Tiene que elegir cuántos conjuntos quiere y atenerse a ello. Puedes cortarlo de tres maneras o de seis millones, doscientos cincuenta y un mil, seiscientos dos maneras y estás bien.
He escrito un ejemplo para que puedas ver lo que quiero decir en Cómo cortar pasteles .
Si fuera para un propósito aplicado, pero para algo como la política fiscal, donde la idea de un Libro Holandés no significa mucho, entonces podrías salirte con distribuciones previas adecuadas pero difusas. Podrías utilizar cosas como las priores de máxima entropía, suponiendo que estuvieras utilizando la investigación o la información previa como elemento de tu construcción a priori.
Ver
Jaynes, E.T. (2003) Probability Theory The Language of Science. Bretthorst, Larry (ed). Cambridge University Press.
Tengo una o dos conjeturas sobre qué distribuciones están involucradas, pero cambiaría, por ejemplo, si hubiera una fuerte restricción presupuestaria.
Para derivar la distribución, mira
Weisstein, Eric W. "Distribución de ratios". De MathWorld--A Wolfram Web Resource. https://mathworld.wolfram.com/RatioDistribution.html
Deberías buscar un libro básico de grado en estadística y leer sobre la suma, la resta, la multiplicación y la división de variables aleatorias. Puedes tener problemas con las distribuciones truncadas si ignoras el truncamiento, así que también adquiere conocimientos básicos sobre las consecuencias del truncamiento.
La buena noticia es que las distribuciones, al carecer de media o varianza, también carecen de un sesgo o curtosis definidos. Hay dos posibles fuentes de sesgo percibido. En primer lugar, si las variables están truncadas, toda la cola izquierda desaparece. Incluso si fuera simétrica, de no ser por el truncamiento, parecería sesgada. En segundo lugar, las restricciones probabilísticas amortiguarán la distribución a medida que vaya hacia la derecha.
En cuanto a la curtosis, bueno, ignorando que no existe, el intervalo del 99,99% para la distribución de Cauchy es $\pm{636}\sigma$ no $\pm{3}\sigma$ . Sin embargo, $\sigma$ no es una desviación estándar, es la media anchura a la mitad del máximo. Es aproximadamente la mitad del rango intercuartil si no hay truncamiento. Si hay truncamiento, entonces es la ubicación desde el centro hasta el punto donde la densidad es exactamente la mitad de la altura de la moda.
EDITAR Bien, déjame tomar tus comentarios en orden. No todas las distribuciones de probabilidad tienen un valor esperado, una media poblacional. Algunas que tienen una media poblacional no tienen una varianza.
Como ejemplo, observe que si existe una media poblacional, entonces $$E(x)=\int_{-\infty}^\infty{x}f(x)\mathrm{d}x.$$ Para la distribución normal, es decir, si $f$ es una distribución normal, entonces $E(x)=\mu$ , donde $\mu$ es la media de la población.
Sin embargo, consideremos el caso simple en el que $$f(x)=\pi^{-1}\frac{1}{1+x^2.}$$ Esta distribución se denomina distribución de Cauchy. El nombre probablemente no es apropiado, pero muchas cosas llevan el nombre de Cauchy.
La distribución fue descubierta por Poisson como un contraejemplo del teorema del límite central. El teorema del límite central no se cumple para esta distribución. Cauchy la encontró como un ejemplo en el que los mínimos cuadrados siempre fallan como método de regresión.
Así, a partir de la definición anterior, $$E(x)=\int_{-\infty}^\infty\frac{1}{\pi}\frac{x}{1+x^2}\mathrm{d}x.$$
La integral indefinida es $$\int\frac{1}{\pi}\frac{x}{1+x^2}\mathrm{d}x=\frac{1}{2}\log(1+x^2)+C.$$ Obviamente, como $x$ va al infinito positivo o negativo, los términos superior e inferior de la integral van al infinito. Esta es una integral impropia, por lo que la forma exacta en que podríamos discutirla depende un poco de cómo definamos la integral, ya que el infinito no forma parte de los números reales, la integral diverge.
Dado que los mínimos cuadrados encuentran la pendiente media que pasa por el valor medio y el valor medio no existe, el estimador se deshace y no está relacionado con ningún valor real de la población. Como la media de la población no existe, la media de la muestra no tiene sentido. Dado que la media no está definida, la varianza, la inclinación y la curtosis tampoco lo están.
Por supuesto, dado que la rentabilidad se define como la relación de los precios, el mismo problema existe para la rentabilidad de las acciones. Ese es también el origen de las colas gruesas.
La mediana existe para todas las distribuciones, incluidas las distribuciones en las que toda la masa se encuentra en un solo punto. Por lo tanto, funcionan los métodos sin parámetros y sin distribución que implican la mediana. La interpretación de la regresión cambiará.
Por ejemplo, el estimador de la pendiente de Theil es la mediana de la pendiente del conjunto de todas las pendientes que pasan entre cada punto de la muestra. Por ello, tiene que existir una relación entre las variables al menos la mitad del tiempo, pero no tiene que existir en absoluto el resto del tiempo. Los actores tienen que ser racionales al menos en la mitad de las transacciones, pero pueden estar locos de remate el resto del tiempo. No tendrá ningún impacto en la regresión si la gente se comporta de una manera totalmente loca el 41% del tiempo. Reduce los requisitos del comportamiento humano.
En cuanto a si está truncado, importa que el cociente pueda ser negativo. Si no puede, las herramientas basadas en la verosimilitud, como los métodos bayesianos o el método de máxima verosimilitud, producirán resultados que no convergen al parámetro a menos que se tenga en cuenta el truncamiento en su fórmula. Serán sensibles al elemento que falta en la distribución.
En cuanto a si se trata de un trabajo científico o aplicado, la cuestión gira en torno a la importancia del Teorema del Libro Holandés.
Si yo dirigiera un casino y tú entraras a jugar, y mis cálculos violaran el Teorema del Libro Holandés, entonces existirían momentos en los que se te garantizaría una victoria segura. ¿Por qué querría jugar si me obligasen a tener pérdidas?
Además de crear probabilidades válidas, los estimadores bayesianos no pueden ser dominados por otros estimadores. Consideremos el caso en el que $$f(x|\mu)=\left[\frac{\pi}{2}+\tan^{-1}(\mu)\right]^{-1}\frac{1}{1+(x-\mu)^2},x\ge{0}.$$ Este es el caso truncado de la distribución anterior donde $\mu\in\Re$ en lugar de $\mu=0$ . En ese caso, $\mu$ no está en la mediana.
Las estadísticas basadas en la mediana siguen siendo válidas para ello, pero no representan el comportamiento del actor marginal. En cambio, representan el comportamiento del actor medio.
Los métodos basados en la probabilidad serán superiores para localizar $\mu$ en lugar de los métodos basados en la mediana, que tendrían la garantía de que no se produce.
Aunque los métodos frecuentistas basados en la mediana, como la regresión de Theil, tienen garantizado el error del parámetro poblacional, siguen ofreciendo garantías de probabilidad válidas sobre el actor medio. Los valores p darán inferencias correctas. Los intervalos de confianza proporcionarán una cobertura correcta. Así, por ejemplo, si se preguntara por la aplicabilidad de un modelo monetarista a una pregunta concreta en la que no se definiera una media, proporcionaría una inferencia válida.
Si su objetivo es la verdad o la falsedad, entonces está bien utilizar la regresión de Theil. Si necesita apostar dinero con su modelo, entonces no puede ser.
En cuanto a los momentos, puede encontrar una discusión sobre la función generadora de momentos en el artículo de la wiki al respecto . También hay que mirar la función característica, ya que puede existir una función característica aunque no existan momentos, véase el artículo de la wiki sobre eso .