La valoración de opciones en general consiste en construir una cartera de cobertura donde, si tienes una cantidad determinada de dinero y sigues una estrategia determinada, replicarás perfectamente el payoff de la opción. La valoración de opción binomial es una forma particular de construir esta estrategia que tiene la ventaja de ser bastante intuitiva de entender.
Desde una perspectiva práctica, tener $u = \frac{1}{d}$ es bastante importante. Ingenuamente, puedes hacer que $u$ y $d$ sean lo que quieras (e incluso puedes hacer que $u_t$ y $d_t$ dependan del tiempo), pero esto conduciría a $2^t$ nodos en el tiempo $t$, mientras que un árbol con $ud=1$ se puede diseñar de tal manera que en el paso de tiempo $t$ haya $t+1$ nodos. Esto lleva el algoritmo de valoración de $O(2^N)$ a $O(N^2)$ -- una aceleración apreciable en un entorno de trading si tal vez tienes 20 pasos de tiempo, absolutamente necesario si tienes 365.
En cuanto a la forma exacta de $u = e^{\sigma \sqrt h}$, quizás alguien tiene una respuesta más rigurosa que la mía, pero esta fórmula tiene la propiedad agradable de que relaciona el movimiento hacia arriba con 1) la longitud del paso de tiempo durante el cual se observa este movimiento, y 2) la volatilidad de la acción.
Para la pregunta de por qué una volatilidad igualando la desviación estándar de los rendimientos pasados hace que el valor de la opción sea justo, no necesariamente. En los mercados de opciones puedes pensar en la volatilidad implícita como el parámetro $\sigma$ que iguala el precio de mercado de una opción con el valor dado en un modelo como Black Scholes. Personalmente consideraría el modelo binomial con $\sigma$ elegido como lo has descrito como un punto de partida en el proceso de valoración y un parámetro que se podría "ajustar". (Esta es una opinión personal, las volatilidades implícitas para opciones que no puedes observar directamente es un tema importante del cual no soy un experto.)