Usted derivación aquí es imperfecto porque va a derivar con respecto a dos de los procesos y usted no se toma en cuenta que la variable $W_t$ es estocástico y por lo tanto $S_t$ es así.
Así, para derivar $S_t$ de $dS_t$, se tiene que aplicar el Lema de Ito, ver esta pregunta para obtener más detalles. Este es el "clásico" de la manera que usted la vea.
Si quieres hacerlo de la otra forma, la configuración de $S_t = f(W_t,t) = S_0 \exp \left[ (\mu - \frac{\sigma^2}{2}) t + \sigma W_t \derecho]$ y aplicando el Lema de Ito te ofrece:
$$ df(W_t,t) = \frac{\partial f}{ \partial t } dt + \frac{\partial f}{ \partial W_t } dW_t + \frac{\partial^2 f}{ (\partial W_t)^2 } d \langle W\rangle_t$$
$$ df(W_t,t) = S_t \left(\mu - \frac{\sigma^2}{2} \right) dt + S_t \sigma dW_t + \frac{1}{2} S_t \sigma^2 dt$$
$$ df(W_t,t) = S_t \left[ \left(\mu - \frac{\sigma^2}{2} + \frac{\sigma^2}{2} \right) dt + \sigma dW_t \derecho]$$
$$ df(W_t,t) = S_t ( \mu dt + \sigma dW_t ) = dS_t$$
Así que, esencialmente Ito Lema añade un plazo para la variación cuadrática de un proceso estocástico, $d \langle W\rangle_t$, que es 0 para determinista de los procesos. Esto es donde $\frac{\sigma^2}{2}$ (o desaparece dependiendo de cómo se vea).