Voy a proporcionar una explicación heurística.
Un martingala local $(M_t)_t$ (mart) es un proceso estocástico cuyos incrementos esperados son cero, es decir, $E(\mathrm{d}M_t)=0$. Bajo condiciones técnicas adecuadas, una martingala local también es una martingala (verdadera) ya que el valor actual es la mejor estimación para su valor futuro: $E(M_t)=M_0$. La diferencia entre los dos casos es que una martingala local podría tener trayectorias en las que experimenta un comportamiento explosivo.
Un proceso $(A_t)_t$ con variación localmente acotada (BV) es, hablando en términos generales, un proceso que es "relativamente suave" en el sentido de que nunca experimenta un salto arbitrariamente grande en un intervalo de tiempo muy pequeño. Este proceso también debe ser continuo por la derecha con límites por la izquierda y adaptado.
Un semimartingala $(S_t)_t$ es un proceso estocástico que permite la descomposición: $$S\equiv M+A$$ es decir, puede escribirse como la suma de una martingala y un proceso de variación acotada. La Movimiento Browniano Geométrico (GBM) es una semimartingala: $$\textrm{d}S_t=\underbrace{\mu S_t\textrm{d}t}_{\text{BV}}+\underbrace{\sigma S_t\textrm{d}W_t}_{\text{mart}}$$ De hecho, en cada intervalo infinitesimal $\textrm{d}t$ el GBM (1) aumenta/disminuye a una tasa proporcional $\mu$, siendo la cantidad menor cuanto más pequeño sea el intervalo o el valor $S_t$, sin que haya nada brusco, y (2) una cantidad aleatoria que depende del Movimiento Browniano $W$ cuyo incremento esperado es cero: $E(\textrm{d}W_t)=0$.
Las semimartingalas son importantes en la teoría de procesos estocásticos porque son fáciles de integrar. De manera intuitiva, están compuestas por un término estocástico "imparcial" sin tendencia al alza/baja, y un componente de tendencia que está restringido a una variación acotada para evitar ser explosivo, y por lo tanto ser integrable.