Todo depende de si se trata la restricción presupuestaria como un igualdad o desigualdad restricción. Se trata de dos problemas diferentes, con dos soluciones distintas en este caso.
Una versión del problema (reescribiendo el objetivo en la forma sugerida por denesp, y eliminando la constante, para mayor claridad) es \begin{align} \max~&-4(x-4.5)^2 -2(y-1.5)^2\\\text{s.t. }&5x+7y=40 \end{align} Con este igualdad la restricción, el óptimo es $(x,y)=(4.78,2.29)$ como se encontró utilizando el método de los multiplicadores de Lagrange y Wolfram alpha. Es cierto que preferirías consumir menos y mantenerte en el punto de felicidad, pero si asumimos que la restricción presupuestaria es una igualdad, entonces no se te permite consumir menos.
Otra versión del problema es \begin{align} \max~&-4(x-4.5)^2 -2(y-1.5)^2\\\text{s.t. }&5x+7y\leq40 \end{align} con un desigualdad en la restricción presupuestaria. En este caso, como señalas, está claro que el óptimo es $(x,y)=(4.5,1.5)$ porque ese es el perfil de consumo que maximiza globalmente la función de utilidad (y obedece a la desigualdad presupuestaria).
Asumir que la restricción presupuestaria es una desigualdad suele ser más apropiado (suponiendo que siempre se puede "tirar" la riqueza extra).
Cuando se resuelven problemas de optimización restringidos en los que algunas de las restricciones son desigualdades, necesitamos una generalización del método básico de los multiplicadores de Lagrange llamado Condiciones Karesh-Kuhn-Tucker (KKT) que probablemente no se haya tratado en su curso. Puedes leer sobre esto con más detalle en el artículo enlazado de la wikipedia, pero la idea básica es simple: podemos seguir estableciendo el Lagrangiano, donde escribimos la restricción como $g(x,y)=5x+7x-40\leq 0$ y luego restar $\lambda g(x,y)$ del objetivo: $$\mathcal{L} = -4(x-4.5)^2 -2(y-1.5)^2 - \lambda(5x+7y-40)$$ Podemos entonces igualar las derivadas parciales a 0 ( $\partial\mathcal{L}/\partial x = 0$ y $\partial\mathcal{L}/\partial y=0$ ) para obtener dos condiciones \begin{align} \frac{\partial\mathcal{L}}{\partial x}&=0 \Longleftrightarrow 8(x-4.5)=-5\lambda\tag{1}\\ \frac{\partial\mathcal{L}}{\partial y}&=0 \Longleftrightarrow 4(y-1.5)=-7\lambda\tag{2} \end{align} La cuestión, entonces, es cómo precisar $\lambda$ . Probablemente esté acostumbrado a encontrar $\lambda$ viendo qué valor hace que la restricción presupuestaria se mantenga con igualdad. En este caso, sin embargo, eso implica $\lambda<0$ . Esto no está permitido para una restricción de desigualdad bajo las condiciones KKT, que requieren $\lambda\geq 0$ Desde $\lambda$ resulta ser la utilidad marginal de la riqueza, esta restricción equivale a decir que más riqueza (que relaja la desigualdad) no debería perjudicarnos.
Las condiciones KKT también tienen un requisito llamado holgura complementaria que establece que, o bien la desigualdad debe ser vinculante (mantener la igualdad) en el óptimo, o bien $\lambda$ debe ser 0. (Ya que $\lambda$ mide el "coste" de la restricción, esto es lógico: si la restricción no es vinculante, entonces el coste debe ser 0, y no debería afectar a su problema de optimización local). Ya vimos que si la restricción presupuestaria se mantiene con igualdad, obtenemos $\lambda<0$ que no está permitido, por lo que la holgura complementaria implica que nuestra única opción restante es $\lambda=0$ . Introduciendo esto en (1) y (2), obtenemos $(x,y) = (4.5,1.5)$ que es la solución que ya encontraste intuitivamente.
Por lo general, en la microintroducción no es necesario utilizar las condiciones de KKT completas, ya que trabajamos con funciones de utilidad que son monótonas, en las que siempre se querrá agotar la restricción presupuestaria. La utilidad cuadrática simple con un punto de felicidad interior, como en este caso, es una excepción en la que necesitamos un caso muy simple de las condiciones KKT para hacer la optimización correctamente.
**Nota: por supuesto, si añadimos $\lambda g(x)$ en lugar de restarlo al Lagrangiano, los signos se invierten. He visto muchas convenciones diferentes, y me quedo con la que hace $\lambda$ no negativo. El artículo de Wikipedia utiliza la convención opuesta.