1) "A primer orden" parece ser una abreviatura de "a una aproximación de primer orden", lo que significa a su vez, "a una aproximación lineal".
2) No es que "lo uno implique lo otro", es que lo uno es coherente con lo otro.
Al intentar llegar a una especificación funcional para la función "costes de distorsión fiscal", digamos $C_D=h(T)$ En primer lugar, razonamos que si los ingresos fiscales son nulos (no debido a la ineficiencia de la recaudación y/o la evasión fiscal, sino porque el tipo impositivo se fija en cero), entonces las distorsiones debidas a los impuestos también serán nulas. Esto implica que $h(T)$ no debe contener un término constante, por lo que $h(0) = 0$ .
Además si razonamos (como hace D. Romer) que "las distorsiones de los impuestos probablemente aumenten más que proporcionalmente con la cantidad de ingresos recaudados", esto implica que $h(T)$ debe no sea lineal en $T$ pero debe ser convexo (esto es lo que significa decir "más que proporcionalmente").
El paso natural entonces es considerar una función de coste de distorsión cuadrática, sin un término constante:
$$C_D = aT^2,\;\; a>0$$
que refleja ambos nuestros argumentos teóricos (y en particular, $h(0) =0$ ).
Pero esto también implica que "los costes de distorsión son cero hasta una aproximación de primer orden", porque tenemos
$$h'(T) = 2aT \implies h'(0)=0$$
por lo que un de primer orden La aproximación (expansión de Taylor) alrededor de cero daría
$$h(T) \approx h(0) + h'(0)\cdot T = 0+0\cdot T =0$$