DIFERENCIAS DEL INGRESO ENTRE TRABAJADORES DE LOS SECTORES FORMAL E INFORMAL DE LA  
ECONOMÍA GUATEMALTECA EN EL AÑO 2018

4

REVISTA ACADÉMICA ECO (23) : 1-23, JULIO-DICIEMBRE DE 2020

2. Modelos y datos

Para el presente estudio, los sujetos de investigación están conformados por 
los estratos de población ocupada que representan el sector formal y el sector 
informal de la economía guatemalteca. En la ENEI 2018 se incluye una variable 
que especifica si los individuos pertenecen al sector formal o al informal; por 
consiguiente, la población ocupada del país se encuentra en 7 003 398 personas. 
Según estos datos, el sector informal está formado por el 69.5 % de la población 
ocupada, que representa 4 867 361 personas, mientras que el sector formal está 
formado por el restante de 30.5 %, que representa 2 136 036 personas.

Sin embargo, las estimaciones pueden verse afectadas por sesgo de selección, esto 
significa que los individuos que se reportan en las encuestas se autoseleccionaron 
para entrar en el sector formal o informal. Si las características de estos difieren 
sistemáticamente, el modelo haría estimaciones de una muestra no aleatoria 
y los resultados no serían representativos para toda la población; por lo que se 
implementará el modelo Heckit (Perodi, Ramírez y Thompson, 2017).

Para definir la población, se utilizaron los datos proporcionados por el INE. De 
acuerdo con las proyecciones y estimaciones de población para el 2018, se estima 
que la población de Guatemala es de 17 311 086 habitantes.

El esquema de muestreo que adopta la ENEI 2018 es de carácter probabilístico, 
bietápico, estratificado y por conglomerados. El tamaño de la muestra fue 
calculado considerando como variable principal la tasa de subempleo visible (TSV). 
Este tamaño de la muestra es válido para dar estimaciones a nivel de cada dominio 
de estudio y total del país.

La muestra en su total fue de 5277 viviendas en 363 sectores: de la misma, 40 
sectores pertenecen al dominio urbano metropolitano, 33 al resto urbano, 11 al 
rural nacional y 25 al nacional, con un nivel de confiabilidad del 95 %. La submuestra 
fue de 8573 observaciones, de las cuales 3230 pertenecen al sector formal y 5343 
pertenecen al sector informal.

La presente investigación es de tipo descriptivo, y para calcular las diferencias 
salariales entre los trabajadores del sector formal e informal, se utilizarán tres 
modelos econométricos.

El primer modelo es el método de Heckman (1979) o modelo Heckit, el cual corrige 
el sesgo de selección en dos etapas; este error puede atribuirse a la omisión de 
una variable relevante en el modelo. En la primera etapa se estima la variable 
omitida, conocida como la razón inversa de Mills , por medio de un modelo probit