Introducción a la Econometría y Modelos Econométricos

ECONOMETRÍA

Rama de la Economía que aúna la Teoría Económica, las Matemáticas, la Estadística y la Informática para estudiar y analizar fenómenos económicos. Su principal propósito es proporcionar un sustrato empírico a la Teoría Económica.

MODELO ECONÓMICO

Representación simplificada de la realidad económica mediante la expresión matemática de una determinada teoría económica.

MODELO ECONOMÉTRICO

Es aquel modelo económico que contiene todos los elementos necesarios para ser estudiado desde un punto de vista empírico. Es un modelo económico en el que se ha especificado:

  • El tipo de relación entre variables (en este curso, lineal).
  • El número de variables.
  • La introducción de la perturbación aleatoria (para recoger el efecto de las variables no incluidas fundamentalmente).

FASES DEL MODELO ECONOMÉTRICO

  1. Especificación (se propone la forma matemática).
  2. Estimación (obtención de valores numéricos de las cantidades constantes del modelo).
  3. Validación.
  4. Explotación (usar el modelo para la predicción).

COMPONENTES DEL MODELO ECONOMÉTRICO

VARIABLES

  • Observables: aquellas de las que disponemos de datos, pueden ser dependientes, explicadas, endógenas /o/ independientes, explicativas, exógenas.
  • No observables: perturbación aleatoria “u”, es el término de error y se explica por efectos impredecibles, errores de medida y errores de especificación.

PARÁMETROS

Cantidades fijas o constantes del modelo econométrico que se desean estimar (coeficientes de las variables y varianza de la perturbación aleatoria).

ECUACIÓN

La relación entre las distintas variables se explica con una ecuación matemática.

TIPOS DE INFORMACIÓN UTILIZADA

  • Datos de corte transversal: conjunto de datos formados por unidades en un momento determinado (ej. consumo de varias familias en un mes concreto).
  • Datos de serie temporal: conjunto de datos de observaciones de una misma variable a lo largo del tiempo (ej. consumo mensual de una familia a lo largo de un año).
  • Datos de panel o longitudinales: datos que combinan una dimensión temporal con otra transversal (ej. consumo mensual de un conjunto de familias a lo largo de un año).

EL MODELO DE REGRESIÓN LINEAL MÚLTIPLE (RLM)

Y = B0 + B1X1 + E (para una variable independiente)
Y = B0 + B1X1 + B2X2… + E (para más de una variable independiente)

OBJETIVO DE LA ECONOMETRÍA

Comprender mejor un fenómeno económico y poder realizar predicciones de la evolución futura de dicho fenómeno.

ETAPAS DEL ESTUDIO ECONOMÉTRICO

  1. Formulación del problema.
  2. Recolección de datos estadísticos relevantes.
  3. Formulación y estimación del modelo.
  4. Análisis del modelo.
  5. Aplicación del modelo.

CLASIFICACIÓN DE LOS DATOS ECONÓMICOS

  1. Datos cuantitativos.
  2. Datos cualitativos.
  3. Datos de serie temporal (datos recogidos en sucesivos momentos del tiempo: año, trimestre, mes).
  4. Datos de sección cruzada (valores que toman diferentes agentes en un momento del tiempo, ej. población desempleada en 2005 en la Unión Europea).
  5. Datos de panel o longitudinales (combinación de datos de sección cruzada y series temporales, ej. paro y crecimiento del PIB).
  6. Datos microeconómicos.
  7. Datos macroeconómicos.

ESPECIFICACIÓN

Fase en la que se propone la función matemática y se decide el número de ecuaciones y variables que forman el modelo.

HIPÓTESIS BÁSICAS

Son las condiciones bajo las que vamos a trabajar en un principio, son los distintos elementos de la regresión.

  • Sobre la forma funcional: el modelo es lineal en los coeficientes.
  • Sobre los coeficientes: los coeficientes se mantienen estables a lo largo de la muestra.
  • Sobre la variable endógena: requiere métodos alternativos.
  • Sobre la variable explicativa: variable explicativa X tiene varianza muestral no nula, variable exógena X es fija no estocástica, el modelo está bien especificado.
  • Sobre la perturbación: la perturbación tiene media 0, varianza constante, no está autocorrelacionada.

MODELO LINEAL UNIECUACIONAL MÚLTIPLE

Analiza la relación lineal entre una variable dependiente Y, y más de una variable independiente X, más un término aleatorio u.

HIPÓTESIS DEL MODELO

  • Cuando las variables explicativas no tienen ninguna relación lineal entre ellas, son NO estocásticas.
  • Multicolinealidad.
  • Perturbación aleatoria.
  • Homocedasticidad: restricción fuerte en determinadas situaciones. Es la hipótesis de varianza constante de las perturbaciones. Es cuando, en algunos modelos de regresión lineal, los errores de estimación son constantes a lo largo de las observaciones. Nos permite realizar modelos más fiables.
  • Heterocedasticidad.
  • Hipótesis de ausencia de correlación en la perturbación: es la más restrictiva, especialmente cuando trabajamos con datos de series temporales económicos.
  • Autocorrelación.
  • Permanencia estructural: única estructura, válida para todo el período de la muestra, y para el horizonte de predicción. (cuando no se cumple, hay cambio estructural).

ESTIMACIÓN

  • Estimación por Mínimos Cuadrados Ordinarios: es el estimador adecuado de los coeficientes del modelo de regresión. Para calcular una estimación de los parámetros a partir de los valores de una muestra, adoptamos el criterio de estimación (MCO).
  • Estimación mínimo cuadrática de los coeficientes del modelo: son los estimadores obtenidos a partir de este método (definiendo los errores y residuos del modelo lineal como la diferencia entre los verdaderos valores de la variable dependiente y su estimación).
  • Teorema de Gauss-Markov: dice que en un modelo lineal general se establecen los supuestos: correcta especificación, muestreo aleatorio simple, perturbación nula, homocedasticidad. Se basa en que no hay correlación entre las perturbaciones ni multicolinealidad perfecta.
  • Estimación de la varianza de la perturbación aleatoria: hay que estimar también la varianza de la perturbación aleatoria. La perturbación es el efecto conjunto de varias variables que aisladamente son insignificantes, pero que no somos capaces de especificar.
  • Interpretación de parámetros estimados: mide el efecto parcial de la variable explicativa sobre la variable dependiente, ceteris paribus. El primer contraste elemental es que su signo sea consistente con la teoría.

VALIDACIÓN

Bondad de ajuste (coeficiente de determinación)

El coeficiente de determinación (R2) es una medida para estudiar la bondad de ajuste lineal determinado por los estimadores MCO (porcentaje de variabilidad explicada por el modelo). Toma valores entre 0 y 1, donde 0 significa que la Suma de Cuadrados Explicados es nula (el modelo no es adecuado) y 1 cuando la Suma de Cuadrados de Regresión es nula (el modelo es adecuado). Se utiliza como medida de significación global de la estimación del modelo. Con datos de series temporales el R2 es alto y con los de sección cruzada es menor ya que las variables presentan mayor dispersión. También se puede utilizar para comparar distintos modelos (se escoge el modelo con menor valor).

EXPLOTACIÓN

  • Contraste de significatividad individual: se quiere ver si son estadísticamente relevantes los factores que hemos considerado como explicativos de la variable dependiente.
  • Contraste de significación conjunta: la hipótesis nula que se está contrastando es que conjuntamente todos los coeficientes, excepto el asociado al término constante, sean 0.