Risk adjustment revisited using machine learning techniques ; Revisión del ajuste de riesgo con técnicas de aprendizaje de máquinas
Risk adjustment is vital in health policy design. Risk adjustment defines the annual capitation payments to health insurers and is a key determinant of insolvency risk for health insurers. In this study we compare the current risk adjustment formula used by Colombia's Ministry of Health and Social Protection against alternative specifications that adjust for additional factors. We show that the current risk adjustment formula, which conditions on demographic factors and their interactions, can only predict 30% of total health expenditures in the upper quintile of the expenditure distribution. We also show the government's formula can improve significantly by conditioning ex ante on measures indicators of 29 long-term diseases. We contribute to the risk adjustment literature by estimating machine learning based models and showing non-parametric methodologies (e.g., boosted trees models) outperform linear regressions even when fitted in a smaller set of regressors. ; El ajuste de riesgo es un componente esencial en el diseño de la política del sector de la salud. El ajuste de riesgo define los pagos de capitación que se le hacen a las aseguradoras en salud y determina el riesgo de insolvencia de las mismas. En este estudio comparamos la formula usada actualmente por el Ministerio de Salud y Protección Social para determinar el ajuste de riesgo, contra especificaciones alternativas que controlan por factores de riesgo adicionales. Mostramos que la formula actual, la cual ajusta los pagos solamente a factores de riesgo demográficos, predice tan solo el 30 % del gasto en el quintil superior de la distribución del gasto. Nuestros resultados muestran que incorporar indicadores de 29 enfermedades de larga duración en un modelo lineal, como el que usa el gobierno, mejora su capacidad predictiva considerablemente. Finalmente, contribuimos a la literatura de ajuste de riesgo a través de la estimación de modelos de aprendizaje de máquinas y mostramos que modelos no paramétricos (e.g., boosting de arboles) tienen un mejor desempeño que los modelos lineales, incluso cuando se ajustan sobre un conjunto de regresores más pequeño.