Обобщённые линейные модели (GLM) - общепризнанный метод статистической обработки данных в страховании. Благодаря компьютерным технологиям, GLM широко признаны страховыми компании Европы, и быстро завоевывают признание профессионалов в США и Канаде.
GLM являются хорошо разработанным и простым для понимания способом построения моделей для анализа претензий и для прогнозирования продления старых/заключения новых страховых договоров.
Сегодня GLM - общепризнанный метод статистической обработки данных в автомобильном и других видах страхования.
Большинство европейских страховых компаний используют GLM для анализа портфелей. GLM используются в Италии, Голландии, Испании, Португалии, Бельгии, Швейцарии, Южной Африке, Израиле, Австралии и в скандинавских странах.
Метод становится популярен в Канаде, Японии, Корее, Бразилии, Сингапуре, Малайзии и странах восточной Европы.
Основными приложениями GLM в страховании являются разработка тарифов и андеррайтинг (Андеррайтинг - принятие страховой ответственности за заявленные убытки или повреждения за вознаграждение - страховую премию). Кроме того, GLM часто используется для анализа целевого маркетинга.
Обобщённые линейные модели включают в себя большое количество моделей, в том числе и все линейные модели.
GLM, в отличие от линейных моделей, не предполагают нормальность, равенство дисперсий и аддитивность эффектов.
Вместо этого
1) вводится предположение о принадлежности зависимой переменной экспоненциальному семейству распределений;
2) допускается изменение дисперсии при изменении среднего;
3) наконец, влияния ковариат на зависимую переменную предполагается аддитивным в преобразованном масштабе.
Таким образом, вводятся следующие три предположения GLM:
Структуру GLM можно записать в виде
- вектор значений отклика
- функция связи: обратимая функция, которая выражает зависимость ожидаемого отклика от линейной комбинации факторов
- матрица (матрица плана), создаваемая по значениям факторов
- вектор оцениваемых параметров модели
- вектор известных эффектов или «параметров сдвига»
- параметр масштаба функции
- функция дисперсии
- априорные веса, отражающие доверие к каждому наблюдению
Вектор откликов Y i, матрица плана X ij, априорные веса и параметры сдвига
основаны на данных, определяемых пользователем. Предположения, которые в дальнейшем определяют форму моделей, выражены в функции связи g(x), функции дисперсии V(x), и параметре
(вместо параметра
можно использовать его оценку).
После задания модели, т.е. определения и задания множества наблюдений
, компоненты вектора
могут быть получены максимизированием функции правдоподобия (или, что эквивалентно, максимизированием логарифма от функции правдоподобия). Такой подход направлен на поиск значений параметров, при которых выбранная модель принимает данные значения с наибольшей вероятностью.
Правдоподобие определяется как произведение вероятностей наблюдения данного значения. Для непрерывных распределений, таких как нормальное или гамма распределение, вместо вероятностей используются соответствующие значения функции плотности.
Обычно, для удобства вычислений, рассматривается не сама функция правдоподобия, а логарифм от неё; очевидно, что значения, максимизирующие функцию правдоподобия максимизируют и логарифм от неё.
Общая структура данных, используемых при построении GLM для претензий, состоит из информации о полисе и требованиях отдельно взятого клиента. Кратко говоря, обычно включают следующую информацию по требованиям:
При анализе удерживания полисодержателей или при анализе новой бизнес – политики компании требуется другой формат хранения данных.
Например, для подгонки GLM к данным о продлении действия полисов, таблица должна содержать отдельную запись для каждого предложения продлить полис и должна состоять из следующих полей:
Связанные определения:
Обобщенная линейная модель
Функция связи
Скачать
Курсы по актуарной математике