일반화 선형 모델은 종속변수가 지정된 연결함수를 통해 요인 및 공변량과 선형적으로 관련되도록 일반 선형 모델을 확장합니다. 더욱이 모델을 사용하면 종속변수가 비정규 분포를 가질 수 있습니다. 또한 정상적으로 분포된 반응, 이분형 데이터의 로지스틱 모델, 계수 데이터의 선형로그 모델, 구간 중도절단 생존 데이터에 대한 보 로그-로그 모델은 물론 매우 일반적인 모델 공식을 통해 다른 많은 통계 모델 같이 널리 사용되는 통계 모델을 포함합니다.
예. 운송 회사에서는 일반화 선형 모델을 사용하여 서로 다른 기간에 구성된 선박의 여러 유형에 대한 손상 횟수에 포아송 회귀분석을 맞출 수 있습니다. 그리고 결과로 생성된 모델은 손상될 확률이 높은 선박 유형을 판별하는 데 도움이 될 수 있습니다.
자동차 보험 회사는 일반화 선형 모델을 사용하여 자동차의 손해 배상 청구에 감마회귀를 맞출 수 있습니다. 결과로 생성되는 모델은 청구 규모에 가장 많이 기여하는 요인을 판별하는 데 도움을 줄 수 있습니다.
의료 연구자는 일반화 선형 모델을 사용하여 구간 중도절단 생존 데이터에 보완 로그-로그 회귀분석을 맞추어 의료 조건에 대한 재발 시간을 예측할 수 있습니다.
일반화 선형 모델은 입력 필드 값을 출력 필드 값에 연관시키는 방정식을 작성하여 작동됩니다. 모델이 생성된 후 이를 사용하여 새 데이터의 값을 추정할 수 있습니다. 각 레코드의 경우 가능한 각 출력 범주에 대해 소속 확률이 계산됩니다. 확률이 가장 높은 목표 범주는 해당 레코드의 예측된 출력 값으로 지정됩니다.
요구사항. 둘 이상의 범주가 있는 하나 이상의 입력 필드와 정확히 하나의 대상 필드 ( Continuous
또는 Flag
의 측정 수준을 가질 수 있음) 가 필요합니다. 모델에 사용된 필드는 유형이 완전히 인스턴스화되어 있어야 합니다.
강도. 일반화 선형 모델은 매우 탄력적이지만, 모델 구조를 선택하는 프로세스가 자동화되어 있지 않고, "블랙박스" 알고리즘에 필요하지 않은 데이터와 어느 정도 친숙해야 함을 요구합니다.