Multikollinearitet (definisjon, typer) | Topp 3 eksempler med forklaring

Hva er multikollinearitet?

Multikollinearitet er et statistisk fenomen der to eller flere variabler i en regresjonsmodell er avhengige av de andre variablene på en slik måte at man kan forutsies lineært fra den andre med høy grad av nøyaktighet. Den brukes vanligvis i observasjonsstudier og mindre populær i eksperimentelle studier.

Typer multikollinearitet

Det er fire typer multikollinearitet

# 1 - Perfekt multikollinearitet - Den eksisterer når de uavhengige variablene i ligningen forutsier det perfekte lineære forholdet.
# 2 - Høy multikollinearitet - Det refererer til det lineære forholdet mellom de to eller flere uavhengige variablene som ikke er perfekt korrelert til hverandre.
# 3 - Strukturell multikollinearitet - Dette er forårsaket av forskeren selv ved å sette inn forskjellige uavhengige variabler i ligningen.
# 4 - Databasert multikollinaritet - Det er forårsaket av eksperimenter som er dårlig designet av forskeren.

Årsaker til flerkollinearitet

Uavhengige variabler, endring i parametrene til variablene gjør at en liten endring i variablene har en betydelig innvirkning på resultatet og datasamlinger refererer til utvalget av den valgte befolkningen som tas.

Eksempler på multikollinearitet

Eksempel 1

La oss anta at ABC Ltd a KPO er ansatt av et farmasøytisk selskap for å tilby forskningstjenester og statistisk analyse av sykdommene i India. For denne ABC ltd har valgt alder, vekt, yrke, høyde og helse som prima facie parametere.

I eksemplet ovenfor er det en multikollinearitetssituasjon siden de uavhengige variablene valgt for studien er direkte korrelert med resultatene. Derfor vil det være tilrådelig for forskeren å justere variablene først før de starter et prosjekt, siden resultatene vil bli direkte påvirket på grunn av de valgte variablene her.

Eksempel 2

La oss anta at ABC Ltd er utnevnt av Tata Motors for å forstå salgsvolumet for tata-motorer vil være høyt i hvilken kategori i markedet.

I eksemplet ovenfor vil først uavhengige variabler bli avsluttet basert på hvilken forskningen må fullføres. det kan være månedlig inntekt, alder. merkevare, underklassen. Det betyr bare at data blir valgt som passer inn i alle disse kategoriene for å finne ut hvor mange som kan kjøpe denne bilen (tata nano) uten å se på noen annen bil.

Eksempel 3

La oss anta at ABC Ltd er ansatt for å sende inn en rapport for å vite hvor mange personer under 50 år som er utsatt for hjerteinfarkt. for dette er parameterne alder, kjønn, medisinsk historie

I eksemplet ovenfor er det multikollinearitet som har oppstått fordi den uavhengige variabelen "alder" må tilpasses til å være under 50 år for å invitere applikasjoner fra publikum, slik at personer som er over 50 år blir automatisk filtrert.

Fordeler

Nedenfor er noen av fordelene

Lineært forhold mellom de uavhengige variablene i ligningen.
Veldig nyttig i statistiske modeller og forskningsrapporter utarbeidet av forskningsbaserte firmaer.
Direkte innvirkning på ønsket resultat.

Ulemper

Nedenfor er noen av ulempene

I noen av situasjonene vil dette problemet løses ved å samle inn mer data om variablene.
Feil bruk av dummyvariabler, dvs. forskeren kan glemme å bruke dummyvariablene når det er nødvendig.
Å sette inn 2 samme eller identiske variabler i ligningen som kg og lbs i vekter.
Sette inn en variabel i ligningen som er en kombinasjon av 2.
Komplisert å utføre beregninger siden det er den statistiske teknikken og krever at statistiske kalkulatorer utfører.

Konklusjon

Multikollinearitet er et av de mest favoriserte statistiske verktøyene som ofte brukes i regresjonsanalyse og statistisk analyse for store databaser og ønsket produksjon. Alle større selskaper har en egen statistisk avdeling i selskapet for å utføre statistisk regresjonsanalyse av produkter eller mennesker for å gi et strategisk syn på markedet til ledelsen og også hjelpe dem med å utarbeide sine langsiktige strategier med tanke på dette. Den grafiske presentasjonen av analysen gir leseren et klart bilde av det direkte forholdet, nøyaktigheten og ytelsen.

Hvis målet med forskeren er å forstå de uavhengige variablene i ligningen, vil multikollinearitet være et stort problem for ham.
Forskeren må gjøre de nødvendige endringene i variablene på trinn 0 selv, ellers kan det ha en enorm innvirkning på resultatene.
Multikollinearitet kan gjøres ved å undersøke korrelasjonsmatrisen.
Avhjelpende tiltak spiller en viktig rolle i å løse problemene for multikollinearitet.