Flera linjära regressionslokaler, metod och användningsområden



den multipel linjär regression är ett beräkningsverktyg som undersöker orsakseffektförhållandena mellan studierna och testar komplexa hypoteser.

Det används i matematik och statistik. Denna typ av linjär regression kräver beroende (med andra ord, de resultat) och oberoende variabler (dvs orsakar) följer en hierarkisk ordning, och andra faktorer är inneboende i olika områden i studien.

Vanligtvis är den linjära regressionen en som representeras av en linjär funktion som beräknas från två beroende variabler. Detta har som det viktigaste fallet i vilket fenomenet studerat har en rak linje av regression.

I en given uppsättning data (x1, y1) (xn, yn) och av värden som motsvarar ett par slumpmässiga variabler i direkt korrelation med varandra kan regressionslinjen, för att börja, börja formen av en ekvation, som y = a · x + b .

Teoretiska lokaler för beräkning vid multipel lineär regression

Varje beräkning som använder multipel linjär regression kommer att bero mycket på det studerade objektet och studieområdet, såsom ekonomi, eftersom variablerna gör de använda formlerna har komplexiteter som varierar beroende på fallet.

Detta innebär att ju mer intrikata frågan, desto fler faktorer bör tas i beaktande, mer data bör insamlas och därför större blir volymen av de varor som skall inkluderas i beräkningen, vilket kommer att göra formeln är större.

Dock att det finns, den vanligt i alla dessa formler en vertikal axel (ordinatan eller Y-axeln) och en horisontell axel (abskissan eller X-axeln) beräknades sedan grafiskt representeras av ett kartesiskt.

Därifrån görs tolkningarna av data (se nästa avsnitt) och slutsatser eller förutsägelser görs. Under alla omständigheter kan pre-statistiska lokaler användas för att väga variablerna, till exempel följande:

1- Svag exogenitet

Det betyder att variabeln måste antas med ett fast värde som knappast kan låna sig för förändringar i modellen på grund av orsaker som är yttre mot sig själv.

2- Linjär karaktär

Det innebär att värdena för variablerna, liksom av andra parametrar och förutsägelsekoefficienter, måste visas som en linjär kombination av element som kan representeras i grafen, i det kartesiska systemet.

3- Homocedasticity

Detta måste vara konstant. Här menas det att oberoende av de prediktiva variablerna måste det finnas samma varians av felen för varje enskild svarsvariabel.

4- oberoende

Detta gäller endast fel i svarvariablerna, vilka måste visas isolerat och inte som en grupp av fel som representerar ett definierat mönster.

5- Frånvaro av multikollinearitet

Den används för oberoende variabler. Det händer när du försöker studera något men mycket liten information är tillgänglig, så det kan finnas många svar och därför kan värdena ha många tolkningar som i slutändan inte löser problemet.

Det finns andra lokaler som tas med i beräkningen, men de som presenteras ovan gör det klart att flera linjära regression kräver mycket information, inte bara för att ha en strängare, komplett och fri från fördomar, men så att lösningen på frågan förslaget är konkret.

Det betyder att det måste gå till rätta med något mycket specifikt, specifikt, som inte låter sig vara vaghet och att det i mindre utsträckning kan ge upphov till fel.

Tänk på att flera linjär regression inte är ofelbar och kan vara utsatt för fel och felaktigheter vid beräkning. Det här är inte så mycket på grund av vem som utför studien, men eftersom ett visst fenomen av naturen inte är helt förutsägbart eller nödvändigtvis är produkten av en viss orsak.

Det händer ofta att något föremål kan förändras plötsligt eller att en händelse uppstår ur åtgärden (eller inaktivitet) av många element som interagerar med varandra.

Tolkningar av grafiken

När uppgifterna har beräknats enligt de modeller som utformats i tidigare faser av studien kommer formlerna att ge värden som kan representeras i en graf.

I denna ordning med idéer kommer det kartesiska systemet att visa många punkter som motsvarar de beräknade variablerna. Vissa kommer att vara mer i ordinatorns axel, medan andra kommer att vara mer i abscissas axel. Vissa blir mer grupperade, medan andra blir mer isolerade.

För att märka den komplexitet som är inblandad i tolkningen av data i diagrammen kan vi exempelvis observera Ascombe kvartetten. I denna kvartett hanteras fyra olika uppsättningar data och var och en av dem är i ett separat diagram som därför förtjänar en separat analys.

Linjäriteten förblir, men punkterna i det kartesiska systemet måste ses mycket noga innan man vet hur delarna av pusslet kommer samman. Därefter kan de relevanta slutsatserna dras.

Naturligtvis finns det flera sätt att dessa bitar passar ihop, även om de följer olika metoder som beskrivs i specialiserade beräkningsmanualer..

Multipel linjär regression, som redan nämnts, beror på många variabler som föremålet för studien och det område där den tillämpas, så att de förfaranden i ekonomi är inte densamma som i medicin eller datavetenskap. I allt är dock en uppskattning, en hypotes som sedan kontrolleras vid slutet utföres.

Förlängningar av multipel linjär regression

Det finns flera typer av linjär regression, såsom enkel och generell, men det finns också flera aspekter av multipel regression som anpassar sig till olika objekt av studier och därmed till vetenskapens behov..

Dessa hanterar vanligtvis ett stort antal variabler, så du kan ofta se modeller som multivariate eller multilevel. Var och en använder postulater och formler av olika komplexitet, så att tolkningen av deras resultat tenderar att vara av större betydelse..

Beräkningsmetoder

Det finns ett brett spektrum av förfaranden för att uppskatta data som erhållits i den multipla linjära regressionen.

Återigen, allt här beror på robustheten i modellen används beräkningsformler, antalet variabler, de teoretiska postulat som beaktats, studieområde, de algoritmer som är programmerade i program specialiserad dator och framför alla andra, varvid komplexiteten av objektet, fenomen eller händelse analyseras.

Varje uppskattningsmetod använder helt olika formler. Ingen är perfekt, men den har unika dygder som bör användas i enlighet med den statistiska undersökningen som utförts.

Det finns alla typer: instrumentella variabler, generaliserade minsta kvadrater, Bayesian linjär regression, blandade modeller, Tyjonov regularisering, kvantil regression, Theil-Sen estimator och en lång lista över verktyg som data kan studeras med större precision. 

Praktiska användningsområden

Multipla linjär regression används i olika studier och i många fall krävs hjälp av datorprogram för att få mer exakta data.

På så sätt minskar de felmarginaler som kan uppkomma från manliga beräkningar (med tanke på närvaron av många oberoende och beroende variabler, är det inte förvånande att denna typ av linjär regression möjliggör sig för misstag, eftersom det finns många data och faktorer bearbetade).

I analysen av marknadstrender undersöks till exempel om data som priserna på en produkt har ökat och minskat, men framförallt när och varför.

När analyseras just när det finns viktiga variationer i siffrorna under en given tidsperiod, främst om förändringarna är oväntade. Varför letar du efter de exakta eller sannolika faktorerna för att den produkten gick upp, sänkt eller höll sitt återförsäljningspris?.

På samma sätt dra nytta av hälsovetenskap (medicin, bioanalys, apotek, epidemiologi) av flera linjära regressioner, genom vilka de studerar hälsoindikatorer som dödlighet, sjuklighet och födelsetal..

I dessa fall kan vi börja från en studie som börjar med observationen, men efteråt görs en modell för att avgöra om variationen av några av indikatorerna beror på viss specifik orsak, när och varför.

Ekonomin använder också flera linjära regressioner för att undersöka fördelarna och nackdelarna med att göra vissa investeringar. Här är det alltid nödvändigt att veta när de finansiella transaktionerna görs, med vem och vilka var de förväntade fördelarna.

Risknivåerna kommer att vara högre eller lägre i enlighet med de olika faktorer som beaktas vid bedömningen av kvaliteten på dessa investeringar, med tanke på också volymen av monetära utbyten.

Det är dock i ekonomin där det här beräkningsverktyget används mest. I denna vetenskap används därför flera linjära regressioner med målet att förutsäga konsumtionsutgifter, investeringskostnader, inköp, export, import, tillgångar, efterfrågan på arbetskraft, jobb och många andra element..

Alla är relaterade till makroekonomi och mikroekonomi, som är den första där dataanalysvariablerna är rikligare eftersom de ligger globalt..

referenser

  1. Baldor, Aurelio (1967). Plan- och rymdgeometri, med en introduktion till trigonometri. Caracas: Editorial Cultura Venezolana, S.A..
  2. Universitetssjukhuset Ramón y Cajal (2017). Multipel linjär regressionsmodell. Madrid, Spanien: HRC, Madrid-regionen. Hämtad från www.hrc.es.
  3. Pedhazur, Elazar J. (1982). Multipel regression i beteendeforskning: Förklaring och förutsägelse, 2: a upplagan. New York: Holt, Rinehart & Winston.
  4. Rojo Abuín, J.M. (2007). Multipla linjär regression Madrid, Spanien: Centrum för human och samhällsvetenskap. Återställd från humaniora.cchs.csic.es.
  5. Autonoma Universitetet i Madrid (2008). Multipla linjär regression Madrid, Spanien: UAM. Återställd från web.uam.es.
  6. University of A Coruña (2017). Flera linjär regressionsmodell; Korrelation. La Coruña, Spanien: UDC, Institutionen för matematik. Återställd från dm.udc.es.
  7. Uriel, E. (2017). Multipla linjär regression: uppskattning och egenskaper. Valencia, Spanien: Universitetet i Valencia. Återställd från www.uv.es.
  8. Barrio Castro, Tomás del; Clar López, Miquel och Suriñach Caral, Jordi (2002). Multipel linjär regressionsmodell: specifikation, uppskattning och kontrast. Katalonien: UOC Editorial.