Bivariate en multivariate analyses zijn statistische methoden om relaties tussen gegevensmonsters te onderzoeken. Bivariate analyse kijkt naar twee gepaarde datasets en onderzoekt of er een verband tussen bestaat. Multivariate analyse maakt gebruik van twee of meer variabelen en analyses die, indien aanwezig, gecorreleerd zijn met een specifieke uitkomst. Het doel in het laatste geval is om te bepalen welke variabelen de uitkomst beïnvloeden of veroorzaken.
Bivariate analyse onderzoekt de relatie tussen twee datasets, met een paar observaties uit een enkel monster of individu. Elke steekproef is echter onafhankelijk. Je analyseert de data met tools als t-toetsen en chikwadraattoetsen, om te kijken of de twee groepen data met elkaar correleren. Als de variabelen kwantitatief zijn, zet je ze meestal in een spreidingsdiagram. Bivariate analyse onderzoekt ook de sterkte van een correlatie.
Een voorbeeld van bivariate analyse is een onderzoeksteam dat de leeftijd van zowel man als vrouw in een enkel huwelijk vastlegt. Deze gegevens zijn gekoppeld omdat beide leeftijden uit hetzelfde huwelijk komen, maar onafhankelijk omdat de leeftijd van een persoon niet de leeftijd van een andere persoon veroorzaakt. Je plot de gegevens om een correlatie aan te tonen: de oudere mannen hebben oudere vrouwen. Een tweede voorbeeld is het registreren van metingen van de grijpkracht en armkracht van individuen. De gegevens zijn gekoppeld omdat beide metingen van één persoon afkomstig zijn, maar onafhankelijk omdat verschillende spieren worden gebruikt. Je plot gegevens van veel individuen om een correlatie aan te tonen: mensen met een hogere grijpkracht hebben een hogere armkracht.
Multivariate analyse onderzoekt verschillende variabelen om te zien of een of meer van hen voorspellend zijn voor een bepaalde uitkomst. De voorspellende variabelen zijn onafhankelijke variabelen en de uitkomst is de afhankelijke variabele. De variabelen kunnen continu zijn, wat betekent dat ze een reeks waarden kunnen hebben, of ze kunnen dichotoom zijn, wat betekent dat ze het antwoord op een ja of nee vraag vertegenwoordigen. Meervoudige regressieanalyse is de meest gebruikte methode in multivariate analyse om correlaties tussen datasets te vinden. Andere omvatten logistische regressie en multivariate variantieanalyse.
Multivariate analyse werd gebruikt door onderzoekers in een Journal of Pediatrics-studie uit 2009 om te onderzoeken of negatieve levensgebeurtenissen, gezinsomgeving, huiselijk geweld, mediageweld en depressie zijn voorspellers van jeugdagressie en pesten. In dit geval: negatieve levensgebeurtenissen, gezinsomgeving, gezinsgeweld, mediageweld en depressie waren de onafhankelijke voorspellende variabelen, en agressie en pesten waren de afhankelijke uitkomst variabelen. Meer dan 600 proefpersonen, met een gemiddelde leeftijd van 12 jaar, kregen vragenlijsten om de voorspellende variabelen voor elk kind te bepalen. Een enquête bepaalde ook de uitkomstvariabelen voor elk kind. Meerdere regressievergelijkingen en structurele vergelijkingsmodellering werden gebruikt om de dataset te bestuderen. Negatieve levensgebeurtenissen en depressie bleken de sterkste voorspellers van agressie onder jongeren.