Durante l'utilizzo di Fogli Google per lavorare con due set di dati, potresti voler confrontare i due determinando il grado in cui uno influenza l'altro.
Le correlazioni possono offrire informazioni sull'esistenza di una relazione predittiva tra i piani x e y, ma non indicano necessariamente la causalità. Ecco come puoi utilizzare Fogli Google per identificare le correlazioni nei tuoi dati.
Che cos'è la correlazione e per cosa puoi usarla?
Quando due variabili sono correlate, una può determinare in che modo una variabile influisce sull'altra. Ma è fondamentale ricordare che la correlazione non implica la dipendenza in questo caso; mostra solo quanto strettamente e rapidamente due variabili si confrontano o si relazionano.
Le metriche statistiche aiutano nella comprensione delle tendenze sottostanti nell'analisi dei dati. La correlazione è tra le metriche statistiche più utilizzate e determina quanto strettamente correlate o dipendenti siano due variabili.
Comprensione del coefficiente di correlazione in Fogli Google
In Fogli Google, un coefficiente di correlazione viene calcolato utilizzando la funzione CORREL. Il coefficiente di correlazione serve come indicatore di quanto siano strettamente collegati gli insiemi di dati. Può essere utilizzato per ottenere il coefficiente di correlazione momento-prodotto di Pearson (r) se si dispone di due set di dati variabili. Se desideri saperne di più su questo coefficiente, puoi leggere di più in questa guida da Statistiche a Leard.
Si potrebbe imbattersi in una delle tre metriche di correlazione. Ogni misurazione definisce le relazioni tra le variabili in modo diverso. Il suo valore è compreso tra -1 e +1:
- -1 denota una perfetta correlazione negativa: Quando una correlazione ha un coefficiente di correlazione uguale o inferiore a -0,9, viene definita fortemente negativa. È un'indicazione che i dati sono correlati. Tuttavia, la variabile x continua ad aumentare, mentre la variabile y continua a diminuire.
- 0 indica nessuna connessione: Le variabili sono considerate non correlate se il coefficiente di correlazione è maggiore di 0,01 ma minore di 0,1 poiché non esiste una relazione distinguibile tra ciascuna variabile. Sono indipendenti l'uno dall'altro.
- +1 denota una perfetta correlazione positiva: Quando il coefficiente di correlazione cade tra 0,9 e 1, è considerato altamente positivo. Indica che c'è stato un aumento nei due insiemi di variabili.
Il valore più alto di un coefficiente potrebbe essere stato un coefficiente di correlazione di 1. Quando il valore di correlazione è 1, implica che se dovessi rappresentare graficamente i dati, sarebbe completamente allineato per creare una linea retta.
Se sei ancora un po' perso, non preoccuparti. Spiegheremo la sintassi della funzione CORREL e poi ci immergeremo in alcuni esempi del mondo reale per aiutarti a capirla meglio. Comprensione delle linee di migliore vestibilità e come creare linee di tendenza in Fogli Google ti aiuterà in questo.
Sintassi della funzione CORREL in Fogli Google
=CORREL(dati_y, dati_x)
Analizziamolo nelle sue parti e comprendiamo meglio cosa significa ogni frase:
- =CORRE: questa è la funzione Google Sheet che determina r, (il coefficiente di correlazione momento-prodotto di Pearson del set di dati).
- data_y: si riferisce al gruppo di celle contenente i dati dipendenti o all'intervallo di valori per tali celle.
- dati x: Questo è un riferimento verso l'array di celle con i dati indipendenti o l'intervallo di valori per quelle celle.
Se dovessi rappresentare graficamente i punti dati, data_y sarebbe l'asse Y e data_x l'asse X. Noterai che ci sono due modi diversi per inserire l'intervallo di dati. Un intervallo di celle di riferimento o l'immissione diretta di dati nella funzione sono opzioni.
Nella maggior parte dei casi, è preferibile l'uso dell'intervallo di celle di riferimento. Questo perché molto probabilmente il foglio di calcolo contiene già i tuoi dati. L'uso di un intervallo di celle di riferimento può evitare un input digitato eccessivo che potrebbe causare un errore dell'utente.
Esempi di funzioni CORREL in Fogli Google
Diamo un'occhiata ad alcuni esempi per comprendere come utilizzare la funzione CORREL in Fogli Google.
Esempio 1: una forte correlazione positiva
Per questo primo esempio, supponiamo di lavorare nel settore immobiliare. Nel foglio di lavoro sottostante, abbiamo partizioni di ettari di terreno che stai vendendo e il numero di unità vendute dei dati di quei diversi terreni nel tuo foglio Google.
- Se stai seguendo un foglio, inizierai digitando i dati delle variabili nel tuo foglio di calcolo, come mostrato di seguito:
- Fare clic sulla cella C2
- Tipo =CORREL(
- Procederai quindi a digitare data_y, che nel nostro caso è l'intervallo di celle di riferimento LA2:LA6, quindi inserisci una virgola.
- Procedi a digitare data_x, che nel nostro caso viene indicato come SI2:SI6.
- Terminare con una parentesi di chiusura, come mostrato di seguito:
- Infine, premi accedere per restituire il coefficiente di correlazione dei due dati nella cella C2.
Usando l'esempio appena mostrato sopra, hai ottenuto un coefficiente di correlazione di 0,90, che è una forte correlazione positiva poiché il suo valore è compreso tra 0,9 e 1. Pertanto, ciò indica che al variare di y, anche x cambia in modo sostanzialmente comparabile.
Di seguito è riportata una rappresentazione dei nostri dati campione di esempio su un grafico a dispersione XY. Come puoi vedere, la linea di miglior adattamento è vicina ai punti dati sul grafico, il che supporta l'idea che le cifre siano fortemente correlate.
Puoi saperne di più su creazione di grafici a dispersione XY in Fogli Google nel nostro altro articolo.
Esempio 2: una correlazione negativa debole
Questa volta useremo un esempio più generico di "variabile x e y" nel nostro foglio di calcolo. Abbiamo volutamente incluso cifre per dimostrare una correlazione negativa, che la funzione CORREL dimostra di seguito:
Non c'è una forte relazione tra le variabili y e x, quindi il risultato che otteniamo è un coefficiente di correlazione meno significativo rispetto all'esempio precedente. Il risultato che abbiamo ottenuto è -0,47. Ciò, tuttavia, non implica che non vi sia alcuna correlazione. Diamo un'occhiata di nuovo a una linea di adattamento migliore per dargli un senso.
Come puoi vedere dal grafico a dispersione, i punti dati sono più lontani dalla linea di miglior adattamento. C'è, quindi, meno correlazione che nel primo esempio, ma non nessuna. Noterai anche che la linea di miglior adattamento sta diminuendo. Questo mostra una correlazione negativa, un valore diminuisce mentre l'altro aumenta.
Esempio 3: nessuna connessione
Qui abbiamo una serie di numeri completamente casuali. Tocchiamo rapidamente come utilizzare nuovamente la funzione CORRELAZIONE:
- Digita Cella C2 la formula di CORRELAZIONE
- I nostri argomenti sono A2:A10 E SI2:SI10
- Premi Invio
Il valore restituito su C2 è 0,02. Se un coefficiente di correlazione è compreso tra 0,01 e 0,1, si determina che le variabili in questione non sono correlate poiché non vi è alcuna connessione percepibile tra di esse. Le relazioni tra le variabili sono del tutto indipendenti.
Di seguito la rappresentazione dello stesso su un grafico a dispersione. La linea di miglior adattamento è quasi piatta, indicando una scarsa correlazione tra i due set di dati.
Correla facilmente i tuoi dati in Fogli Google
La correlazione potrebbe essere un argomento stimolante se non ci hai lavorato molto al liceo. Questa guida ha trattato tutte le nozioni di base, ma dovrai continuare a utilizzare la funzione CORRELAZIONE in Fogli Google per mantenerla fresca nella tua mente.
Questa è una funzione potente in quanto aiuta a evitare la creazione di grafici a dispersione e può trovare rapidamente le tendenze nei dati. Tuttavia, non aver paura di aggiungere grafici per aiutare altri utenti a comprendere meglio i dati nei tuoi fogli di lavoro.