L'Internet Movie Database (IMDb) è il più grande database online contenente informazioni relative a film, serie televisive, home video, videogiochi e contenuti in streaming. Il database online contiene milioni di record accurati che è possibile utilizzare per eseguire l'analisi dei dati.

Cinemagoer (precedentemente noto come IMDbPY) è una libreria Python per la gestione e il recupero dei dati del database dei film IMDb. È possibile accedere a dati su film, persone e aziende, che possono essere ulteriormente utilizzati per l'analisi.

Installazione delle librerie richieste

Devi installare il spettatore Libreria Python per accedere alla IMDb Banca dati. Eseguire il seguente comando nel prompt dei comandi per installare la libreria:

pippo installare spettatore

Tu devi avere pip installato sul tuo sistema per installare librerie Python esterne.

Il codice utilizzato in questo progetto è disponibile in a Deposito GitHub ed è gratuito per l'uso con la licenza MIT.

Estrazione di dati IMDb utilizzando Python

instagram viewer

Devi importare la libreria dello spettatore prima di utilizzarla nel tuo codice.

da imdb importare Cineasta
ia = Cineasta()

Il codice precedente importa la libreria cinemagoer e crea un'istanza della classe cinemagoer.

Ricerca di film

Puoi cercare film con un determinato titolo (o simile) utilizzando il file cerca_film() metodo. Ad esempio, se vuoi cercare film con il titolo "rock", devi eseguire il seguente codice:

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Ricerca di film che hanno il rock nel loro nome
film = ia.search_movie('roccia')
stampa(film[0])

Questo dovrebbe stampare il primo film che trova, ad esempio:

Puoi ottenere un film tramite il suo ID IMDb. È quindi possibile estrarre ulteriori informazioni come i nomi dei registi e i generi. Devi scorrere l'elenco per ottenere informazioni individuali.

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Ottenere film per ID IMDb
film = ia.get_movie('0468569')
stampa(film)

# Stampa dei nomi dei registi del film
stampa('Registi:')

per il regista nel film['registi']:
stampa (direttore['nome'])

# stampa dei generi del film
stampa('Generi:')

per genere nel film['generi']:
stampa(genere)

Nell'output, dovresti vedere il nome del film specificato, i suoi registi e il suo genere:

Alla ricerca di una persona

Puoi cercare persone usando il cerca_persona() metodo. Ad esempio, se vuoi cercare "Heath", devi eseguire il seguente codice:

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Ricerca di persone che hanno Heath nel loro nome
persone = ia.search_person('Brughiera')
stampa(persone[0])

Vedrai il nome della prima persona corrispondente trovata dalla ricerca:

Ricerca aziende

Puoi cercare le aziende utilizzando il cerca_azienda() metodo. Ad esempio, se vuoi cercare "Universal", devi eseguire il seguente codice:

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Ricerca di aziende che hanno Universal nel loro nome
aziende = ia.search_company('universale')
stampa(aziende)

Otterrai l'elenco di tutte le aziende che hanno Universal nel loro nome.

Puoi anche recuperare i dati di una persona e di un'azienda utilizzando il suo ID.

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Ottenere dati personali per ID
persona = ia.get_person('0005132')
stampa (persona['nome'])
stampa (persona['Data di nascita'])

# Ottenere i dati dell'azienda per ID
azienda = ia.get_azienda('0005073')
stampa (azienda['nome'])

L'output mostrerà i dettagli della persona e il nome di un'azienda:

Trovare film in alto e in basso

È possibile recuperare i dati per i primi 250 e gli ultimi 100 film utilizzando il file get_top250_movies() E get_bottom100_movies() metodi, rispettivamente:

da imdb importare Cineasta

# Creazione di un'istanza della classe Cinemagoer
ia = Cineasta()

# Trovare i primi 250 film
in alto = ia.get_top250_movies()
stampa(superiore[0])

# Trovare gli ultimi 100 film
fondo = ia.get_bottom100_movies()
stampa(metter il fondo a[0])

In risposta, vedrai il nome del miglior film e il nome del peggiore:

La biblioteca del cinema fornisce anche altri metodi come get_top250_tv(), get_popular100_movies(), E get_top250_film_indiani().

L'analisi dei dati è la valutazione dei dati utilizzando strumenti analitici o statistici per estrarre informazioni. La popolarità dell'analisi dei dati cresce ogni giorno. Ora è utilizzato da aziende, società di marketing e squadre sportive. Il processo completo di analisi dei dati include la definizione degli obiettivi, la formulazione di domande, la raccolta dei dati, lo scrubbing dei dati, l'analisi dei dati e i risultati conclusivi.

Puoi ottenere set di dati per i tuoi progetti utilizzando librerie Python come Cinemagoer o tramite piattaforme online come Kaggle. Oltre a linguaggi completi come Python e R, puoi utilizzare altri strumenti come Microsoft Excel, Tableau e Stata per eseguire l'analisi dei dati.