Netflix: come utilizza tutti i dati che possiede

Le miniature nella home page di Netflix vengono selezionate da un algoritmo in grado di sceglierla opportunamente tra migliaia di frame.

Sembra un processo banale ma l’anteprima di un film o di una serie televisiva è il primo elemento decisionale che spinge lo spettatore al “click”.

Considerando che una serie come “strange things” possiede all’incirca novanta mila frame, la scelta non risulta più così immediata anche perchè si occorre tener conto della relazione che deve sussistere tra copertina e titolo della puntata.

Per automatizzare e semplificare tale processo, Netflix utilizza un particolare algoritmo: AVA, Aesthetic Visual Analysis.

Tale algoritmo esegue un’analisi quantitativa su ogni singolo frame analizzando variabili quali luminosità, contrasto, nitidezza e presenza di soggetti in movimento.

Attraverso questa prima analisi vengono scartate buona parte delle immagini che non risulterebbero adeguate per la creazione di una miniatura adeguata.

Ma la vera potenzialità di AVA consiste nella capacità di individuare il volto del protagonista principale della puntata ed identificarne le espressioni facciali.

Se il protagonista risulta in secondo piano e la sua espressione non combacia con il titolo della puntata, allora, tale frame viene automaticamente scartato.

Mediante questo processo si riescono a ridurre notevolmente le possibili immagini candidate per la creazione della miniatura anche se la scelta finale viene comunque demandata all’art director.

Python

Dietro ad ogni contenuto di Netflix e algoritmo che decide quale serie o film promuovere c’è un linguaggio di programmazione: in questo caso Python.

Tale linguaggio viene utilizzato in ogni contesto: dai suggerimenti sulle serie che ti potrebbero interessare ai processi di sicurezza, dalla scelta delle anteprime e alla personalizzazione dei contenuti in base all’area demografica dell’utente.

Inoltre, attraverso uno strumento proprietario di Netflix, Metaflow, tale linguaggio di programmazione viene spinto ai sui limiti insieme ad una libreria di strumenti open source.

Archer è un altro framework utilizzato per l’elaborazione dei video: grazie a questa piattaforma distribuita si possono “spaccare” i singoli frame in moduli più piccoli e leggeri per agevolarne l’elaborazione parallela.

L’imaging ranking, in sostanza, viene automatizzato attraverso processi di addestramento di algoritmi di machine learning in grado di prioritizzare o meno alcuni contenuti sulla base di parametri e output desiderati scelti tra milioni di possibili risultati.

Approfondimenti: https://medium.com/@NetflixTechBlog

Spread the love
Translate