La metodologia

Come verifichiamo che un provider di servizi Internet è in grado di garantire in modo continuativo il supporto di YouTube in HD.

Le classificazioni

Che cosa indicano le classificazioni?

Le classificazioni indicano la qualità dello streaming video che ci si può aspettare (almeno per il 90% del tempo) quando si guarda un video su YouTube mediante un provider di servizi Internet in una zona specifica.

  • YouTube HD verificata: gli utenti delle reti YouTube HD verificata possono quasi sempre contare su una riproduzione uniforme dei video in alta definizione (con risoluzioni a partire da 720p).
  • Definizione standard: gli utenti delle reti a definizione standard possono contare su una riproduzione uniforme dei video di YouTube in definizione standard (360p) e riscontrare interruzioni occasionali nei video in alta definizione (con risoluzioni a partire da 720p).
  • Bassa definizione: gli utenti delle reti a bassa definizione possono riscontrare una scarsa qualità dell'immagine e frequenti interruzioni durante la riproduzione dei video con risoluzioni a partire da 360p.

Perché sono utili i dati?

Anziché sfruttare i dati relativi a un piccolo campione di utenti, questo rapporto si basa su miliardi di video di YouTube visualizzati attraverso migliaia di provider.

  • Analizziamo il tempo di caricamento dei dati di tutti i video di YouTube negli ultimi 30 giorni.
  • Segmentiamo i risultati in base al provider di servizi Internet e alla località geografica.
  • Determiniamo la velocità minima disponibile per almeno il 90% del tempo.

Come proteggiamo la privacy degli utenti?

I dati di tutti gli utenti che visualizzano YouTube tramite un provider di servizi Internet sono resi anonimi.

  • Le classificazioni quindi non sono incentrate sugli utenti ma sulle reti.
  • Tutti i campioni sono resi anonimi e le informazioni sull'utente non vengono mai archiviate o utilizzate.
  • I risultati che riportiamo si riferiscono a un'area geografica abbastanza grande da contenere moltissimi utenti.

Introduzione

Esistono molti fattori che possono influire sull'esperienza utente in Internet. Tra questi, ad esempio, sono inclusi la velocità della connessione a Internet, l'affidabilità della rete di accesso, la disponibilità e le caratteristiche del carico dei server di applicazioni e in certi casi perfino la configurazione della rete domestica degli utenti. Misurazioni singole e isolate della velocità di accesso o della capacità dei server non riescono a dar conto dell'effettiva esperienza utente. Il metodo giusto per valutare e quantificare l'esperienza utente effettiva in Internet consiste nel misurare le prestazioni end-to-end a livello di applicazione, tenendo conto di tutte le variabili dell'equazione.

In questa pagina viene presentata una metodologia che consente di valutare i provider di servizi Internet dal punto di vista della funzionalità video di YouTube, sulla base di misurazioni delle prestazioni continuative a livello di applicazione. L'obiettivo è produrre una classificazione significativa, facile da interpretare e fedele all'esperienza reale di Internet.

Metodologia

Misurazioni

In genere la riproduzione di un video di YouTube avviene in questo modo: un client YouTube (player) recupera byte video in modalità streaming da un server YouTube (CDN) nell'ambito di una o più richieste (ad esempio HTTP GET). Il primo passaggio per determinare le classificazioni del provider di servizi Internet consiste nel misurare la velocità continuativa di trasferimento dei byte video dal server al client. Per calcolare il throughput raggiunto a livello di applicazione (goodput), vengono registrati per ogni richiesta i seguenti dati:

  1. 1) Identità della richiesta: data e ora, rete di accesso (ad esempio blocco di rete, Autonomous System Number del provider) e località geografica approssimativa (ad esempio Paese, area metropolitana), desunta da attributi del client quali l'indirizzo IP, l'agente utente e così via, della richiesta di origine. Tieni presente che la conversione da IP a località effettuata dai nostri sistemi automatici non è sempre precisa al 100%.
  2. 2) Dimensione della risposta: il numero di byte dell'applicazione (incluse le intestazioni ma escluso l'overhead a livello di kernel) trasferiti dal server al client in risposta alla richiesta.
  3. 3) Tempo di risposta: il tempo necessario al server per elaborare la risposta, incluso il tempo di trasmissione della rete (tutti i byte confermati dal destinatario).

In base a queste misurazioni è possibile calcolare il goodput di una data richiesta "R" applicando la formula riportata qui sotto. Ogni richiesta misurata è ritenuta un campione di goodput.

Goodput
R
= dimensione della risposta
R
/ tempo di risposta
R

Classificazioni

Le classificazioni derivano dall'aggregazione di vari campioni di goodput validi registrati in fase di misurazione. La metodologia supporta il calcolo delle classificazioni a vari livelli di granularità per le dimensioni selezionate. Ad esempio è possibile calcolare una classificazione per varie frazioni di tempo (ora, giorno, settimana, mese) e/o diversi livelli geografici (Paese, provincia, area metropolitana, città).

Ad esempio, per un dato intervallo di tempo "T" (30 giorni consecutivi) e una località geografica "L" (San Francisco, California, Stati Uniti), la classificazione di un provider di servizi Internet "P" (Comcast) viene calcolata come segue:

  1. 1) Aggregazione dei campioni significativi: vengono raccolti tutti i campioni di goodput identificati con le lettere "T", "L" e "P", ovvero relativi alle richieste che hanno avuto origine all'interno del provider di servizi Internet preso in esame, dalla località specificata e nell'intervallo di tempo designato.
  2. 2) Elaborazione del volume GAT (Goodput Above Threshold): colloca ogni campione di goodput in uno dei tre segmenti di capacità, ovvero HD (alta definizione), SD (definizione standard) o LD (bassa definizione), in base alle soglie di goodput specificate nella seguente tabella. In questo modo viene rilevato il volume GAT aggregato per le dimensioni selezionate.
Segmento GAT Soglia di goodput
HD > 2,5 Mbps
SD Da 0,7 a 2,5 Mbps
LD < 0,7 Mbps
Campioni HD Campioni SD Campioni LD Volume (GAT)
  1. 3) Definizione del criterio di classificazione: il criterio di classificazione dei provider di servizi Internet si basa sul livello minimo del requisito sul volume GAT per ogni livello di classificazione. Si tratta di una metrica concepita per rispecchiare l'affidabilità e la continuità della rete del provider. La misura deve pertanto essere impostata a un livello tale da rilevare le prestazioni continuative anziché le prestazioni tipiche (medie). A questo scopo vengono definite tre scale di classificazione, ovvero GAT-90 (90% delle richieste al di sopra della soglia), GAT-95 (95% delle richieste al di sopra della soglia), GAT-99 (99% delle richieste al di sopra della soglia), che rappresentano tre livelli di affidabilità diversi.

    In questa tabella sono illustrati i criteri per la classificazione finale dei provider di servizi Internet utilizzando la nostra metodologia e il livello GAT-90. La misura del 90% è stata scelta dopo un attento esame delle prestazioni osservate sul campo. Tale misura seguirà di pari passo l'evoluzione temporale delle funzionalità di rete.

Classificazione Criteri (GAT-90)
HD Più del 90% dei campioni è
contrassegnato come HD
SD Più del 90% dei campioni è
contrassegnato come SD
LD Nessuna delle due
  1. 4) Assegnazione di una classificazione: i tre segmenti GAT del passaggio 2 vengono sovrapposti per convertire il volume GAT approssimativo in una percentuale GAT. Per determinare la classificazione finale vengono utilizzati i criteri definiti nel passaggio 3. Nella figura qui sotto la classificazione assegnata è SD (definizione standard), dal momento che il 90% o più delle richieste soddisfa questo criterio (la rete è in grado di offrire come minimo una qualità SD a oltre il 90% delle richieste gestite).
0% 20% 40% 60% 80% 100% SD Classificazione al 90%

Privacy

Le classificazioni non sono incentrate sugli utenti ma sulle reti. Tutti i campioni di goodput sono resi anonimi e le informazioni sull'utente (indirizzo IP, cookie del browser) non vengono mai salvate in modo permanente o utilizzate nell'algoritmo di classificazione. Inoltre, se il volume dei campioni aggregati per l'intervallo di tempo e l'area geografica selezionati non supera una certa soglia, l'algoritmo tornerebbe a utilizzare dimensioni con un minore livello di dettaglio (ovvero aggregazione basata su un intervallo di tempo e/o una zona geografica più ampi), in linea con le dimensioni minime necessarie per il calcolo della classificazione.