La méthodologie

Comment vérifier qu'un fournisseur d'accès Internet est en mesure de diffuser des vidéos YouTube en HD de façon constante ?

Les classifications

À quoi correspondent les notations ?

Les notations représentent la qualité du flux vidéo à laquelle vous pouvez vous attendre (pendant au moins 90 % du temps) lorsque vous utilisez YouTube sur le réseau d'un fournisseur d'accès Internet (FAI) d'une région donnée.

  • Réseaux agréés YouTube HD : sur les réseaux agréés YouTube HD, la lecture est presque toujours fluide pour les vidéos YouTube haute définition (720p et au-delà).
  • Réseaux standards : sur les réseaux conçus pour une définition standard, la lecture des vidéos YouTube en définition standard (360p) est fluide. Quelques interruptions peuvent occasionnellement survenir pour les vidéos YouTube haute définition (720p et au-delà).
  • Réseaux basse définition : sur les réseaux basse définition, la lecture des vidéos YouTube (360p et au-delà) risque d'être interrompue régulièrement et les images peuvent être floues.

Quelle est l'utilité de ces données ?

Au lieu de représenter les données d'un petit panel d'utilisateurs, ce rapport se base sur des milliards de vidéos YouTube visionnées sur des milliers de réseaux de FAI.

  • Nous observons la vitesse de chargement de toutes les données vidéo YouTube au cours des 30 derniers jours.
  • Nous segmentons les résultats par FAI et par emplacement géographique.
  • Nous déterminons la vitesse minimale disponible pendant au moins 90 % du temps.

Comment ma vie privée est-elle protégée ?

Toutes les données sont anonymes et concernent l'ensemble des personnes qui regardent YouTube en utilisant le réseau d'un FAI.

  • Les notations sont fondées sur les réseaux et non sur les utilisateurs.
  • Tous les membres des panels sont anonymes et aucune information relative aux internautes n'est conservée ni utilisée.
  • Nous ne proposons des résultats que pour les zones géographiques suffisamment vastes pour comporter de nombreux utilisateurs.

Résumé

Indépendamment les uns des autres, de nombreux facteurs ont un impact sur l'expérience en ligne des utilisateurs. Le débit de la connexion Internet, la fiabilité du réseau d'accès, la disponibilité et les caractéristiques de chargement des serveurs d'applications et, dans certains cas, la configuration du réseau domestique de l'utilisateur sont autant de facteurs possibles. Les mesures individuelles et isolées, telles que la vitesse d'accès ou la capacité des serveurs, ne reflètent pas l'expérience réelle de l'utilisateur. Pour évaluer et quantifier l'expérience réelle de l'utilisateur sur Internet, il faut mesurer les performances de l'application du début à la fin, en prenant en compte tous les facteurs qui ont un impact.

La méthodologie présentée ici permet d'évaluer les fournisseurs d'accès Internet (FAI) en fonction de leur capacité à diffuser les vidéos YouTube. Ces classifications sont le résultat des mesures effectuées sur les performances continues de l'application. L'objectif est de proposer une classification à la fois simple et significative, qui corresponde exactement à l'expérience en ligne des utilisateurs.

Méthodologie

Mesures

D'une façon générale, la lecture d'une vidéo YouTube se passe de la manière suivante : un client (lecteur) YouTube récupère des octets de vidéo par streaming sur un serveur YouTube (CDN). Pour ce faire, il effectue au moins une demande (du type HTTP GET, par exemple). Pour classer un FAI, la première étape consiste à mesurer la vitesse continue du transfert de ces octets de vidéo entre le serveur et le client. Afin de mesurer le débit atteint au niveau de l'application (c'est-à-dire le débit utile, ou "goodput"), les éléments suivants sont enregistrés pour chaque demande :

  1. 1) Identité de la demande : horodatage de la demande d'origine, réseau d'accès (bloc réseau ou numéro de système autonome du FAI, par exemple) et emplacement géographique approximatif (pays ou agglomération, par exemple). Ces informations proviennent des attributs du client, tels que l'adresse IP, le user-agent, etc. Remarque : la conversion d'une adresse IP en emplacement géographique effectuée par nos systèmes automatiques n'est pas toujours exacte pour certains utilisateurs.
  2. 2) Taille de la réponse : nombre d'octets de l'application (en-têtes compris, mais sans compter le trafic au niveau du noyau) transférés par le serveur vers le client, pour répondre à la demande.
  3. 3) Temps de réponse : temps nécessaire au serveur pour traiter la demande. Ce délai inclut la durée de transmission du réseau (tous les octets reconnus par le destinataire).

Sur la base de ces mesures, la formule suivante permet de calculer le débit utile (goodput) pour une demande "R" donnée. Chaque demande mesurée correspond à un échantillon de goodput.

Goodput
R
= Taille de la réponse
R
/ Temps de réponse
R

Classifications

Pour déterminer la classification d'un FAI, nous regroupons tous les échantillons pertinents de goodput enregistrés au cours de la phase de mesure. La méthodologie appliquée permet d'évaluer les classifications à différents niveaux de précision, en fonction des variables sélectionnées. Par exemple, il est possible de calculer la classification d'un FAI sur différentes périodes (par heure, jour, semaine ou par mois, par exemple) et/ou à des échelles géographiques différentes (par pays, région, agglomération ou ville, par exemple).

Pour une période "T" donnée (les 30 derniers jours, par exemple) et un lieu "L" (Paris, Île-de-France, France, par exemple), la classification d'un FAI "P" (Orange, par exemple) est calculée de la manière suivante :

  1. 1) Regroupement des échantillons pertinents : tous les échantillons correspondant aux critères de "T", "L" et "P" sont collectés ; ils correspondent à toutes les demandes émanant du FAI ciblé, dans le lieu et sur la période choisis.
  2. 2) Calcul du volume de débit utile (goodput) supérieur au seuil (GAT, Goodput Above Threshold) : en fonction des seuils de goodput définis dans le tableau ci-dessous, chaque échantillon de goodput est classé dans l'un des trois segments de niveau de qualité : HD (haute définition), DS (définition standard) ou BD (basse définition). Nous obtenons ainsi le volume de GAT brut total pour les trois variables sélectionnées.
Segment GAT Seuil de goodput
HD > 2,5 Mbits/s
SD 0,7 à 2,5 Mbits/s
LD < 0,7 Mbits/s
Échantillons HD Échantillons DS Échantillons BD Volume (GAT)
  1. 3) Définition des critères de classification : les critères de classification des FAI sont définis en fonction du niveau du volume de GAT minimal requis pour chaque niveau de classification. Cette mesure sert à révéler la constance et la fiabilité du réseau du FAI. Il faut donc définir des niveaux de classification qui correspondent à des performances continues plutôt qu'à des performances générales (moyennes). C'est pourquoi nous avons défini trois échelles de classification : GAT-90 (90 % des demandes dépassent ce seuil), GAT-95 (95 % des demandes dépassent ce seuil) et GAT-99 (99 % des demandes dépassent ce seuil).

    Le tableau suivant définit les critères utilisés pour déterminer la classification finale d'un FAI selon notre méthodologie avec l'échelle de classification GAT-90. L'échelle de classification de 90 % a été choisie après avoir étudié attentivement les performances pratiques du réseau sur le terrain. Cette échelle suivra de près l'évolution des capacités du réseau au fil du temps.

Classification Critères (GAT-90)
HD Plus de 90 % des échantillons ont
le statut HD
SD Plus de 90 % des échantillons ont
au moins le statut DS
LD Aucune des options ci-dessus
  1. 4) Attribution d'une classification : addition des trois segments GAT de l'étape 2 pour convertir le volume GAT brut en pourcentage GAT. Les critères définis à l'étape 3 sont utilisés pour déterminer la classification finale. Dans l'illustration ci-dessous, DS (définition standard) est la classification attribuée, car au moins 90 % des demandes répondent aux critères (c'est-à-dire que le réseau est capable d'offrir au moins la qualité DS pour plus de 90 % des demandes traitées).
0% 20% 40% 60% 80% 100% SD Classification à 90 %

Vie privée

Les classifications sont fondées sur les réseaux et non sur les utilisateurs. Tous les échantillons de goodput sont totalement anonymes. Aucune information sur les internautes (par exemple, les cookies de navigation et l'adresse IP) n'est conservée ni utilisée directement dans l'algorithme de classification. En outre, si le volume des échantillons regroupés pour l'emplacement géographique et la période sélectionnés est inférieur à un certain seuil, l'algorithme utilise des variables plus étendues (par exemple, en regroupant les échantillons d'un emplacement géographique plus vaste ou d'une période plus longue) jusqu'à atteindre le seuil minimal permettant de calculer la classification.