Cuando hablamos de conectividad, ¿de qué estamos hablando? Desde que las redes se conectan unas con las otras, los operadores han estado trabajando para que la conectividad entre ellas sea mejor. En este artículo les presentamos un estudio de conectividad donde les explicamos cómo medimos la conectividad de la región LAC, y cómo ha evolucionado durante los últimos años.

Introducción

El término conectividad es utilizado a menudo en la industria de Internet, pero su significado puede variar según el contexto en el que se esté abordando. Puede ser medida según su capacidad de ancho de banda, su número de saltos, o bien en el caso de este artículo: su latencia. En este sentido decimos que dos lugares se encuentran bien conectados cuando su latencia entre ellos es baja, es decir el tiempo que le lleva a un mensaje ir de origen a destino es bajo.

Desde LACNIC buscamos conocer en mayor detalle las características de la interconexión de redes en América Latina y el Caribe, con el fin de que los operadores cuenten con información que les sirva a sus estrategias de crecimiento. A raíz de ello es muy útil realizar mediciones de conectividad que abarquen toda la región, incluida toda la región de El Caribe y no sólo la región LAC como región de RIR. Típicamente las mediciones de conectividad se realizan entre un origen y un destino, o entre pocos orígenes y pocos destinos; por lo general las mediciones se lanzan desde nodos en nuestra propia infraestructura, o hacia nuestra propia infraestructura. Pero para obtener mediciones de conectividad que abarquen toda la región se requiere lanzar mediciones desde redes de terceros, lo cual es un desafío que requiere la colaboración de muchos actores. Algunas plataformas ofrecen la posibilidad de hacerlo:

RIPE Atlas es un claro ejemplo, donde los usuarios que colaboran deciden hospedar una sonda (puede ser de hardware o de software) y mantenerla conectada a Internet. De esa forma otros usuarios de la plataforma pueden utilizar esa sonda para lanzar mediciones. Si bien la presencia de sondas de RIPE Atlas en LAC está mejorando a lo largo del tiempo, aún no hay presencia suficiente como para realizar estudios que abarquen toda la región.
CAIDA Ark, o Archipielago, es una plataforma similar a RIPE Atlas, basada en Raspberry Pi generación 2. Lamentablemente sólo cuenta con 11 sondas en 10 sistemas autónomos de la región LAC.
M-Lab, o Measurement Lab, es una plataforma que ofrece una serie de herramientas para medir diferentes parámetros de red. Lamentablemente estas herramientas no ponen foco en la medición de latencia entre redes de terceros, sino en mediciones de ancho de banda a través de NDT (Network Diagnosis Tools) entre el cliente y los servidores de M-Lab (que no son muchos en la región LAC).
Por otra parte Speedchecker, una plataforma que ofrece similares funcionalidades, ofrece mejor cobertura en la región LAC. A diferencia de RIPE Atlas, esta plataforma cuenta únicamente con sondas de software, lo que hace que el sistema sea más inestable que las demás plataformas. Sin embargo, dado que en estudios anteriores habíamos utilizado esta plataforma, decidimos utilizarla nuevamente, de forma de poder comparar los resultados con mayor seguridad.

Metodología y estudios anteriores

LACNIC ha llevado a cabo estudios similares durante años anteriores, pueden ver los estudios para los años 2016 (en inglés) y 2017. A grandes rasgos estos estudios dan una vista panorámica sobre la región en cada año, y muestran sensibles mejoras en las mediciones de año-sobre-año. La metodología para realizar las mediciones es la siguiente: Desde todos los países de la región LAC, se programan mediciones cada 1 hora. Estas mediciones son pings ICMP, donde se envían 10 paquetes por cada medición. El destino de los paquetes es una dirección IP aleatoria de un pool de direcciones IP conocidas Este pool de direcciones IP se compone por todos los servidores Speedtest de la región. Esto permite tener una gran cantidad de puntos de prueba, ubicados en muchísimas redes de la región, con un uptime considerablemente bueno (es altamente probable que la dirección IP sea alcanzable al momento de realizar la medición). Se recolectan los datos y se realiza post-procesamiento La información de geolocalización se obtiene de Maxmind La información de routing (Sistema Autónomo, prefixo bajo el que se anuncia) se obtiene de RIPE RIS

Estudio 2020

Para esta edición del estudio, se comenzó una campaña de mediciones desde comienzos de septiembre hasta comienzos de noviembre. En ese período se realizaron 13.000 mediciones desde 26 países, con destino a 25 países. A su vez, esas 13.000 mediciones provinieron desde 332 diferentes Sistemas Autónomos.

Resultados

Una vez obtenidos los datos, se agruparon las mediciones en 3 perspectivas diferentes según la medición esté relacionada con:

país de origen: Esta categoría contiene todas las mediciones con sondas ubicadas en el país, pero no incluye aquellas que terminan en el mismo país. Es decir las mediciones son únicamente salientes al país.
país de destino: Esta categoría contiene todas las mediciones con puntos de prueba (servidores) ubicados en el país, pero no incluye aquellas que son originadas en el mismo país. Es decir las mediciones son únicamente entrantes al país
ambos país de origen y de destino: Esta categoría contiene todas las mediciones cuyo país de origen y destino es el mismo. Es decir, son mediciones que son internas al país. Esta categoría contiene todas las mediciones con sondas y puntos de prueba ubicados dentro del mismo país. Los resultados se pueden visualizar a través de los siguientes 3 gráficos, donde graficamos la mediana de los resultados de cada país:

A simple vista se puede ver que tanto para la latencia saliente como para la entrante, los valores rondan entre 150 y 200 milisegundos. Además, naturalmente, se puede ver que la latencia interna es menor a la latencia saliente y la entrante. Otro aspecto que se puede ver de esta campaña es que la cantidad de países con sondas activas es mucho mayor que la cantidad de países con servidores de pruebas: 37 y 26 respectivamente; esta diferencia hace que el gráfico 1 tenga más entradas que los gráficos 2 y 3. Además, implica que no todas las combinaciones <país_origen, país_destino> se encuentren cubiertas por esta campaña de mediciones, al menos hasta el momento. Cabe hacer una mención especial acerca de algunos países que presentan malas latencias en los gráficos anteriores, ya que se debe principalmente a un sesgo en la metodología de mediciones. Como mencionamos anteriormente, los destinos de las mediciones es un pool de servidores en la región LAC. Debido a que existe una concentración desigual de esos servidores en la región (hay más servidores en países más grandes), al agendar una nueva medición existe una probabilidad más alta de que sea agendada hacia estos países más grandes. Y de hecho los países con peores latencias del gráfico 1: Cuba (CU), Islas Turcas y Caicos (TC), Guyana Francesa (GF), Suriname (SR), Guyana (GY), y Venezuela (VE), tienen resultados únicamente hacia esos países (hasta el momento de este reporte). A medida que pase el tiempo y se agenden más mediciones hacia más países, este sesgo irá bajando y las mediciones reflejarán de mejor forma la realidad de la conectividad regional. Los gráficos anteriores también se pueden visualizar en un mapa:

Clusters de latencia

En base a los tiempos de latencia registrados entre países, y de la misma forma de los estudios llevados a cabo en años anteriores, agrupamos aquellos países que se encuentran más cerca uno del otro que del resto de la región. Cuando corrimos el análisis de clusters sin supervisión, este retornó un total de 4 clusters, de los cuales 2 tienen menos de 20 mediciones, por lo que tuvimos que tener algunas consideraciones. Una vez filtrando los datos, tuvimos 2 clusters que se muestran en los mapas de abajo, cada uno en un color diferente:

Podemos ver que hay un grupo de países en la zona sur de América que comprende Brasil, Uruguay, Paraguay, Argentina y Chile, y otros países. Este es el cluster #1 y es el que tiene mejor interconexión, con una latencia interna de 68 ms (mediana). Estos grupos están interconectados a través de conexiones de fibra óptica desplegadas por distintos carriers que permite una alta integración. Por esa razón los tiempos de latencia son bajos entre sí.

El cluster #0 está compuesta por México y la mayor parte de países de Centroamérica, algunos países de Sudamérica, y algunos países del Caribe. Este tiene una latencia interna de 129 ms (2.8 veces la del cluster #1). La definición de los 2 clusters se puede ver la nota a la derecha.

Cluster 0

Belize
Bolivia
Colombia
Costa Rica
Dominican Republic
Ecuador
El Salvador
Guatemala
Guyana
Honduras
Mexico
Panama
Peru
Suriname
Trinidad and Tobago
Venezuela

Cluster 1

Anguilla
Antigua and Barbuda
Argentina
Aruba
Barbados
Brazil
Chile
Cuba
Dominica
French Guiana
Guadeloupe
Haiti
Jamaica
Nicaragua
Paraguay
Puerto Rico
Saint Lucia
The Bahamas
Turks and Caicos Islands
Uruguay
Virgin Islands (U.S.)

Notas finales

Pueden encontrar las notas que soportan este estudio en el GitHub de LACNIC Labs.
Las mediciones que soportan el estudio se encuentran aquí.
El estudio completo se encontrará disponible, junto a otros informes técnicos similares, en la sección de Informes Técnicos de LACNIC. En el mismo se puede encontrar un análisis más profundo sobre las mediciones, y una comparación entre el estudio actual y un estudio similar llevado acabo durante 2017.

The LACNIC Labs Blog LACNIC Labs

Conectividad en LAC 2020

Elisa Peirano

Asistente de I+D

Guillermo Cicileo

Líder de Investigación y Desarrollo en infraestructura de Internet

Agustín Formoso

Colaborador