Això és el que ha passat a l’eXO des de 2024-05-08.
Comunitat
LibreMesh
LibreMesh is a modular framework for creating OpenWrt-based firmwares for wireless mesh nodes.
evilham informa
Aprofitant media.eXO.cat, el PeerTube de l’eXO, el col·lectiu de LibreMesh ha començat a publicar vídeos de preguntes i respostes al fediverse, els podeu seguir al compte @libremesh@media.eXO.cat per estar-hi al dia, i aquí podreu veure la primera publicació
Operacions eXO
Comissió tècnica eXO-servers
La comissió tècnica eXO-servers centralitza tot el que té a veure amb la part tècnica de l’associació.
evilham diu
La comissió tècnica eXO-servers ha estat molt activa amb altes de serveis i millores de manteniment i operació general.
Entre altres, estem formalitzant processos de report d’incidents i actuacions, fent servir com a base les guies de l’equip Wikitech de la Wikimedia Foundation.
També hem afegit una funcionalitat a adlermanager que afegeix enllaços directes a dashboards de mètriques i documentació a fer servir en cas d’incidència, i hem millorat la monitorització externa a nivell de serveis.
Resum d’operacions eXO
2024-07-09: Actuació programada: actualització Proxmox
No s’esperen afectacions de servei, és una actualització esglaonada on no es toca equipament de xarxa i on la redundància de cluster s’assegura que els serveis estiguin en marxa. En cas de fallida, principalment podria afectar les màquines virtuals.
Vegeu més detalls aquí.2024-07-01: Actuació programada esdevinguda incidència: manteniment switchos edge
Havíem de crear una VLAN únicament (un canvi amb molt baix risc) i s’esperaven únicament microtalls, a causa d’un mal funcionament d’un dels switchos redundats va haver afectació de servei de connectivitat i de màquines virtuals. Traiem
sw3
fora de servei, perdent redundància temporalment.
Vegeu més detalls aquí.2024-06-12: Actuació programada: manteniment de switchos core
Vam actualitzar els Switchos core i redundats de la eXO.
Vegeu més detalls aquí.2024-06-08: Incidència: parcial de servei de VMs
A causa d’un incident de sincronització en el clúster, vam haver de reiniciar algunes màquines virtuals, que van estar indisponibles (de 7:14 a 14:55) mentre fèiem diverses comprovacions de salut general de l’emmagatzematge i el servei.
Vegeu més detalls aquí.2024-05-22: Incidència: de servei general
En total ~10 minuts de durada en dos trams (18:40-18:45 i 19:07-19:12), els dos canvis als commutadors principals redundats han generat un tall general de servei en l’operació de reboot de cadascun d’ells corresponentment durant una intervenció per afegir nous serveis.
Vegeu més detalls aquí.2024-05-21: Incidència: de servei xarxa guifi
En sessió d’eXO-servers el dia, durant una actuació d’alta de servei hem tingut una incidència de pocs minuts en l’accés a la xarxa guifi de pocs minuts (17:00-17:12).
Vegeu més detalls aquí.
Fins la propera!
Participeu i informeu dels vostres projectes a #eXOfasia:matrix.guifi.net!