it-swarm-eu.dev

Recherche de la cause de TCP retransmission dans un LAN

Bonjour les habitants de Server Fault

J'ai un problème irritant avec un LAN d'environ 100 ordinateurs, 2 serveurs de domaine Windows et 12 téléphones VoIP. Depuis leur installation il y a environ un an, chaque semaine environ, nous remarquons qu'un téléphone VoIP se réinitialise - parfois au milieu d'un appel. Simultanément, il y a souvent des signes de perte de connexion temporaire sur les ordinateurs: se bloque dans l'Explorateur lors de l'accès aux partages réseau, des erreurs dans notre logiciel d'administration en raison de la perte de connexion au serveur de base de données.

J'ai fait une surveillance de Wireshark sur la connexion entre la VoIP PBX et le reste du réseau. Wireshark prend une grappe de paquets retransmis TCP au niveau du fois où nous enregistrons les redémarrages du téléphone. Le journal Wireshark affiche environ 2 clusters de retransmissions par jour, allant de 5 paquets à des centaines. Ceux de chaque cluster se situent principalement entre le PBX et certains ensembles de téléphones VoIP , mais pas toujours le même ensemble. Souvent, les retransmissions en même temps sont vers des téléphones connectés au même commutateur, mais parfois les retransmissions se produisent ensemble vers des téléphones aux extrémités opposées du réseau. Il y a généralement des retransmissions coïncidentes en passant TCP, par exemple entre les machines clientes et les serveurs de fichiers.

Les pics des retransmissions et des réinitialisations téléphoniques ne correspondent pas bien avec le moment où le réseau est lourdement chargé. Ils semblent se produire un peu plus pendant la journée, mais surtout le soir, lorsque le trafic devrait diminuer. Ils se produisent assez souvent tard dans la nuit, lorsque la plupart des ordinateurs sont éteints et que le trafic doit être le plus faible.

Avez-vous des idées qui pourraient aider à diagnostiquer la cause de problèmes comme celui-ci? Une chose que je n'ai pas encore essayée, mais que j'aurais dû, est la mise à jour du firmware de tous les commutateurs.

25
Surreal

Les retransmissions TCP sont généralement dues à la congestion du réseau. Recherchez un grand nombre de paquets de diffusion au moment où le problème se produit. Si le pourcentage de trafic diffusé dans votre capture est supérieur à environ 3% du trafic total capturé, vous avez certainement une congestion. Recherchez les diffusions de couche physique (ARP) et de couche réseau (résolution de noms) sur le réseau. Si vous trouvez un volume élevé de trafic de diffusion, vous pouvez le suivre jusqu'à la source à partir des données de capture.

17
joeqwerty

La collecte de statistiques de trafic pour vos commutateurs peut indiquer que vous avez des périodes où vous exécutez à pleine capacité ou presque. Cela peut conduire à de nouvelles tentatives lorsque les réponses ne reviennent pas dans le délai initial (souvent 3 secondes). Cela augmente momentanément la congestion jusqu'à ce que les mécanismes d'atténuation de la congestion interviennent.

Recherchez des personnes utilisant des médias en streaming car cela peut absorber rapidement la bande passante.

Vous pourrez peut-être atténuer le problème pour les téléphones en modulant le trafic. Cela ne fera que déplacer le problème vers d'autres utilisateurs.

2
BillThor

Cela ressemble à une boucle de spanning tree ou à une tempête de diffusion pour moi, surtout si les retransmissions et les problèmes sont localisés sur le même commutateur (qui diffère). Lorsque cela se produit, quels sont les états de port sur votre appareil L2? Probablement un mauvais commutateur ou de mauvaises priorités de pont racine? Problème intéressant.

2
McJeff

Vous avez probablement résolu ce problème depuis si longtemps, mais vous devez essentiellement activer le "port rapide" sur les ports dotés de terminaux (téléphones VoIP, postes de travail, serveurs). Un téléphone peut envoyer des PDU, donc si ce type redémarre, une convergence STP se produira) provoquant le vidage de la table FDB et tous les appareils passant par l'étape 4/5 STP fun. En plaçant les ports avec point d'extrémité en "port rapide", ils sautent l'attente et passent directement au mode de transfert.

2
barak s.

Espérons que vos téléphones se trouvent sur un sous-réseau différent et VLAN des autres ordinateurs?

1
Greg Askew

Il peut également s'agir d'un équipement défectueux comme un interrupteur défectueux. Les retransmissions sont-elles liées aux téléphones/ordinateurs sur un commutateur ou une partie du réseau particulier?

Juste pour étendre un peu ma réponse. Tous les commutateurs ne sont pas créés égaux, même s'ils ont les mêmes spécifications. Certains sont capables de faire face à une charge beaucoup plus élevée que d'autres car ils ont des processeurs plus rapides à l'intérieur. Il se peut que vos commutateurs ne soient pas tout à fait à la hauteur.

Je commencerais par mettre certains de vos téléphones VOIP les plus gênants sur leur propre commutateur physique et voir si les réinitialisations continuent. Si cela disparaît, vous êtes sur la voie de le résoudre très bientôt.

1
Matt