LAN-Ausfälle protokollieren zum beheben

Sockets, TCP/IP, (XML-)RPC und ähnliche Themen gehören in dieses Forum
Antworten
Benutzeravatar
Kebap
User
Beiträge: 765
Registriert: Dienstag 15. November 2011, 14:20
Wohnort: Dortmund

Hallo zusammen,

wir haben hier mehrere Endgeräte per WLAN und LAN verbunden, manchmal direkt am Router, oder mit weiteren Hubs und Repeatern eingebunden. Es ist kompliziert. Nun klagen einige (aber nicht alle) Nutzer über regelmäßige Ausfälle, vermutlich weil vorübergehend kein Internet verfügbar war. Das geht von wenigen Sekunden bis mehreren Minuten.

Ich wurde gebeten, das zu reparieren. Bin spontan völlig überfragt. Einmal alles neu starten brachte keine Besserung. Also erstmal genauer messen. Dazu lasse ich einen Ping auf Google stundenlang durchlaufen und beobachte, wieviele Pakete nicht oder verzögert zurückkommen.

Im Grunde sieht das Ergebnis recht harmlos aus. Geschätzt weit über 90% der Pakete kommen innerhalb von 20ms zurück. Damit bin ich völlig zufrieden. Zwischendurch gibt es dann aber auch mehrere Zeilen hintereinander, in denen plötzlich 300 oder 4000ms Dauer, oder sogar gar keine Antwort erscheint. Nach 2-3 Dutzend solcher Zeilen normalisiert sich alles wieder. Also das würde ich als eine Störung bezeichnen. Wie komme ich nun zur Lösung solcher Störungen?

Wieder dann habe ich überlegt, ob mir Python dabei helfen kann, diese Zeilen nicht nur manuell auszuwerten. Ich hätte gerne Zeitstempel der Störungen und betroffenen Geräte und genutzten Netzwerkverbindungen. Manche Geräte haben WLAN und LAN-Kabel aktiviert, und welchseln automatisch vom Kabel zum WLAN, wenn per Kabel kein Signal kommt. Das alles merkt oder zeigt Ping nicht an. Nicht mal die Zeitstempel. Inwiefern mir das bei der Lösung helfen wird, weiß ich noch nicht genau. Bisher ist kaum ein Muster erkennbar.

Hatte schon mal jemand ähnliche Probleme zu lösen und/oder ein paar hilfreiche Tipps parat? Ich höre sie gerne.
MorgenGrauen: 1 Welt, 8 Rassen, 13 Gilden, >250 Abenteuer, >5000 Waffen & Rüstungen,
>7000 NPC, >16000 Räume, >200 freiwillige Programmierer, nur Text, viel Spaß, seit 1992.
Benutzeravatar
Kebap
User
Beiträge: 765
Registriert: Dienstag 15. November 2011, 14:20
Wohnort: Dortmund

Ich habe jetzt das Paket "ping3" gefunden:

https://pypi.org/project/ping3/

Damit könnte ich mir vmtl. Zeitstempel selbst bauen. Man kann auch "src_addr" angeben, von welcher IP aus, also über welches Interface gepingt werden soll. Klingt somit schon recht brauchbar.
MorgenGrauen: 1 Welt, 8 Rassen, 13 Gilden, >250 Abenteuer, >5000 Waffen & Rüstungen,
>7000 NPC, >16000 Räume, >200 freiwillige Programmierer, nur Text, viel Spaß, seit 1992.
nezzcarth
User
Beiträge: 1739
Registriert: Samstag 16. April 2011, 12:47

Ping ist halt so das Basiswerkzeug. Hilfreich wäre in dem Kontext mindestens mal noch traceroute/tracepath oder besser mtr. Auch fping fand ich in solchen Fällen schon praktisch. Das Ziel wäre dann, systematisch die Verbindung zwischen den einzelnen Geräten durch zu prüfen und nach dem Ausschlussverfahren die Quelle einzugrenzen.
imonbln
User
Beiträge: 189
Registriert: Freitag 3. Dezember 2021, 17:07

Du solltest dir mal ansehen, ob deine Router nicht irgendwelche Diagnose Funktionen haben (die meisten Professionellen haben die), vielleicht gibt es auch Port Mirroring so das du den Traffic passiv messen kannst. Das Dauerpingen von Google, kann dir jedenfalls nicht alle Fehler zeigen, außerdem sind Milliarden von Pings an google auch irgendwann eine DDos Attacke. Viele Router geben auch Informationen per SNMP Preis.

Grundsätzlich sollte es da schon was mit Ichinga2 oder Nagios geben, das Problem das eigene Netzwerk zu Monitoren hat doch jeder Admin.
Antworten