Deep Dive: Juniper Memory Leak

Hassen Sie es nicht auch, wenn kritische Netzwerkgeräte spontan neu starten? Dann ist dieser Artikel zum Thema Juniper Memory Leak genau das Richtige für Sie!

  #Deep Dive   #Juniper Networks   #Network as a Service  
Diana Stucki
+41 58 510 13 54
diana.stucki@umb.ch

Liebe Leserinnen und Leser, bitte beachten Sie, dass dieser Blog schon etwas älter ist und sich daher der Inhalt, die Erkenntnisse und Aussagen im Laufe der Zeit geändert haben könnten, da sich Produkte, Dienstleistungen und Technologien weiterentwickeln.

In einem kürzlich erschienenen Technical Bulletin von Juniper wurde darauf hingewiesen, dass auf MX-, EX- oder SRX-Plattformen, welche die TRIO ASIC-Familie verwenden, die MPCs oder Linecards manchmal zurückgesetzt und spontan neu gestartet werden. Dies wird durch die Überlastung des Speichers verursacht. Junos OS 18.3 Versionen und höhere sind nicht betroffen. Für alle, die aber betroffen sind, stellt Juniper Networks Details und Lösungsansätze zur Verfügung.

 

Grundlegende Ursache

Ein Memory Leak ist ein Ressourcenleck, das auftritt, wenn ein Computerprogramm Speicherzuweisungen falsch verwaltet, so dass nicht mehr benötigter Speicher nicht freigegeben wird. In zwei Problemberichten von Juniper (PR1241973 und PR1216300) wird eine Protokollierungsfunktion zur Verfolgung von Speicherereignissen eingeführt. Dies hilft beim Aufspüren von übermässiger Speichernutzung oder von Speicherplatz, der nicht ordnungsgemäss freigegeben wird. Die Informationsmenge wird aber dadurch nicht begrenzt, und wenn sich ein Teil der Informationen auf die Next-Hop-Aktivitäten von Routen bezieht, kann es in einem Netzwerk mit ständigen Routenänderungen dazu kommen, dass den Linecards der Speicher ausgeht und sie zurückgesetzt werden.

 

Betroffene Systeme

  • MX240, MX480, MX960, MX2020s Trio-Based MPCs – all parts start with “MPC” prefix
  • MX80, MX104, MX204, MX10003/8/16
  • EX9200 line cards
  • SRX4600 and SRX5000 series

 

Signatur, Abhilfe und Lösung

Die folgenden Syslog-Einträge sind einige Beispiele für Speicherüberlastung:

 

Sep 4 03:56:24 re0-mx fpc14 IFRT: 'IFD get B chip stats' (opcode 53) failed
Sep 4 03:56:24 re0-mx kernel: if_pfe: Error 6 (No Memory) on IF command 53 
(IFD bchip stats)

You can monitor FPC's heap memory usage with the following command 
to see if the amount of memory is increasing.

pfe-cli> show heap 0

 

 

Sobald der Speicher 90 Prozent erreicht, sollten Sie einen Neustart der Linecards vorbereiten, um Speicher freizugeben, bevor sie zurückgesetzt werden. Dies ist jedoch nur eine Übergangslösung; es sind Software-Lösungen verfügbar. Wenn Sie betroffen sind, sollten Sie die Software auf Ihrem Gerät aktualisieren. Das wäre auf lange Sicht die optimale Lösung.

Nachfolgend finden Sie eine Liste mit den betroffenen Softwareversionen und den Junos-Versionen, die einen Fix enthalten:

  • 16.1R3-S4 or later Service Releases
  • 16.1R5, 16.1R6, 16.1R7 – fixed available in 16.1R7-S3 or later
  • 16.2R1-S4 or later – no fix available – EOL since Mai 2020 go to 17.3R3-S2 (EOL Feb. 2022) or later
  • 16.2R2 or later – no fix available – EOL since Mai 2020 go to 17.3R3-S2 (EOL Feb. 2022) or later
  • 17.1R1, 17.1R2, 17.1R3  – no fix available- EOL since March 2020, go to 17.3R3-S2 (EOL Feb. 2022) or later
  • 17.2R1, 17.2R2, 17.2R3 – fixed in 17.2R3-S3 or later
  • 17.2X75 – fixed in 17.2X75-D92, -D101, -D102, and -D110
  • 17.3R1, 17.3R2, 17.3R3 – fixed in 17.3R3-S2  or later
  • 17.4R1, 17.4R2 – fixed in 17.4R1-S7 or later, 17.4R2-S1 or later, and 17.4R3
  • 18.1R1, 18.1R2, 18.1R3 – fixed in 18.1R3-S1 or later
  • 18.2R1 – fixed in 18.2R1-S4 or later, 18.2R2 or later
  • 18.2X75 or later – fixed in 18.2X75-D11, D23, D30

 

Die von JTAC empfohlenen Versionen finden Sie hier und Junos OS können Sie hier herunterladen.

Sie können sich natürlich an JTAC wenden, wenn Sie keine passende Softwareversion für Ihre Situation finden, oder wenn Sie zu unseren Kunden gehören, eröffnen Sie einfach ein Ticket auf unserer Support-Plattform und wir helfen Ihnen gerne weiter.

Information ist Macht, und jetzt haben Sie die Macht, dieses Juniper Speicherleck zu vermeiden und den Rest des Tages zu geniessen!