Hoi, Wat gebruiken jullie zoal voor de BGP hold timer setting in jullie router op AMS-IX ? Onze Junipers stellen het standaard op 90 seconden is, waarbij verkeer naar (vooral uplink) BGP peer in het minst gunstige geval 90 seconden lang wordt geblackholed, als de peer down is. Ik zou de hold timer willen terug schroeven naar bijvoorbeeld 30 seconden.. maar is dat te kort of juist nog te lang ? Wat is jullie mening hier over ? groet, Pim -- __________________ Met vriendelijke groet, /\ ___/ Pim van Pelt /- \ _/ Business Internet Trends BV PBVP1-RIPE /--- \/ __________________
On vrijdag, jun 6, 2003, at 13:05 Europe/Amsterdam, Pim van Pelt wrote:
Wat gebruiken jullie zoal voor de BGP hold timer setting in jullie router op AMS-IX ? Onze Junipers stellen het standaard op 90 seconden is, waarbij verkeer naar (vooral uplink) BGP peer in het minst gunstige geval 90 seconden lang wordt geblackholed, als de peer down is.
Traffic kan toch al 60 seconden geblackholed worden op Cisco's omdat het BGP Scanner process maar eens in de minuut draait.
Ik zou de hold timer willen terug schroeven naar bijvoorbeeld 30 seconden.. maar is dat te kort of juist nog te lang ? Wat is jullie mening hier over ?
Mijn advies is om hier niet mee te gaan spelen. Ik heb ooit op MAE-East de timers moeten verhogen omdat enkele peers anders timeouts gaven - maar we hebben het dan wel over MAE-East, en niet bepaald in de gloriedagen ervan. Als een router gecontroleerd reboot sluit 'ie in het algemeen netjes z'n BGP-sessies af. Bij een link failure wordt de BGP-sessie ook meteen afgeschoten (tenzij "no bgp fast-external-rollover" is aangezet, of het equivalent daarvan op andere platforms). Tijdens RIPE45 is door een scientist van Juniper een goede presentatie hierover gegeven. Zijn advies was in het kort "Niet mee gaan spelen", wat ik graag overneem. Helaas (voor jullie :P) vertelde hij een stuk meer dan terug te vinden is in z'n slides. http://www.ripe.net/ripe/meetings/ripe-45/presentations/ripe45-eof- pedro/ Je zou kunnen proberen je timers naar bepaalde peers te verlagen als je weet dat ze (1) instabiel zijn en (2) voldoende cpu in hun routers hebben zodat het risico op gemiste keepalives minimaal is - maar de doorsnede van deze twee sets schat ik in als vrij klein. Excessieve flaps zijn ook slecht. -- Niels. --
On Fri, 6 Jun 2003, Pim van Pelt wrote:
Ik zou de hold timer willen terug schroeven naar bijvoorbeeld 30 seconden.. maar is dat te kort of juist nog te lang ? Wat is jullie mening hier over ?
De peers zijn verplicht de laagste hold timer te kiezen die voorgesteld wordt in de OPEN messages. De grote maar hierin is dat peers ook elke hold time mogen afwijzen. Dus een peer met een "speciale" BGP implementatie mag je 30 seconden voorstel afwijzen, waardoor afhankelijk weer van de router aan jouw kant de sessie of niet opkomt of opkomt met alsnog 90 seconden (de standaard waarde per de RFC). Dus, voor peers op de exchange is het een slecht idee omdat je niet weet waar je tegen peert. Voor speciale peers, zoals upstream is 30 seconden geen idiote waarde en zal helpen om sneller te recoveren in situaties waarbij je media niet down gaat (ATM PVC of switched Ethernet) als er een failure is of er een onverwachte peer outage is. De enige knelpunten zijn dus de BGP implementatie aan de andere kant en mogelijke congestion op je lijn waardoor je BGP sessie iets minder stabiel van zou kunnen worden. Tx, Said.
participants (3)
-
niels.bakker@ams-ix.net -
pim@bit.nl -
said@ouissal.net