<div dir="ltr"><div class="gmail_extra">Hi Ryan, I don't think that's the issue.  Those variables can only be modified in setNumCapabilities, which acquires *all* the capabilities before it makes any changes.  There should be no other threads running RTS code(*) while we change the number of capabilities.  In particular we shouldn't be in releaseGCThreads while enabled_capabilities is being changed.</div><div class="gmail_extra"><br></div><div class="gmail_extra">(*) well except for the parts at the boundary with the external world which run without a capability, such as rts_lock() which acquires a capability.</div><div class="gmail_extra"><br></div><div class="gmail_extra">Cheers</div><div class="gmail_extra">Simon</div><div class="gmail_extra"><br><div class="gmail_quote">On 27 Oct 2016 17:10, "Ryan Yates" <<a href="mailto:fryguybob@gmail.com" target="_blank">fryguybob@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Briefly looking at the code it seems like several global variables involved should be volatile: n_capabilities, enab<wbr>led_capabilities, and capabilities.  Perhaps in a loop like in scheduleDoGC the compiler moves the reads of n_capabilites or capabilites outside the loop.  A failed requestSync in that loop would not get updated values for those global pointers.  That particular loop isn't doing that optimization for me, but I think it could happen without volatile.<div><br></div><div>Ryan</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Oct 27, 2016 at 9:18 AM, Ben Gamari <span dir="ltr"><<a href="mailto:ben@smart-cactus.org" target="_blank">ben@smart-cactus.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><span>Simon Marlow <<a href="mailto:marlowsd@gmail.com" target="_blank">marlowsd@gmail.com</a>> writes:<br>
<br>
> I haven't been able to reproduce the failure yet. :(<br>
><br>
</span>Indeed I've also not seen it in my own local builds. It's quite an<br>
fragile failure.<br>
<br>
Cheers,<br>
<br>
- Ben<br>
<br>
<br>______________________________<wbr>_________________<br>
ghc-devs mailing list<br>
<a href="mailto:ghc-devs@haskell.org" target="_blank">ghc-devs@haskell.org</a><br>
<a href="http://mail.haskell.org/cgi-bin/mailman/listinfo/ghc-devs" rel="noreferrer" target="_blank">http://mail.haskell.org/cgi-bi<wbr>n/mailman/listinfo/ghc-devs</a><br>
<br></blockquote></div><br></div>
</blockquote></div></div>
</div>