<div dir="ltr">Hi Alexis,<div><br></div><div>let me try to provide the high up view. I'm sorry if I'm going a bit overboard on details you already know. But let's</div><div>start with clearing up a misconception first. No, GHCi does not always require dynamic linking.</div><div><br></div><div>At the very abstract level we have a compiler that knows how to turn various inputs into object code. This includes, C, Cmm, Haskell, assembly (.c, .S, .cmm, .hs -> .o). Thus a complete haskell package ends up as a bunch of object code files. We know that for dynamic linkers, we may need slightly different arguments (e.g. PIC).</div><div><br>We next roll these up into archives (.a) and occasionally a pre-linked object file (e.g. link the whole set of object files into one object file, and resolve internal references); as well as a dynamic (shared object, dylib) file.</div><div><br></div><div>For GHCi's purposes (and TH), we ultimately want to call a haskell function to produce some AST to splice in. This haskell</div><div>function might not be defined in a different package, but the same, so we'll have to deal with some in-flight packages anyway.</div><div>We may habe some Byte Code Object (BCO) glue code to invoke the haskell function, which GHCi will interpret during evaluation. However that function can depend on a large dependency tree, and we don't have BCO for everything. I still think it would be nice to have an abstract machine and an Intermediate Representation/ByteCode, that's a much larger project though. Also until recently BCO's couldn't encode unboxed types/sums even.</div><div><br></div><div>So given the BCO glue code, we really want to call into object code (also for performance). You can instruct GHCi to prefer object code as well via -fobject-code.</div><div><br></div><div>This now leads us to the need of getting the object code somehow into memory and running it. The dynamic system linker approach would be to turn the object code with the function we want to call into a shared library, and just hand that over to the linker (e.g. dlopen).</div><div><br></div><div>However, GHC has for a long time grown it's own in-memory static linker. As such it has the capability to load object file (.o) and resolve them on the fly. There is no need for system shared libraries, a system linker, and to deal with potential bugs in that linker. It also means we can link on platforms that don't have a system linker or a severely restricted one (e.g. iOS).</div><div><br></div><div>So from a high level you can look at GHC's RTS linker as a special feature of GHC that allows us to not need a system</div><div>provided dynamic linker, if there is none available, or using it is undesirable.</div><div><br></div><div>Whether or not stuff is loaded through the internal or external interpreter has near no difference. You _can_ load different abi's through the external iserv (as that iserv can be built against a different abi).<br><br></div><div>Hope this helps a bit? Feel free to ask more questions.<br><br>Cheers,<br> Moritz</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Wed, 1 Jun 2022 at 03:38, Alexis King <<a href="mailto:lexi.lambda@gmail.com">lexi.lambda@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Hi all,</div><div><br></div><div>I’ve recently been trying to better understand how and where time is spent at compile-time when running Template Haskell splices, and one of the areas I’ve been struggling to figure out is the operation of the linker. From reading the source code, here’s a summary of what I think I’ve figured out so far:</div><div><ul><li>TH splices are executed using the GHCi interpreter, though it may be internal or external (if -fexternal-interpreter is used).<br><br></li><li>Regardless of which mode is used, TH splices need their dependencies loaded into the interpreter context before they can be run. This is handled by the call to loadDecls in hscCompileCoreExpr', which in turn calls loadDependencies in GHC.Linker.Loader.<br><br></li><li>loadDependencies loads packages and modules in different ways. Package dependencies are just loaded via the appropriate built shared libraries, but modules from the current package have to be loaded a different way, via loadObjects (also in GHC.Linker.Loader).</li></ul><div>Here, however, is where I get a bit lost. GHC has two strategies for loading individual objects, which it chooses between depending on whether the current value of interpreterDynamic is True. But I don’t actually understand what interpreterDynamic means! The Haddock comment just says that it determines whether or not the “interpreter uses the Dynamic way”, but I don’t see why that matters. My understanding was that GHCi <i>always</i> requires dynamic linking, since it is, after all, loading code dynamically. Under what circumstances would interpreterDynamic ever be False?</div><div><br></div><div>Furthermore, I don’t actually understand precisely how and why this influences the choice of loading strategy. In the case that interpreterDynamic is True, GHC appears to convert the desired dyn_o object into a shared library by calling the system linker, then loads that, which can be very slow but otherwise works. However, when interpreterDynamic is False, it loads the object directly. Both paths eventually call into “the RTS linker”, implemented in rts/Linker.c, to actually load the resulting object.</div><div><br></div><div>I have found precious little information on what the RTS linker does, in which contexts it’s used, or how precisely it works. Note [runtime-linker-phases] at the top of Linker.c has some information, but it’s mostly a high-level description of what the code actually does rather than an explanation of its role in the bigger picture. Does anyone know of any resources they could possibly point me to that help to explain how all the pieces fit together here? I’ve spent quite a bit of time reading the code, but I’m afraid I still haven’t managed to see the forest for the trees.</div><div><br></div><div>Thanks,</div><div>Alexis<br></div></div></div>
_______________________________________________<br>
ghc-devs mailing list<br>
<a href="mailto:ghc-devs@haskell.org" target="_blank">ghc-devs@haskell.org</a><br>
<a href="http://mail.haskell.org/cgi-bin/mailman/listinfo/ghc-devs" rel="noreferrer" target="_blank">http://mail.haskell.org/cgi-bin/mailman/listinfo/ghc-devs</a><br>
</blockquote></div>