<div dir="ltr"><div dir="ltr">On Tue, 1 Jun 2021 at 15:32, Vladislav Zavialov (int-index) <<a href="mailto:vlad.z.4096@gmail.com">vlad.z.4096@gmail.com</a>> wrote:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br>
> On 1 Jun 2021, at 15:12, Simon Marlow <<a href="mailto:marlowsd@gmail.com" target="_blank">marlowsd@gmail.com</a>> wrote:<br>
> <br>
> I'm hoping that what I'm suggesting could be done while still doing renaming strictly before typechecking. It's a kind of lazy name resolution - a name can resolve to a set of entities, and whether that is actually ambiguous or not is decided later during type checking, when we know whether we need to resolve the name in a value or a type context. Does that make sense?<br>
<br>
<br>
Yes, I see how this can work, but if name resolution returns a set of possible entities rather than one, it means it hasn’t actually done name resolution completely. After all, not doing name resolution at all is also equivalent to having a set of names – if the user refers to a variable by its name “x”, then we already narrowed down the set of possible bindings from “all bindings” to “bindings of variables named ‘x’”. But name resolution is complete only when we find out which “x” exactly is referred to.<br>
<br>
So this idea of lazy name resolution seems to amount to some name resolution prior to type checking, and then some more during type checking. It might be possible, but it does not strike me as "renaming strictly before typechecking”.<br></blockquote><div><br></div><div>Don't we already do this for DataKinds? The lexical scoping rule is slightly cheating with respect to DataKinds because while we can resolve an identifier to its binding site, the binding site in the case of a promoted constructor is actually two binding sites :)<br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
I worry that it might cause some trouble in other parts of the compiler. Dependency analysis of declarations comes to mind. Let’s say the user defines:<br>
<br>
data A = B …<br>
data B = A …<br>
<br>
Currently we can process these declarations independently, there are no mutual dependencies. But if we postpone namespace selection, then this will become a strongly connected component, which will affect kind inference. I conjecture a more realistic example could be produced, but my goal is to simply state that weakening name resolution will have non-negligible impact on the implementation.<br>
<br>
Implementation aside, the lexical scoping principle to which I referred is also about user expectations. When reading and writing code, I don’t want to inspect types just to figure out which name refers to what binding. It should be deducible from the lexical structure of the program.<br>
<br>
So, while the idea sounds attractive, and it might be implementable, one would have to abandon the lexical scoping principle to pursue it.<br>
<br>
> On 1 Jun 2021, at 15:12, Simon Marlow <<a href="mailto:marlowsd@gmail.com" target="_blank">marlowsd@gmail.com</a>> wrote:<br>
> <br>
> Not being able to use `[Int]` where a type is expected would be a serious drawback in my opinion, and I don't like the other alternative either: use `List Int` everywhere (rewrite all the Haskell textbooks!).<br>
> <br>
> Cheers<br>
> Simon<br>
<br>
I share your disappointment, but it’s not as bad as rewriting all Haskell books! We continue to support the old syntax in all the old places, so code examples from the books will continue to compile. At the same time, codebases that lean strongly towards intermixing terms and types might adopt a different convention and require writing `List Int` everywhere. It could be part of a project style guide, for example.<br></blockquote><div><br></div><div>To clarify what I meant here - if we want consistency, where consistency means referring to the type of lists of Int using the same syntax everywhere, then this leads to List Int and having to rewrite the Haskell textbooks. So all the options are bad: we either have two ways to write list of Int (and in some places only one of them works), or we have consistency but we're changing something fundamental (and to a worse syntax). The third option, namely using the "type" prefix also doesn't seem appealing, because I have to know when to use the "type" prefix. I could use it all the time, but then that's not much better than the current situation (@-prefix) and I also have to read code written by other people who don't adopt this convention.</div><div><br></div><div>With regard to list syntax in particular, I guess I still don't understand why we can't</div><div>* require a promoted list to be written <span style="font-family:monospace">'[Int]</span></div><div>* change the T2T mapping so that <span style="font-family:monospace">[Int]</span> means "list of Int" rather than the promoted interpretation</div><div><br></div><div>After all, DataKinds already recommends using the leading quote and not relying on unquoted syntax.<br></div><div><br></div><div>or perhaps this is undesirable for some reason? Do you think the promoted interpretation is more useful?<br></div><div> </div><div>Cheers</div><div>Simon</div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
Also, it is interesting that you say ‘where a type is expected’, because I there are at least three ways to interpret this:<br>
<br>
1. Syntactically, a type is what follows after `@`, `::`, etc.<br>
2. Things of kind `… -> Type` are types, things of other kinds are data. So `Bool` is a type, while `True` is data.<br>
3. Erased things are types, so forall-quantified variables stand for types, while lambda-bound variables stand for terms.<br>
<br>
Interestingly, under the first interpretation, `[Int]` does stand for the type of lists under this proposal, so I imagine it’s not what you meant. The choice between 2 and 3, on the other hand (and if we did lazy name resolution as you suggested earlier), would determine the meaning of programs such as:<br>
<br>
  import Type.Reflection<br>
<br>
  data True<br>
<br>
  kindOf :: forall a -> Typeable a => String<br>
  kindOf a = show (typeRepKind (typeRep @a))<br>
<br>
  main = print (kindOf True)<br>
<br>
Should this program print “Bool” or “Type”? Under (2), it must print “Bool”, because “True” is first of all data. Under (3), it must print “Type”, because the input to ‘kindOf’ is forall-quantified and erased.<br>
<br>
Even if we partially postpone name resolution until type checking, there’s a lot of design space to explore (and to explain in the User’s Guide! this is not straightforward).<br>
<br>
Under (1) it prints “Bool”, and name resolution remains blissfully unaware of any types involved.<br>
<br>
- Vlad<br>
<br>
<br>
</blockquote></div></div>