<div><div dir="auto">It’s worth also mentioning that my previous 1.2 wip stuff was using splitmix as the suggested default Splittable  too. </div></div><div dir="auto"><br></div><div dir="auto">The proposal has a number of nice ideas. And a number of things that I’m reflecting on how to tweak or align with my own thoughts because I think it’s wrong but I’m not 100% on what approach is best yet. Just that the current one proposed or that random currently has is not ! </div><div dir="auto"><br></div><div dir="auto">I’m taking my time with this because even under ideal circumstances rng algorithms can have hard to see issues, and all the weirdness going on in the world right now doesn’t lend itself to speedy clear thinking so I’m being doubly careful to figure out how to communicate and factor this work.  </div><div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Jun 1, 2020 at 7:26 AM Markert, Leonhard <<a href="mailto:leonhard.markert@tweag.io">leonhard.markert@tweag.io</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Thank you, Simon! I am keen to see the improvements we've been working on released for others to use.<div><br></div><div>I just wanted to mention Oleg Grenrus (@phadej) here - the proposed random v1.2 uses his fast, pure-Haskell <a href="https://hackage.haskell.org/package/splitmix" target="_blank">SplitMix implementation</a> as its default PRNG.</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Jun 1, 2020 at 12:55 PM Simon Peyton Jones via Libraries <<a href="mailto:libraries@haskell.org" target="_blank">libraries@haskell.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">





<div lang="EN-GB">
<div>
<p class="MsoNormal"><span>Friends<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>Random number generation lies far outside my expertise, but I know it to be an area where it’s easy to mess up, either in performance or in generating genuinely random numbers.  So I’m delighted
 that Dominic and his colleagues have been working so hard on this.   We all owe them a debt of thanks.  Good RNGs are at the beating heart of many other algorithms, but are rather un-loved as an object of study in their own right.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>So thank you Dominic, @curiousleo @lehins  -- and indeed Guy Steele and colleagues, on whose work this is based.  We don’t often get perf boosts of 1000x!<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>I hope that that, after suitable scrutiny and refinement if necessary, this ends up being accepted.<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<p class="MsoNormal"><span>Simon<u></u><u></u></span></p>
<p class="MsoNormal"><span><u></u> <u></u></span></p>
<div style="border-top:none;border-right:none;border-bottom:none;border-left:1.5pt solid blue;padding:0cm 0cm 0cm 4pt">
<div>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(225,225,225);padding:3pt 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US">From:</span></b><span lang="EN-US"> Libraries <<a href="mailto:libraries-bounces@haskell.org" target="_blank">libraries-bounces@haskell.org</a>>
<b>On Behalf Of </b><a href="mailto:dominic@steinitz.org" target="_blank">dominic@steinitz.org</a><br>
<b>Sent:</b> 26 May 2020 11:00<br>
<b>To:</b> libraries <<a href="mailto:libraries@haskell.org" target="_blank">libraries@haskell.org</a>><br>
<b>Cc:</b> Alexey Kuleshevich <<a href="mailto:alexey@kuleshevi.ch" target="_blank">alexey@kuleshevi.ch</a>><br>
<b>Subject:</b> Improving Random<u></u><u></u></span></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Hello Libraries,<u></u><u></u></p>
<p class="MsoNormal">You may recall that following the blog
<a href="https://alexey.kuleshevi.ch/blog/2019/12/21/random-benchmarks/" target="_blank">post</a> by @lehins, a group of us (@curiousleo, @lehins and me) invited participation in
<a href="https://mail.haskell.org/pipermail/libraries/2020-February/030261.html" target="_blank">
February</a> to take this work and apply it to improving the current <code><span style="font-size:10pt">random</span></code> library.<u></u><u></u></p>
<p class="MsoNormal">Our proximate goals were to fix
<a href="https://github.com/haskell/random/issues/25" target="_blank">#25</a> (filed in 2015) and
<a href="https://github.com/haskell/random/issues/51" target="_blank">#51</a> (filed in 2018). After a lot of discussion and experimentation, we have a proposal that addresses both these issues and also:
<a href="https://github.com/haskell/random/issues/26" target="_blank">#26</a>, <a href="https://github.com/haskell/random/issues/44" target="_blank">
#44</a>, <a href="https://github.com/haskell/random/issues/53" target="_blank">#53</a>, <a href="https://github.com/haskell/random/issues/55" target="_blank">
#55</a>, <a href="https://github.com/haskell/random/issues/58" target="_blank">#58</a> and <a href="https://github.com/haskell/random/issues/59" target="_blank">
#59</a>.<u></u><u></u></p>
<p class="MsoNormal">For backwards compatibility, the proposal retains the old style classes and enhances them. Thus in 1.1 we have<u></u><u></u></p>
<pre><code>class RandomGen g where<u></u><u></u></code></pre>
<pre><code>    next :: g -> (Int, g)<u></u><u></u></code></pre>
<pre><code>    genRange :: g -> (Int, Int)<u></u><u></u></code></pre>
<pre><code>    split :: g -> (g, g)<u></u><u></u></code></pre>
<pre><code>    {-# MINIMAL next, split #-}<u></u><u></u></code></pre>
<p class="MsoNormal">and in 1.2 we have<u></u><u></u></p>
<pre><code>class RandomGen g where<u></u><u></u></code></pre>
<pre><code>    next :: g -> (Int, g)<u></u><u></u></code></pre>
<pre><code>    genWord8 :: g -> (Word8, g)<u></u><u></u></code></pre>
<pre><code>    genWord16 :: g -> (Word16, g)<u></u><u></u></code></pre>
<pre><code>    genWord32 :: g -> (Word32, g)<u></u><u></u></code></pre>
<pre><code>    genWord64 :: g -> (Word64, g)<u></u><u></u></code></pre>
<pre><code>    genWord32R :: Word32 -> g -> (Word32, g)<u></u><u></u></code></pre>
<pre><code>    genWord64R :: Word64 -> g -> (Word64, g)<u></u><u></u></code></pre>
<pre><code>    genShortByteString :: Int<u></u><u></u></code></pre>
<pre><code>        -> g -> (Data.ByteString.Short.Internal.ShortByteString, g)<u></u><u></u></code></pre>
<pre><code>    genRange :: g -> (Int, Int)<u></u><u></u></code></pre>
<pre><code>    split :: g -> (g, g)<u></u><u></u></code></pre>
<pre><code>    {-# MINIMAL split, (genWord32 | genWord64 | next, genRange) #-}<u></u><u></u></code></pre>
<p class="MsoNormal">and
<code><span style="font-size:10pt">next</span></code> and <code><span style="font-size:10pt">genRange</span></code> are deprecated. This interface is what allows the significantly faster performance as no longer is everything forced to go via
<code><span style="font-size:10pt">Integer</span></code>.<u></u><u></u></p>
<p class="MsoNormal">Several new interfaces are introduced and it is recommended that new applications use these and, where feasible, existing applications migrate to using them.<u></u><u></u></p>
<p class="MsoNormal">The major API addition in this PR is the definition of a new class
<code><span style="font-size:10pt">MonadRandom</span></code>:<u></u><u></u></p>
<pre><code>-- | 'MonadRandom' is an interface to monadic pseudo-random number generators.<u></u><u></u></code></pre>
<pre><code>class Monad m => MonadRandom g s m | g m -> s where<u></u><u></u></code></pre>
<pre><code>{-# MINIMAL freezeGen,thawGen,(uniformWord32|uniformWord64) #-}<u></u><u></u></code></pre>
<pre><code><u></u> <u></u></code></pre>
<pre><code>    type Frozen g = (f :: Type) | f -> g<u></u><u></u></code></pre>
<pre><code>    freezeGen :: g s -> m (Frozen g)<u></u><u></u></code></pre>
<pre><code>    thawGen :: Frozen g -> m (g s)<u></u><u></u></code></pre>
<pre><code><u></u> <u></u></code></pre>
<pre><code>    uniformWord32 :: g s -> m Word32 -- default implementation in terms of uniformWord64<u></u><u></u></code></pre>
<pre><code>    uniformWord64 :: g s -> m Word64 -- default implementation in terms of uniformWord32<u></u><u></u></code></pre>
<pre><code>    -- plus methods for other word sizes and for byte strings<u></u><u></u></code></pre>
<pre><code>    -- all have default implementations so the MINIMAL pragma holds<u></u><u></u></code></pre>
<p class="MsoNormal">Conceptually, in
<code><span style="font-size:10pt">MonadRandom g s m</span></code>, <code><span style="font-size:10pt">g s</span></code> is the type of the generator,
<code><span style="font-size:10pt">s</span></code> is the state type, and <code>
<span style="font-size:10pt">m</span></code> the underlying monad. Via the functional dependency
<code><span style="font-size:10pt">g m -> s</span></code>, the state type is determined by the generator and monad.<u></u><u></u></p>
<p class="MsoNormal"><code><span style="font-size:10pt">Frozen</span></code> is the type of the generator's state "at rest". It is defined as an injective type family via
<code><span style="font-size:10pt">f -> g</span></code>, so there is no ambiguity as to which
<code><span style="font-size:10pt">g</span></code> any <code><span style="font-size:10pt">Frozen g</span></code> belongs to.<u></u><u></u></p>
<p class="MsoNormal">This definition is generic enough to accommodate, for example, the
<code><span style="font-size:10pt">Gen</span></code> type from <code><span style="font-size:10pt">mwc-random</span></code>, which itself abstracts over the underlying primitive monad and state token. This is the full instance declaration (provided here
 as an example - this instance is not part of <code><span style="font-size:10pt">random</span></code> as
<code><span style="font-size:10pt">random</span></code> does not depend on <code>
<span style="font-size:10pt">mwc-random</span></code>):<u></u><u></u></p>
<pre><code>instance (s ~ PrimState m, PrimMonad m) => MonadRandom MWC.Gen s m where<u></u><u></u></code></pre>
<pre><code>    type Frozen MWC.Gen = MWC.Seed<u></u><u></u></code></pre>
<pre><code>    freezeGen = MWC.save<u></u><u></u></code></pre>
<pre><code>    thawGen = MWC.restore<u></u><u></u></code></pre>
<pre><code><u></u> <u></u></code></pre>
<pre><code>    uniformWord8 = MWC.uniform<u></u><u></u></code></pre>
<pre><code>    uniformWord16 = MWC.uniform<u></u><u></u></code></pre>
<pre><code>    uniformWord32 = MWC.uniform<u></u><u></u></code></pre>
<pre><code>    uniformWord64 = MWC.uniform<u></u><u></u></code></pre>
<pre><code>    uniformShortByteString n g = unsafeSTToPrim (genShortByteStringST n (MWC.uniform g))<u></u><u></u></code></pre>
<p class="MsoNormal">Pure random number generators can also be made instances of this class providing a uniform interface to both pure and stateful random number generators. An instance for the standard
 number generator <code><span style="font-size:10pt">StdGen</span></code> is provided.<u></u><u></u></p>
<p class="MsoNormal">The
<code><span style="font-size:10pt">Random</span></code> typeclass has conceptually been split into
<code><span style="font-size:10pt">Uniform</span></code> and <code><span style="font-size:10pt">UniformRange</span></code>. The
<code><span style="font-size:10pt">Random</span></code> typeclass is still included for backwards compatibility.
<code><span style="font-size:10pt">Uniform</span></code> is for types where it is possible to sample from the type's entire domain;
<code><span style="font-size:10pt">UniformRange</span></code> is for types where one can sample from a specified range:<u></u><u></u></p>
<pre><code>class Uniform a where<u></u><u></u></code></pre>
<pre><code>    uniformM :: MonadRandom g s m => g s -> m a<u></u><u></u></code></pre>
<pre><code><u></u> <u></u></code></pre>
<pre><code>class UniformRange a where<u></u><u></u></code></pre>
<pre><code>    uniformRM :: MonadRandom g s m => (a, a) -> g s -> m a<u></u><u></u></code></pre>
<p class="MsoNormal">The proposal is a breaking change but the changes are not very intrusive and we have PRs ready for the affected downstream libraries:<u></u><u></u></p>
<ul type="disc">
<li class="MsoNormal">
requires <code><span style="font-size:10pt">base</span></code> >= 4.10 (GHC-8.2)<u></u><u></u></li><li class="MsoNormal">
<code><span style="font-size:10pt">StdGen</span></code> is no longer an instance of
<code><span style="font-size:10pt">Read</span></code><u></u><u></u></li><li class="MsoNormal">
<code><span style="font-size:10pt">randomIO</span></code> and <code><span style="font-size:10pt">randomRIO</span></code> were extracted from the
<code><span style="font-size:10pt">Random</span></code> class into separate functions<u></u><u></u></li></ul>
<p class="MsoNormal">In addition, there may be import clashes with new functions, e.g.
<code><span style="font-size:10pt">uniform</span></code> and <code><span style="font-size:10pt">uniformR</span></code>.<u></u><u></u></p>
<p class="MsoNormal">Further explanatory details may be found
<a href="https://github.com/idontgetoutmuch/random/blob/v1.2-release-notes/RELEASE-NOTES-v1.2.md#api-changes" target="_blank">
here</a> and the PR for the proposed new version is <a href="https://github.com/haskell/random/pull/61" target="_blank">
here</a>.<u></u><u></u></p>
<p class="MsoNormal">Here are some benchmarks run on a 3.1 GHz Intel Core i7. The full benchmarks can be run using e.g.
<code><span style="font-size:10pt">stack bench</span></code>. The benchmarks are measured in milliseconds per 100,000 generations. In some cases, the performance is over x1000(!) times better; the minimum performance increase for the types listed below is
 more than x35.<u></u><u></u></p>
<pre><code>| Name                    | Mean (1.1) | Mean (1.2) | Improvement|<u></u><u></u></code></pre>
<pre><code>| ----------------------- | ---------- | ---------- | ---------- |<u></u><u></u></code></pre>
<pre><code>| pure/random/Float       |         30 |       0.03 |        1038|<u></u><u></u></code></pre>
<pre><code>| pure/random/Double      |         52 |       0.03 |        1672|<u></u><u></u></code></pre>
<pre><code>| pure/random/Integer     |         43 |       0.33 |         131|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Word8      |         14 |       0.03 |         422|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Word16     |         13 |       0.03 |         375|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Word32     |         21 |       0.03 |         594|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Word64     |         42 |       0.03 |        1283|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Word       |         44 |       0.03 |        1491|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Int8       |         15 |       0.03 |         511|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Int16      |         15 |       0.03 |         507|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Int32      |         22 |       0.03 |         749|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Int64      |         44 |       0.03 |        1405|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Int        |         43 |       0.03 |        1512|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Char       |         17 |       0.49 |          35|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/Bool       |         18 |       0.03 |         618|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CChar      |         14 |       0.03 |         485|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CSChar     |         14 |       0.03 |         455|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CUChar     |         13 |       0.03 |         448|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CShort     |         14 |       0.03 |         473|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CUShort    |         13 |       0.03 |         457|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CInt       |         21 |       0.03 |         737|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CUInt      |         21 |       0.03 |         742|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CLong      |         43 |       0.03 |        1544|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CULong     |         42 |       0.03 |        1460|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CPtrdiff   |         43 |       0.03 |        1494|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CSize      |         43 |       0.03 |        1475|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CWchar     |         22 |       0.03 |         785|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CSigAtomic |         21 |       0.03 |         749|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CLLong     |         43 |       0.03 |        1554|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CULLong    |         42 |       0.03 |        1505|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CIntPtr    |         43 |       0.03 |        1476|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CUIntPtr   |         42 |       0.03 |        1463|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CIntMax    |         43 |       0.03 |        1535|<u></u><u></u></code></pre>
<pre><code>| pure/uniform/CUIntMax   |         42 |       0.03 |        1493|<u></u><u></u></code></pre>
<p class="MsoNormal" style="margin-bottom:12pt"><u></u> <u></u></p>
<div>
<div>
<div>
<p class="MsoNormal"><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black">Dominic Steinitz<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black"><a href="mailto:dominic@steinitz.org" target="_blank">dominic@steinitz.org</a><u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black"><a href="http://idontgetoutmuch.org" target="_blank">http://idontgetoutmuch.org</a><u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black">Twitter: @idontgetoutmuch<u></u><u></u></span></p>
</div>
<div>
<p class="MsoNormal"><span style="font-size:9pt;font-family:Helvetica,sans-serif;color:black"><u></u> <u></u></span></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
</div>
</div>

_______________________________________________<br>
Libraries mailing list<br>
<a href="mailto:Libraries@haskell.org" target="_blank">Libraries@haskell.org</a><br>
<a href="http://mail.haskell.org/cgi-bin/mailman/listinfo/libraries" rel="noreferrer" target="_blank">http://mail.haskell.org/cgi-bin/mailman/listinfo/libraries</a><br>
</blockquote></div>
_______________________________________________<br>
Libraries mailing list<br>
<a href="mailto:Libraries@haskell.org" target="_blank">Libraries@haskell.org</a><br>
<a href="http://mail.haskell.org/cgi-bin/mailman/listinfo/libraries" rel="noreferrer" target="_blank">http://mail.haskell.org/cgi-bin/mailman/listinfo/libraries</a><br>
</blockquote></div></div>