・最終手の評価値が逆になるバグを修正
このアプリでは、最先端の手法である深層強化学習により訓練されたCPUと対局・検討を行うことができます。DeepMind社が示したAlphaZeroと同様の学習手法によりパラメータを訓練しており、十分な探索を含めればトップソフトに比類する性能を誇ります。
またこのアプリで用いられるモデルでは評価値を分布として表示する機能が追加されており、評価値の安定度をひと目で把握することができます。評価値が確信を持って出されているのか、それとも多くの可能性がある中での値なのか、そういった情報はもしかすると人間の解釈において有用かもしれません。
パソコン向けのC++プログラムはGitHubで公開しています。
https://github.com/SakodaShintaro/Miacis