A* アルゴリズムは、「グラフ上でスタートからゴールまでの道を見つける」というグラフ探索問題において、ヒューリスティック関数 h(n) という探索の道標となる関数を用いて探索を行うアルゴリズムである。hは各頂点nからゴールまでの距離のある妥当な推定値を返す関数で、解くグラフ探索問題の種類に応じてさまざまなhを設計することが出来る。

A* - Wikipedia

グラフ探索って何よ？

qiita.com

⇧ 上記サイト様が説明してくれています。

カーナビです。つまり、まず、今居る所「スタート」と、目的地「ゴール」があります。通ることの出来る「道路」があって、その途中に沢山「交差点」があります。あなたは一番短い時間、距離でゴールにたどり着きたいと思っています。グラフ探索問題とは、与えられた地図上で、スタートとゴールがあるときに、ゴールまでの最短の行き方を調べるための問題です。

グラフ探索ことはじめ - 幅・深さ優先探索 - - Qiita

そういうことらしく、

例えば、カーナビなどで用いられる単純な二次元の地図での探索では、hとしてユークリッド距離 ${\sqrt {x^{2}+y^{2}}}$ を使うことができ、この値は道に沿った実際の距離のおおまかな予測になっている。

A* - Wikipedia

⇧ この最適なhを見つけることが重要であると。

A* アルゴリズムは、ダイクストラ法を推定値付きの場合に一般化したもので、h が恒等的に0である場合はもとのダイクストラ法に一致する。

A* - Wikipedia

⇧ 限りなく0に近づけば近づくほど理想的ということですかね？（<= そういうわけではないようです。）

A*の探索効率はhの正確さに左右される。もしもhがまったくでたらめな値を返すならば、探索はゴールとはあさっての方向に進んでしまい、現実的な時間内 --- 一時間、一週間、一年 --- では解を発見できない場合がある。

A* - Wikipedia

⇧ さらっと怖いこと言ってますね...。

しかし、いくらおかしな方向に探索が進んだとしても、いつかは必ず解を発見できる保証がある(完全性)。

A* - Wikipedia

⇧ いや、いつかって全然保証になってないですね....。

一方、hが常に正しい値h*を返す場合、計算機は「迷うこと無く=分岐をすること無く」グラフ上の最短経路を発見することができる。そのようなhのことを、パーフェクト・ヒューリスティクスとよぶ。

A* - Wikipedia

⇧ パーフェクト・ヒューリスティック！

現実に用いられる有用なhは、これらの中間の位置にある。A*の性質はhの性質によって大きく左右される。関数h(n) は常に非負でなくてはならない。

A* - Wikipedia

⇧ 現実の厳しさ...。要するに、h(n)>=0 が絶対条件ということらしいっすね。

ヒューリスティック探索って?

どうやら、A* == ヒューリスティック探索ってことみたいですかね。

A*は「ヒューリスティック探索」とか「発見的探索」と呼ばれます。この名前が悪くて、おかげで、酷い誤解を受けています。例えばあるスライドでは、A*は「近そうなところから探索」と書かれています。なんか適当に探索するかのような印象ですね。A*は、ダイクストラ法を拡張し、 理論的裏付けを持った下界を用いてグラフを探索するための手法 です。

A* (1968) - Qiita

qiita.com

⇧ 上記サイト様が詳しいです。

探索するグラフによって最適なh（ヒューリスティック）を見つけて行きましょう、ヒューリスティックを探索していきましょうってことで、ヒューリスティック探索ってことですかね？

もしくは、理想的なヒューリスティックを使って探索するということで、ヒューリスティック探索ですかね？

つまりは、まずは、問題となるグラフありきということになりますかね。

ヒューリスティック探索で15パズル

せっかくなんで、15パズルというものをJavaで実装してみたいと思います。

その前に、15パズルって何ぞ？

15パズルは、スライディングブロックパズル（Sliding puzzle）のひとつである。4×4のボードの上に4×4-1すなわち15枚の駒があり、1駒ぶんの空きを利用して駒をスライドし、駒を目的の配置にする。3×3のボード上で8枚の駒で同様に遊ぶものは8パズルと呼ばれる。m×nのボードとm×n-1個の駒（m, n ≧ 2）に一般化できる。右下の隅または左上の隅を空きとした配置を最終目標とするものが多い。

15パズル - Wikipedia

⇧ Wikipedia 様の見解。

n×nパズルにおいて、最短手数を求める問題はNP困難である。最短手数の定数倍の変形を求める多項式時間アルゴリズムが提案されている。

8パズルは任意の可能な配置へ31手以内で変形でき、31手が必要な配置は確認されている。15パズルは任意の可能な配置へ80手以内で変形でき、80手が必要な配置は確認されている。

簡単なソルバーをプログラミングする場合、評価関数を各駒の目的の位置までのマンハッタン距離の和とするのが手頃である。

15パズル - Wikipedia

Wikipediaさんによりますと、「数字を渦巻き」状にするような問題だと、

f:id:ts0818:20190608181439p:plain

⇧ のようになるようなアルゴリズムを考えないといけないらしい...

そんでは、Java で15パズル問題にトライ。今回は、Paiza 様の問題。

15パズルとは、1～15の数字が書かれたタイルを4x4の合計16マスからなる枠の中でスライドさせ、並び替えるゲームです。タイルのない空マスの四方に隣接するタイルを空マスへ移動することでゲームを進行します。
例えば、次の図のようにゲームを進行することができます。

f:id:ts0818:20190608181718p:plain

タイルをスライドさせ、盤面を完成させるプログラムを作成してください。ただし、最短の手数でパズルを完成させる必要はなく、盤面を完成させることができるならば、どのような順番でタイルをスライドしても構いません。

Rena and Minami International Programming Competition |Paiza Online Hackathon 5

⇧ 「右から来たものを左へ受け流すの歌」じゃないけども、左から右へ受け流す～、という思いで、左から順々に並べていくアルゴリズムですかね。

fantom1x.blog130.fc2.com

paiza.hatenablog.com

qiita.com

⇧ Paiza の記事で紹介されていたQiitaの「@uwi@github」さんの記事。

Pattern Database
IDA* -- Iterative Deepening A* -- 反復深化A *
両側探索
Greedy algorithm -- 貪欲法
ビームサーチ
- 幅優先ビームサーチ
- 最良優先ビームサーチ

など、正直、聞いたこともないレベルの高い話に、付いていけないっす...っていうか、この人、専門的に研究されてたような人なんでしょうね...

なんとなくですが、「Pattern Database」とそれぞれの『探索法』を組みわせるというイメージですかね？

「Pattern Database」については、

www.semanticscholar.org

The efficiency of A* searching depends on the quality of the lower bound estimates of the solution cost. Pattern databases enumerate all possible subgoals required by any solution, subject to constraints on the subgoal size. Each subgoal in the database provides a tight lower bound on the cost of achieving it. For a given state in the search space, all possible subgoals are looked up in the pattern database, with the maximum cost over all lookups being the lower bound. For sliding tile puzzles, the database enumerates all possible patterns containing N tiles and, for each one, contains a lower bound on the distance to correctly move all N tiles into their correct final location. For the 15-Puzzle, iterative-deepening A* with pattern databases (N=8) reduces the total number of nodes searched on a standard problem set of 100 positions by over 1000-fold.

Pattern Databases - Semantic Scholar

⇧ 上記サイト様が詳しいです...pattern database の使用で、探索の効率がむっちゃ上がるらしい、よく分からんけど。

「IDA*」については、

qiita.com

そこでIDA*の出番です。(IDDFSはIDA*の h=0h=0 版です。) IDA*は、答えとなる経路の深さdd, ノードの子の数の平均値bb (branching factor) に対して、最悪でO(bd)O(bd)のメモリしか用いません。

一方、A*(およびDijkstra)は最悪でO(bd)O(bd)、すなわち指数的に大きなメモリ量を要する可能性があります。 IDA* は、用いるヒューリスティクスがconsistentであれば常に最適解を返します。

Rubik's Cube, 15/24-Puzzleなど有名なパズル問題に用いられるパターンデータベース(PDB)ヒューリスティクスは、計算が早くかつconsistentなので、よくIDA*と共につかわれます。

IDA*を一言で表すと、「最大深さを制限した深さ優先探索(DFS)を、深さを増やしながら繰り返す」です。

それぞれのイテレーションでは、最大深さの限界値はグローバル変数として設定しておき、その深さ以上には探索しません。

ここで、「深さ」は正しくはf値です。仮にh=0,f=gh=0,f=gとすると、f値は深さと同義になり、このアルゴリズムはIDDFSと呼ばれます。

IDA* -- Iterative Deepening A* - Qiita

⇧ 上記サイト様が詳しいです。