AlphaGo Zero: ゼロから始める - Plato Data Intelligence

これは、新しい形式の強化学習、AlphaGo Zeroが独自の教師になる。システムは、囲碁のゲームについて何も知らないニューラルネットワークから始まります。次に、このニューラルネットワークを強力な検索アルゴリズムと組み合わせることにより、それ自体に対してゲームをプレイします。プレイ中、ニューラルネットワークは、動きを予測し、最終的にゲームの勝者となるように調整および更新されます。

次に、この更新されたニューラルネットワークを検索アルゴリズムと組み合わせて、新しいより強力なバージョンのAlphaGo Zeroを作成し、プロセスを再び開始します。各反復で、システムのパフォーマンスが少し向上し、セルフプレイゲームの品質が向上します。その結果、ニューラルネットワークがますます正確になり、AlphaGo Zeroのバージョンがさらに強力になります。

この手法は、人間の知識の制限による制約を受けなくなったため、AlphaGoの以前のバージョンよりも強力です。代わりに、世界最強のプレイヤーであるAlphaGo自体から表ラサを学ぶことができます。

また、他の注目すべき点で以前のバージョンとは異なります。

AlphaGoゼロは、入力としてGoボードからの黒と白の石のみを使用しますが、以前のバージョンのAlphaGoには、少数のハンドエンジニアリング機能が含まれていました。
XNUMXつではなくXNUMXつのニューラルネットワークを使用します。 AlphaGoの以前のバージョンでは、「ポリシーネットワーク」を使用して次にプレイする動きを選択し、「バリューネットワーク」を使用して各ポジションからゲームの勝者を予測していました。これらはAlphaGo Zeroで組み合わされており、トレーニングと評価をより効率的に行うことができます。
AlphaGo Zeroは「ロールアウト」を使用しません。これは、他のGoプログラムが現在のボード位置から勝つプレイヤーを予測するために使用される高速でランダムなゲームです。代わりに、高品質のニューラルネットワークを使用して位置を評価します。

これらの違いはすべて、システムのパフォーマンスを向上させ、より一般的なものにするのに役立ちます。しかし、システムをはるかに強力かつ効率的にするのは、アルゴリズムの変更です。

出典：https://deepmind.com/blog/article/alphago-zero-starting-scratch

プラトンデータインテリジェンス。
バーティカルサーチ＆アイ。

AlphaGo Zero：ゼロから始める

Anito Legends が Apple App Store で正式に利用可能になり、アクセシビリティが拡大 |ビットピナス

Creation Business Consultants、香港に新オフィスを開設し存在感を拡大

最新のインテリジェンス

RCO Finance、AI活用取引への成長を加速するため最新の資金調達ラウンドで250万ドルを確保 – CryptoInfoNet

日本と米国の仮想通貨規制の違いをXRP支持の弁護士が強調 – CryptoInfoNet

リップルCEOガーリングハウス氏、仮想通貨との戦いで長期的にはSECが負けると予測

司法省、仮想通貨取引所バイナンスを3年間監視する役割を担うコンサルティング会社を任命：レポート – The Daily Hodl

リップルのXRPアーキテクト、デビッド・シュワルツ氏が40,000万ETHのICO購入と逃した財産について語る

サトシ再登場？ 60年間休眠状態だったウォレットが復活し、XNUMX万ドル以上のBTCが放出される

私たちとチャット

プラトンデータインテリジェンス。バーティカルサーチ＆アイ。

AlphaGo Zero：ゼロから始める

最新のインテリジェンス

私たちとチャット

プラトンデータインテリジェンス。
バーティカルサーチ＆アイ。