Результаты (
русский) 1:
[копия]Скопировано!
Глубокое изучение дает усиливающее обучение (RL) способность к масштабу для задач принятия решений с высокими размерностью государственных и действиями пространств [59]. Deep RL в основном зависит от глубоких нейронных сетей для аппроксимации политики оптимальной [59]. Deep RL можно использовать представление обучения для решения проблемы проклятия размерности [59]. Например, он может использовать сверточные нейронные сети (CNNs), чтобы извлечь из высоких размерности исходных данных [59]. AlphaGo representsoneofthepromisingsuccessfordeepRL, whichdefeated чемпиона мира в Go. AlphaGo зависит от нейронных сетей, которые были обучены с помощью контролируемого обучения, RL и традиционный эвристический алгоритм поиска [59].
переводится, пожалуйста, подождите..
