Offline dengan aplikasi Player FM !
Julekalender luke 3: AI for kontinuerlig læring
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
156 episode
Manage episode 348729563 series 2497947
De fleste forsterkningslæringsalgoritmer er episodiske. Det betyr at de lærer ved å utføre en oppgave i et miljø som starter på nytt hver gang agenten feiler. Inntil nå. Bak denne luke skjuler det seg en helt annen måte å trene forsterkningslæring på.
Artikkel: Autonomous Reinforcement Learning: Formalism and Benchmarking (EARL),https://arxiv.org/abs/2112.09605
Prøv selv: https://architsharma97.github.io/earl_benchmark/overview.html
156 episode
Semua episode
×Selamat datang di Player FM!
Player FM memindai web untuk mencari podcast berkualitas tinggi untuk Anda nikmati saat ini. Ini adalah aplikasi podcast terbaik dan bekerja untuk Android, iPhone, dan web. Daftar untuk menyinkronkan langganan di seluruh perangkat.