FTR:冨田
x1.0 x2.5
https://www.dropbox.com/sh/jwssdvk1yh586z0/AADzHuftXUJcYoVzgx0hnR9wa?dl=0
The demand for animal experiments has increased to test the effectiveness of medicine or the effect of modifying genes.
In my research, I propose a method to help analyzing videos from the experiments.
In this seminar, I’ll explain the progress.
x1.0 x2.5
https://www.dropbox.com/sh/74bn3nfbgxdfbl4/AAD7GTVih2KLPbsBt-BRIkFda?dl=0
In inverse reinforcement learning, it is costly to prepare experts for slightly different imitation targets.
I consider introducing the Variational Discriminator Bottlenecks(VDB) concept into my current approach.
I will show the results of experiments path planning ploblem
・Evaluation of Discriminator output
・Effect of changing the number of neurons in the discriminator
x1.0 x2.5
https://www.dropbox.com/sh/404lj5deaejbevl/AAApfIopvEhzZF9OB8j3BHpna?dl=0
複数のタスクで学習したスキルを1つの方策に統合する手法を提案した。
強化学習の連続行動空間を有する問題における性能が向上している。長期間にわたって使用可能なアプリケーションを構築するためには,新しいスキルの学習を行い,それを既存の方策に統合する機構が必要である。提案手法では,方策の転移学習とマルチタスクの方策蒸留の組み合わせにより,断続的にスキルを学習し,過去に学習したすべてのスキルの統合を行う。
実験により提案手法が新しいスキルの高速な学習と過去のタスクを忘却せずにスキルの統合可能であることを示した。