20201008

FTR:冨田


DeepLabCutとTemporal Cycle-Consistencyによる行動分析に関する研究(B4:小嶋)

x1.0 x2.5

https://www.dropbox.com/sh/jwssdvk1yh586z0/AADzHuftXUJcYoVzgx0hnR9wa?dl=0

The demand for animal experiments has increased to test the effectiveness of medicine or the effect of modifying genes.

In my research, I propose a method to help analyzing videos from the experiments.

In this seminar, I’ll explain the progress.

 


最適方策が複数存在する環境に対応可能な敵対的逆強化学習(M1山下9

x1.0 x2.5

https://www.dropbox.com/sh/74bn3nfbgxdfbl4/AAD7GTVih2KLPbsBt-BRIkFda?dl=0

In inverse reinforcement learning, it is costly to prepare experts for slightly different imitation targets.

I consider introducing the Variational Discriminator Bottlenecks(VDB) concept into my current approach.

I will show the results of experiments path planning ploblem

・Evaluation of Discriminator output

・Effect of changing the number of neurons in the discriminator

 


Progressive Reinforcement Learning with Distillation for Multi-skilled Motion Control(M2夏)

x1.0 x2.5

https://www.dropbox.com/sh/404lj5deaejbevl/AAApfIopvEhzZF9OB8j3BHpna?dl=0

複数のタスクで学習したスキルを1つの方策に統合する手法を提案した。

強化学習の連続行動空間を有する問題における性能が向上している。長期間にわたって使用可能なアプリケーションを構築するためには,新しいスキルの学習を行い,それを既存の方策に統合する機構が必要である。提案手法では,方策の転移学習とマルチタスクの方策蒸留の組み合わせにより,断続的にスキルを学習し,過去に学習したすべてのスキルの統合を行う。

実験により提案手法が新しいスキルの高速な学習と過去のタスクを忘却せずにスキルの統合可能であることを示した。