京都大学大学院生命科学研究科の本田直樹准教授、情報学研究科の山口正一朗修士課程学生(現・株式会社Preferred Networks)、石井信 同教授らの研究グループは、動物の行動データから行動戦略を明らかにする機械学習法を考案するとともに、名古屋大学大学院理学研究科の森郁恵教授らとの共同研究でこの手法を線虫に応用して有用性を確認した。
京都大学によると、ヒトや動物は食べ物、お金など何らかの報酬を得るために、状況に応じた行動戦略を取っている。しかし、報酬には実態を伴わないものも含まれているため、自由に行動する動物を観察するだけでは、何を報酬として意思決定しているのかを知ることが難しかった。
そこで、研究グループは線虫の温度走性行動に注目した。線虫は一定温度でえさを十分に与えて成長すると、その成育温度を記憶し、温度にムラがある空間では成育温度に向かって移動する。逆に一定温度化でえさのない飢餓状態を経験しながら成長すると、成育温度から逃げようとする性質を持つ。
研究グループは計測された時系列データから未知の報酬を推定する機械学習法(逆強化学習法)を考案。線虫の行動時系列データを分析したところ、えさが十分にある状態で育った線虫は効率的に成育温度に向かうか、同じ温度の等高線に沿って移動する性質を持つことが分かった。
さらに、推定された報酬に基づき、線虫の行動をコンピューターでシミュレーションした結果、線虫の温度走性行動が再現された。研究グループはこの方法を使うことでこれまで解明できなかった動物の行動戦略研究が進むと期待している。