2024/02/18 更新

写真a

ホリウチ ユウスケ
堀内 侑祐
所属
理工学術院 基幹理工学部
職名
助手
 

共同研究・競争的資金等の研究課題

  • 任意の画像処理・生成・認識に応用可能な微分可能領域分割モジュールの開発

    日本学術振興会  科学研究費助成事業

    研究期間:

    2021年08月
    -
    2023年03月
     

    堀内 侑祐

     概要を見る

    本研究の目的は、画像処理において畳み込みニューラルネット(CNN)が不得意なタスクについてその原因を明らかにし、これを改善するための手法を開発することである。本年度の研究期間においては、 CNN で解くことが困難な問題を設定し検証をすることを目標としていた。
    本年度は CNN で解くことが困難であるがアルゴリズムでは解くことが容易な問題を生成するプログラムを開発した。また、既存のニューラルネット構造でこの問題と正解を学習させることでは、この問題が解けないことを実験的に示した。この結果は、より多くのデータをより大きなニューラルネットで学習させることで性能が向上するという現在の常識には限界があることを示す有意義な根拠となる。
    また、既存のニューラルネットの学習の枠組みの中でこの問題を解く能力を得るための新しい手法を開発中である。既存ニューラルネットで解くことが困難な問題の例として閉領域塗り分け(Flood Fill)がある。閉領域塗り分けは注目画素とその周辺画素の状態によって画像内の画素を探索し、領域を同定することで実現できる。現時点では、GPU上で高速に動作する塗り分けアルゴリズムや領域内外との距離を計算するアルゴリズムをもつライブラリを開発し、既存のディープラーニングフレームワーク上で動作するように実装した。また、これらのアルゴリズムに対して勾配を逆伝播する手法を開発中である。開発中の手法では、非常に簡単な状況では学習が動作することが実験的に示されているが、状況によっては学習が不安定になり有意な改善がされない。そのため、手法の変更と実験・評価を繰り返し、より安定的に動作する手法を探索中である。動作の安定化が実現できれば、画像内の探索が必要な複雑な画像処理をニューラルネットによって解くことが可能となり、実際の画像編集作業において実用的な AI を実現できる。