2025/09/21 更新

写真a

タナカ ケイタロウ
田中 啓太郎
所属
理工学術院 理工学術院総合研究所
職名
次席研究員(研究院講師)
学位
博士(工学) ( 2025年03月 早稲田大学 )

経歴

  • 2025年04月
    -
    継続中

    早稲田大学理工学術院総合研究所   次席研究員

  • 2022年04月
    -
    2025年03月

    独立行政法人日本学術振興会   特別研究員(DC1)

学歴

  • 2022年04月
    -
    2025年03月

    早稲田大学   大学院先進理工学研究科   物理学及応用物理学専攻  

    博士後期課程

  • 2020年04月
    -
    2022年03月

    早稲田大学   大学院先進理工学研究科   物理学及応用物理学専攻  

    修士課程

  • 2016年04月
    -
    2020年03月

    早稲田大学   先進理工学部   物理学科  

委員歴

  • 2025年04月
    -
    継続中

    情報処理学会  音楽情報科学研究会 SIGMUS 運営委員

所属学協会

  •  
     
     

    ISCA

  •  
     
     

    APSIPA

  •  
     
     

    情報処理学会

  •  
     
     

    IEEE

研究分野

  • 知覚情報処理

研究キーワード

  • 視聴覚マルチモーダル

  • 深層学習

  • 音楽情報処理

受賞

  • 2025年度山下記念研究賞(内定)

    2025年09月   情報処理学会  

    受賞者: 田中 啓太郎

  • 学生優秀賞

    2025年08月   画像の認識・理解シンポジウム (MIRU)  

    受賞者: 佐々木 馨, 佐藤 和仁, 山口 周悟, 田中 啓太郎, 森島 繁生

  • オーディエンス賞

    2025年08月   画像の認識・理解シンポジウム (MIRU)  

    受賞者: 佐々木 馨, 佐藤 和仁, 山口 周悟, 田中 啓太郎, 森島 繁生

  • ACM Student Research Competition Semi-Finalist

    2025年06月   SIGGRAPH  

    受賞者: Kaoru Sasaki, Kazuhito Sato, Shugo Yamaguchi, Keitaro Tanaka, Shigeo Morishima

  • 小野梓記念学術賞

    2025年03月   早稲田大学  

    受賞者: 吉永 朋矢, 田中 啓太郎, 坂東 宜昭, 井本 桂右, 森島 繁生

  • 音楽情報科学研究会 2024年度 COCOTONE賞

    2025年03月   情報処理学会  

  • 2024年秋季研究発表会 学生優秀発表賞

    2024年12月   日本音響学会  

  • 電気音響研究会 学生研究奨励賞

    2024年11月   日本音響学会  

  • コンピュータグラフィックスとビジュアル情報学 (CGVI) 研究会 学生発表賞

    2024年09月   情報処理学会  

  • VC学生研究賞

    2024年09月   Visual Computing  

  • 第141回音楽情報科学研究会 夏のシンポジウム ベストプレゼンテーション賞 (Best Research 部門)

    2024年08月   情報処理学会  

  • Best Student Paper Contest Finalist

    2023年08月   European Signal Processing Conference (EUSIPCO)  

  • 第85回全国大会 学生奨励賞

    2023年03月   情報処理学会  

    受賞者: 神庭 有花, 田中 啓太郎, 平田 明日香, 森島 繁生

  • 第85回全国大会 学生奨励賞

    2023年03月   情報処理学会  

    受賞者: 柏木 爽良, 田中 啓太郎, 森島 繁生

  • 物理応物修士論文賞(宮部賞)

    2022年03月   早稲田大学  

  • Japan Student Conference Paper Award

    2021年12月   IEEE Signal Processing Society (SPS)  

  • 小野梓記念学術賞

    2021年03月   早稲田大学  

  • 第83回全国大会 学生奨励賞

    2021年03月   情報処理学会  

  • 第128回音楽情報科学研究会 夏のシンポジウム ベストプレゼンテーション賞

    2020年08月   情報処理学会  

  • 第82回全国大会 大会奨励賞

    2020年05月   情報処理学会  

  • 第82回全国大会 学生奨励賞

    2020年03月   情報処理学会  

▼全件表示

 

論文

  • ビット操作に基づく学習不要かつ高セキュリティな3D Gaussian Splattingステガノグラフィ

    佐々木 馨, 佐藤 和仁, 山口 周悟, 田中 啓太郎, 森島 繁生

    Visual Computing (VC)    2025年09月  [査読有り]

  • Training Onset-and-Offset Aware Sound Event Detection on a Heterogeneous Dataset via Probabilistic Sequential Modeling

    Tomoya Yoshinaga, Yoshiaki Bando, Keitaro Tanaka, Keisuke Imoto, Masaki Onishi, Shigeo Morishima

    Annual Conference of the International Speech Communication Association (Interspeech)    2025年08月  [査読有り]

  • Cross-lingual Data Selection Using Clip-level Acoustic Similarity for Enhancing Low-resource Automatic Speech Recognition

    Shunsuke Mitsumori, Sara Kashiwagi, Keitaro Tanaka, Shigeo Morishima

    Annual Conference of the International Speech Communication Association (Interspeech)    2025年08月  [査読有り]

  • Hide A Bit: A Training-Free and High-Fidelity Steganography Method for 3D Gaussian Splatting Based on Bit Manipulation and RSA Encryption

    Kaoru Sasaki, Kazuhito Sato, Shugo Yamaguchi, Keitaro Tanaka, Shigeo Morishima

    ACM International Conference and Exhibition on Computer Graphics and Interactive Techniques (SIGGRAPH) Posters   70   1 - 2  2025年08月  [査読有り]

  • 数式ドリブン事前学習に基づくロボットの方策学習の検証

    岩片 彰吾, 元田 智大, 山田 亮佑, 牧原 昂志, 中條 亨一, 田中 啓太郎, 片岡 裕雄, 森島 繁生

    画像の認識・理解シンポジウム (MIRU) ポスター発表    2025年08月

  • Hide A Bit: 3D Gaussian Splattingに対するビット操作とRSA暗号に基づく学習不要な高品質ステガノグラフィ

    佐々木 馨, 佐藤 和仁, 山口 周悟, 田中 啓太郎, 森島 繁生

    画像の認識・理解シンポジウム (MIRU) 口頭発表    2025年07月  [査読有り]

  • 口パク動画の発話内容推測モデルの学習における効率的な他言語データ活用に向けて

    三森 俊祐, 柏木 紗良, 田中 啓太郎, 森島 繁生

    画像の認識・理解シンポジウム (MIRU) ポスター発表    2025年07月

  • AcousticPerformer: 再構成音を用いた双ドメイン損失による楽器演奏モーション生成

    西澤 大樹, Seong Jong Yoo, 田中 啓太郎, 山口 周悟, 馮 起, 森島 繁生

    画像の認識・理解シンポジウム (MIRU) ポスター発表    2025年07月

  • Formula-Supervised Sound Event Detection: Pre-Training Without Real Data

    Yuto Shibata, Keitaro Tanaka, Yoshiaki Bando, Keisuke Imoto, Hirokatsu Kataoka, Yoshimitsu Aoki

    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)     1 - 5  2025年04月  [査読有り]

  • SyncViolinist: Music-Oriented Violin Motion Generation Based on Bowing and Fingering

    Hiroki Nishizawa, Keitaro Tanaka, Asuka Hirata, Shugo Yamaguchi, Qi Feng, Masatoshi Hamanaka, Shigeo Morishima

    情報処理学会 第142回音楽情報科学研究会 国際既発表セッション   25 ( 2 )  2025年03月

  • 低リソース言語の自動音声認識における他言語データの効率的利用

    三森 俊祐, 柏木 爽良, 田中 啓太郎, 森島 繁生

    情報処理学会 第87回全国大会    2025年03月

  • 音響イベント検出のための隠れセミマルコフモデルに基づくユニバーサル・イベント単位学習

    吉永 朋矢, 田中 啓太郎, 坂東 宜昭, 井本 桂右, 大西 正輝, 森島 繁生

    情報処理学会 第87回全国大会    2025年03月

  • SyncViolinist: Music-Oriented Violin Motion Generation Based on Bowing and Fingering

    Hiroki Nishizawa, Keitaro Tanaka, Asuka Hirata, Shugo Yamaguchi, Qi Feng, Masatoshi Hamanaka, Shigeo Morishima

    IEEE/CVF Winter Conference on Applications of Computer Vision (WACV)     5419 - 5428  2025年03月  [査読有り]

  • Unsupervised Pitch-Timbre-Variation Disentanglement of Monophonic Music Signals Based on Random Perturbation and Re-entry Training

    Keitaro Tanaka, Kazuyoshi Yoshii, Simon Dixon, Shigeo Morishima

    APSIPA Transactions on Signal and Information Processing   14 ( 1 )  2025年02月  [査読有り]

  • Capturing Dynamic Identity Features for Speaker-Adaptive Visual Speech Recognition

    Sara Kashiwagi, Keitaro Tanaka, Shigeo Morishima

    Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)     1 - 6  2024年12月  [査読有り]

  • 汎用事前学習済みモデルを用いた音響イベント検出のためのHSMMに基づくイベント単位学習

    吉永 朋矢, 田中 啓太郎, 坂東 宜昭, 井本 桂右, 大西 正輝, 森島 繁生

    日本音響学会 応用/電気音響(EA)研究会    2024年11月

  • Onset-and-Offset-Aware Sound Event Detection via Differentiable Frame-to-Event Mapping

    Tomoya Yoshinaga, Keitaro Tanaka, Yoshiaki Bando, Keisuke Imoto, Shigeo Morishima

    IEEE Signal Processing Letters   32   186 - 190  2024年11月  [査読有り]

  • 音源信号の数式ドリブン合成に基づく音響イベント検出の事前学習

    柴田 優斗, 田中 啓太郎, 坂東 宜昭, 井本 桂右, 片岡 裕雄, 青木 義満

    日本音響学会 第152回 (2024年秋季) 研究発表会    2024年09月

  • 音響イベント検出のための隠れセミマルコフモデルに基づくイベント単位損失

    吉永 朋矢, 坂東 宜昭, 田中 啓太郎, 井本 桂右, 大西 正輝, 森島 繁生

    日本音響学会 第152回 (2024年秋季) 研究発表会    2024年09月

  • 話者固有の発話特性に着目したマルチタスク学習に基づく読唇精度向上手法

    柏木 爽良, 田中 啓太郎, 森島 繁生

    Visual Computing (VC) Long Track   42  2024年09月  [査読有り]

  • 変分オートエンコーダを用いた単旋律音楽信号の音高・音色・変動への分解

    田中 啓太郎, 吉井 和佳, Simon Dixon, 森島 繁生

    情報処理学会 第141回音楽情報科学研究会    2024年08月

  • Keep Eyes on the Sentence: An Interactive Sentence Simplification System for English Learners Based on Eye Tracking and Large Language Models

    Taichi Higasa, Keitaro Tanaka, Qi Feng, Shigeo Morishima

    ACM CHI Conference on Human Factors in Computing Systems Late-Breaking Work   211   1 - 7  2024年05月  [査読有り]

  • On the Use of Synthesized Datasets and Transformer Adaptors for Musical Instrument Recognition

    Keitaro Tanaka, Yin-Jyun Luo, Kin Wai Cheuk, Kazuyoshi Yoshii, Shigeo Morishima, Simon Dixon

    International Society for Music Information Retrieval (ISMIR) Late-Breaking Demo    2023年11月  [査読有り]

  • Gaze-Driven Sentence Simplification for Language Learners: Enhancing Comprehension and Readability

    Taichi Higasa, Keitaro Tanaka, Qi Feng, Shigeo Morishima

    ACM International Conference on Multimodal Interaction (ICMI) workshops, Multimodal, Interactive Interfaces for Education     292 - 296  2023年10月  [査読有り]

  • Detecting Unknown Multiword Expressions in Natural English Reading via Eye Gaze

    Taichi Higasa, Asuka Hirata, Keitaro Tanaka, Qi Feng, Shigeo Morishima

    Visual Computing (VC) Short Track   38  2023年09月  [査読有り]

  • Audio-Visual Speech Enhancement With Preserving Specific Off-Screen Speech

    Tomoya Yoshinaga, Keitaro Tanaka, Shigeo Morishima

    Visual Computing (VC) Short Track   39  2023年09月  [査読有り]

  • 通常発声と無音発声の動画を用いた発話内容推測における距離学習に基づく精度差改善手法

    柏木 爽良, 田中 啓太郎, 森島 繁生

    Visual Computing (VC) Long Track   37  2023年09月  [査読有り]

  • Audio-Visual Speech Enhancement With Selective Off-Screen Speech Extraction

    Tomoya Yoshinaga, Keitaro Tanaka, Shigeo Morishima

    European Signal Processing Conference (EUSIPCO)     595 - 599  2023年09月  [査読有り]

  • Improving the Gap in Visual Speech Recognition Between Normal and Silent Speech Based on Metric Learning

    Sara Kashiwagi, Keitaro Tanaka, Qi Feng, Shigeo Morishima

    Annual Conference of the International Speech Communication Association (Interspeech)     3397 - 3401  2023年08月  [査読有り]

  • パッチ分割による拡散確率モデルのメモリ消費量削減の検討

    荒川 深映, 綱島 秀樹, 堀田 大地, 田中 啓太郎, 森島 繁生

    画像の認識・理解シンポジウム (MIRU) ポスター発表    2023年07月  [査読有り]

  • Memory Efficient Diffusion Probabilistic Models via Patch-based Generation

    Shinei Arakawa, Hideki Tsunashima, Daichi Horita, Keitaro Tanaka, Shigeo Morishima

    IEEE/CVF Computer Vision and Pattern Recognition Conference (CVPR) workshops, Generative Models for Computer Vision   9  2023年06月  [査読有り]

  • 口パク動画の発話内容推測における距離学習に基づく精度向上手法

    柏木 爽良, 田中 啓太郎, 森島 繁生

    情報処理学会 第85回全国大会    2023年03月

  • 覚醒度と感情価に基づく音楽による画像スタイル変換

    神庭 有花, 田中 啓太郎, 平田 明日香, 森島 繁生

    情報処理学会 第85回全国大会    2023年03月

  • 動画内話者の音声強調における特定背景音声の透過

    吉永 朋矢, 田中 啓太郎, 森島 繁生

    情報処理学会 第85回全国大会    2023年03月

  • 視線情報と比喩度に基づく英語フレーズの理解度推定

    樋笠 泰祐, 平田 明日香, 田中 啓太郎, 森島 繁生

    インタラクティブシステムとソフトウェアに関するワークショップ (WISS)    2022年12月

  • 口パク動画の発話内容推測における距離学習に基づく精度向上手法の検討

    柏木 爽良, 田中 啓太郎, 森島 繁生

    ビジュアルコンピューティングワークショップ (VCWS)   2  2022年11月

  • 入力動画に対する動画内話者と特定背景話者の同時音声抽出

    吉永 朋矢, 田中 啓太郎, 森島 繁生

    ビジュアルコンピューティングワークショップ (VCWS)   3  2022年11月

  • Unsupervised Disentanglement of Timbral, Pitch, and Variation Features From Musical Instrument Sounds With Random Perturbation

    Keitaro Tanaka, Yoshiaki Bando, Kazuyoshi Yoshii, Shigeo Morishima

    Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)     709 - 716  2022年11月  [査読有り]

  • Patch-based Memory Efficient Diffusion Probabilistic Models

    Shinei Arakawa, Hideki Tsunashima, Daichi Horita, Keitaro Tanaka, Shigeo Morishima

    Visual Computing (VC) Posters   10  2022年10月

  • 運指と運弓を反映した音響信号からのヴァイオリン演奏アニメーションの自動生成

    平田 明日香, 田中 啓太郎, 浜中 雅俊, 森島 繁生

    Visual Computing (VC) Short Track   28  2022年10月  [査読有り]

  • Audio-Driven Violin Performance Animation with Clear Fingering and Bowing

    Asuka Hirata, Keitaro Tanaka, Masatoshi Hamanaka, Shigeo Morishima

    ACM International Conference and Exhibition on Computer Graphics and Interactive Techniques (SIGGRAPH) Posters   7   1 - 2  2022年08月  [査読有り]

  • 視線情報を用いた英語フレーズの理解度推定

    樋笠 泰祐, 平田 明日香, 田中 啓太郎, 森島 繁生

    情報処理学会 第84回全国大会     559 - 560  2022年03月

  • 弓遣いに基づく弦楽器演奏モーションの自動生成

    平田 明日香, 田中 啓太郎, 島村 僚, 森島 繁生

    Visual Computing (VC) Short Track   33  2021年09月  [査読有り]

  • Bowing-Net: Motion Generation for String Instruments Based on Bowing Information

    Asuka Hirata, Keitaro Tanaka, Ryo Shimamura, Shigeo Morishima

    ACM International Conference and Exhibition on Computer Graphics and Interactive Techniques (SIGGRAPH) Posters   40   1 - 2  2021年08月  [査読有り]

  • Manifold-Aware Deep Clustering: Maximizing Angles between Embedding Vectors Based on Regular Simplex

    Keitaro Tanaka, Ryosuke Sawata, Shusuke Takahashi

    Annual Conference of the International Speech Communication Association (Interspeech)     1134 - 1138  2021年08月  [査読有り]

  • 変分自己符号化器を用いた距離学習による楽器音の音高・音色分離表現

    田中 啓太郎, 錦見 亮, 坂東 宜昭, 吉井 和佳, 森島 繁生

    情報処理学会 第131回音楽情報科学研究会・第137回音声言語情報処理研究会共催研究会    2021年06月

  • Pitch-Timbre Disentanglement of Musical Instrument Sounds Based on VAE-Based Metric Learning

    Keitaro Tanaka, Ryo Nishikimi, Yoshiaki Bando, Kazuyoshi Yoshii, Shigeo Morishima

    IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP)     111 - 115  2021年06月  [査読有り]

  • 弓動作を反映した演奏モーションの自動生成

    平田 明日香, 田中 啓太郎, 島村 僚, 森島 繁生

    情報処理学会 第83回全国大会     263 - 264  2021年03月

  • 弓動作に着目した弦楽器演奏モーションの自動生成

    平田 明日香, 田中 啓太郎, 島村 僚, 森島 繁生

    Visual Computing (VC) Posters   42  2020年12月

  • Multi-Instrument Music Transcription Based on Deep Spherical Clustering of Spectrograms and Pitchgrams

    Keitaro Tanaka, Takayuki Nakatsuka, Ryo Nishikimi, Kazuyoshi Yoshii, Shigeo Morishima

    International Society for Music Information Retrieval (ISMIR)     327 - 334  2020年10月  [査読有り]

  • スペクトログラムとピッチグラムの深層クラスタリングに基づく複数楽器パート採譜

    田中 啓太郎, 中塚 貴之, 錦見 亮, 吉井 和佳, 森島 繁生

    情報処理学会 第128回音楽情報科学研究会    2020年08月

  • 深層クラスタリングを用いた任意楽器パートの自動採譜

    田中 啓太郎, 中塚 貴之, 錦見 亮, 吉井 和佳, 森島 繁生

    情報処理学会 第82回全国大会     365 - 366  2020年03月

▼全件表示

共同研究・競争的資金等の研究課題

  • 音の三要素に基づく生成過程を考慮した深層ベイズ自動採譜

    日本学術振興会  科学研究費助成事業

    研究期間:

    2022年04月
    -
    2025年03月
     

    田中 啓太郎

     概要を見る

    本研究では,音楽音響信号を構成する全ての楽器に対して各楽譜を推定する,多楽器自動採譜技術を扱う.本年度は主に,昨年度開発した奏法の違いを陽に考慮する三要素分離手法の発展に取り組んだ.従来モデルは単音の楽器音に対しては動作したが,時変音高を有する単旋律入力や歌声に対しては,所望の潜在特徴が他空間に漏洩してしまう問題があった.
    この問題を受け,従来モデルを構成モジュールとして保持しつつ,新たな確率的生成モデルを定式化した.具体的には,エンコーダとデコーダをそれぞれ2回使用する構造により,各潜在空間において不必要な情報が徐々に淘汰されていく訓練手法を提案した.これにより,多様な入力に対する潜在空間での分離精度を向上させることに成功した.
    加えて,楽器認識に焦点を当てた研究も行った.音楽情報処理分野において楽器認識タスクは主流な問題設定の一つである.しかしながら,限られたベンチマークデータセットでのみ精度が評価されており,特にデータ量の少ない他のデータセットに対しては,期待される認識精度が得られないという課題があった.そこで,人工的に作成されたデータセットの効率的な活用法を提案し,他のデータセットに対する認識精度を向上させることに成功した.
    さらに本年度は,派生技術の他ドメイン展開にも取り組んだ.三要素分離手法の前身である同質性に着目した距離学習は,話し方の違いに頑健な読唇術手法へ,三要素分離手法の根幹である時変時不変の性質に着目したモデル構造は,効率的かつ高精度な視聴覚音声強調手法へ,それぞれ応用に成功した.