小川 哲司 (オガワ テツジ)

写真a

所属

理工学術院 基幹理工学部

職名

教授

ホームページ

https://sites.google.com/site/ogatetsu/

プロフィール

2000年早稲田大学理工学部電気電子情報工学科卒業.2002年同大学大学院修士課程修了.2005年同大学大学院博士後期課程終了.博士(工学).2004--2007年早稲田大学理工学術院助手.2007年早稲田大学IT研究機構講師.2007--2012年早稲田大学高等研究所助教.2012-2019年早稲田大学理工学術院准教授.現在,早稲田大学理工学術院教授.その間,2012年,2013年米国ジョンズホプキンス大学訪問研究者,2014年,2015年チェコ共和国ブルノ工科大学訪問研究者.2012--2015年エジプト・日本科学技術大学(E-JUST)特任准教授.2016年より産業技術総合研究所人工知能研究センター客員研究員.音声・音響情報処理,画像・映像情報処理,IoT,パターン認識に関する研究に従事.IEEE,電子情報通信学会,情報処理学会,日本音響学会,人工知能学会,日本機械学会,日本風力エネルギー学会,日本水産学会,日本畜産学会各会員.

兼担 【 表示 / 非表示

  • 理工学術院   大学院基幹理工学研究科

学内研究所等 【 表示 / 非表示

  • 2020年
    -
    2022年

    理工学術院総合研究所   兼任研究員

学歴 【 表示 / 非表示

  • 2002年04月
    -
    2005年03月

    早稲田大学大学院   理工学研究科   電気工学専攻  

  • 2000年04月
    -
    2002年03月

    早稲田大学大学院   理工学研究科   電気工学専攻  

  • 1996年04月
    -
    2000年03月

    早稲田大学   理工学部   電気電子情報工学科  

学位 【 表示 / 非表示

  • 早稲田大学   博士(工学)

経歴 【 表示 / 非表示

  • 2019年04月
    -
     

    早稲田大学理工学術院 教授

  • 2012年04月
    -
    2019年03月

    早稲田大学理工学術院 准教授

  • 2016年06月
    -
     

    産業技術総合研究所人工知能研究センター 客員研究員

  • 2016年06月
    -
     

    産業技術総合研究所人工知能研究センター 客員研究員

  • 2015年05月
    -
    2015年08月

    ブルノ工科大学 訪問研究者

全件表示 >>

所属学協会 【 表示 / 非表示

  •  
     
     

    日本水産学会

  •  
     
     

    日本畜産学会

  •  
     
     

    日本風力エネルギー学会

  •  
     
     

    日本機械学会

  •  
     
     

    日本音響学会

全件表示 >>

 

研究分野 【 表示 / 非表示

  • 知覚情報処理

研究キーワード 【 表示 / 非表示

  • 音声・音響情報処理、画像・映像情報処理、IoT、パターン認識、機械学習

論文 【 表示 / 非表示

  • Investigation on network architecture for single-channel end-to-end denoising

    Takuya Hasumi, Tetsunori Kobayashi, Tetsuji Ogawa

    Proc. The 2020 European Signal Processing Conference (EUSIPCO2020)    2021年01月  [査読有り]

  • Noise-robust attention learning for end-to-end speech recognition

    Yosuke Higuchi, Naohiro Tawara, Atsunori Ogawa, Tomoharu Iwata, Tetsunori Kobayashi, Tetsuji Ogawa

    Proc. The 2020 European Signal Processing Conference (EUSIPCO2020)    2021年01月  [査読有り]

  • Toward building a data-driven system for detecting mounting actions of black beef cattle

    Yuriko Kawano, Susumu Saito, Teppei Nakano, Ikumi Kondo, Ryota Yamazaki, Hiromi Kusaka, Minoru Sakaguchi, Tetsuji Ogawa

    Proc. 25th International Conference on Pattern Recognition (ICPR2020)    2021年01月  [査読有り]

  • Crowdsourced verification for operating calving surveillance systems at an early stage

    Yusuke Okimoto, Soshi Kawata, Susumu Saito, Nakano Teppei, Tetsuji Ogawa

    Proc. 25th International Conference on Pattern Recognition (ICPR2020)    2021年01月  [査読有り]

  • Feature Representation Learning for Calving Detection of Cows Using Video Frames

    Ryosuke Hyodo, Teppei Nakano, Tetsuji Ogawa

    Proc. 25th International Conference on Pattern Recognition (ICPR2020)    2021年01月  [査読有り]

全件表示 >>

書籍等出版物 【 表示 / 非表示

  • 人工知能学大辞典(話者認識・話者照合)

    人工知能学( 担当: 分担執筆)

    共立出版  2017年07月 ISBN: 9784320124202

  • 音響キーワードブック(話者ダイアライゼーション)

    日本音響学( 担当: 分担執筆)

    コロナ社  2016年03月 ISBN: 9784339008807

    ASIN

Misc 【 表示 / 非表示

  • i-vectorを用いた話者認識

    小川 哲司, 塩田 さやか

    日本音響学会誌   70 ( 6 ) 332 - 339  2014年06月

    DOI CiNii J-GLOBAL

産業財産権 【 表示 / 非表示

  • 学習装置、音声認識装置、学習方法、および、学習プログラム

    小川 哲司, 小林 哲則, 樋口 陽祐

    特許権

  • 照合装置、照合方法、および、照合プログラム

    小川 哲司

    特許権

  • 信号処理装置、信号処理プログラム、信号処理方法、及び収音装置

    小川 哲司, 俵 直弘

    特許権

  • 予兆検知システムおよびプログラム

    小川 哲司, 小林 哲則, 沖本 祐典

    特許権

  • 制御状態監視システムおよびプログラム

    小川 哲司, 小林 哲則

    特許権

全件表示 >>

受賞 【 表示 / 非表示

  • 早稲田大学ティーチングアワード総長賞

    2018年02月   早稲田大学  

  • APSIPA ASC2017 Poster Book Prizes

    2017年12月   APSIPA ASC2017  

  • 情報処理学会 山下記念研究賞

    2012年03月   情報処理学会  

  • 日本音響学会粟屋潔学術奨励賞

    2011年03月   日本音響学会  

  • BTAS2008 Best Paper Award

    2008年10月   BTAS2008  

共同研究・競争的資金等の研究課題 【 表示 / 非表示

  • 動画に対する深い意味的注釈の付与

    基盤研究(B)

    研究期間:

    2017年04月
    -
    2021年03月
     

  • 動画に対する深い意味的注釈の付与

    基盤研究(B)

    研究期間:

    2017年04月
    -
    2021年03月
     

  • 局所的海洋データを活用した漁業の効率化の研究開発

    研究期間:

    2017年04月
    -
    2020年03月
     

  • 人の発声機構を考慮した話者固有の情報の抽出と話者照合への応用に関する研究

    研究期間:

    2016年04月
    -
    2019年03月
     

     概要を見る

    話者性と音韻性は分離可能であると仮定し,音韻の影響を受けない話者表現を得るためのニューラルネットワークを構築することを試みた.その成果として,音響特徴量から音韻性と話者性をフレーム単位で分離・抽出するディスエンタングリング・ニューラルネットワークの構築に成功した.発話単位で表出する話者情報をフレーム単位の特徴量に反映させるために統計的プーリングを導入し,特に識別の直前にプーリングを行うことの重要性を明らかにした.さらに,分離・抽出された各特徴量が各々話者および音韻の情報のみを含むように特徴抽出器を最適化するために,識別器のエントロピーに基づく損失を新たに導入しその有効性を明らかにした.本研究成果は,発話内容の違いの影響による話者照合性能劣化に対する本質的な解法を与えるもので,音声によるバイオメトリクス認証などアプリケーションとしての期待は高いものの依然として実用のレベルに達していない,数秒程度の短い発話に対する話者照合の性能を抜本的に改善することを可能とする.また,本研究を通じて,これまでほとんど議論されてこなかった「真の話者性」を工学的に明らかにするための新たな研究領域の開拓が期待できる.これは話者認識研究における本質的な問いであり,当該研究分野において日本のプレゼンスを示す好機ともなる

全件表示 >>

講演・口頭発表等 【 表示 / 非表示

  • ユーザの意思決定過程に関するドメイン知識を組み込んだ解釈可能な映像監視モデリング

    兵頭亮介, 中野鐵兵, 小川哲司

    第23回情報論的学習理論ワークショップ (IBIS2020)   (茨城県・つくば市) 

    発表年月: 2020年11月

  • ドローン空撮画像を用いた潮目の検知に関する検討

    幸加木裕也, 小林哲則, 小川哲司

    日本水産学会春季大会   (東京都・品川区) 

    発表年月: 2020年03月

  • 人工知能技術の現状と課題~メンテナンスや一次産業支援に適用する際に注意すべきこと~

    小川哲司  [招待有り]

    IoTビジネス推進コンソーシアム沖縄第7回セミナー   (沖縄県・那覇市) 

    発表年月: 2019年10月

  • 画像情報による黒毛和牛種の乗駕行動の検知に関する検討

    川野百合子, 河田宗士, 沖本裕典, 中野鐵兵, 赤羽誠, 近藤育海, 山崎凌汰, 日下裕美, 坂口実, 小川哲司

    日本畜産学会 第126回大会   (岩手県・盛岡市) 

    発表年月: 2019年09月

  • センサデータの欠損が漁獲量予測性能に与える影響

    小川哲司, 堀内優佳, 小林哲則, 福嶋正義, 井戸上彰

    マリンITワークショップ2019   (北海道・函館市) 

    発表年月: 2019年08月

全件表示 >>

特定課題研究 【 表示 / 非表示

  • クラウドソーシングを活用した持続可能な状態監視システムの構築・運用法に関する研究

    2020年  

     概要を見る

    人の意思決定支援を目的とした映像監視システムは,1)少量データで構築可能,2)持続的に運用可能,3)予測結果の根拠を説明可能,であることが求められる.本研究では,ユーザ(専門家)の意思決定プロセスに係る知識をニューラルネットワークに組み込むことで,これらの要件を満たすシステムを構築・運用するためのフレームワークを確立することを試みた.提案フレームワークに基づき映像監視による繁殖牛の分娩予兆検知システムを構築し,少量データ・環境変動に対して頑健な予兆検知性能と畜産業従事者に対する予測根拠の解釈可能性の両面においてend-to-endアプローチで構築したシステムに対する有効性を明らかにした.

  • ドローンによる空撮に基づく潮目の検知に関する研究

    2020年  

     概要を見る

    ドローンによって撮影された海面映像から自動的に潮目を検知する技術の開発を試みた.ドローンによる潮目の検知が可能になれば,良漁場に関する情報を比較的低コストで漁業事業者に提供できるため,操業効率化への貢献が期待される.潮目検知モデルを構築するために,ドローン空撮による潮目画像データセット(画像総数158,739枚)を構築し,潮目の有無に関する識別実験を行った.潮目の検知モデルにPyramid pooling moduleを備えた畳み込みニューラルネットワークを用いたところ,適合率0.90,再現率0.81,F値0.85という性能で潮目が検知できることがわかった.

  • 映像監視システムの持続可能な運用法に関する研究

    2019年  

     概要を見る

    ビッグデータの蓄積を待たずに映像監視システムを早期運用しながら,日々蓄えられるデータを効率的に利用してシステムを成長させる枠組みの確立を試みた.特に,本研究では,パターン認識に基づく映像監視の結果をクラウドソーシングを活用して修正することで,システムの早期運用段階においても高い検知性能を保持する枠組みの開発と検証を行った.映像情報を用いた繁殖牛の分娩検知システムの開発を通じて,提案した映像監視システムの早期運用法に関する評価を行ったところ,パターン認識(分娩検知)とクラウドソーシングを併用することにより,分娩の見逃しを低く抑えながら誤検出を抑制でき,映像監視システムの早期運用が可能であることを明らかにした.

  • 映像情報を用いた繁殖牛の発情予兆検知に関する研究

    2019年  

     概要を見る

    インターネットを通して不特定多数の人に仕事を依頼するクラウドソーシングを用いて,映像から繁殖牛の発情予兆を検知するための技術開発を行った.特に,本研究では,牛の発情予兆として乗駕行動に着目し,その評価基盤を構築した.まず,物体検出アルゴリズムとクラウドソーシングを用いて,牛の検出漏れを抑えながら乗駕行動の有無を信頼性高くアノテーションする方式を開発した.14頭の肉牛がいるフリーストール内で収録した乗駕行動29回分の映像データに対して提案したアノテーションを実施し,合計5020枚の画像からなるデータセットを構築した.さらに,構築したデータセットを用いて交差検証による実験を行ったところ,画像単位では陽性判定率0.80,感度0.76で乗駕行動の検知が可能であることがわかった.

  • エリア収音と敵対的生成ネットワークを用いた多様な雑音に頑健な音声強調

    2018年   俵 直弘

     概要を見る

    エリア収音により生じた非線形歪を敵対的デノイジングオートエンコーダ (ADAE) により補正するポストフィルタ法を提案した.エリア収音は時間周波数マスキングに基づき目的音と妨害音を高精度に分離可能な技術であるが,非線形信号処理特有の不快な歪が発生するという問題がある.そこで,単チャネル音源強調において有効なADAEを用いて非線形歪を低減することを試みたところ,音質改善に有効であることが示された.また,分離処理前の観測信号や雑音情報をADAEの補助入力として用いるnoise-aware学習の枠組みを導入することで,強調信号の更なる品質改善が得られた.

全件表示 >>

 

現在担当している科目 【 表示 / 非表示

全件表示 >>

 

委員歴 【 表示 / 非表示

  • 2019年
    -
    継続中

    高知県マリンイノベーション運営協議会  委員

  • 2019年05月
    -
    2021年04月

    電子情報通信学会 音声研究会  幹事

  • 2020年
     
     

    Speaker Odyssey 2020  Local Organizing Committee

  • 2017年05月
    -
    2019年04月

    電子情報通信学会 音声研究会  専門委員

  • 2017年
     
     

    第7回バイオメトリクスと認識・認証シンポジウム  プログラム委員

全件表示 >>