2025/04/15 更新

写真a

コバヤシ マナブ
小林 学
所属
附属機関・学校 データ科学センター
職名
教授
学位
博士(工学) ( 早稲田大学 )

経歴

  • 2018年04月
    -
    継続中

    早稲田大学   データ科学センター   教授

  • 2014年04月
    -
    2018年03月

    湘南工科大学   工学部   教授

  • 2008年04月
    -
    2014年03月

    湘南工科大学   工学部   准教授

  • 2002年04月
    -
    2008年03月

    湘南工科大学   工学部   講師

  • 2001年04月
    -
    2002年03月

    早稲田大学   理工学総合研究センター   研究員

▼全件表示

学歴

  • 1996年04月
    -
    1999年03月

    早稲田大学   理工学研究科   機械工学専攻経営システム工学専門分野博士後期課程  

  • 1994年04月
    -
    1996年03月

    早稲田大学   理工学研究科   機械工学専攻経営システム工学専門分野博士前期課程  

  • 1990年04月
    -
    1994年03月

    早稲田大学   理工学部   工業経営学科  

委員歴

  • 2010年04月
    -
    継続中

    電子情報通信学会  東京支部学生会顧問

  • 2020年05月
    -
    2022年05月

    電子情報通信学会情報理論とその応用サブソサイエティ  庶務

  • 2017年04月
    -
    2019年03月

    電子情報通信学会  英文論文誌特集号編集幹事

  • 2016年04月
    -
    2018年03月

    電子情報通信学会  SITA2017 プログラム委員幹事

  • 2015年04月
    -
    2017年03月

    電子情報通信学会  ISITA2016 実行委員

▼全件表示

所属学協会

  • 2021年04月
    -
    継続中

    日本経営工学会

  •  
     
     

    情報処理学会

  •  
     
     

    電子情報通信学会

  •  
     
     

    IEEE

研究分野

  • 知能情報学 / 統計科学 / 情報学基礎論   数理情報学 / 通信工学

研究キーワード

  • データマイニング

  • 機械学習

  • 情報理論

  • 符号理論

受賞

  • IEEE EDUNINE 2022 最優秀論文賞

    2022年03月   Institute of Electrical and Electronics Engineers(IEEE)   Research Results on System Development of the Research Project of a Self-Study System for Language Learning  

    受賞者: Katsuyuki Umezawa, Makoto Nakazawa, Manabu Kobayashi, Yutaka Ishii, Michiko Nakano, Shigeichi Hirasawa

  • The World CIST'18 Best Paper award 6th World Conference on Information Systems and Technologies (WorldCist'18)

    2018年03月  

  • 功績賞

    2017年03月   電子情報通信学会   I-Scoverシステム開発に関する長年の貢献  

    受賞者: 小林 学

  • 第74回情報処理学会全国大会 大会優秀賞

    2012年03月   情報処理学会   マルコフモデルによる自動分類に対する分類誤り確率の推定  

    受賞者: 小林 学

 

論文

  • 生成AIを用いた統計学の学習用練習問題自動生成システムの試作

    石田 崇, 雲居 玄道, 小林 学, 平澤 茂一

    日本教育工学会論文誌   49 ( 2 )  2025年08月  [査読有り]

  • Integrating Attribute Information into Relational Data: a Latent Structure Approach

    Kenta Mikawa, Manabu Kobayashi, Tomoyuki Sasaki, Akiko Manada

    Proc. of 2025 1st International Conference on Consumer Technology (ICCT-Pacific)    2025年03月  [査読有り]

  • Detection Probability of Poor Responses in Questionnaires with Quality Control Questions

    Tota Suko, Manabu Kobayashi

    IEICE Trans on fundamentals   E108-A ( 3 )  2025年03月  [査読有り]

  • Average Performance Analysis of Multi-class Classification based on Error-Correcting Output Codes

    Manabu Kobayashi, Gendo Kumoi, Hideki Yagi, Shigeichi Hirasawa

    Proc. of 2024 IEEE International Conference on Systems, Man, and Cybernetics    2024年10月  [査読有り]

    担当区分:筆頭著者

  • A Study on Latent Structural Models for Binary Relational Data with Attribute Information

    Kenta MIKAWA, Manabu Kobayashi, Tomoyuki Sasaki, Akiko Manada

    Nonlinear Theory and Its Applications, IEICE   E15-N ( 2 )  2024年04月  [査読有り]

▼全件表示

書籍等出版物

  • データ科学入門III:モデルの候補が複数あるときの意思決定

    早稲田大学データ科学教育チーム, 松嶋, 敏泰, 須子統太, 小林学, 野村亮, 堀井俊佑, 安田豪毅, 中原悠太( 担当: 共著,  担当範囲: 5章,付録B)

    サイエンス社  2024年04月 ISBN: 9784781915982

  • データ科学入門I

    松嶋敏泰,中原悠太,小林学,堀井俊佑,野村亮( 担当: 共著)

    サイエンス社  2022年04月 ISBN: 9784781915401

  • 入門パターン認識と機械学習

    後藤正幸, 小林 学( 担当: 共著,  担当範囲: 72-108,121-177頁)

    コロナ社  2014年04月

  • IT Text 確率統計学

    須子統太, 鈴木 誠, 浮田善文, 小林 学, 後藤正幸( 担当: 共著,  担当範囲: 119-164頁)

    オーム社  2010年09月

  • IT Text インターネットプロトコル

    阪田史郎, 甲藤二郎, 佐藤文明, 小林 学, 塩田茂雄( 担当: 共著,  担当範囲: 191-220頁)

    オーム社  2005年10月

共同研究・競争的資金等の研究課題

  • データ駆動型社会の基盤をなす次世代実験計画技術の開発と実証的評価

    日本学術振興会  科学研究費助成事業

    研究期間:

    2021年04月
    -
    2025年03月
     

    後藤 正幸, 上田 雅夫, 守口 剛, 関 庸一, 鈴木 秀男, 生田目 崇, 小林 学, 三川 健太, 山下 遥

     概要を見る

    本研究では,以下の3つの基本的課題を設定し,研究に取り組んでいる.
    1.(機械学習モデルの設計) 施策の最適化を目的とした実験計画のために,「機械学習に基づく統計モデル」を「追加実験によるデータ取得」と「施策の最適化」に結び付けるプロセスの全体像,及び,効果的な実験計画を可能とする機械学習モデルを如何に設計すべきか.
    2.(効率的な追加実験の計画手法構築)大規模ログデータから構築された統計モデルが与えられたもとで,最小限の回数で最適施策の探索に結び付ける,効率的な追加実験を如何に計画することが可能か.
    3.(施策の最適化と因果効果の評価手法の開発) 大規模データから得られた統計モデルと実験データを統合し,どのような方法で施策を最適化するか.加えて,共変量やデータの選択バイアスを考慮し,施策の因果効果を精度よく評価することが可能であるか.
    2021年度は,これらの研究課題に関連する領域として,“能動学習”,“ベイズ最適化”,“バンディッドアルゴリズム”,“因果推論”の領域の体系的整理を行う研究会を定期開催し,その全体的な体系の明確化と問題点の整理を行った.これと並行して,「1.機械学習モデルの設計」については継続して企業の実問題を対象として研究を行い,様々な具体的事例に対して機械学習モデルを活用する技術基盤についての成果を得ている.また,「2.効率的な追加実験の計画手法構築」については,過去の大量のログデータを学習した機械学習モデルを活用して,いくつかの仮説のもとにA/Bテストを計画し,実ビジネスにおいて実証的に検証する試みを行った.今のところ,完全に再現性のある結果は得られていないが,様々なノウハウが蓄積されたため,今後の研究に結びつける予定である.「3.施策の最適化と因果効果の評価手法の開発」については,ベイズ最適化と因果推論モデルの実活用と改良を行い,一定の成果を得ている.

  • ビジネス価値創造のためのデータ解析プラットフォームと時変協調フィルタリングの研究

    日本学術振興会  科学研究費助成事業

    研究期間:

    2019年04月
    -
    2023年03月
     

    小林 学, 平澤 茂一, 松嶋 敏泰

     概要を見る

    本研究ではデータを持ち出さずに解析を行うプラットフォーム(DAPF)の構築並びにその効果的な運用方法の提案を目的の一つとしている.現在までにクラウドを用いたDAPF(CDAPF),並びにオンプレミスによるDAPF(ODAPF)のそれぞれの構築が完了している.またCDAPFに関しては実運用を開始しており,現在みずほ銀行の実データの解析を行う3つのプロジェクトを実施している.これにより,DAPFの持つべき機能やセキュリティ等が明らかになってきている.またCDAPFについては2021年度に新たにVPN接続を可能にすることにより,大学外からセキュアにデータ解析を可能とした.さらにデータ持ち出しを防ぐためのチェック要件定義を行い,運用の効率化の実施を提案した.
    また顧客の消費行動に対するビジネス価値創造のための機械学習に関して,昨今説明性が大変重要になってきている.具体的にはデータの構造推定結果や予測関数の意味などが分析者に理解できる説明性が求められてきている.2021年度はこの説明性に着目して,回帰並びに分類というプリミティブな問題に対して,回帰木(あるいは決定木)に対する生成モデルを設定し,この生成モデルにおけるベイズ最適な予測を決定関数として出力する方法を示し,さらにこれにブースティングを適用することにより,非常に複雑な問題にも良好な性能を示す手法を提案した.この手法は一般化加法モデルの一種となることを示すことができ,説明性を担保することが可能である.これによって時系列の影響を可視化することが可能であり,非定常な場合に拡張が可能になっている.
    さらに,ディープラーニングを含む多値分類手法の複数の2値分類器の組合せで行われているが,これを効果的に行う誤り訂正出力符号(ECOC)が提案されている.この手法に対して理論的に最適な符号の構成,並びにその理論的な性能解析を行なった.

  • 言語学習を対象とした時空を越えて相手を感じられる自学自習システムの開発

    日本学術振興会  科学研究費助成事業

    研究期間:

    2019年04月
    -
    2022年03月
     

    梅澤 克之, 平澤 茂一, 中澤 真, 中野 美知子, 小林 学, 石井 雄隆

     概要を見る

    本研究の目的は,言語学習を統一的な枠組みで捉え,相手(学習者)を感じて助言を行う人工教師を搭載した自学自習システムを開発し,その評価を行うことである.「相手を感じる」とは,学習者の学習状況をシステム側が把握することを指す.本研究では,自学自習システムの開発に必要な学習者のつまずきを検出するための方法や学習状態を推定する方法とシステムの開発を行った.またそれらを用いて英語およびプログラミング言語の学習の実証実験を行った.さらに,英語教育とプログラミング言語教育の関連性や教育方法の援用についての調査・検討を行った.さらに,本研究成果の普及に向けての脳波以外の計測器での代用可能性の研究を行った.

  • 大規模ラーニングアナリティクスを用いた初学者のためのプログラミング教育システム

    日本学術振興会  科学研究費助成事業

    研究期間:

    2016年04月
    -
    2019年03月
     

    小林 学, 平澤 茂一

     概要を見る

    本研究ではプログラミング初学者を対象として,実際の授業用のWEBを用いたe-learningプログラミング教育システムを構築し,さらにそこから得られたビッグデータに対してラーニングアナリティクスを用いて分析を行なう手法を検討した.具体的にはまず学習者のプログラミングの各種ログを取得し,機械学習手法を用いたプログラムの自動採点により,教員の労度を大幅に削減しつつ精度の高い採点を行うことが可能であることを明らかにした.さらに課題の採点結果を用いて,同じ採点結果の傾向を示す学習者及び課題を自動的に抽出する手法の提案並びに評価を行い,提案したモデル並びに分析法の有効性を示した.

  • 大規模データ時代のビジネスアナリティクス手法に関する基礎的研究

    日本学術振興会  科学研究費助成事業

    研究期間:

    2014年04月
    -
    2017年03月
     

    後藤 正幸, 三川 健太, 平澤 茂一, 須子 統太, 堀井 俊佑, 小林 学, 鈴木 誠, 山下 遥

     概要を見る

    本研究では,大規模かつ多様なビジネスデータの分析技術(ビジネスアナリティクス)の体系化と深化を研究の目的とし,様々なビジネスデータに対応した分析モデルの提案と評価を行った.具体的には,1)ECサイトのデータベース情報を対象とした情報分析技術の開発,2)テキストデータとして蓄積されるマーケティング情報の分析技術の開発,3)情報推薦のための統計モデルの開発,4)情報検索や推薦の技術を活用したWebマーケティングモデルの理論解析,5)高次元かつ疎な大規模データを対象とした分析手法の開発,6)プライバシー保護データ解析の方法論の開発,などの個別研究課題を軸として研究を推進した.

▼全件表示

Misc

  • データサイエンス学習のための生成AI による文脈をもつデータ作成

    石田 崇, 小林 学, 雲居 玄道, 隈 裕子, 平澤 茂一

    情報処理学会第 87 回全国大会予稿集     4-415 - 4-416  2025年03月

  • 生成AI を活用した教材ベース問題生成における最適プロンプト設計に関する一考察

    雲居玄道, 隈裕子, 小林学, 石田崇, 平澤茂一

    情報処理学会第 87 回全国大会予稿集     4-409 - 4-410  2025年03月

  • n vs. the Rest 型2 値判別器を用いたECOC の構成法とその性質

    平澤茂一, 雲居玄道, 八木秀樹, 小林学

    情報処理学会第 87 回全国大会予稿集     1-173 - 1-174  2025年03月

  • 時系列出⽋席モデルによる⽋席バイアスを考慮した授業演習難易度推定

    小林学, 松嶋敏泰, 平澤茂一

    日本教育工学会 2024年秋季全国大会予稿集    2024年09月

    担当区分:筆頭著者

  • 生成 AI を用いた問題自動生成における教材読込の効果

    隈裕子, 小林学, 石田崇, 雲居玄道, 平澤茂一

    日本教育工学会 2024年秋季全国大会予稿集    2024年09月

▼全件表示

 

現在担当している科目

▼全件表示

 

他学部・他研究科等兼任情報

  • 附属機関・学校   グローバル・エデュケーション・センター

  • 理工学術院   大学院基幹理工学研究科

特定課題制度(学内資金)

  • 潜在構造の推定を目的とした機械学習による協調フィルタリング

    2024年  

     概要を見る

     近年,マーケティングなどにおいて顧客(ユーザ)の商品(サービス)に対する消費行動(WEBの閲覧履歴や購買行動など)を数理モデルとして表現し,過去のデータから今後の顧客の消費行動を予測する協調フィルタリングが盛んに研究されている. 一方,実際のデータとしては消費行動の他に各顧客の属性データや各商品の属性データなどが存在し,これらも消費行動には間接的に影響を与えていることも考えられる.しかし,このような多種のデータを統一的に扱う研究は数少ない. 本研究ではこの顧客・商品・消費行動それぞれの観測変数に対して,各顧客の潜在変数ベクトルと各商品の潜在変数ベクトルが存在するものと仮定する.また潜在変数ベクトルから観測変数が生成・観測される確率的な潜在構造を設定する.ただし簡単のために全ての変数は量的変数と仮定する.このとき顧客および商品に対する潜在変数の特定には因子分析を用いることができ,一方で消費行動に対する潜在変数の分析にはPCAや行列因子分解,さらにはこれらの確率モデルバージョンのアルゴリズムを用いることが可能である.本研究ではこのときに欠測が発生していても効果的に推定可能な方法を提示した.さらに,これらから得られた潜在変数同士の関係を明らかにする手法の提案を行い,人工データを用いてその有効性を示すことができた. これらの結果から,顧客,商品,消費行動の関係を明確な数理モデルで表現でき,またその構造推定を可能としたことにより,今後施策の評価などに用いることができる.今後の課題としては,実データに対する有効性の評価が挙げられる. 

  • 潜在構造による多種属性を考慮可能な協調フィルタリング手法に関する研究

    2023年  

     概要を見る

     近年,Eマーケティングなどにおいて顧客(ユーザ)の商品(サービス)に対する消費行動(WEBの閲覧履歴や購買行動など)を数理モデルとして表現し,過去のデータから今後の顧客の消費行動を予測する協調フィルタリングが盛んに研究されている.一方,実際のデータとしては消費行動の他に各顧客の属性データや各商品の属性データなどが存在し,これらも消費行動には間接的に影響を与えていることも考えられる.しかし,このような多種のデータを統一的に扱う研究は数少ない. 本研究ではこの顧客・商品・消費行動それぞれの観測変数に対して,各顧客の潜在変数ベクトルと各商品の潜在変数ベクトルが存在するものと仮定する.そして顧客の潜在変数ベクトルから顧客の観測変数が生成され,商品も同様とする.この関係は因子分析のモデルと等価と設定する.一方顧客の商品に対する消費行動は,それぞれの潜在変数の内積から生成されるものとする.例として,消費行動が量的変数であれば潜在変数の内積に誤差が加わるモデルとし,消費行動が2値の質的変数の場合,潜在変数の内積が質的変数の対数確率比となるモデルとすることができる.この提案方法により,多種多様なマーケティングデータを統一的な数理モデルで表現することが可能になり,生成・観測メカニズムの構造推定問題や未観測の消費行動に対する予測問題などを統計的に扱うことを可能とする. 本研究ではさらに,この数理モデルに対する各種パラメータの推定,並びに潜在変数の事後確率推定のための繰り返しアルゴリズムを提案した.結果的に実験によりパラメータの推定精度並びに予測精度を高めることができることを確認した. 今後の課題として,構造推定に対するモデル選択における一致性の検討が挙げられる.

  • 説明性を持つ回帰・分類手法のベイズ的アプローチ

    2022年  

     概要を見る

    一般化加法モデル(GAM)は,統計的モデルによるデータの説明性を担保しつつ,データに対するフィッティングを行えるように説明変数に対する基底関数をデータから学習可能にしている.本研究ではある予測に対する残差に対してベイズ最適な予測を繰り返し適用するブースティング手法の提案を行なった.またこの時各繰り返しにおいて結果となるモデルクラスがGAMとなるように近似を導入した.結果的に予測モデルのクラスとしてベイズ最適な決定木並びにガウス過程回帰を用いることにより,従来のGAMよりも性能の高い手法となることを評価実験により示した.

  • 潜在構造を仮定したイジングモデルの学習と協調フィルタリングへの応用

    2021年  

     概要を見る

    自然言語処理における単語のパラメータ推定問題は,その発生確率が一般に小さいため難しい.この時単語が発生する数理モデルをイジングモデルと仮定したときのパラメータ推定として,ロジスティック回帰型の近似を行う方法が効果的であることが知られている.本研究ではイジングモデルのパラメータが確率的に生起する潜在クラスモデル(潜在イジングモデル)を提案し,そのパラメータ推定を効果的に行う近似的拡張EMアルゴリズムを提案した.また実際の自然言語処理に応用することにより,その有効性を示した.本数理モデル及び推定アルゴリズムは,商品をユーザが購入する数理モデルを考える協調フィルタリング問題に応用可能である. 

  • 複数属性を考慮可能な統計的協調フィルタリング

    2020年  

     概要を見る

    ビジネスアナリティクス分野において協調フィルタリングはユーザと商品やサービスの関係を解析する上で非常に重要なツールである.協調フィルタリングにおいて,ユーザの商品に対する消費行動がデータとなる.本研究では従来扱うことが難しかったユーザ情報や商品情報等を合わせて取り扱う統計的手法の開発を行なった.具体的にはユーザと商品に対する消費行動を統計的モデルとする他,ユーザ情報や商品情報の生成も潜在構造として取り込む確率的生成モデルを提案した.さらに与えられたデータからそれらの潜在構造モデル及びパラメータを推定する変分ベイズ手法の開発を行い,モデル及び推定手法の評価を行ない,その有効性を示した.

▼全件表示