2022/12/04 更新

写真a

スコ トウタ
須子 統太
Scopus 論文情報  
論文数: 0  Citation: 0  h-index: 1

Citation Countは当該年に発表した論文の被引用数

所属
社会科学総合学術院 社会科学部
職名
准教授

他学部・他研究科等兼任情報

  • 附属機関・学校   グローバルエデュケーションセンター

学内研究所・附属機関兼任歴

  • 2021年
    -
    2022年

    大学総合研究センター   兼任センター員

  • 2020年
    -
    2022年

    理工学術院総合研究所   兼任研究員

学位

  • 早稲田大学   博士(工学)

 

研究分野

  • 知能情報学

  • 統計科学

  • 情報学基礎論

研究キーワード

  • ベイズ統計、統計的学習理論、ビジネス統計、データマイニング、情報理論

論文

  • A new latent class model for analysis of purchasing and browsing histories on EC sites

    Masayuki Goto, Kenta Mikawa, Shigeichi Hirasawa, Manabu Kobayashi, Tota Suko, Shunsuke Horii

    Industrial Engineering and Management Systems   14 ( 4 ) 335 - 346  2015年12月

     概要を見る

    The electronic commerce site (EC site) has become an important marketing channel where consumers can purchase many kinds of products
    their access logs, including purchase records and browsing histories, are saved in the EC sites' databases. These log data can be utilized for the purpose of web marketing. The customers who purchase many product items are good customers, whereas the other customers, who do not purchase many items, must not be good customers even if they browse many items. If the attributes of good customers and those of other customers are clarified, such information is valuable as input for making a new marketing strategy. Regarding the product items, the characteristics of good items that are bought by many users are valuable information. It is necessary to construct a method to efficiently analyze such characteristics. This paper proposes a new latent class model to analyze both purchasing and browsing histories to make latent item and user clusters. By applying the proposal, an example of data analysis on an EC site is demonstrated. Through the clusters obtained by the proposed latent class model and the classification rule by the decision tree model, new findings are extracted from the data of purchasing and browsing histories.

    DOI

    Scopus

    9
    被引用数
    (Scopus)
  • 詳細な学習ログを用いた英語リーディング過程の分析(2) ログデータから見た成績との関係

    中野美知子, 吉田諭史, 須子統太, 玉木欽也, ギエルモ エンリケズ

    情報処理学会第77回全国大会 講演論文集   4   503 - 504  2015年03月

  • 電子教材とワークシートを用いた統計基礎教育におけるブレンディッドラーニングに関する一考察

    小泉大城, 須子統太, 平澤茂一

    情報処理学会第77回全国大会 講演論文集   4   605 - 606  2015年03月

  • Asymptotics of Bayesian Inference for a Class of Probabilistic Models under Misspecification

    Nozomi Miya, Tota Suko, Goki Yasuda, Toshiyasu Matsushima

    IEICE Trans. FUNDAMENTALS   Vol.E97-A ( No.12 ) 2352 - 2360  2014年12月  [査読有り]

  • プライバシー保護機能を持つ分散型正則化最小二乗法について

    須子統太, 堀井俊佑, 小林学

    第37回情報理論とその応用シンポジウム予稿集(SITA2014)     300 - 305  2014年11月

  • An Analysis of Purchasing and Browsing Histories on an EC Site Based on a New Latent Class Model

    Masayuki Goto, Kenta Mikawa, Manabu Kobayashi, Shunsuke Horii, Tota Suko, Shigeichi Hirasawa

    The 1st East Asia Workshop on Industrial Engineering    2014年11月

  • Asymptotics of MLE-based Prediction for Semi-supervised Learning

    Goki Yasuda, Nozomi Miya, Tota Suko, Toshiyasu Matsushima

    Proc. of 2012 International Symposium on Information Theory and its Applications (ISITA2014)     343  2014年10月

  • 統計基礎学修のためのブレンディッドラーニングの取り組み

    小泉 大城, 須子 統太

    平成26年度私立大学情報教育協会 ICT利用による教育改善研究発表会 資料集     28 - 29  2014年08月

  • プライバシー保護機能を持つ線形回帰モデルにおける最小二乗推定量の分散計算法について

    須子統太, 堀井俊佑, 小林学, 後藤正幸, 松嶋敏泰, 平澤茂一

    日本経営工学会論文誌   Vol.65 ( No.2 ) 77 - 78  2014年07月

  • PDFファイルをベースとした電子教材作成支援システム

    荒本 道隆, 小泉 大城, 須子 統太, 平澤 茂一

    情報処理学会 第76回全国大会 講演論文集   4  2014年03月

  • 統計基礎教育のためのタブレット型端末向け電子教材の試作と評価

    小泉 大城, 須子 統太, 平澤 茂一

    情報処理学会 第76回全国大会 講演論文集   4   361 - 362  2014年03月

  • 判別を目的としたプライバシー保護データ解析に関する一考察

    後藤正幸, 須子統太, 小林 学, 平澤茂一

    日本経営工学会 平成25年春季大会予稿集     54 - 55  2013年05月

  • 大学教育のための電子教材の試作 〜 タブレット端末向け統計基礎教材 〜

    小泉大城, 須子統太, 平澤茂一

    情報処理学会 第75回全国大会 講演論文集   4   467 - 468  2013年03月

  • 統計的決定理論に基づく階層構造を利用したマルチラベル分類法について

    山本 粋士, 須子 統太, 松嶋 敏泰

    電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習   112 ( 454 ) 101 - 106  2013年02月

     概要を見る

    本稿では,統計的決定理論に基づくマルチラベル分類法を扱う.マルチラベル分類は,ラベル集合の冪集合の要素を一つのクラスと見なすことで,多クラス分類としても扱える.しかしこの場合,ラベル集合の要素数についてクラスの数が指数的に増加する.その為,要素数が大きい場合には,分類を行うことが計算量的に困難となる.この計算量的困難性を回避する為の研究が従来より行われており,その一つにラベル間の階層構造を利用した研究がある.他方,ベイズ基準のもとで最適な分類法が近年注目されている.本稿では,このベイズ基準のもとで最適な分類法をマルチラベル分類問題に適用する.更にラベル間に階層構造を仮定することで,分類で必要となる計算量をラベル集合の要素数についての線形オーダーで抑えるアルゴリズムを提案する.ベイズ基準のもとで最適となる分類法では,仮定する損失関数により具体的な計算式が異なる.その為本稿では,0-1損失,ハミング損失それぞれの場合において,効率的な分類アルゴリズムを示す.

    CiNii

  • Iterative Multiuser Joint Decoding based on Augmented Lagrangian Method

    Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

    電子情報通信学会技術研究報告   IT2013-34   13 - 17  2013年

  • 真の分布を含むとは限らない階層モデル族に対するベイズ推定の漸近評価

    宮希望, 須子統太, 安田豪毅, 松嶋敏泰

    第36回情報理論とその応用シンポジウム予稿集(SITA2013)     665 - 670  2013年

  • 半教師付き学習における一致推定量に基づく予測の漸近評価,

    安田豪毅, 宮希望, 須子統太, 松嶋敏泰

    第36回情報理論とその応用シンポジウム予稿集(SITA2013)     659 - 664  2013年

  • 次数未知の多変数多項式回帰モデルにおけるベイズ予測

    山本粋士, 須子統太, 松嶋敏泰

    第36回情報理論とその応用シンポジウム予稿集(SITA2013)     520 - 524  2013年

  • 線形回帰モデルにおけるベイズ決定理論に基づく予測の近似手法

    都築遼馬, 須子統太, 松嶋敏泰

    第36回情報理論とその応用シンポジウム予稿集(SITA2013)     438 - 441  2013年

  • プライバシー保護を目的とした線形回帰モデルにおける事後確率最大推定量の分散計算法について

    中井 祥人, 須子統太, 松嶋敏泰

    電子情報通信学会技術研究報告   IBISML, 112(454)   47 - 54  2013年

  • 木構造を仮定した信号に対する拡張ラグランジュ法に基づいた圧縮センシングについて

    堀井俊佑, 須子統太, 松嶋敏泰

    第35回情報理論とその応用シンポジウム予稿集     320 - 325  2012年

  • プライバシー保護を目的とした線形回帰モデルにおける最小二乗推定量 の分散計算法について

    須子統太, 堀井俊佑, 小林学, 後藤正幸, 松嶋敏泰, 平澤茂一

    電子情報通信学会技術研究報告   IBISML2012-49   107 - 111  2012年

  • プライバシー保護を目的とした回帰分析の拡張について

    須子統太, 堀井俊佑, 小林学, 松嶋敏泰, 平澤茂一

    第35回情報理論とその応用シンポジウム予稿集     562 - 567  2012年

  • Asymptotics of Bayesian estimation for nested models under misspecification

    Nozomi Miya, Tota Suko, Goki Yasuda, Toshiyasu Matsushima

    2012 INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY AND ITS APPLICATIONS (ISITA 2012)     86 - 90  2012年  [査読有り]

     概要を見る

    We analyze the asymptotic properties of the cumulative logarithmic loss in the decision problem based on the Bayesian principle and explicitly identify the constant terms of the asymptotic equations as in the case of previous studies by Clarke and Barron and Gotoh et al. We assume that the set of models is given that identify a class of parameterized distributions, it has a nested structure and the source distribution is not contained in all the families of parameterized distributions that are identified by each model. The cumulative logarithmic loss is the sum of the logarithmic loss functions for each time decision-, e. g., the redundancy in the universal noiseless source coding.

  • 真のモデルを含まないパラメトリックモデル族に対するベイズ予測の漸近評価(フレッシュマンセッション,一般)

    宮 希望, 須子 統太, 安田 豪毅, 松嶋 敏泰

    電子情報通信学会技術研究報告. IT, 情報理論   111 ( 142 ) 71 - 76  2011年07月

     概要を見る

    情報源から発生するデータを逐次的に観測し,それに基づいて次に発生するデータの予測を行う逐次予測問題を考える.予測の評価基準として対数損失を考えた場合,これは次の1時点のデータを予測した場合の1時点の損失とそれをある時点まで総和をとった累積損失の2つに分類される.ここで様々な予測手法が考えられるが,本研究ではべイズ基準の下での予測を考える.このとき,仮定したパラメトリックモデル族は真のモデルを含んでいることが前提であるが,未知である真のモデルは実際には仮定したモデル族に含まれないということも考えられる.本研究では累積損失に対してべイズ基準の下で最適な予測を行う.そして仮定したモデル族は実際には真のモデルを含んでいないという状況の下で損失の漸近的な解析を行う.

    CiNii

  • 真のモデルを含まないパラメトリックモデル族に対するベイズ予測の漸近評価

    宮希望, 須子統太, 松嶋敏泰

    電子情報通信学会技術研究報告   IT2011-11   71 - 76  2011年

  • A Note on Linear Programming Based Communication Receivers

    S. Horii, T. Suko, T. Matsushima, S. Hirasawa

    in Proc. of the 3rd International Castle Meeting on Coding Theory and Applications     141 - 146  2011年

  • Bayes universal source coding scheme for correlated sources

    Tota Suko, Shunsuke Horii, Toshiyasu Matsushima, Shigeichi Hirasawa

    Proceedings of the 1st IEEE African Winter School on Information Theory and Communications 2010     27  2010年05月

  • Maximum likelihood detection for DS-CDMA using Gr�{o}bner bases

    Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

    第33回情報理論とその応用シンポジウム予稿集     489 - 493  2010年

  • 複数の相関のある情報源に対するベイズ符号化について

    須子統太, 堀井俊佑, 松嶋敏泰, 平澤茂一

    第33回情報理論とその応用シンポジウム予稿集     759 - 763  2010年

  • On the Bayesian Forecasting Algorithm under the Non-Stationary Binomial Distribution with the Hyper Parameter Estimation

    Daiki Koizumi, Tota Suko, Toshiyasu Matsushima

    Proceeding of Ninth Valencia International Meeting on Bayesian Statistics     167 - 168  2010年

  • Asymptotic property of universal lossless coding for independent piecewise identically distributed sources

    Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

    Journal of Discrete Mathematical Sciences and Cryptography   13 ( 4 ) 383 - 391  2010年

     概要を見る

    The universal lossless source coding problem is one of the most important problem in communication systems. The aim of source coding is to compress data to reduce costs in digital communication. Traditional universal source coding schemes are usually designed for stationary sources. Recently, some universal codes for nonstationary sources have been proposed. Independent piecewise identically distributed (i.p.i.d.) sources are simple nonstationary sources that parameter changes discontinuously. In this paper, we assume new i.p.i.d. sources class, and we prove that Bayes codes minimize the mean redundancy when parameter transition pattern is known and parameter is unknown. © 2010 Taylor &amp
    Francis Group, LLC.

    DOI

    Scopus

  • 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム

    須子統太, 松嶋敏泰, 平澤茂一

    情報処理学会論文誌数理モデル化と応用   Vol.1 ( No.1 ) 17 - 26  2008年09月

  • 拡張された有本-Blahutアルゴリズムの大域的収束性について

    安井謙介, 須子統太, 松嶋敏泰

    電子情報通信学会論文誌   Vol.91-A ( No.9 ) 846 - 860  2008年09月

     概要を見る

    有本-Blahutアルゴリズムは,通信語容量やレートひずみ関数を効率的に計算するアルゴリズムであり,有本とBlahutにより独立に提案された.この計算法は,目的関数が通信路容量と同形の関数形となれば他の問題にも適用可能であり,例えば補助情報が存在する通信モデルにおける通信路容量などの計算にも適用することができる.しかし,多端子のモデルにおける通信路容量の関数形は,一般に通信路容量と同形の関数形とはならないため適用することができない.本論文では,まず通信路容量やレートひずみ関数の関数形を含むような形で目的関数を一般的に定義する.目的関数の例として,通信路容量やレートひずみ関数の関数形のほかに,計算法が示されていなかった秘密保持容量(secrecy capacity)やKaspiが導出したレートひずみ関数の関数形がある.次に,その目的関数の最小値を計算する逐次最小化アルゴリズムを有本-Blahutアルゴリズムを拡張した形で提案する.また,目的関数が凸性を満たすならば,提案法は大域的収束性を保証するアルゴリズムであることを証明する.最後に数値実験を用いて,秘密保持容量の性質を調べる.

    CiNii

  • A Note on Multiuser Detection Algorithms for CDMA based on the Belief Propagation Algorithm

    S. Horii, T. Suko, T. Matsushima, S. Hirasawa

    電子情報通信学会技術報告   IT2007-26   7 - 12  2008年

  • 区間で一定なパラメータを持つ非定常情報源の漸近的な性質について

    須子統太, 松嶋敏泰, 平澤茂一

    第31回情報理論とその応用シンポジウム予稿集     815 - 818  2008年

  • マーキング仮定に基づくフィンガープリンティング符号のキャパシティについて

    柴田大介, 須子統太, 松嶋敏泰

    暗号と情報セキュリティシンポジウム予稿集    2008年

  • Multiuser detection algorithm for CDMA based on the belief propagation algorithm

    Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

    IEEE International Symposium on Spread Spectrum Techniques and Applications     194 - 199  2008年

     概要を見る

    Optimum detection for the multiuser code-division multiple-access channel is prohibitively complex. This paper considers new iterative multiuser detection algorithm based on the belief propagation algorithm. Previously, the idea to apply the belief propagation algorithm to multiuser detection problem was suggested , however, it was believed that to apply the belief propagation algorithm to the detection problem is impossible because it requires an exponentially large amount of computation. It was the only fact that the parallel interference canceller is derived as an approximation of the belief propagation. In this paper, we show that the belief propagation algorithm can be applied to the detection problem by converting the factor graph structure. Performance of the detector based on the belief propagation algorithm is better than that of the parallel interference canceller. © 2008 IEEE.

    DOI

    Scopus

    1
    被引用数
    (Scopus)
  • 外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム

    須子統太, 松嶋敏泰, 平澤茂一

    情報処理学会研究報告   2007-MPS-67   13 - 16  2007年

  • An Algorithm for Computing the Secrecy Capacity of Broadcast Channels with Confidential Messages

    Kensuke Yasui, Tota Suko, Toshiyasu Matsushima

    Proceedings of IEEE International Symposium on Information Theory    2007年  [査読有り]

  • 密情報を持つBroadcast Channel の Secrecy Capacity 計算アルゴリズム

    安井謙介, 須子統太, 松嶋敏泰

    第29回情報理論とその応用シンポジウム予稿集     69 - 73  2006年

  • Multiuser Detection Algorithms for CDMA based on the Massage Passing Algorithms

    Shunsuke Horii, Tota Suko, Toshiyasu Matsushima

    Proceeding of 2006 Hawaii, IEICE and SITA Joint Conference on Information Theory (HISC2006)   106 ( 60 ) 17 - 22  2006年

    CiNii

  • 電子透かしにおける秘匿容量の計算手法に関する研究

    安井謙介, 須子統太, 松嶋敏泰

    電子情報通信学会技術報告   IT2005-47   29 - 34  2005年

  • 使用ユーザが変化するDS/CDMAシステムにおけるベイズ最適なマルチユーザ検出について

    堀井俊佑, 須子統太, 松嶋敏泰

    第28回情報理論とその応用シンポジウム予稿集     781 - 784  2005年

  • 電子透かしにおける秘匿容量計算計算アルゴリズム

    安井謙介, 須子統太, 松嶋敏泰

    電子情報通信学会技術報告   IT2005-94   177 - 182  2005年

  • BW変換を用いたユニバーサル符号化アルゴリズムに関する研究

    須子統太, 松嶋敏泰, 平澤茂一

    第28回情報理論とその応用シンポジウム予稿集     343 - 346  2005年

  • 階層モデルにおけるベイズ予測の漸近評価に関する一考察

    宅味丈夫, 須子統太, 松嶋敏泰

    第27回情報理論とその応用シンポジウム予稿集     639 - 642  2004年

  • 区間で定常なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について

    須子統太, 松嶋敏泰, 平澤茂一

    電子情報通信学会技術報告   IT2004-22   23 - 28  2004年

  • 外れ値データの発生を考慮にいれた回帰モデルにおけるベイズ予測法について

    須子統太, 仲川文隆, 松嶋敏泰

    2004年情報論的学習理論ワークショップ(IBIS2004)予稿集     34 - 39  2004年

  • 区間で一定なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について

    須子統太, 松嶋 敏泰, 平澤 茂一

    第27回情報理論とその応用シンポジウム予稿集     523 - 526  2004年

  • 決定木モデルにおける予測アルゴリズムについて

    須子統太, 野村亮, 松嶋敏泰, 平澤茂一

    電子情報通信学会技術報告   COMP2003-36   93 - 98  2003年

  • 区間で一定なパラメータを持つ情報源におけるベイズ符号化法について

    須子統太, 松嶋敏泰, 平澤茂一

    第26回情報理論とその応用シンポジウム予稿集     165 - 168  2003年

  • 相関のある時系列の状態空間によるモデル化と予測

    鈴木悠哉, 須子統太, 松嶋敏泰

    電子情報通信学会技術報告   IT2003-38   87 - 92  2003年

  • ベイズ決定理論に基づく予測における近似手法について

    江口公盛, 須子統太, 松嶋敏泰

    第26回情報理論とその応用シンポジウム予稿集     703 - 706  2003年

  • 拡張された階層モデルにおける予測アルゴリズムについて

    須子統太, 野村亮, 松嶋敏泰

    第25回情報理論とその応用シンポジウム予稿集     755 - 758  2002年

▼全件表示

書籍等出版物

  • IT Text 確率統計学

    須子統太, 鈴木誠, 浮田善文, 小林学, 後藤正幸

    オーム社  2010年09月 ISBN: 9784274209130

共同研究・競争的資金等の研究課題

  • 様々な低品質データに対応するロバストな分類アルゴリズムの開発

    研究期間:

    2018年04月
    -
    2021年03月
     

     概要を見る

    蓄積されたデータをもとに,ある特徴量に対応するラベル(離散値)を予測する分類問題は,古くから統計学や機械学習,人工知能の分野で盛んに研究されている.近年様々な高精度な分類アルゴリズムが開発されたことにより,手書き文字認識,文書分類,購買行動予測など様々な場面でこれら分類アルゴリズムが活用されるようになってきた.その一方,必ずしも理想的な状況でデータが得られるとは限らず,低品質なデータに対する分類アルゴリズムの必要性が増してきている.そのため,ノイズを含むラベルからの学習や半教師あり学習など,様々な低品質なデータ取得状況に応じた分類手法の研究が個別に行われている.本研究では,分類問題におけるこれら低品質データの得られる状況を単一のモデルとして表現し,そのもとで高性能な分類アルゴリズムを構成することで,データの取得状況によらないロバストな分類アルゴリズムの開発を目的としている.本研究ではデータの発生構造として生成モデルおよび識別モデルと呼ばれる確率的な発生モデルを仮定し,それぞれにラベルノイズモデルを仮定した場合の分類アルゴリズムの提案および性能評価を行う計画を立てていた.2019年度は,当初予定を一部変更し,ノイズモデルのさらなる拡張を行い,潜在構造を持つ分類問題に対しラベルノイズモデルを適応した高性能な分類アルゴリズムの開発を行った.また,2018年度に行った漸近的な性能の理論解析の結果について,一部不十分な点が判明したため追加の研究を行い,提案したアルゴリズムの理論性能について詳細な解析結果を得た.2019年度の当初予定(研究課題申請時の計画)では,2018年度に行った,基本的な生成モデルを仮定した場合の分類アルゴリズムの開発および,そのアルゴリズムの性能評価を拡張し,生成モデルに対するカーネル法への拡張と識別モデルへの拡張を計画していた.しかし,2018年度の実績報告の際に報告した通り,2019年度開始時には計画を変更しており,2018年度に利用したラベルノイズモデルの更なる一般化および他のラベルノイズモデルを提案し,そのもとでデータの発生モデルとしては生成モデルを仮定した場合の分類アルゴリズムの提案およびその性能評価を行うことを計画していた.(尚この変更は,当初計画における「計画が予定通り進まない場合の対応」で想定していた範囲内の変更である.)本年度は変更された計画に従い,ラベルノイズモデルの更なる一般化として,潜在構造を持つ分類問題に対しラベルノイズモデルを拡張し分類アルゴリズムの開発とその性能評価を行った.また,2018年度に行った漸近的な性能の理論解析の結果について,一部不十分な点が判明したため追加の研究を行い,提案したアルゴリズムの理論性能について詳細な解析結果を得た.以上より,課題申請時の計画からは変更は出ているものの,2019年度当初に変更した計画通りに研究は進んでいる.2019年度の研究結果より,提案したモデルに対する新たな分類アルゴリズムについて,実験上の性能と理論解析における性能限界との間に大きな乖離がある事が分かった.これは提案したアルゴリズムの性能を更に向上させる事ができる可能性を示唆した結果であると考えられる.そこで2020年度は分類アルゴリズムの性能を理論限界に近づけるべく,アルゴリズムの挙動に対する詳細な調査および,それを元にしたアルゴリズムの改良を進めて行く予定である

  • 大規模データ時代のビジネスアナリティクス手法に関する基礎的研究

    研究期間:

    2014年04月
    -
    2017年03月
     

     概要を見る

    本研究では,大規模かつ多様なビジネスデータの分析技術(ビジネスアナリティクス)の体系化と深化を研究の目的とし,様々なビジネスデータに対応した分析モデルの提案と評価を行った.具体的には,1)ECサイトのデータベース情報を対象とした情報分析技術の開発,2)テキストデータとして蓄積されるマーケティング情報の分析技術の開発,3)情報推薦のための統計モデルの開発,4)情報検索や推薦の技術を活用したWebマーケティングモデルの理論解析,5)高次元かつ疎な大規模データを対象とした分析手法の開発,6)プライバシー保護データ解析の方法論の開発,などの個別研究課題を軸として研究を推進した

  • 確率的要素を含む情報セキュリティシステムの利便性と安全性からの最適化と統合評価

    研究期間:

    2013年04月
    -
    2016年03月
     

     概要を見る

    確率的要素を含む情報セキュリティ問題に対し確率モデルにより定式化を行い,安全性や利便性等の評価基準を明確にし,最適な攻撃法や認証法等を理論的に明らかにした.個々の符号やシステムに対して安全性を評価するのではなく,統一的数理モデルの枠組のもとで安全性の理論的な限界を不変的に評価した.さらに,安全性と利便性のトレードオフ関係についても,理論的限界や最適性を明らかにし,情報セキュリティシステムの新たな評価指標を示した.また,学習理論や最適化理論等の周辺研究分野における等価な確率モデルを用いた問題の成果を応用することで,最適法を近似する高性能アルゴリズムを構成し,安全性や利便性を具体的に評価した

  • プライバシー保護データマイニングにおける分散型回帰分析の実用化

    研究期間:

    2013年04月
    -
    2015年03月
     

     概要を見る

    本研究ではプライバシー保護回帰分析を扱った.複数のユーザがそれぞれ個別にデータを保持している状況において,ユーザが持つそれぞれのデータはユーザ間で共有しないもとで,全てのデータを用いた場合と同等の分析結果を得ることを考える.従来よりいくつかのプロトコルが提案されているが,本研究ではより実用的な状況に適用するために,いくつかの種類の分散計算法を新しく提案した.これにより多重共線性がある場合や,スパース性がある場合にもプライバシー保護回帰分析が適用可能となった

  • 古今東西の全言語を対象にしたテキストマイニングに関する研究

    科学研究費助成事業(湘南工科大学)  科学研究費助成事業(基盤研究(C))

    研究期間:

    2010年
    -
    2012年
     

     概要を見る

    文字N-グラムに基づく言語独立なテキスト分類手法である蓄積手法を提案した。蓄積手法は、索引語を形成する際に文字N-グラムを使用するので、言語固有の文法構造に依存しない。テキスト文書がUnicodeで表現されてさえいれば、蓄積手法は異なる言語に対しても同一のプログラムを用いて文書を分類することができる。そこで、この蓄積手法を用いて英語と日本語と韓国語と中国語のテキスト文書の分類実験をした。その結果、英語のReuters-21578は94.5%、日本語の毎日新聞の実験データは88.5%、韓国語のハンギョレー新聞の実験データは90.2%、中国語の人民日報の実験データに対しても92.6%の精度で分類することができた。このように、蓄積手法が様々な言語で比較的高い精度で分類できることを確認した。さらに、蓄積手法の数理モデルを構築し、その数理的な意味を解明することができた。

学内研究費(特定課題)

  • ナノスケール半導体デバイス設計のための機械学習アルゴリズムの開発

    2021年   村口 正和

     概要を見る

    近年,ナノスケールのデバイス設計に機械学習を⽤いることで,量⼦物理を取り込んだシミュレーションの煩雑さと計算コストの課題克服を⽬指す研究が進められている.本研究では,ナノスケールの半導体デバイス中のキャリアダイナミクスシミュレーションをモチーフとし,シミュレーションによるデバイス設計を機械学習により代替するための3種類の予測モデルの開発を行った.①不純物分布から電⼦の透過率を予測するモデル,②不純物分布および電子密度の初期状態から電子密度分布の変化を予測するモデル,③電子密度の変化データから不純物分布を予測するモデル.①については論文投稿を行い受理,②と③については学会発表を行った.

  • 低品質データ解析アルゴリズムの一般化と実データへの適用

    2020年  

     概要を見る

    様々な低品質データに対するデータ解析手法の開発を目的とし研究を行った.まず,ラベルにノイズを含む分類問題に関する研究を行った.誤りや欠損など様々なノイズ混入を一般的に表現可能なモデルを提案し,それに対応する分類アルゴリズムの提案を行い,その理論性能について評価を行った.また,日本語文書における同音異義語誤りを検出するアルゴリズムを提案し,実験によりその性能評価を行った.

  • 先端データ科学アルゴリズムの人文社会科学分野への応用

    2019年  

     概要を見る

    本研究課題では自身や他の研究者が開発した最新のデータ分析アルゴリズムを様々な実データに対して適用することで,様々な分析対象における実問題の解決を図るとともに,分析アルゴリズムの欠点や問題点を明らかにし,新たな分析アルゴリズムの開発に繋がる知見を得る事を目的としていた.本年度は,実際の大規模な消費者アンケートデータを分析対象とし,信頼度の低いアンケートデータにおける分析アルゴリズムの開発を行った.更に,半導体中での電子ダイナミクス計算によって得られたデータを対象とし,ナノスケールデバイスの設計における機械学習アルゴリズムの応用に関する研究を行った.

  • 低品質データのための次世代データ解析基盤の構築

    2017年  

     概要を見る

     様々な低品質データに対するデータ解析手法の開発を目的とし研究を行った.まず,ラベルにノイズを含む分類問題に関する研究を行った.誤りや欠損など様々なノイズ混入を一般的に表現可能なモデルを提案し,それに対応する分類アルゴリズムの提案を行った.次に,Web調査などのランダムサンプリングの前提が崩れているアンケートデータを用いて,母集団の回答分布を推定する研究を行った.最後に,重回帰分析におけるスパース推定について研究した.説明変数に複雑な交互作用や,高次の項を含む多項式回帰モデルにおいて,最大次数が未知の場合のスパース推定アルゴリズムを提案した.それぞれの研究成果については国内学会で発表を行った.

  • クラウド環境における確率モデルに基づく無歪み高圧縮符号化に関する研究

    2011年  

     概要を見る

    膨大な量のディジタルデータが流通する現代において,データ圧縮(情報源符号化)技術は,ネットワーク社会を支える重要な基盤技術のひとつとなっている.現在,主に使われているデータ圧縮技術は80 年代にZiv らによって提案されたLempel-Ziv 法(LZ 法)を基礎においている.具体的には,gzip などの圧縮ツールに用いられている手法である.LZ 法が提案されて以来,LZ法をベースにした改良法の研究が数多くされてきたものの,90 年代後半になると一定の成果を得たことで大きな進展はなくなった.また情報ネットワークの高速化に伴い,アルゴリズムの改善によるメリットが薄れてきたため,圧縮技術に関する研究は1 度は収束を迎えたかのように見えた.しかし近年,ネットワークの高速化が頭打ちになりつつある中,クラウドコンピューティングの発達やディジタルコンテンツの大容量化により,ネットワークトラヒックやサーバの記憶容量は増加の一途を辿っている.そのため,データ圧縮技術のさらなる発展が求められるようになり,今後のネットワーク社会における重要な課題のひとつであると考えられる.データ圧縮アルゴリズムは,圧縮対象となるデータの出現構造に対し,陽に確率モデルを仮定するアルゴリズムと,陽には仮定しないアルゴリズムに分類することができる.前者にはCTW法やベイズ符号など,後者にはLZ 法やその改良法などが含まれる.圧縮アルゴリズムの性能評価は,データのサイズを伸ばしていった時に,圧縮後のファイルのサイズが,圧縮の理論限界であるエントロピーへ収束するのか,また収束する場合にはどれくらいの速さで収束するのか,によって評価される.確率モデルを陽に仮定するアルゴリズムは,エントロピーの収束速度が非常に速い代わりに,仮定した確率モデルに対してしかエントロピーへの収束を保証できない.それに対し,LZ 法などの確率モデルを陽に仮定しないアルゴリズムは,非常に広いモデルのクラスに対してエントロピーへの収束が保証できる代わりに,その収束速度は非常に遅く,有限時点での圧縮性能は必ずしも高くない.現在主流として用いられている圧縮技術のほとんどは,LZ 法をベースとした確率モデルを陽に仮定しないアルゴリズムを用いているため,汎用性は高いものの個々のファイルに対しての圧縮性能は必ずしも高いとは言えず,圧縮率の改善の余地はまだまだあると考えられる.その一方,ベイズ符号などの確率モデルを仮定するアルゴリズムに関する研究は,限られた確率モデルに対する研究しか行われておらず,実用的なデータ構造に対する研究が不十分であるため実用化には至っていない.そこで本研究では,高圧縮率である確率モデルを仮定した圧縮アルゴリズムを,実用的なデータ構造に対して適用することを目的として研究を行った.特に従来テキストデータに対して,非常に高い圧縮率を持ち,理論的最適性の保証することのできるベイズ符号を他のデータ構造に対し拡張し適用を行った.その結果,アルゴリズムを実装する際,ベイズ符号が仮定する確率モデルと,真の確率構造がことなる場合においても,ベイズ符号は一定の圧縮性能を持つ事を理論的に示すことができた.

  • 実用化に向けた高圧縮符号化アルゴリズムに関する研究

    2006年  

     概要を見る

    情報ネットワーク社会において,情報の圧縮技術は欠くことのできない基盤技術である.現在、主に使われている圧縮技術は80年代にZivらによって提案されたLempel-Ziv法(LZ法)を基礎においている.具体的には,gzipなどの圧縮ツールのアルゴリズムで使われている.LZ法が提案されて以来,LZ法をベースにした改良法の研究が数多くされてきた.90年代後半になると,一定の成果を得たことで,大きな進展はなくなり,また情報ネットワークの高速化に伴い,多少の改善によるメリットが薄れてきたため,圧縮技術に関する研究は,一度は収束を迎えたかのように見えた.しかし近年,情報ネットワークの高速化が頭打ちになりつつある中,情報コンテンツの大容量化の速度は依然衰えず,圧縮技術の重要性が増しつつある.そのため,圧縮技術の基礎理論のさらなる発展は今後のネットワーク社会における重要な課題のひとつである.90年代に研究されていたベイズ符号という符号化法がある.この符号は,理論限界を達成することが示されており,他の符号よりも高い圧縮率で圧縮することが可能であることが知られている.従来,ベイズ符号やその他の符号に関する研究では定常な情報源に対しての研究がほとんどであり,より一般的な情報源である非定常情報源に対する研究は少ない.実際に圧縮するデータが非定常性を有することは充分に考えられ,実用化に際しては非定常な情報源に対しても性能が保証される符号の構成が必要となってくる.そこで本研究ではある非定常な情報源のクラスに対し,効率的なベイズ符号の構成法を提案し,それに対する漸近的な性能評価を行った.

▼全件表示

 

現在担当している科目

▼全件表示