研究者詳細 - 須子　統太

写真a

スコ　トウタ

須子　統太

Scopus 論文情報

論文数: 15 Citation: 47 h-index: 2

Click to view the Scopus page. The data was downloaded from Scopus API in July 28, 2026, via http://api.elsevier.com and http://www.scopus.com .

所属

社会科学総合学術院社会科学部

職名

准教授

学位

博士（工学） ( 早稲田大学 )

ホームページ

https://t-suko.w.waseda.jp/

研究分野

情報学基礎論 / 知能情報学 / 統計科学

研究キーワード

統計的学習理論、情報理論、統計的決定理論、機械学習

論文

A Study on Predictor Variable-Dependent Model Selection for Minimizing the Bayes Risk of Prediction Error

INOUE Kazuma, HORII Shunsuke, SUKO Tota

IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E109.A ( 3 ) 511 - 523 2026年03月 [査読有り]

　概要を見る

Model selection is a critical step in data analysis and machine learning, particularly in prediction tasks where the true underlying model is rarely known. Although numerous techniques have been proposed, most traditional methods select the same model regardless of the predictor variables. In practice, however, predictor variables may be fully or partially available at the time of prediction, which is expected to improve predictive accuracy. In this paper, we present a novel model selection framework in which the chosen model varies depending on the values of the predictor variables based on statistical decision theory. We begin by defining a loss function that explicitly incorporates the predictor variables and then derive the corresponding Bayes risk function. Subsequently, we present an expression for model selection that minimizes this Bayes risk. Using the same procedure, we also define a loss function for the scenario in which predictor variables are unavailable and derive an expression that minimizes the Bayes risk in that setting. Building on these formulations, we establish a theorem for a model selection method that minimizes Bayes risk, enabling us to obtain explicit selection criteria under commonly used loss functions, including the logarithmic and squared error losses. Furthermore, by applying this theorem, we demonstrate a connection to the existing Procedure for Optimal Predictive Model Selection (POPMOS). In particular, we show that POPMOS — originally devised to minimize the Kullback-Leibler divergence between each model’s predictive distribution and the posterior predictive distribution — arises as a special case of our general Bayes risk minimization framework when the logarithmic loss function is employed. We validate the effectiveness of our approach through extensive simulations on synthetic data, demonstrating that our framework not only reduces prediction error but also compares favorably with current model selection techniques.

DOI
生成AIを用いた刑事裁判例の分析支援—構成要件該当事実の抽出手法の検討

今井伊織, 西村剛輝, 中田己悠, 仲道祐樹, 須子統太, 野村亮

人工知能学会論文誌 40 ( 4 ) B-O121_1 - 10 2025年07月 [査読有り]

DOI
Detection Probability of Poor Responses in Questionnaires with Quality Control Questions

SUKO Tota, KOBAYASHI Manabu

IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E108.A ( 3 ) 442 - 449 2025年03月 [査読有り]

　概要を見る

In the realm of web-based surveys, ensuring the quality of responses is a crucial yet challenging task. This study addresses the issue of detecting poor responses, particularly focusing on the phenomenon of ’satisficing’ - a situation where respondents provide minimal effort responses. Traditional methods such as the Instructional Manipulation Check (IMC) and Directed Question Scale (DQS) have been commonly employed to tackle this issue. However, their effectiveness is often limited due to various constraints. This paper introduces a theoretical framework and a generalized model for the design of questionnaires. This framework aims to improve the detection of poor responses, thus enhancing the reliability and validity of survey data. Through numerical experiments, the paper demonstrates the applicability and effectiveness of the proposed model. The study's approach is based on a thorough analysis of response patterns and the integration of quality control questions within the survey structure. The findings of this research have significant implications for the field of survey methodology, providing a more robust and systematic way of ensuring data integrity in web-based surveys.

DOI
正則化最小二乗法を用いた多変量多項式回帰モデルに対するパラメータ推定法

井上一磨, 清水良太郎, 須子統太, 後藤正幸

情報処理学会論文誌数理モデル化と応用（TOM） 17 ( 1 ) 36 - 46 2024年02月 [査読有り]

　概要を見る

多項式回帰モデルは，単純な線形回帰モデルに比べて複雑な関係を表現できるモデルであり，様々な予測問題に活用されている．また，複雑な処理を行う機械学習モデルに比べて，高い解釈性を持つという点でも有用なモデルであると考えられる．しかし，多変量の多項式回帰モデルでは，次数が大きくなると変数の数が指数的に増大するため，適切な説明変数の選択が必要である．従来，多変量多項式回帰モデルに対してスパース推定を用いて，効率的に高次の項の推定を可能にするアルゴリズムが提案されている．それらの1つであるSPORE-LASSOは，元の説明変数にLASSOを適用して一部の変数を取り出し，少数の説明変数に任意の次数の多項式展開を行って構築した多項式回帰モデルに対して，再度スパース推定を行うアルゴリズムである．その結果，すべての説明変数を考慮せず，多項式回帰モデルに対する効率的なパラメータ推定を実現している．しかし，従来のアルゴリズムは，最大次数を固定する必要がある．故に，最大次数を小さく設定すると真の構造をとらえることができなくなってしまい，大きく設定した場合には上述のように，変数の数が指数的に増加してしまうという問題を抱えている．そこで本稿では，最大次数が未知の多項式回帰モデルに対し，スパース推定を行う新たなアルゴリズムを提案し，人工データによるシミュレーション実験と実データを用いた実験によりその有効性を検証する．
We introduce a novel algorithm designed to estimate the parameters of multivariate polynomial regression models with an undefined maximum order. Polynomial regression models are crucial tools in predictive tasks. However, as the number of explanatory variables rises, so does the complexity of the polynomial terms, making accurate parameter estimation particularly challenging when dealing with higher order models. The SPORE-LASSO algorithm tackles this issue by leveraging sparse estimation for multivariate polynomial regression models, effectively approximating higher order terms. By utilizing the LASSO technique, it identifies a concise set of significant explanatory variables. This method permits sparse estimation of polynomial regression models, adeptly managing a restricted number of polynomial terms. Nonetheless, conventional algorithms mandate the specification of a maximum order. When this parameter is set too low, the model's true structure may be overlooked. Conversely, if the maximum order is set too high, an unwieldy increase in the number of variables arises. Thus, we've developed a new algorithm that mitigates these issues. We have confirmed the efficacy of this algorithm through simulation experiments employing both synthetic and real-world data.
Asymptotic Evaluation of Classification in the Presence of Label Noise

Goki Yasuda, Tota Suko, Manabu Kobayashi, Toshiyasu Matsushima

IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences E106A ( 3 ) 422 - 430 2023年03月 [査読有り]

　概要を見る

In a practical classification problem, there are cases where incorrect labels are included in training data due to label noise. We introduce a classification method in the presence of label noise that idealizes a classification method based on the expectation-maximization (EM) algorithm, and evaluate its performance theoretically. Its performance is asymptotically evaluated by assessing the risk function defined as the Kullback-Leibler divergence between predictive distribution and true distribution. The result of this performance evaluation enables a theoretical evaluation of the most successful performance that the EM-based classification method may achieve.

DOI

Scopus
A Study on Estimation of Distribution from Survey Data with Selection Bias based on Statistical Decision Theory

Tota Suko

Journal of Japan Industrial Management Association 73 ( 4 E ) 260 - 267 2023年 [査読有り]

　概要を見る

In recent years, web-based questionnaire surveys have become widely used. Since the cost of web surveys is low, they are easily used as a basic research tool for planning various policies. However, web surveys often contain selection bias. The results of questionnaires that do not reflect the population to be surveyed may lead to the planning of wrong measures. Therefore, it is important to develop a method to correct the selection bias in order to use web surveys effectively. In previous studies, a correction method has been proposed by modeling the occurrence of selection bias using a selection model. In this study, we propose a new correction method for selection bias based on statistical decision theory. We present an optimal distribution estimation method that minimizes the loss function under the Bayes criterion. We show that the proposed method is not only theoretically optimal, but also has good performance in numerical experiments on artificial data.

DOI

Scopus
Investigation of features for prediction modeling of nanoscale conduction with time-dependent calculation of electron wave packet

Masakazu Muraguchi, Ryuho Nakaya, Souma Kawahara, Yoshitaka Itoh, Tota Suko

Japanese Journal of Applied Physics 61 ( 4 ) 2022年04月 [査読有り]

　概要を見る

A model to predict the electron transmission probability from the random impurity distribution in a two-dimensional nanowire system by combining the time evolution of the electron wave function and machine learning is proposed. We have shown that the intermediate state of the time evolution calculation is advantageous for efficient modeling by machine learning. The features for machine learning are extracted by analyzing the time variation of the electron density distribution using time evolution calculations. Consequently, the prediction error of the model is improved by performing machine learning based on the features. The proposed method provides a useful perspective for analyzing the motion of electrons in nanoscale semiconductors.

DOI

Scopus
A Note on the Estimation Method of Intervention Effects based on Statistical Decision Theory

Shunsuke Horii, Tota Suko

2019 53rd Annual Conference on Information Sciences and Systems, CISS 2019 2019年04月 [査読有り]

　概要を見る

In this paper, we deal with the problem of estimating the intervention effect in the statistical causal analysis using the structural equation model and the causal diagram. The intervention effect is defined as a causal effect on the response variable Y when the causal variable X is fixed to a certain value by an external operation and is defined based on the causal diagram. The intervention effect is defined as a function of the probability distributions in the causal diagram, however, generally these probability distributions are unknown, so it is required to estimate them from data. In other words, the steps of the estimation of the intervention effect using the causal diagram are as follows: 1. Estimate the causal diagram from the data, 2. Estimate the probability distributions in the causal diagram from the data, 3. Calculate the intervention effect. However, if the problem of estimating the intervention effect is formulated in the statistical decision theory framework, estimation with this procedure is not necessarily optimal. In this study, we formulate the problem of estimating the intervention effect for the two cases, the case where the causal diagram is known and the case where it is unknown, in the framework of statistical decision theory and derive the optimal decision method under the Bayesian criterion. We show the effectiveness of the proposed method through numerical simulations.

DOI

Scopus

2

被引用数

(Scopus)
半教師付き学習における一致性を満たすゆう度方程式の解に基づく予測の漸近評価

安田豪毅, 宮希望, 須子統太, 松嶋敏泰

電子情報通信学会論文誌 A(Web) J100-A ( 1 ) 2017年 [査読有り]

J-GLOBAL
A new latent class model for analysis of purchasing and browsing histories on EC sites

Masayuki Goto, Kenta Mikawa, Shigeichi Hirasawa, Manabu Kobayashi, Tota Suko, Shunsuke Horii

Industrial Engineering and Management Systems 14 ( 4 ) 335 - 346 2015年12月 [査読有り]

　概要を見る

The electronic commerce site (EC site) has become an important marketing channel where consumers can purchase many kinds of products
their access logs, including purchase records and browsing histories, are saved in the EC sites' databases. These log data can be utilized for the purpose of web marketing. The customers who purchase many product items are good customers, whereas the other customers, who do not purchase many items, must not be good customers even if they browse many items. If the attributes of good customers and those of other customers are clarified, such information is valuable as input for making a new marketing strategy. Regarding the product items, the characteristics of good items that are bought by many users are valuable information. It is necessary to construct a method to efficiently analyze such characteristics. This paper proposes a new latent class model to analyze both purchasing and browsing histories to make latent item and user clusters. By applying the proposal, an example of data analysis on an EC site is demonstrated. Through the clusters obtained by the proposed latent class model and the classification rule by the decision tree model, new findings are extracted from the data of purchasing and browsing histories.

DOI

Scopus

23

被引用数

(Scopus)
Asymptotics of Bayesian Inference for a Class of Probabilistic Models under Misspecification

Nozomi Miya, Tota Suko, Goki Yasuda, Toshiyasu Matsushima

IEICE TRANSACTIONS ON FUNDAMENTALS OF ELECTRONICS COMMUNICATIONS AND COMPUTER SCIENCES E97A ( 12 ) 2352 - 2360 2014年12月 [査読有り]

　概要を見る

In this paper, sequential prediction is studied. The typical assumptions about the probabilistic model in sequential prediction are following two cases. One is the case that a certain probabilistic model is given and the parameters are unknown. The other is the case that not a certain probabilistic model but a class of probabilistic models is given and the parameters are unknown. If there exist some parameters and some models such that the distributions that are identified by them equal the source distribution, an assumed model or a class of models can represent the source distribution. This case is called that specifiable condition is satisfied. In this study, the decision based on the Bayesian principle is made for a class of probabilistic models (not for a certain probabilistic model). The case that specifiable condition is not satisfied is studied. Then, the asymptotic behaviors of the cumulative logarithmic loss for individual sequence in the sense of almost sure convergence and the expected loss, i.e. redundancy are analyzed and the constant terms of the asymptotic equations are identified.

DOI

Scopus
An Analysis of Purchasing and Browsing Histories on an EC Site Based on a New Latent Class Model

Masayuki Goto, Kenta Mikawa, Manabu Kobayashi, Shunsuke Horii, Tota Suko, Shigeichi Hirasawa

The 1st East Asia Workshop on Industrial Engineering 2014年11月
Asymptotics of MLE-based Prediction for Semi-supervised Learning

Goki Yasuda, Nozomi Miya, Tota Suko, Toshiyasu Matsushima

Proc. of 2012 International Symposium on Information Theory and its Applications (ISITA2014) 343 2014年10月 [査読有り]
プライバシー保護機能を持つ線形回帰モデルにおける最小二乗推定量の分散計算法について

須子統太, 堀井俊佑, 小林学, 後藤正幸, 松嶋敏泰, 平澤茂一

日本経営工学会論文誌 65 ( 2 ) 78 - 88 2014年07月 [査読有り]

　概要を見る

本稿ではプライバシー保護を目的とした回帰分析について扱う．これは複数のユーザがそれぞれ異なるデータを保持したもとで，それぞれの保持するデータを互いに公開，共有することなく，協力して全てのデータを用いた場合と同等の回帰分析を行うというものである．本稿ではまず，ユーザが2人の場合を想定し，2者が異なる属性に関するデータを保持しているもとで最小二乗推定量を分散計算する場合を考える．そのもとで，新たな分散計算プロトコルを提案し，プライバシーについてプロトコルの安全性を評価する．また，提案するプロトコルは繰り返し計算を行うため，数値実験によりプロトコルの繰り返し数についての評価を行う．さらに，収束回数を削減する修正プロトコルを提案し，多者間での分散計算への拡張も行う．

DOI CiNii
Iterative multiuser joint decoding based on ADMM

S. Horii, T. Suko, T. Matsushima, S. Hirasawa

2013 IEEE Global Conference on Signal and Information Processing, GlobalSIP 2013 - Proceedings 1097 - 1100 2013年 [査読有り]

　概要を見る

In this paper, we develop an iterative multiuser joint decoding of code-division multiple-access (CDMA) signals based on a distributed optimization algorithm. For the joint decoding problem, decoding algorithm based on the turbo principle is widely used. The algorithm consists of soft-input soft-output (SISO) channel decoder and SISO multiuser detector and it can be derived as an application of the sum-product algorithm. On the other hand, in the research area of error correcting codes, the decoding algorithm based on convex optimization has been attracting a great deal of attention. Decoding algorithm based on linear programming (LP) has decoding error rate which is comparable with sum-product algorithm with stronger theoretical guarantees. We formulate the joint decoding problem of CDMA signals as an convex optimization problem and we present a relax form of the problem. Moreover, we propose a distributed algorithm which efficiently solves the relaxed optimization problem. The proposed algorithm is based on alternating direction method of multipliers (ADMM). We also see the performance of the proposed decoder through numerical simulations. © 2013 IEEE.

DOI

Scopus
Asymptotics of Bayesian estimation for nested models under misspecification

Nozomi Miya, Tota Suko, Goki Yasuda, Toshiyasu Matsushima

2012 INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY AND ITS APPLICATIONS (ISITA 2012) 86 - 90 2012年 [査読有り]

　概要を見る

We analyze the asymptotic properties of the cumulative logarithmic loss in the decision problem based on the Bayesian principle and explicitly identify the constant terms of the asymptotic equations as in the case of previous studies by Clarke and Barron and Gotoh et al. We assume that the set of models is given that identify a class of parameterized distributions, it has a nested structure and the source distribution is not contained in all the families of parameterized distributions that are identified by each model. The cumulative logarithmic loss is the sum of the logarithmic loss functions for each time decision-, e. g., the redundancy in the universal noiseless source coding.
A Note on Linear Programming Based Communication Receivers

S. Horii, T. Suko, T. Matsushima, S. Hirasawa

in Proc. of the 3rd International Castle Meeting on Coding Theory and Applications 141 - 146 2011年 [査読有り]
Bayes universal source coding scheme for correlated sources

Tota Suko, Shunsuke Horii, Toshiyasu Matsushima, Shigeichi Hirasawa

Proceedings of the 1st IEEE African Winter School on Information Theory and Communications 2010 27 2010年05月 [査読有り]
On the Bayesian Forecasting Algorithm under the Non-Stationary Binomial Distribution with the Hyper Parameter Estimation

Daiki Koizumi, Tota Suko, Toshiyasu Matsushima

Proceeding of Ninth Valencia International Meeting on Bayesian Statistics 167 - 168 2010年 [査読有り]
Asymptotic property of universal lossless coding for independent piecewise identically distributed sources

Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

Journal of Discrete Mathematical Sciences and Cryptography 13 ( 4 ) 383 - 391 2010年 [査読有り]

　概要を見る

The universal lossless source coding problem is one of the most important problem in communication systems. The aim of source coding is to compress data to reduce costs in digital communication. Traditional universal source coding schemes are usually designed for stationary sources. Recently, some universal codes for nonstationary sources have been proposed. Independent piecewise identically distributed (i.p.i.d.) sources are simple nonstationary sources that parameter changes discontinuously. In this paper, we assume new i.p.i.d. sources class, and we prove that Bayes codes minimize the mean redundancy when parameter transition pattern is known and parameter is unknown. © 2010 Taylor &amp
Francis Group, LLC.

DOI

Scopus
外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム

須子統太, 松嶋敏泰, 平澤茂一

情報処理学会論文誌数理モデル化と応用 Vol.1 ( No.1 ) 17 - 26 2008年09月 [査読有り]

　概要を見る

統計解析を行う際，得られたデータの中に外れ値が含まれることが多々ある．外れ値は少量であっても解析結果に大きく影響を与えることがあるため，従来から外れ値を含むデータに対する統計解析手法が数多く研究されている．従来，Boxらにより線形回帰モデルに対し混合分布を用いて外れ値の発生をモデル化する研究が行われている．同様のモデルに対し様々な研究が行われているが，いずれも外れ値の検出やパラメータの推定を目的としている．そこで本研究では，外れ値データの発生を含む回帰モデルに対する予測法について扱う．まず，このモデルに対しベイズ基準のもとで最適な予測法を示す．しかし，この方法はデータ数に対し指数的に計算量が増大してしまう．そこで，EMアルゴリズムを用いて計算量を削減した近似アルゴリズムを提案し，シミュレーションにより有効性を検証する．
Outliers are often included in statistical data. A statistical analysis result is influenced from outliers. Therefore, there are many researches for a statistical analysis of data with outliers. Box modeled outliers using mixture distribution. There are many researches that aim parameter estimation or outlier detection about this model. In this paper, we treat prediction problem about this model. First, we present an optimal prediction method with reference to the Bayes criterion in this model. The computational complexity of this method grows exponentially with data size. Next, we propose an approximation algorithm reducing the computational complexity using EM algorithm, and evaluate this algorithm through some simulations.

CiNii
拡張された有本-Blahutアルゴリズムの大域的収束性について

安井謙介, 須子統太, 松嶋敏泰

電子情報通信学会論文誌 Vol.91-A ( No.9 ) 846 - 860 2008年09月 [査読有り]

　概要を見る

有本-Blahutアルゴリズムは,通信語容量やレートひずみ関数を効率的に計算するアルゴリズムであり,有本とBlahutにより独立に提案された.この計算法は,目的関数が通信路容量と同形の関数形となれば他の問題にも適用可能であり,例えば補助情報が存在する通信モデルにおける通信路容量などの計算にも適用することができる.しかし,多端子のモデルにおける通信路容量の関数形は,一般に通信路容量と同形の関数形とはならないため適用することができない.本論文では,まず通信路容量やレートひずみ関数の関数形を含むような形で目的関数を一般的に定義する.目的関数の例として,通信路容量やレートひずみ関数の関数形のほかに,計算法が示されていなかった秘密保持容量(secrecy capacity)やKaspiが導出したレートひずみ関数の関数形がある.次に,その目的関数の最小値を計算する逐次最小化アルゴリズムを有本-Blahutアルゴリズムを拡張した形で提案する.また,目的関数が凸性を満たすならば,提案法は大域的収束性を保証するアルゴリズムであることを証明する.最後に数値実験を用いて,秘密保持容量の性質を調べる.

CiNii
Multiuser detection algorithm for CDMA based on the belief propagation algorithm

Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

IEEE International Symposium on Spread Spectrum Techniques and Applications 194 - 199 2008年 [査読有り]

　概要を見る

Optimum detection for the multiuser code-division multiple-access channel is prohibitively complex. This paper considers new iterative multiuser detection algorithm based on the belief propagation algorithm. Previously, the idea to apply the belief propagation algorithm to multiuser detection problem was suggested , however, it was believed that to apply the belief propagation algorithm to the detection problem is impossible because it requires an exponentially large amount of computation. It was the only fact that the parallel interference canceller is derived as an approximation of the belief propagation. In this paper, we show that the belief propagation algorithm can be applied to the detection problem by converting the factor graph structure. Performance of the detector based on the belief propagation algorithm is better than that of the parallel interference canceller. © 2008 IEEE.

DOI

Scopus

1

被引用数

(Scopus)
An Algorithm for Computing the Secrecy Capacity of Broadcast Channels with Confidential Messages

Kensuke Yasui, Tota Suko, Toshiyasu Matsushima

Proceedings of IEEE International Symposium on Information Theory 936 - 940 2007年06月 [査読有り]

　概要を見る

In this paper, we present an iterative algorithm for computing the secrecy capacity of broadcast channel with confidential message (BCC) in the situation that the main channel is less noisy than the eavesdropper's channel. The global convergence of the algorithm is proved, and an expression for its convergence rate is derived.

DOI CiNii

Scopus

20

被引用数

(Scopus)
Multiuser Detection Algorithms for CDMA based on the Massage Passing Algorithms

Shunsuke Horii, Tota Suko, Toshiyasu Matsushima

Proceeding of 2006 Hawaii, IEICE and SITA Joint Conference on Information Theory (HISC2006) 106 ( 60 ) 17 - 22 2006年

CiNii

▼全件表示

書籍等出版物

データ科学入門IV : 写像とグラフによる統一的体系化―変数/定数の観測可能性の視点から

松嶋敏泰, 須子統太, 小林学, 野村亮, 堀井俊佑, 安田豪毅, 中原悠太

2025年04月 ISBN: 9784781916293
データ科学入門III : モデルの候補が複数あるときの意思決定

松嶋敏泰, 須子統太, 小林学, 野村亮, 堀井俊佑, 安田豪毅, 中原悠太

2024年04月 ISBN: 9784781915982
データ科学入門II : 特徴記述・構造推定・予測 ― 回帰と分類を例に

松嶋敏泰, 須子統太, 小林学, 野村亮, 堀井俊佑, 安田豪毅, 中原悠太

2023年03月 ISBN: 9784781915678
データ科学入門I : データに基づく意思決定の基礎

松嶋敏泰, 須子統太, 小林学, 野村亮, 安田豪毅, 堀井俊佑, 鎌塚明, 中原悠太

2022年04月 ISBN: 9784781915401
IT Text 確率統計学

須子統太, 鈴木誠, 浮田善文, 小林学, 後藤正幸

オーム社 2010年09月 ISBN: 9784274209130

共同研究・競争的資金等の研究課題

電子波動関数の時間発展データを用いたナノスケール半導体中の物性予測モデルの構築

日本学術振興会科学研究費助成事業

研究期間:

2023年04月

-

2026年03月

村口正和, 須子統太
データの低品質性を考慮したデータ解析手法の開発と体系化

日本学術振興会科学研究費助成事業

研究期間:

2021年04月

-

2024年03月

須子統太

　概要を見る

本研究では，所謂ビッグデータにおけるデータの低品質性に着目し，低品質データからでも有用な知識を抽出する事ができる新しい分析手法を開発するとともに，様々な分析手法を体系化することで低品質データの統合的な扱い方を明らかにすることを目的としている．具体的には「目的A.統計的決定理論に基づく選択バイアス補正手法の開発」「目的B.不良回答を含むアンケートデータの分析手法の確立」「目的C.データ劣化過程の統合モデルの開発と体系化」という3つの目的に対する研究を進めていく．2021年度は目的AおよびBについて研究を実施した．
目的A：選択バイアスの補正手法について，傾向スコア法や回帰モデル法など様々なアルゴリズムが提案されている．しかし，万能な補正アルゴリズムはなく，データによって補正精度の高いアルゴリズムが異なる事が実験的に示されている．そこで，選択バイアス発生のモデルを明確に定義することで，統計的決定理論に基づく最適な選択バイアス補正手法の提案を目的としている．2021年度は統計的決定理論に基づいた理論的なフレームワークを構築し，選択バイアス補正問題に対する理論的な最適戦略を明らかにした．また，人工データを用いた最適戦略のバイアス補正性能に関する評価実験を行った．この成果については国内学会にて発表を行い，同内容について現在論文投稿中である．
目的B：不良回答が混入したアンケートに対する分析手法の開発を目的としている．2021年度は，アンケートに追加の設問を付与することで不良回答を検出する手法に関する理論的な検出精度の導出に関する研究を行った．本研究では一般的な設問の追加方法と不良回答混入モデルを提案することで，様々な状況における理論的な不良回答検出確率を導出した．これらの成果について国内学会での発表を行った．
様々な低品質データに対応するロバストな分類アルゴリズムの開発

研究期間:

2018年04月

-

2021年03月

　概要を見る

蓄積されたデータをもとに，ある特徴量に対応するラベル（離散値）を予測する分類問題は，古くから統計学や機械学習，人工知能の分野で盛んに研究されている．近年様々な高精度な分類アルゴリズムが開発されたことにより，手書き文字認識，文書分類，購買行動予測など様々な場面でこれら分類アルゴリズムが活用されるようになってきた．その一方，必ずしも理想的な状況でデータが得られるとは限らず，低品質なデータに対する分類アルゴリズムの必要性が増してきている．そのため，ノイズを含むラベルからの学習や半教師あり学習など，様々な低品質なデータ取得状況に応じた分類手法の研究が個別に行われている．本研究では，分類問題におけるこれら低品質データの得られる状況を単一のモデルとして表現し，そのもとで高性能な分類アルゴリズムを構成することで，データの取得状況によらないロバストな分類アルゴリズムの開発を目的としている．本研究ではデータの発生構造として生成モデルおよび識別モデルと呼ばれる確率的な発生モデルを仮定し，それぞれにラベルノイズモデルを仮定した場合の分類アルゴリズムの提案および性能評価を行う計画を立てていた．2019年度は，当初予定を一部変更し，ノイズモデルのさらなる拡張を行い，潜在構造を持つ分類問題に対しラベルノイズモデルを適応した高性能な分類アルゴリズムの開発を行った．また，2018年度に行った漸近的な性能の理論解析の結果について，一部不十分な点が判明したため追加の研究を行い，提案したアルゴリズムの理論性能について詳細な解析結果を得た．2019年度の当初予定（研究課題申請時の計画）では，2018年度に行った，基本的な生成モデルを仮定した場合の分類アルゴリズムの開発および，そのアルゴリズムの性能評価を拡張し，生成モデルに対するカーネル法への拡張と識別モデルへの拡張を計画していた．しかし，2018年度の実績報告の際に報告した通り，2019年度開始時には計画を変更しており，2018年度に利用したラベルノイズモデルの更なる一般化および他のラベルノイズモデルを提案し，そのもとでデータの発生モデルとしては生成モデルを仮定した場合の分類アルゴリズムの提案およびその性能評価を行うことを計画していた．（尚この変更は，当初計画における「計画が予定通り進まない場合の対応」で想定していた範囲内の変更である．）本年度は変更された計画に従い，ラベルノイズモデルの更なる一般化として，潜在構造を持つ分類問題に対しラベルノイズモデルを拡張し分類アルゴリズムの開発とその性能評価を行った．また，2018年度に行った漸近的な性能の理論解析の結果について，一部不十分な点が判明したため追加の研究を行い，提案したアルゴリズムの理論性能について詳細な解析結果を得た．以上より，課題申請時の計画からは変更は出ているものの，2019年度当初に変更した計画通りに研究は進んでいる．2019年度の研究結果より，提案したモデルに対する新たな分類アルゴリズムについて，実験上の性能と理論解析における性能限界との間に大きな乖離がある事が分かった．これは提案したアルゴリズムの性能を更に向上させる事ができる可能性を示唆した結果であると考えられる．そこで2020年度は分類アルゴリズムの性能を理論限界に近づけるべく，アルゴリズムの挙動に対する詳細な調査および，それを元にしたアルゴリズムの改良を進めて行く予定である
大規模データ時代のビジネスアナリティクス手法に関する基礎的研究

日本学術振興会科学研究費助成事業

研究期間:

2014年04月

-

2017年03月

後藤正幸, 三川健太, 平澤茂一, 須子統太, 堀井俊佑, 小林学, 鈴木誠, 山下遥

　概要を見る

本研究では，大規模かつ多様なビジネスデータの分析技術（ビジネスアナリティクス）の体系化と深化を研究の目的とし，様々なビジネスデータに対応した分析モデルの提案と評価を行った．具体的には，１）ECサイトのデータベース情報を対象とした情報分析技術の開発，２）テキストデータとして蓄積されるマーケティング情報の分析技術の開発，３）情報推薦のための統計モデルの開発，４）情報検索や推薦の技術を活用したWebマーケティングモデルの理論解析，５）高次元かつ疎な大規模データを対象とした分析手法の開発，６）プライバシー保護データ解析の方法論の開発，などの個別研究課題を軸として研究を推進した
確率的要素を含む情報セキュリティシステムの利便性と安全性からの最適化と統合評価

日本学術振興会科学研究費助成事業

研究期間:

2013年04月

-

2016年03月

松嶋敏泰, 浮田善文, 吉田隆弘, 野村亮, 須子統太, 堀井俊佑

　概要を見る

確率的要素を含む情報セキュリティ問題に対し確率モデルにより定式化を行い，安全性や利便性等の評価基準を明確にし，最適な攻撃法や認証法等を理論的に明らかにした．個々の符号やシステムに対して安全性を評価するのではなく，統一的数理モデルの枠組のもとで安全性の理論的な限界を不変的に評価した．さらに，安全性と利便性のトレードオフ関係についても，理論的限界や最適性を明らかにし，情報セキュリティシステムの新たな評価指標を示した．また，学習理論や最適化理論等の周辺研究分野における等価な確率モデルを用いた問題の成果を応用することで，最適法を近似する高性能アルゴリズムを構成し，安全性や利便性を具体的に評価した
プライバシー保護データマイニングにおける分散型回帰分析の実用化

日本学術振興会科学研究費助成事業

研究期間:

2013年04月

-

2015年03月

須子統太

　概要を見る

本研究ではプライバシー保護回帰分析を扱った．複数のユーザがそれぞれ個別にデータを保持している状況において，ユーザが持つそれぞれのデータはユーザ間で共有しないもとで，全てのデータを用いた場合と同等の分析結果を得ることを考える．従来よりいくつかのプロトコルが提案されているが，本研究ではより実用的な状況に適用するために，いくつかの種類の分散計算法を新しく提案した．これにより多重共線性がある場合や，スパース性がある場合にもプライバシー保護回帰分析が適用可能となった
古今東西の全言語を対象にしたテキストマイニングに関する研究

科学研究費助成事業(湘南工科大学) 科学研究費助成事業(基盤研究(C))

研究期間:

2010年

-

2012年

鈴木誠, 大須賀昭彦, 後藤正幸, 須子統太

　概要を見る

文字N-グラムに基づく言語独立なテキスト分類手法である蓄積手法を提案した。蓄積手法は、索引語を形成する際に文字N-グラムを使用するので、言語固有の文法構造に依存しない。テキスト文書がUnicodeで表現されてさえいれば、蓄積手法は異なる言語に対しても同一のプログラムを用いて文書を分類することができる。そこで、この蓄積手法を用いて英語と日本語と韓国語と中国語のテキスト文書の分類実験をした。その結果、英語のReuters-21578は94.5%、日本語の毎日新聞の実験データは88.5%、韓国語のハンギョレー新聞の実験データは90.2%、中国語の人民日報の実験データに対しても92.6%の精度で分類することができた。このように、蓄積手法が様々な言語で比較的高い精度で分類できることを確認した。さらに、蓄積手法の数理モデルを構築し、その数理的な意味を解明することができた。

▼全件表示

Misc

波動関数の時間発展を用いた二次元ナノスケール半導体中の不純物数推定

梨木風吾, 杉山聖, 伊藤佳卓, 村口正和, 須子統太

2026年電子情報通信学会総合大会エレクトロニクス講演論文集2 36 2026年03月
大規模言語モデルによる教育目的に応じた統計データ生成手法の検討

石田崇, 小林学, 須子統太, 雲居玄道, 隈裕子, 渡邉文枝, 平澤茂一

2026年電子情報通信学会総合大会情報・システム講演論文集1 141 2026年03月
統計的決定理論に基づくコンセプトドリフト下のベイズ予測

谷崎悠太, 須子統太

2026年電子情報通信学会総合大会情報・システム講演論文集2 180 2026年03月
基盤モデルにおけるレート・損失領域の導出

今井伊織, 須子統太, 野村亮

2026年電子情報通信学会総合大会基礎・境界/NOLTA講演論文集 31 2026年03月
波動関数の時間発展を活用した半導体ナノ構造中の不純物分布予測フレームワーク

梨木風吾, 杉山聖, 伊藤佳卓, 須子統太, 村口正和

令和7年度電気・情報関係学会北海道支部連合大会 2025年11月
統計的決定理論に基づくAUROCを最大にする分類器の構成法について

須子統太, 小林学, 松嶋敏泰

第48回情報理論とその応用シンポジウム(SITA2025) 48 - 53 2025年11月
階層構造データ分類のためのECOC符号設計

道正楽南, 坂井瞭太, 小林学, 須子統太

第48回情報理論とその応用シンポジウム(SITA2025) 474 - 478 2025年11月
統計的決定理論に基づくラベルの階層構造を考慮した分類法について

坂井瞭太, 道正楽南, 小林学, 須子統太

第48回情報理論とその応用シンポジウム(SITA2025) 468 - 473 2025年11月
線形潜在構造を考慮したオフライン政策評価法

増本雄太, 東歩夢, 小林学, 須子統太

第48回情報理論とその応用シンポジウム(SITA2025) 294 - 299 2025年11月
統計的決定理論に基づくノイズを含まないソフトラベル学習法に関する一考察

石寺旬太郎, 小林学, 須子統太

第48回情報理論とその応用シンポジウム(SITA2025) 133 - 137 2025年11月
統計的決定理論に基づく自己選択バイアスを伴う調査データからの分布推定に関する研究

大橋絵莉菜, 小林学, 須子統太

第48回情報理論とその応用シンポジウム(SITA2025) 128 - 132 2025年11月
細分化した学習項目に基づく数学学習用問題のAI自動生成に関する検討

石田崇, 須子統太, 小林学, 雲居玄道, 隈裕子, 平澤茂一

2025PCカンファレンス 2025年08月
変分オートエンコーダを用いた不純物分布生成の高精度化による半導体ナノワイヤ中の電子伝導特性の設計に関する研究

杉山聖, 伊藤佳卓, 須子統太, 村口正和

応用物理学会学術講演会講演予稿集(CD-ROM) 86th 2025年

J-GLOBAL
早稲田大学における全学向けデータ科学教育-意思決定写像を用いた体系化の試み-

望月泰博, 小林学, 野村亮, 堀井俊佑, 安田豪毅, 中原悠太, 須子統太, 松嶋敏泰, 須子統太, 松嶋敏泰

統計関連学会連合大会講演報告集 2025 2025年

J-GLOBAL
言語モデルを用いたアンケート設問文からの回答分布予測に関する研究

道正楽南, 末次拓斗, 須子統太

第47回情報理論とその応用シンポジウム(SITA2024) 316 - 320 2024年12月
選択バイアスを含むアンケートデータに対するベイズ最適な分布推定手法における選択モデルの拡張

今井伊織, 須子統太

第47回情報理論とその応用シンポジウム(SITA2024) 310 - 315 2024年12月
予測に対するベイズリスクを最小化するモデル選択法について

井上一磨, 堀井俊佑, 須子統太

第47回情報理論とその応用シンポジウム(SITA2024) 236 - 241 2024年12月
複数意図を持つ音声言語理解のためのデータセット拡張と実用的なアルゴリズムの提案

末次拓斗, 須子統太

第47回情報理論とその応用シンポジウム(SITA2024) 230 - 235 2024年12月
生成AIを用いた刑事裁判例における構成要件該当事実の抽出システム

今井伊織, 西村剛輝, 中田己悠, 仲道祐樹, 須子統太, 野村亮

人工知能学会全国大会論文集(Web) 38th 2024年

J-GLOBAL
不良回答検出を目的としたアンケート設計手法と検出率の理論評価について

野口, 稜太, 須子, 統太, 小林, 学

情報処理学会第85回全国大会講演論文集 2023 ( 1 ) 491 - 492 2023年02月

　概要を見る

アンケート調査は企業や教育機関など様々な組織の意思決定に活用されている．特にWebアンケートはコストが安いことから多くの場面で用いられているが，不良回答が含まれる事も多く集計結果の信頼性に課題がある．そのため，従来よりダミーの追加設問を用いることで不良回答を検出する手法が考案されている．しかし，不良回答の検出精度に関しては一部の条件下でのみ理論評価が行われているだけで不明な点も多い．そこで本研究では従来と異なる条件のもと，不良回答混入モデルを仮定することで，不良回答検出手法の検出率についての理論評価を行う．
日本語音声言語理解タスクに対する日本語SLUモデルの活用

末次拓斗, 須子統太

情報処理学会第85回全国大会講演論文集 2023 ( 1 ) 421 - 422 2023年02月

　概要を見る

近年，音声言語理解（SLU）では多言語モデルの研究が進んでおり，英語以外の言語，特にSLUのデータが不十分な言語で有効な手法だとされている．一方で，日本語や韓国語など一部の言語に対しては多言語モデルの性能は低く，転移学習の効果が相対的に低いことが指摘されている．本論文では，日本語のみで事前学習した日本語ジョイントSLUモデルを開発し，従来の多言語モデルとの性能比較を行う．実験結果により，我々の提案する日本語モデルは，意図分類精度，スロットフィリングF1でより高い性能を達成することを示す．加えて，分かち書き，ジョイントモデルの有効性の検証を行い，日本語SLUモデルの性能向上の検討を行う．
正則化最小二乗法を用いた線形基底関数モデルに対する予測アルゴリズム

倉持七海, 須子統太

情報処理学会第85回全国大会講演論文集 2023 ( 1 ) 367 - 368 2023年02月

　概要を見る

機械学習における予測モデルでは，ニューラルネットワークのように表現力の高い複雑な関数系を仮定してデータから学習するアプローチが主流である．しかし，予測精度の高いモデルを学習するには大量のサンプルが必要であったり，パラメータのチューニングが難しいなどの問題がある．本研究では，正則化最小二乗法を利用することで，様々な基底関数を動的に選択しながら予想精度の高いモデルを構築するアルゴリズムを提案する．そのもとで，いくつかの実データを用いて提案アルゴリズムの評価を行う．
BERTを用いた刑事裁判例における犯罪構成要件要素の抽出手法について

中村恒太, 阿部太一, 西村剛輝, 中田己悠, 福岡咲歩, 須子統太, 野村亮, 仲道祐樹, 松澤伸

情報処理学会第85回全国大会講演論文集 2023 ( 1 ) 651 - 652 2023年02月

　概要を見る

刑事裁判例研究では法律専門家が大量の裁判例を読み込み，各犯罪の成立要件（構成要件）に該当する部分を抽出し比較する必要があるが，現状はこの作業を人手で行う必要がある．研究では，刑事裁判例研究の作業効率の改善のために，裁判例から各構成要件に該当する部分を抽出する．抽出は事前学習済みのBERTを用いて各構成要件と裁判例内の文章とのコサイン類似度を計算し，類似度の上位を各構成要件に該当する部分と判断する方法で行う．コサイン類似度を計算する際により典型的な裁判例から平均ベクトルを作成し用いること，抽出部分は各構成要件で重複しないこと，抽出順の変更を行うこと等により，抽出精度の改善が見られた．
最大次数が未知の多項式回帰モデルに対するスパース推定に関する一考察

井上一磨, 井上一磨, 清水良太郎, 須子統太, 後藤正幸

情報処理学会研究報告(Web) 2023 ( MPS-143 ) 2023年

J-GLOBAL
ナノスケール半導体中の電子の時間発展から不純物分布を予測するモデル化

村口正和, 原田和輝, 小林祐貴, 伊藤佳卓, 須子統太

応用物理学会春季学術講演会講演予稿集(CD-ROM) 70th 2023年

J-GLOBAL
不良回答の検出を目的としたアンケート設計に関する一考察

須子統太, 小林学

情報理論とその応用シンポジウム予稿集(CD-ROM) 46th 2023年

J-GLOBAL
3次元畳み込みニューラルネットワークを用いたナノスケール半導体中における電子ダイナミクスのモデル化精度向上

杉山聖, 伊藤佳卓, 須子統太, 村口正和

応用物理学会秋季学術講演会講演予稿集(CD-ROM) 84th 2023年

J-GLOBAL
ロジスティック回帰モデルにおける統計的決定理論に基づく選択バイアス補正アルゴリズムについて

阿部太一, 須子統太, 後藤正幸

人工知能学会全国大会論文集 JSAI2023 1G3GS102 - 1G3GS102 2023年

　概要を見る

Webアンケートは安価かつ手軽に消費者意向を調査できるため，マーケティング等の分野における施策の立案・検証のための調査方法として非常に有用なツールとなっている．しかし，完全なランダムサンプリングによってWebアンケートを行うことは難しいことが多く，調査結果にはしばしば選択バイアスが混入してしまう．このような選択バイアスに対応するため，選択バイアスの発生メカニズムをモデル化し，統計的決定理論に基づいて選択バイアスを補正する手法が提案されている．この従来研究は一般的なフレームワークであるが，実際にWebアンケート分析に適用するためには，具体的なモデルに落とし込み，その性能を検討する必要がある．そこで本研究では，回答結果が2値，共変量が連続値で表現されるようなWebアンケートデータにおける選択バイアス補正を対象とし，データの生成モデルとしてロジスティック回帰モデルを仮定する．そのもとで，統計的決定理論に基づく選択バイアス補正のフレームワークを用いて，具体的なモデルの定式化を行う．さらに，補正の精度や性質について，人工データを用いた数値実験で明らかにする

DOI
珠算競技における高負荷練習問題自動生成システム

須子統太,原子弘務,井上一磨

早稲田社会科学総合研究 20 ( 1 ) 39 - 47 2022年12月
小売企業における重要業績評価指標の予測法について

須子統太

早稲田社会科学総合研究 19 ( 1 ) 153 - 162 2022年03月
刑事裁判例研究における類型化のための支援システム

中田己悠, 西村剛輝, 須子統太, 野村亮, 仲道祐樹, 松澤伸

情報処理学会第84回全国大会講演論文集 2022 ( 1 ) 921 - 922 2022年02月

　概要を見る

刑法の研究では、「犯罪になりうる行為のうち、裁判所が実際に処罰しているのはどの範囲か」を客観的に把握することを目的として、裁判例の分析を行っている。裁判例は大量のテキストデータであり内容も千差万別であるが、分析に際し、いかなる類型についてどのような根拠で有罪としているかを分類するという事前作業が行われる。これら事前作業は一般的に専門家による読解と整理により行われており、人的コストが大きい。そこで、本研究では、刑法研究の作業効率を改善するため、この事前作業を自動化する支援システムの開発を行う。代表的な刑法裁判例をもとに提案システムによる分類を行い，事前作業としての要件を満たしているか検証を行う。
不良回答検出のためのアンケート設計方法について

伊藤健太郎, 須子統太, 小林学

情報処理学会第84回全国大会講演論文集 2022 ( 1 ) 445 - 446 2022年02月

　概要を見る

近年，Webアンケート等によるアンケート調査が様々な場面で活用されている．しかし，Webアンケートには不良回答が混入することが多く，アンケートの信頼性に問題がある．不良回答に対する一般的な対処方法として，アンケート設計時に特殊な設問を追加することで不良回答を検出する手法が提案されているが，検出の精度についての議論は少ない．そこで本研究では，不良回答混入モデルを仮定したもとで，不良回答検出のためのアンケート設計方法の統一的な枠組みを示し，いくつかの具体的な設計方法について検出誤り率の評価を行う．
中国人日本語学習者による日中同形異義語誤り検出方法について

崔可欣, 須子統太

情報処理学会第84回全国大会講演論文集 2022 ( 1 ) 791 - 792 2022年02月

　概要を見る

中国語と日本語は同じ漢字を使用する言語であるため同形語が多数存在する．その中には，同じ意味を表している同形同義語もあるが，意味の異なる同形異義語も多数存在する．そのため，中国人日本語学習者が日本語文章を作成する際，同形異義語を中国語の意味を用いて誤用しやすい傾向がある．このような文章は日本人が読むと違和感を感じるが，文法上の誤りがない場合一見して誤っていることが分かりにくい．そこで本研究では，中国人日本語学習者の学習支援を目的とした，日中同形異義語誤りの自動検出方法を検討する．事前学習済みのBERTと日中同形異義語の辞書を用いた，誤り検出アルゴリズムを提案し，評価実験により有効性を検証する．
リカレントニューラルネットワークを用いたランダム不純物分布を有するナノワイヤ中での電子密度分布の時間発展予測モデル

小林祐貴, 原田和輝, 伊藤佳卓, 須子統太, 村口正和

応用物理学会秋季学術講演会講演予稿集(CD-ROM) 83rd 2022年

J-GLOBAL
データ科学教育用フルオンデマンドコンテンツの作成と多目的利用

堀井俊佑, 野村亮, 須子統太

横幹連合コンファレンス予稿集 2022 A-1-2 2022年

DOI
データ科学分野における産学連携の取り組み事例について

須子統太, 堀井俊佑, 小林学

横幹連合コンファレンス予稿集 2022 A-1-4 2022年

DOI
Word2vecを用いた日本語文章における同音異義語誤り検出方法について

吉村光汰, 須子統太

情報処理学会第83回全国大会講演論文集 2021 ( 1 ) 551 - 552 2021年03月

　概要を見る

現在,文書作成ソフトには校正機能が備わっている.しかし,一般的な校正機能では,助詞,助動詞等の文法誤りの検出や,存在する単語であるかの検査は行うが,名詞や動詞,形容詞などにおける同音異義語の変換誤りは検出できない場合が多い.文章作成ソフトで作成された日本語文章において同音異義語の変換誤りは多く,これらを検出する機能は非常に重要な機能であると言える.本研究では,Word2vecを用いることで,文書中に出現した単語と周辺の単語との距離を算出し,同音異義語の変換誤りが無いか検出する方法を提案する.実際の新聞記事データに対し評価実験を行い,提案手法の有効性を検証する.

CiNii
電子密度分布の時間発展データを用いたナノスケール半導体中の不純物分布予測モデル

小倉佑斗, 河原圭汰, 伊藤佳卓, 須子統太, 村口正和

電気・情報関係学会北海道支部連合大会講演論文集(CD-ROM) 2021 2021年

J-GLOBAL
早稲田大学の研究・教育用データ提供プラットフォームWIRPについて

安田豪毅, 中原悠太, 野村亮, 小林学, 須子統太

日本経営工学会春季大会予稿集(Web) 2021 2021年

J-GLOBAL
統計的決定理論に基づく選択バイアスを含む調査データからの分布推定法について

須子統太

日本経営工学会春季大会予稿集(Web) 2021 2021年

J-GLOBAL
ランダム不純物分布を有するナノスケール半導体中での電子透過率および時系列電子密度分布の機械学習によるモデル化

中谷隆帆, 川原颯真, 伊藤佳卓, 須子統太, 村口正和

応用物理学会学術講演会講演予稿集 2020.1 2604 - 2604 2020年02月

DOI
アンケートデータにおける選択バイアスの補正手法の選択方法についての一考察

沢田拓也, 西尾和恭, 石澤由宇輔, 須子統太

情報処理学会第82回全国大会講演論文集 2020 ( 1 ) 559 - 560 2020年02月

　概要を見る

アンケート調査は無作為抽出を前提としている。しかし実際に無作為抽出を行うことは難しく、選択バイアスによって集計結果の信頼性が低下することが多々ある。選択バイアスに対する補正手法は従来よりいくつか提案されているが、どのような調査データにも対応できる万能な手法はなく、対象となるデータによって有効な補正手法が異なることが知られている。そこで本研究では、ある調査データに対してどの補正手法を用いるのが最適かを選択する手法について検討する。

CiNii
アンケート分析における不良回答の影響に関する一考察

成川広貴, 村木鴻介, 須子統太

情報処理学会第82回全国大会講演論文集 2020 ( 1 ) 623 - 624 2020年02月

　概要を見る

近年、インターネット利用者の拡大を背景に、Webを利用したアンケート調査が広く行われている。webアンケートは「安く」、「早く」アンケート調査が実施できるという利点がある反面、回答者が正しく設問に回答しない、いわゆる「不良回答」が混入しやすいという問題がある。不良回答については回答時間をもとに識別を行う手法やアンケートの設問を工夫することで不良回答を検出する手法といった不良回答の除去方法について提案が行われてきた。本研究では不良回答のパターンを確率的にモデル化することで、アンケートに及ぼす不良回答の影響度合いを考察する。

CiNii
ランダム不純物下での電子ダイナミクスのニューラルネットワークによるモデル化

川原颯真, 中谷隆帆, 平田紘大, 伊藤佳卓, 須子統太, 村口正和

応用物理学会北海道支部/日本光学会北海道支部合同学術講演会講演予稿集 55th-16th 2020年

J-GLOBAL
消失を含むラベルノイズの下での分類に関する性能の限界について

安田豪毅, 須子統太, 小林学, 松嶋敏泰

電子情報通信学会技術研究報告(Web) 120 ( 268(IT2020 24-62) ) 2020年

J-GLOBAL
ランダム不純物ばらつき下でのナノスケール電子伝導過程の機械学習によるモデル化

中谷隆帆, 平田紘大, 川原颯真, 須子統太, 村口正和

応用物理学会学術講演会講演予稿集 2019.2 2984 - 2984 2019年09月

DOI
モジュール化されたオンライン統計教材を利用した効率的に学習可能なシステムの構築

堀井俊佑, 石井雄隆, 須子統太

統計教育実践研究 13 - 16 2019年03月

研究発表ペーパー・要旨（全国大会，その他学術会議）
珠算競技における苦手問題自動作成法について〜かけ算に対する検討〜

北村瑠菜, 原子弘務, 守屋郁宏, 神頭和希, 於勢奈都子, 角田和正, 須子統太

情報処理学会第81回全国大会講演論文集 2019 ( 1 ) 731 - 732 2019年02月

　概要を見る

珠算競技は，解答時間の早さと正答率の高さを競う競技である．しかし効率的な練習方法は確立しておらず，一般的には単調な反復練習のみが行われている．従来，わり算種目に対して機械学習を利用した効率的な練習問題の自動作成法が提案されているが，珠算には多くの種目が存在し，他種目にわり算の自動生成手法をそのまま活用することはできない．そこで本研究では，新たにかけ算種目に対して機械学習を用いた苦手問題の自動作成法を開発する．また，従来研究では被験者1名で実験していたのに対し，本研究では被験者を5名に増やすことで競技者間での特性の違いについての検証も行う．

CiNii
不良回答を含むアンケートデータの信頼性向上手法について

村木鴻介, 髙橋朋治, 小田陽平, 丹生谷英子, 須子統太

情報処理学会第81回全国大会講演論文集 2019 ( 1 ) 685 - 686 2019年02月

　概要を見る

近年,様々な場面でWebを利用したアンケート収集が行われている.Webアンケートは手ごろに行えるという利点がある反面,回答者が正しく設問に回答しない,いわゆる不良回答が混入しやすいという問題がある.通常,不良回答はルールベースで除去されるのが一般的である.また,アンケートの設問を工夫することで不良回答を検出しやすくする手法が提案されている.本研究では不良回答のパターンを確率的にモデル化することで,不良回答が含まれたアンケートデータに対し,集計値の信頼性が向上する手法を提案する.また,実際の大規模アンケートデータを用いた提案手法の有効性の検証を行う.

CiNii
アンケートデータにおける選択バイアス補正法に関する一考察

西尾和恭, 岡野拓巳, 戸次陸, 芝千尋, 須子統太

情報処理学会第81回全国大会講演論文集 2019 ( 1 ) 687 - 688 2019年02月

　概要を見る

アンケート調査において，完全な無作為抽出を行う事は難しく，選択バイアスによって集計結果の信頼性が低くなることが多々ある．従来，選択バイアスが含まれるデータに対する分析手法として，傾向スコア法や回帰モデルを利用した方法などが提案されている．しかし各々の手法がどのような状況において上手く補正できるかについて充分明らかにされていない．そこで本研究では，実際のアンケートデータを用いた実験を行うことで，各手法の性質を明らかにする事を目的とする．実際に集められた大規模なアンケートデータを利用し，疑似的に選択バイアスを発生させることで，各手法の性質を明らかにする．

CiNii
ラベルノイズの下での分類に関する性能の限界について

安田豪毅, 須子統太, 小林学, 松嶋敏泰

情報理論とその応用シンポジウム予稿集(CD-ROM) 42nd 2019年

J-GLOBAL
潜在クラスを含むラベルノイズモデルにおける分類アルゴリズム

須子統太, 安田豪毅, 堀井俊佑, 小林学

情報理論とその応用シンポジウム予稿集(CD-ROM) 42nd 2019年

J-GLOBAL
真の因果構造が未知の場合の因果効果の推定精度について

井上一磨, 雲居玄道, 堀井俊佑, 須子統太, 後藤正幸

情報理論とその応用シンポジウム予稿集(CD-ROM) 42nd 2019年

J-GLOBAL
珠算競技における効果的な練習問題の自動生成法について

原子弘務, 井上一磨, 諏訪貴大, 福岡省伍, 村田遼, 須子統太

情報処理学会第80回全国大会講演論文集 2018 ( 1 ) 897 - 898 2018年03月

　概要を見る

珠算競技は解答時間の早さ、並びに正答率の高さを競う競技である。しかし確立された練習方法は存在しない。そのため、従来までの練習は単調なものであり、効果の善し悪しを理解しないまま継続されてきた。そこで本研究では効率の良い練習方法の確立を目的とする。まずはランダムに生成した練習問題の中から間違えた問題や、数字の並び・計算過程において苦手であると感じた問題のデータ化を行った。その元で機械学習法を用いた苦手問題の自動生成法を提案した。提案手法により生成される苦手問題を用いて練習を行い、その効果を検証した。

CiNii
Webアンケートデータを用いた分布推定における信頼性向上手法に関する一考察

佐藤真悟, 岡野拓巳, 戸次陸, 杉本瑛生, 國安裕太, 須子統太

情報処理学会第80回全国大会講演論文集 2018 ( 1 ) 461 - 462 2018年03月

　概要を見る

近年、様々な場面でWebを利用したアンケート収集が行われている。Webアンケートは収集コストが低く抑えられる反面、対象とする母集団からのランダムサンプリングとみなせない事が多く、集計結果の信頼性が著しく低い事が多々ある。通常、リサンプリングによりデータの補正を行うが、属性ごとのサンプルサイズが小さくなってしまい、十分な精度の集計結果が得られない場合がある。そこで、本研究では母集団における属性比率と、取得データの属性比率の偏りを補正することで、アンケートデータの信頼性を効率よく向上させる手法を提案する。また、実際のECサイトの購買データとアンケートデータを利用し、提案手法の有効性の検証を行う.

CiNii
最大次数が未知の多項式回帰におけるスパース推定

井上一磨, 須子統太

情報処理学会第80回全国大会講演論文集 2018 ( 1 ) 281 - 282 2018年03月

　概要を見る

近年,統計学,機械学習の分野でスパース推定に関する研究が数多く行われている.その中で,従来多項式回帰モデルに対してスパース推定を行う研究が行われている.しかし,いずれの研究も最大次数を固定した場合しか扱っていない.そこで本研究では最大次数が未知の多項式回帰モデルに対してスパース推定を行うアルゴリズムを提案する.提案手法は従来のモデルを含むより広いクラスのモデルに対して用いることが可能である.また,提案手法を用いて人工データと実データに対して有効性の検証を行う.

CiNii
一般化ラベルノイズの下での分類に関する漸近評価

安田豪毅, 須子統太, 小林学, 松嶋敏泰

電子情報通信学会技術研究報告 118 ( 284(IBISML2018 44-104)(Web) ) 2018年

J-GLOBAL
パラメータ未知の一般化ラベルノイズモデルにおける分類法について

須子統太, 安田豪毅, 堀井俊佑, 小林学

電子情報通信学会技術研究報告 118 ( 284(IBISML2018 44-104)(Web) ) 2018年

J-GLOBAL
早稲田大学におけるデータ科学教育の取り組み ~早稲田大学データ科学総合研究教育センターの活動~

須子統太, 小林学, 堀井俊佑, 安田豪毅, 松嶋敏泰

日本経営工学会秋季大会予稿集(Web) 2018 2018年

J-GLOBAL
一般化ラベルノイズモデルにおける分類問題について—The Classification Problem in Generalized Label Noise Model—情報論的学習理論と機械学習

須子統太, 堀井俊佑

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 117 ( 293 ) 377 - 382 2017年11月

CiNii
ランダム回答法におけるオンラインベイズ推定について—Online Bayesian estimation of Randomized Response models

須子統太, 堀井俊佑

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 115 ( 235 ) 7 - 11 2015年10月

CiNii
詳細な学習ログを用いた英語リーディング過程の分析(2) ログデータから見た成績との関係

中野美知子, 吉田諭史, 須子統太, 玉木欽也, ギエルモエンリケズ

情報処理学会第77回全国大会講演論文集 4 ( 1 ) 503 - 504 2015年03月

　概要を見る

リーディング過程は直接観測できるものではない。しかし、学習ログを取得することで、読解中における各学習者の行動や記事を読むために費やす時間の観測は可能となる。本発表では、これら学習ログから得られる情報と各学習者の課題に対する内容理解度との関係について調査すべく、デジタル教材を利用して行った実験の結果を報告する。使用した教材は、1000語の時事英語文である。教材に対する内容理解度は、3択式の内容確認問題と自由記述問題への解答から評価した。また、事前事後アンケートとして、Readiness（時事英語を読む心構え）、興味の程度、知識の程度、読解ストラテジーに関する調査を行い、それぞれ学習ログおよび成績との関係について調査を行った。

CiNii
電子教材とワークシートを用いた統計基礎教育におけるブレンディッドラーニングに関する一考察

小泉大城, 須子統太, 平澤茂一

情報処理学会第77回全国大会講演論文集 4 ( 1 ) 605 - 606 2015年03月

　概要を見る

近年，大学内外で様々に統計基礎教育の必要性が指摘され，ICTを援用したMOOCsやiTunes U等においても統計基礎を扱った教材が普及し始めている．著者らのグループもその一環として統計の電子教科書に着目し，試作や評価を行ってきた．一方で，デジタル化された教材の普及により，学習者の側の「手を動かしてノートに書く」という所作が軽視されかねない状況も散見した．このような視点で従来から教育工学において扱われていたテーマとして，ワークシートを利用した学習が挙げられる．本研究では，特に紙のワークシートと電子教科書を併用した，統計のブレンディッドラーニングを想定し，教育効果を測定する実験を行い，従来の研究と比較考察を行った結果を報告する．

CiNii
プライバシー保護機能を持つ分散型正則化最小二乗法について

須子統太, 堀井俊佑, 小林学

第37回情報理論とその応用シンポジウム予稿集(SITA2014) 300 - 305 2014年11月
統計基礎学修のためのブレンディッドラーニングの取り組み

小泉大城, 須子統太

平成26年度私立大学情報教育協会 ICT利用による教育改善研究発表会資料集 28 - 29 2014年08月
PDFファイルをベースとした電子教材作成支援システム

荒本道隆, 小泉大城, 須子統太, 平澤茂一

情報処理学会第76回全国大会講演論文集 4 ( 1 ) 359 - 361 2014年03月

　概要を見る

e-learningで使用する大学向け電子教材を作成する上で，コンテンツを作成する工数の多さと，学習者の所有する様々な端末(PC, タブレット，スマートフォン等)への対応は，代表的な課題である．本研究ではこの課題を解決する一手法として，HTML/Javascriptによる電子教材作成支援システムを実装した．作成したシステムでは，既存のPDFファイルを入力として電子教材に必要と思われる機能の実現を目指したものであり，試作した電子教材を複数の端末で評価し，考察を行う．

CiNii
統計基礎教育のためのタブレット型端末向け電子教材の試作と評価

小泉大城, 須子統太, 平澤茂一

情報処理学会第76回全国大会講演論文集 4 ( 1 ) 361 - 362 2014年03月

　概要を見る

近年，ビッグデータやデータサイエンティストといった用語が盛んに使われるようになり，大学における統計基礎教育のニーズも高まりを見せている．著者らのグループでは，数年前よりタブレット端末向けの統計基礎電子書籍を試作している．電子書籍と紙書籍の違いのひとつに図表等のマルチメディア化があるが，著者らによる従前の書籍試作では機能の確認という面が強かった．そこで今回は，各章の学習目標の要求定義から始め，電子書籍の章構成，レイアウト，マルチメディア化された図表等の配置などをより詳細に検討してから試作を行った．このようにして試作した電子教材について，実際の統計の授業で評価した結果を通じた考察を行う．

CiNii
判別を目的としたプライバシー保護データ解析に関する一考察

後藤正幸, 須子統太, 小林学, 平澤茂一

日本経営工学会平成25年春季大会予稿集 54 - 55 2013年05月
大学教育のための電子教材の試作〜タブレット端末向け統計基礎教材〜

小泉大城, 須子統太, 平澤茂一

情報処理学会第75回全国大会講演論文集 4 ( 1 ) 467 - 468 2013年03月

　概要を見る

大学教育における統計基礎科目の重要性は，多岐にわたる分野で存在しているものと思われるが，特にICTとの連携における課題は山積しているものと思われる．こうした要因のひとつに，大学教育の実態に即した教育コンテンツの開発がなかなか進んでいないという状況があると考えられる．そこで，著者らのグループは，近年，急速に普及が進んでいるタブレット型端末向けに，統計基礎科目における利活用を視野に入れた電子教材を試作した．試作した電子教材には，マルチメディア化された図表，音声解説の導入，大量に自動生成可能な練習問題，Learning Management System(LMS)との連携，などの機能が備わっており，従来の統計基礎科目にはない学習効果が期待される．本研究ではこうした電子教材を試作し，大学教員に試用してもらいながらインタビューによる評価を行った結果について考察と報告を行う．

CiNii
統計的決定理論に基づく階層構造を利用したマルチラベル分類法について

山本粋士, 須子統太, 松嶋敏泰

電子情報通信学会技術研究報告. IBISML, 情報論的学習理論と機械学習 112 ( 454 ) 101 - 106 2013年02月

　概要を見る

本稿では,統計的決定理論に基づくマルチラベル分類法を扱う.マルチラベル分類は,ラベル集合の冪集合の要素を一つのクラスと見なすことで,多クラス分類としても扱える.しかしこの場合,ラベル集合の要素数についてクラスの数が指数的に増加する.その為,要素数が大きい場合には,分類を行うことが計算量的に困難となる.この計算量的困難性を回避する為の研究が従来より行われており,その一つにラベル間の階層構造を利用した研究がある.他方,ベイズ基準のもとで最適な分類法が近年注目されている.本稿では,このベイズ基準のもとで最適な分類法をマルチラベル分類問題に適用する.更にラベル間に階層構造を仮定することで,分類で必要となる計算量をラベル集合の要素数についての線形オーダーで抑えるアルゴリズムを提案する.ベイズ基準のもとで最適となる分類法では,仮定する損失関数により具体的な計算式が異なる.その為本稿では,0-1損失,ハミング損失それぞれの場合において,効率的な分類アルゴリズムを示す.

CiNii
Iterative Multiuser Joint Decoding based on Augmented Lagrangian Method

Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

電子情報通信学会技術研究報告 IT2013-34 13 - 17 2013年
真の分布を含むとは限らない階層モデル族に対するベイズ推定の漸近評価

宮希望, 須子統太, 安田豪毅, 松嶋敏泰

第36回情報理論とその応用シンポジウム予稿集(SITA2013) 665 - 670 2013年
半教師付き学習における一致推定量に基づく予測の漸近評価,

安田豪毅, 宮希望, 須子統太, 松嶋敏泰

第36回情報理論とその応用シンポジウム予稿集(SITA2013) 659 - 664 2013年
次数未知の多変数多項式回帰モデルにおけるベイズ予測

山本粋士, 須子統太, 松嶋敏泰

第36回情報理論とその応用シンポジウム予稿集(SITA2013) 520 - 524 2013年
線形回帰モデルにおけるベイズ決定理論に基づく予測の近似手法

都築遼馬, 須子統太, 松嶋敏泰

第36回情報理論とその応用シンポジウム予稿集(SITA2013) 438 - 441 2013年
プライバシー保護を目的とした線形回帰モデルにおける事後確率最大推定量の分散計算法について

中井祥人, 須子統太, 松嶋敏泰

電子情報通信学会技術研究報告 IBISML, 112(454) ( 452 ) 47 - 54 2013年

CiNii
情報環境利用に関する満足度データの項目反応理論による検討

岩間, 徳兼, 木村, 好美, 石田, 崇, 須子, 統太, 末松, 大

MNC Communications 14 2012年12月

CiNii
木構造を仮定した信号に対する拡張ラグランジュ法に基づいた圧縮センシングについて

堀井俊佑, 須子統太, 松嶋敏泰

第35回情報理論とその応用シンポジウム予稿集 320 - 325 2012年
プライバシー保護を目的とした線形回帰モデルにおける最小二乗推定量の分散計算法について

須子統太, 堀井俊佑, 小林学, 後藤正幸, 松嶋敏泰, 平澤茂一

電子情報通信学会技術研究報告 IBISML2012-49 ( 279 ) 107 - 111 2012年

CiNii
プライバシー保護を目的とした回帰分析の拡張について

須子統太, 堀井俊佑, 小林学, 松嶋敏泰, 平澤茂一

第35回情報理論とその応用シンポジウム予稿集 562 - 567 2012年
真のモデルを含まないパラメトリックモデル族に対するベイズ予測の漸近評価

宮希望, 須子統太, 松嶋敏泰

電子情報通信学会技術研究報告 IT2011-11 ( 142 ) 71 - 76 2011年

CiNii
Maximum likelihood detection for DS-CDMA using Gr�{o}bner bases

Shunsuke Horii, Tota Suko, Toshiyasu Matsushima, Shigeichi Hirasawa

第33回情報理論とその応用シンポジウム予稿集 489 - 493 2010年
複数の相関のある情報源に対するベイズ符号化について

須子統太, 堀井俊佑, 松嶋敏泰, 平澤茂一

第33回情報理論とその応用シンポジウム予稿集 759 - 763 2010年
A Note on Multiuser Detection Algorithms for CDMA based on the Belief Propagation Algorithm

S. Horii, T. Suko, T. Matsushima, S. Hirasawa

電子情報通信学会技術報告 IT2007-26 ( 422 ) 7 - 12 2008年

CiNii
区間で一定なパラメータを持つ非定常情報源の漸近的な性質について

須子統太, 松嶋敏泰, 平澤茂一

第31回情報理論とその応用シンポジウム予稿集 815 - 818 2008年
マーキング仮定に基づくフィンガープリンティング符号のキャパシティについて

柴田大介, 須子統太, 松嶋敏泰

暗号と情報セキュリティシンポジウム予稿集 2008年
外れ値データの発生を含む回帰モデルに対するベイズ予測アルゴリズム

須子統太, 松嶋敏泰, 平澤茂一

情報処理学会研究報告 2007-MPS-67 ( 128 ) 13 - 16 2007年

　概要を見る

統計解析を行う際,得られたデータの中に外れ値が含まれることが多々ある.外れ値は少量であっても解析結果に大きく影響を与えることがあるため,従来から外れ値の取り扱いについて広く研究が行われている.従来,Boxらにより線形回帰モデルに対し混合分布を用いて外れ値の発生をモデル化する研究が行われている.同様のモデルに対し様々な研究が行われているが,いずれも外れ値の検出やパラメータの推定を目的としている.そこで本研究では,外れ値データの発生を含む回帰モデルに対する予測法について扱う.まず,このモデルに対しベイズ基準のもとで最適な予測法を示す.次にEMアルゴリズムを用いて計算量を削減した近似アルゴリズムを提案し,シミュレーションにより有効性を検証する.

CiNii
密情報を持つBroadcast Channel の Secrecy Capacity 計算アルゴリズム

安井謙介, 須子統太, 松嶋敏泰

第29回情報理論とその応用シンポジウム予稿集 69 - 73 2006年
BW変換を用いたユニバーサル符号化アルゴリズムに関する研究

須子統太, 松嶋敏泰, 平澤茂一

情報理論とその応用シンポジウム予稿集 = The proceedings of the Symposium on Information Theory and Its Applications 28 ( 1 ) 315 - 318 2005年11月

CiNii
電子透かしにおける秘匿容量の計算手法に関する研究

安井謙介, 須子統太, 松嶋敏泰

電子情報通信学会技術報告 IT2005-47 ( 191 ) 29 - 34 2005年

CiNii
使用ユーザが変化するDS/CDMAシステムにおけるベイズ最適なマルチユーザ検出について

堀井俊佑, 須子統太, 松嶋敏泰

第28回情報理論とその応用シンポジウム予稿集 28 ( 2 ) 781 - 784 2005年

CiNii
電子透かしにおける秘匿容量計算計算アルゴリズム

安井謙介, 須子統太, 松嶋敏泰

電子情報通信学会技術報告 IT2005-94 ( 665 ) 177 - 182 2005年

CiNii
BW変換を用いたユニバーサル符号化アルゴリズムに関する研究

須子統太, 松嶋敏泰, 平澤茂一

第28回情報理論とその応用シンポジウム予稿集 343 - 346 2005年
階層モデルにおけるベイズ予測の漸近評価に関する一考察

宅味丈夫, 須子統太, 松嶋敏泰

第27回情報理論とその応用シンポジウム予稿集 27 ( 2 ) 639 - 642 2004年

CiNii
区間で定常なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について

須子統太, 松嶋敏泰, 平澤茂一

電子情報通信学会技術報告 IT2004-22 ( 229 ) 23 - 28 2004年

　概要を見る

本研究では,情報源の分布のクラスのみ仮定し,パラメータについては未知である場合のユニバーサル情報源符号化について扱う.その中でもベイズ符号は,ベイズ基準のもとで冗長度を最小にする符号として知られている.近年,非定常な情報源に対するベイズ符号の研究が数多く行われている.その一つに,一定区間では定常なパラメータを持つが,ある時点でパラメータの値が突然変化する情報源に対する研究がある.この情報源は個々の区間をみれば定常とみなすことができるが,パラメータの変化が複数回おこるため,全体としては非定常な情報源として扱われる.従来,この情報源に対し総変化回数が既知のもとで漸近的な平均冗長度の評価が行われている.しかし,厳密な評価については行われておらずユニバーサル性を持つ符号であるかについて正確な議論はされていない.また,より一般化された問題設定として,総変化回数が未知である場合を扱った研究もある.そのもとで有限時点での冗長度の評価が行われているが,漸近的な評価については行われていない.そのため,この情報源におけるベイズ符号の漸近的な性質についてはいまだ知られていない.そこで,本研究では区間で定常なパラメータを持つ非定常情報源に対し,総変化回数が未知のもとで漸近的な平均冗長度についての評価を行う.そのもとで,ある条件を満たすとベイズ符号がユニバーサル性を持つことを示す.

CiNii
外れ値データの発生を考慮にいれた回帰モデルにおけるベイズ予測法について

須子統太, 仲川文隆, 松嶋敏泰

2004年情報論的学習理論ワークショップ（IBIS2004）予稿集 34 - 39 2004年
区間で一定なパラメータを持つ非定常情報源におけるベイズ符号の冗長度について

須子統太, 松嶋敏泰, 平澤茂一

第27回情報理論とその応用シンポジウム予稿集 27 ( 2 ) 523 - 526 2004年

CiNii
決定木モデルにおける予測アルゴリズムについて

須子統太, 野村亮, 松嶋敏泰, 平澤茂一

電子情報通信学会技術報告 COMP2003-36 ( 246 ) 93 - 98 2003年

CiNii
区間で一定なパラメータを持つ情報源におけるベイズ符号化法について

須子統太, 松嶋敏泰, 平澤茂一

第26回情報理論とその応用シンポジウム予稿集 26 ( 1 ) 165 - 168 2003年

CiNii
相関のある時系列の状態空間によるモデル化と予測

鈴木悠哉, 須子統太, 松嶋敏泰

電子情報通信学会技術報告 IT2003-38 ( 215 ) 87 - 92 2003年

　概要を見る

時系列解析のモデルとして状態空間モデルがある.状態空間モデルが線形・ガウス型でかつ分散が既知の場合はカルマンフィルタを用いることでベイズ最適な予測値を解析的に計算することができる.一般的な状態空間モデルにおいてはモンテカルロフィルタを用いることで最適性は保証されないが予測値をえることが可能である.一方,時系列を予測する場合,対象とする時系列と相関のある他の時系列が同時に並行して得られるとき,片方の時系列の情報を用いて他方の時系列を予測することが考えられる.本研究ではこれをモデル化するために,まず二つ以上の系列が同時に発生する多次元の状態空間モデルを提案する.このモデルに対する予測値を計算するためのアルゴリズムを提案する.さらに相関のある他の時系列を用いることの有効性を理論的評価とシミュレーションからの検証を行う.

CiNii
ベイズ決定理論に基づく予測における近似手法について

江口公盛, 須子統太, 松嶋敏泰

第26回情報理論とその応用シンポジウム予稿集 26 ( 2 ) 703 - 706 2003年

CiNii
拡張された階層モデルにおける予測アルゴリズムについて

須子統太, 野村亮, 松嶋敏泰

第25回情報理論とその応用シンポジウム予稿集 755 - 758 2002年

CiNii

▼全件表示

現在担当している科目

経営科学研究演習　II（秋学期）

大学院社会科学研究科

2026年秋学期
経営科学研究演習　II（春学期）

大学院社会科学研究科

2026年春学期
経営科学研究演習　I（秋学期）

大学院社会科学研究科

2026年秋学期
経営科学研究演習　I（春学期）

大学院社会科学研究科

2026年春学期
経営科学研究　I

大学院社会科学研究科

2026年春学期
ゼミナールIII（経営科学／秋学期）

社会科学部

2026年秋学期
ゼミナールIII（経営科学／春学期）

社会科学部

2026年春学期
ゼミナールII（経営科学／秋学期）

社会科学部

2026年秋学期
ゼミナールII（経営科学／春学期）

社会科学部

2026年春学期
ゼミナールI（経営科学／秋学期）

社会科学部

2026年秋学期
経営科学２

社会科学部

2026年春学期
経営科学１

社会科学部

2026年秋学期
経営学入門Ｂ

社会科学部

2026年春学期
経営学入門Ａ

社会科学部

2026年春学期
情報化社会とワーキングスタイル

社会科学部

2026年秋学期

▼全件表示

他学部・他研究科等兼任情報

附属機関・学校グローバル・エデュケーション・センター

学内研究所・附属機関兼任歴

2026年

　

　

データ科学センター兼任センター員
2024年

-

2026年

理工学術院総合研究所兼任研究員

特定課題制度（学内資金）

データの低品質性を考慮したデータ解析手法の開発と体系化

2025年

　概要を見る

本研究課題では，前課題（2021〜2024年度科研費）の成果を発展させ，低品質データからの知識抽出に関する統計的決定理論に基づく手法の拡張と体系化を目指して研究を進めた．具体的には，まずバイアス補正・分布推定の観点から，自己選択バイアスを伴う調査データに対し統計的決定理論に基づく分布推定手法の研究を行い，前課題で開発した選択バイアス補正の枠組みをより実践的な調査場面へ拡張した．次に，データの劣化・変質への対応として，コンセプトドリフト下におけるベイズ予測手法を統計的決定理論の枠組みで定式化し，時間的に変動するデータ分布に対する理論的に最適な予測アルゴリズムの構築に取り組んだ．さらに，ラベル情報の不完全性への対処として，ノイズを含まないソフトラベルからの学習法およびラベルの階層構造を考慮した分類法について統計的決定理論に基づく検討を行い，分類問題におけるデータ品質の多様な劣化形態に対する統一的なアプローチを探究した．加えて，基盤モデルにおけるレート・損失領域の導出にも取り組み，大規模モデルの情報理論的な性能限界についても理論的知見を得た．以上の成果は国内学会において計5件の発表として公表した．本年度の研究を通じて，統計的決定理論に基づくアプローチがバイアス補正のみならず，ドリフト，ラベルノイズ，階層的分類など多様なデータ品質問題に対して有効な統一的枠組みを提供しうることを示した．
AI駆動型データ品質保証と不確実性制御のための統合的統計学習フレームワーク

2025年

　概要を見る

本研究は，データ分析・機械学習における信頼性向上を目的とし，データの品質保証と推論過程の不確実性制御を統合的に扱うフレームワークの構築を目指している．当初の計画では，不良回答検出，選択バイアス補正，パラメータ推定の高度化を柱とし，生成AI技術との融合も視野に入れていた．本年度は，研究計画の一部を変更し，フレームワークの基盤となる統計的決定理論に基づく推論手法の高度化に重点を置いた．具体的には，予測誤差のベイズリスクを最小化する説明変数依存型モデル選択法を提案し，データ特性に応じた適応的な予測分析を可能にした（Inoue et al., IEICE Trans., 2026）．また，AUROCを最大化する分類器の構成法を統計的決定理論の枠組みで定式化し（須子ら, SITA2025），階層構造データに対するECOC符号設計による分類手法の拡張（道正ら, SITA2025），および線形潜在構造を考慮したオフライン政策評価法の開発（増本ら, SITA2025）に取り組んだ．これらの成果は，不完全なデータ環境下での分析精度と信頼性を統計的に保証するための基礎理論に相当し，当初計画の中核である「推論過程における不確実性の制御」に直接貢献するものである．生成AI技術との融合については次年度以降の課題として継続的に取り組む予定である．
大規模テキストデータに内在する本質的な情報の抽出

2024年仲道祐樹, 野村亮

　概要を見る

本研究課題では，社会科学諸分野で扱われる大規模なテキストデータに対し，生成AIや自然言語処理技術の応用を行うとともに，そこに内在するデータ科学的な観点でみた本質的な課題を明らかにすることを目指した．具体的には，法学研究における定量分析や法律実務の支援を目的とした生成AIの応用と，アンケート分析における自然言語処理技術の応用について検討した．前者では，膨大なテキストデータとして公開されている刑事裁判例の中から刑法研究において有益な情報の抽出法の開発を行った．前年度の課題で開発したシステムについて詳細な評価を行いその内容を論文誌へ投稿した．後者については，様々な社会科学分野の研究に活用されるアンケートデータに焦点を当て，自然言語で記述されたアンケート設問とそれに対応する回答で構成されたデータセットから，設問以外の情報をいかに抽出できるかについて検討した．また，これらに加え，口語調で入力される指示から適切な指示内容を抽出する音声言語理解タスクについて，従来あまり検討されていない複数意図をもつデータに対する効果的なアルゴリズムの開発を行った．
先端データ科学技法のビジネス分野への応用と基礎的課題の発見

2023年仲道祐樹, 野村亮

　概要を見る

本研究課題では，当初ビジネス分野におけるAIや機械学習などの先端データ科学技法の応用を目的としていたが，計画を一部変更し，社会科学分野，特に法律分野における応用についての研究を行った．具体的には，刑法の研究における定量分析や法律業務の支援を目的とし，生成AIを用いた刑事裁判例における構成要件該当事実の抽出手法の開発と評価を行った．構成要件とは刑法の条文に規定されている犯罪が成立するために満たされるべき要件を表す．刑事裁判例において具体的な事実のどの部分が構成要件として認定されているかを知ることは，刑法の研究において非常に重要な分析となる．しかしながら，大量の刑事裁判から構成要件要素を人手で抽出するには高い専門性と労力が必要となる．そこでデータ科学を活用した自動抽出システムの開発を目指した．従来，研究代表者は同様の目的を持つシステムをBERTなどの自然言語モデルを利用して開発していたが実用に耐える精度には至らない結果に終わっていた．しかしながら，OpenAI社によって発表されたGPT4のAPIを用いることで高精度なシステムの構築が期待されたことから提案システムの開発を行った．法学研究者と連携することで，実際の刑事裁判例に対し，構成要件該当事実についての正しい抽出データを作成することで，提案システムがどの程度正しく該当箇所を抽出できるか評価を行った．その結果，いくつかの条文に対応する刑事裁判例に対し，非常に高い精度の抽出を行える事が分かった．本研究の結果については，2024年5月に開催される人工知能学会全国大会で発表を行う予定である．
ナノスケール半導体デバイス設計のための機械学習アルゴリズムの開発

2021年村口正和

　概要を見る

近年，ナノスケールのデバイス設計に機械学習を⽤いることで，量⼦物理を取り込んだシミュレーションの煩雑さと計算コストの課題克服を⽬指す研究が進められている．本研究では，ナノスケールの半導体デバイス中のキャリアダイナミクスシミュレーションをモチーフとし，シミュレーションによるデバイス設計を機械学習により代替するための３種類の予測モデルの開発を行った．①不純物分布から電⼦の透過率を予測するモデル，②不純物分布および電子密度の初期状態から電子密度分布の変化を予測するモデル，③電子密度の変化データから不純物分布を予測するモデル．①については論文投稿を行い受理，②と③については学会発表を行った．
低品質データ解析アルゴリズムの一般化と実データへの適用

2020年

　概要を見る

様々な低品質データに対するデータ解析手法の開発を目的とし研究を行った．まず，ラベルにノイズを含む分類問題に関する研究を行った．誤りや欠損など様々なノイズ混入を一般的に表現可能なモデルを提案し，それに対応する分類アルゴリズムの提案を行い，その理論性能について評価を行った．また，日本語文書における同音異義語誤りを検出するアルゴリズムを提案し，実験によりその性能評価を行った．
先端データ科学アルゴリズムの人文社会科学分野への応用

2019年

　概要を見る

本研究課題では自身や他の研究者が開発した最新のデータ分析アルゴリズムを様々な実データに対して適用することで，様々な分析対象における実問題の解決を図るとともに，分析アルゴリズムの欠点や問題点を明らかにし，新たな分析アルゴリズムの開発に繋がる知見を得る事を目的としていた．本年度は，実際の大規模な消費者アンケートデータを分析対象とし，信頼度の低いアンケートデータにおける分析アルゴリズムの開発を行った．更に，半導体中での電子ダイナミクス計算によって得られたデータを対象とし，ナノスケールデバイスの設計における機械学習アルゴリズムの応用に関する研究を行った．
低品質データのための次世代データ解析基盤の構築

2017年

　概要を見る

　様々な低品質データに対するデータ解析手法の開発を目的とし研究を行った．まず，ラベルにノイズを含む分類問題に関する研究を行った．誤りや欠損など様々なノイズ混入を一般的に表現可能なモデルを提案し，それに対応する分類アルゴリズムの提案を行った．次に，Web調査などのランダムサンプリングの前提が崩れているアンケートデータを用いて，母集団の回答分布を推定する研究を行った．最後に，重回帰分析におけるスパース推定について研究した．説明変数に複雑な交互作用や，高次の項を含む多項式回帰モデルにおいて，最大次数が未知の場合のスパース推定アルゴリズムを提案した．それぞれの研究成果については国内学会で発表を行った．
クラウド環境における確率モデルに基づく無歪み高圧縮符号化に関する研究

2011年

　概要を見る

膨大な量のディジタルデータが流通する現代において，データ圧縮（情報源符号化）技術は，ネットワーク社会を支える重要な基盤技術のひとつとなっている．現在，主に使われているデータ圧縮技術は80 年代にZiv らによって提案されたLempel-Ziv 法(LZ 法)を基礎においている．具体的には，gzip などの圧縮ツールに用いられている手法である．LZ 法が提案されて以来，LZ法をベースにした改良法の研究が数多くされてきたものの，90 年代後半になると一定の成果を得たことで大きな進展はなくなった．また情報ネットワークの高速化に伴い，アルゴリズムの改善によるメリットが薄れてきたため，圧縮技術に関する研究は1 度は収束を迎えたかのように見えた．しかし近年，ネットワークの高速化が頭打ちになりつつある中，クラウドコンピューティングの発達やディジタルコンテンツの大容量化により，ネットワークトラヒックやサーバの記憶容量は増加の一途を辿っている．そのため，データ圧縮技術のさらなる発展が求められるようになり，今後のネットワーク社会における重要な課題のひとつであると考えられる．データ圧縮アルゴリズムは，圧縮対象となるデータの出現構造に対し，陽に確率モデルを仮定するアルゴリズムと，陽には仮定しないアルゴリズムに分類することができる．前者にはCTW法やベイズ符号など，後者にはLZ 法やその改良法などが含まれる．圧縮アルゴリズムの性能評価は，データのサイズを伸ばしていった時に，圧縮後のファイルのサイズが，圧縮の理論限界であるエントロピーへ収束するのか，また収束する場合にはどれくらいの速さで収束するのか，によって評価される．確率モデルを陽に仮定するアルゴリズムは，エントロピーの収束速度が非常に速い代わりに，仮定した確率モデルに対してしかエントロピーへの収束を保証できない．それに対し，LZ 法などの確率モデルを陽に仮定しないアルゴリズムは，非常に広いモデルのクラスに対してエントロピーへの収束が保証できる代わりに，その収束速度は非常に遅く，有限時点での圧縮性能は必ずしも高くない．現在主流として用いられている圧縮技術のほとんどは，LZ 法をベースとした確率モデルを陽に仮定しないアルゴリズムを用いているため，汎用性は高いものの個々のファイルに対しての圧縮性能は必ずしも高いとは言えず，圧縮率の改善の余地はまだまだあると考えられる．その一方，ベイズ符号などの確率モデルを仮定するアルゴリズムに関する研究は，限られた確率モデルに対する研究しか行われておらず，実用的なデータ構造に対する研究が不十分であるため実用化には至っていない．そこで本研究では，高圧縮率である確率モデルを仮定した圧縮アルゴリズムを，実用的なデータ構造に対して適用することを目的として研究を行った．特に従来テキストデータに対して，非常に高い圧縮率を持ち，理論的最適性の保証することのできるベイズ符号を他のデータ構造に対し拡張し適用を行った．その結果，アルゴリズムを実装する際，ベイズ符号が仮定する確率モデルと，真の確率構造がことなる場合においても，ベイズ符号は一定の圧縮性能を持つ事を理論的に示すことができた．
実用化に向けた高圧縮符号化アルゴリズムに関する研究

2006年

　概要を見る

情報ネットワーク社会において，情報の圧縮技術は欠くことのできない基盤技術である．現在、主に使われている圧縮技術は80年代にZivらによって提案されたLempel-Ziv法(LZ法)を基礎においている．具体的には，gzipなどの圧縮ツールのアルゴリズムで使われている．LZ法が提案されて以来，LZ法をベースにした改良法の研究が数多くされてきた．90年代後半になると，一定の成果を得たことで，大きな進展はなくなり，また情報ネットワークの高速化に伴い，多少の改善によるメリットが薄れてきたため，圧縮技術に関する研究は，一度は収束を迎えたかのように見えた．しかし近年，情報ネットワークの高速化が頭打ちになりつつある中，情報コンテンツの大容量化の速度は依然衰えず，圧縮技術の重要性が増しつつある．そのため，圧縮技術の基礎理論のさらなる発展は今後のネットワーク社会における重要な課題のひとつである．90年代に研究されていたベイズ符号という符号化法がある．この符号は，理論限界を達成することが示されており，他の符号よりも高い圧縮率で圧縮することが可能であることが知られている．従来，ベイズ符号やその他の符号に関する研究では定常な情報源に対しての研究がほとんどであり，より一般的な情報源である非定常情報源に対する研究は少ない．実際に圧縮するデータが非定常性を有することは充分に考えられ，実用化に際しては非定常な情報源に対しても性能が保証される符号の構成が必要となってくる．そこで本研究ではある非定常な情報源のクラスに対し，効率的なベイズ符号の構成法を提案し，それに対する漸近的な性能評価を行った．

▼全件表示