INOUE, Masato



Faculty of Science and Engineering, School of Advanced Science and Engineering

Job title


Homepage URL

Concurrent Post 【 display / non-display

  • Faculty of Science and Engineering   Graduate School of Advanced Science and Engineering

  • Affiliated organization   Global Education Center

Research Institute 【 display / non-display

  • 2020

    理工学術院総合研究所   兼任研究員

Education 【 display / non-display


    Kyoto University  


    Kyoto University   Graduate School of Medicine  

Degree 【 display / non-display

  • Kyoto University   Doctor of Medical Science


Research Areas 【 display / non-display

  • Life, health and medical informatics

  • Statistical science

  • Kansei informatics

  • Soft computing

  • Theory of informatics

Research Interests 【 display / non-display

  • バイオインフォマティクス

  • 情報統計力学

  • 確率的情報処理

  • Bioinformatics

  • Probabilistic Information Processing

Papers 【 display / non-display

  • An Innovative Voice Analyzer “VA” Smart Phone Program for Quantitative Analysis of Voice Quality

    Tsuyoshi Kojima, Shintaro Fujimura, Ryusuke Hori, Yusuke Okanoue, Kazuhiko Shoji, Masato Inoue

    Journal of Voice    2018  [Refereed]

     View Summary

    Objective: The ‘VA’ Windows program that we developed in 2011 for analyzing voice quality quantitatively uses zerocross picking to find individual basic pitch periods. It has a simple and user-friendly user interface and high accuracy. This program determines the fundamental frequency, jitter, shimmer, PPQ, APQ, and signal-to-noise ratio (Ra). It needs only a general-purpose Windows PC, USB audio interface and a microphone. The aim of this study is to improve the version of the VA Windows program in English and to develop a VA smart phone program to allow wider use of objective acoustic analysis. Study Design: Cross-sectional study. Methods: Sustained vowel /a/ sounds from 40 subjects without evident vocal problems, and 40 subjects with slight hoarseness, were examined. We compared the analyzed data with data from other software (MDVP and Praat). For a comparison between VA for Windows and VA for a smart phone, sustained vowel /a/ sounds from six subjects without hoarseness were recorded with each system simultaneously. Results: The normal voice and slightly hoarse voice data analyzed with VA showed a high correlation with most parameters from both MDVP and Praat. There was a strong correlation between the Windows and smart phone versions of VA in terms of the fundamental frequency and Ra. Conclusions: The results showed that the VA software was not inferior to the other acoustic analysis software tested. The simple and easy to use smart phone version may facilitate our goal of creating an objective, widely available method to evaluate hoarseness.


  • Traffic Velocity Estimation From Vehicle Count Sequences

    Takayuki Katsuki, Tetsuro Morimura, Masato Inoue

    IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS   18 ( 7 ) 1700 - 1712  2017.07  [Refereed]

     View Summary

    Traffic velocity is a fundamental metric for inferring traffic conditions. This paper proposes a new velocity estimation approach from temporal sequences of vehicle count that does not require tracking any vehicles or using any labeled data. It is useful for measuring traffic velocities with low quality and inexpensive sensors such as web cameras in general use. We formalize the task as a density estimation problem by introducing a new model for temporal sequences of vehicle counts wherein the correlation between the sequences is directly related to the traffic velocity. We also derive a sampling-based algorithm for the density estimation. We show the effectiveness of our method on artificial and real-world data sets.


  • A latent class model for competing risks

    M. Rowley, H. Garmo, M. Van Hemelrijck, W. Wulaningsih, B. Grundmark, B. Zethelius, N. Hammar, G. Walldius, M. Inoue, L. Holmberg, A. C. C. Coolen

    STATISTICS IN MEDICINE   36 ( 13 ) 2100 - 2119  2017.06  [Refereed]

     View Summary

    Survival data analysis becomes complex when the proportional hazards assumption is violated at population level or when crude hazard rates are no longer estimators of marginal ones. We develop a Bayesian survival analysis method to deal with these situations, on the basis of assuming that the complexities are induced by latent cohort or disease heterogeneity that is not captured by covariates and that proportional hazards hold at the level of individuals. This leads to a description from which risk-specific marginal hazard rates and survival functions are fully accessible, 'decontaminated' of the effects of informative censoring, and which includes Cox, random effects and latent classmodels as special cases. Simulated data confirm that our approach can map a cohort's substructure and remove heterogeneity-induced informative censoring effects. Application to data from the Uppsala Longitudinal Study of Adult Men cohort leads to plausible alternative explanations for previous counter-intuitive inferences on prostate cancer. The importance of managing cardiovascular disease as a comorbidity in women diagnosed with breast cancer is suggested on application to data from the Swedish Apolipoprotein Mortality Risk Study. Copyright (C) 2017 John Wiley & Sons, Ltd.


  • Bayesian Regression Selecting Valuable Subset from Mixed Bag Training Data

    Takayuki Katsuki, Masato Inoue

    2016 23RD INTERNATIONAL CONFERENCE ON PATTERN RECOGNITION (ICPR)     2580 - 2585  2016  [Refereed]

     View Summary

    This paper addresses a problem in which we learn a regression model from sets of training data. Each of the sets has an only single label, and only one of the training data in the set reflects the label. This is particularly the case when the label is attached to a group of data, such as time-series data. The label is not attached to the point of the sequence but rather attached to particular time window of the sequence. As such, a small part of the time window likely reflects the label, whereas the other larger part of the time window likely does not reflect it. We design an algorithm for estimating which of the training data in each of the sets corresponds to the label, as well as for training the regression model on the basis of Bayesian modeling and posterior inference with variational Bayes. Our experimental results show that our approach perform better than baseline methods on an artificial dataset and on a real-world dataset.


  • A novel high-speed digital imaging system for assessing vocal fold vibration

    Kaneko K, Watanabe T, Inoue M, Takahashi H

    Acta Medica Nagasakiensia   59 ( 1 ) 37 - 40  2014  [Refereed]


display all >>

Books and Other Publications 【 display / non-display

  • International Workshop on Statistical-mechanical Informatics 2009 (IW-SMI 2009)

    Masato Inoue, Shin Ishii, Yoshiyuki Kabashima, Masato Okada( Part: Joint editor)

    Institute of Physics Publishing  2009

Misc 【 display / non-display

  • International Workshop on Statistical-mechanical Informatics 2009 (IW-SMI 2009) PREFACE

    Masato Inoue, Shin Ishii, Yoshiyuki Kabashima, Masato Okada

    Journal of Physics: Conference Series   197  2009


Research Projects 【 display / non-display

  • -

  • -

Specific Research 【 display / non-display

  • 大規模遺伝型・形質型データの解析における低頻度型検出問題の研究


     View Summary

     本研究では,集団中低頻度である遺伝型・形質型において,特定の疾患や治療との因果関係を確認するランダム化比較試験をどのように構成すれば治験人数等のコストの最小化を図れるかを研究した.結果として,1)既存のblocking等の均等割付法が正しくランダム比較試験を構成していないこと(因果関係を過剰に検出することがある),2)ランダム化比較試験の割付乱数系列を工夫することで,比較試験の最後で行われる統計的検定(カイ二乗検定,Fisherの正確確率検定,G検定等の独立性の検定)の検出力を改善することができることが分かった. ランダム化比較試験は,二つの事項の因果関係を統計的に証明する手法であり,通常,原因と思われる事項をランダムかつ強制的に割り付け,結果と思われる事項との間に統計的に優位な相関関係が見られる場合に,因果関係ありと判断するものである.ランダム化比較試験の利点は,因果関係によらず相関関係を生み出す如何なる事項(例えば,共通の原因など)が存在しようとも,その影響を確率的に排除できる点にあり,科学的な因果関係の証明に広く用いられている.しかしながら,サンプル数が少数の場合,割付が過度に偏る可能性があり,このような場合,検出力の低下が起こり,真実として因果関係が存在するにもかかわらずそれを検出できないことがあり,問題となっている. 既存手法では,blocking等,強制的にほぼ同数を割り付ける簡易な手法が存在するが,このような均等割付法を採用した場合,因果関係によらず相関関係を生み出す事項が存在すると,この影響を排除しきれず,結果のp値が誤って有意に出てしまうことがある.更に,このような過誤を修正する統計的手法は一般に知られておらず,誤ったp値がランダム化比較試験の結果として論文等で報告されているケースが少なからずあるのではないかと思われる. 本研究では,G検定においてこの過誤を過小評価せずに扱い,更に,検出力を最大にするような割付乱数の確率分布を求める手法を考案した.この手法は具体的には,G検定の統計量は二つの事項の相互情報量で与えられ,相互情報量の上限は結果が未知の場合は割付乱数のエントロピーで与えられるため,これを最大化するような最適な割付分布を求めるものである.また,ランダム化比較試験は,サンプルを性別等で分類した上で,各分類項目において検定を行うこともあるため,このような場合にも対応できるよう重みづけを行うオプションも考案した.本手法は,現在行われているランダム化比較試験において用いられており,約一年後に結果を纏める予定である.  これ以外に,関連する統計的推論手法についても研究を進めた.

  • タンパク質間相互作用モチーフの情報論的推定手法の開発


     View Summary

     タンパク質の多くは体内で特定の化学反応を促進する酵素として働く.また,酵素としての機能を発揮するには,同種または異種のタンパク質と立体的に結合することが必要なものも多い.タンパク質同士が結合する際は,一般に結合モチーフと呼ばれる数~数十アミノ酸配列が重要であることが分かっている.この配列は,それぞれのタンパク質の組合せに固有であるが,同じタンパク質の同じ部位に結合するタンパク質同士には,似たアミノ酸配列から成る結合モチーフがあると思われる.特定のタンパク質と他の多数のタンパク質が結合する/しないというデータから,この結合モチーフを推定することが本研究の最終的な目的である. これに対し,いくつかのアプローチを試みた.まず,近年はshort linear motifと呼ばれる,10アミノ酸程度の短い配列についての研究が進んでおり,例えば真核細胞のlinear motifデータベースには2000ほどのモチーフが登録されている.これらの中から,特定のタンパク質に結合するタンパク質が共通に持つ結合モチーフを推定することを考えた.結合モチーフは一種類とは限らないため,また,各結合モチーフは正確に同じアミノ酸配列でなくとも,少々の変異を許すため,20種類のアミノ酸の離散分布をアミノ酸数だけ繋げ,更にこれをいくつか混合させた確率モデルを構築した.これにより,これまで結合する/しないの二値分類を行っていたアプローチよりも,より正確に結合モチーフを推定できることが期待できる.また,この問題を変分Bayes法用いて近似解を得る際に,1次のTaylor近似を用いたため,解の収束性が悪く,交互に極端な値を行ったり来たりする現象が見られたため,これを防ぐために更新割合を限定するような修正を加えた. また,やや異なる問題設定であるが,多数のタンパク質について,互いに結合する/しないの二値データから成る行列が与えられた際に,これを互いに結合する者同士でクラスタリングする問題についても研究を行った.互いに結合するタンパク質同士は,同じもしくは似たような機能を担っている可能性が高いため,機能未知のタンパク質の機能推定に有用である.従来法として,Markov chain Monte Carlo (MCMC)法を用いて解く方法があったが,これを平均場近似を用いて高速に解くアルゴリズムを構築した.この手法は,初期値のみランダムで設定する必要があるが,収束解の初期値依存性が強く,解を求める試行を多数行わなければならないという欠点が分かった. 上記研究は,英国King’s College LondonのACC Coolen教授との共同研究で進めた.

  • 大規模遺伝型・形質型データの解析における低頻度型検出問題の研究


     View Summary

     Fisherの正確確率検定は二つの事象間の非独立性を調べる検定法で,一定の仮定のもと,正確なp値を算出できることが利点である.しかし,サンプル数が多い場合や,各事象の起こる場合の数が多い場合は,p値の算出にかかる計算量が指数的に増加するという問題があった.また,genome-wide association study (GWAS)の枠組みでは,ある疾患の原因遺伝子を2万遺伝子,もしくは300万single nucleotide polymorphism (SNP)の中から探し出すという問題を解く必要があるが,これには一疾患対多遺伝子という多重検定を考慮しなければならず,更に難しい問題となっている. 先行研究では,この多重検定補正を行って正確なp値の算出を行うアルゴリズムを構築したが,依然計算量の問題は残っていた.そこで本研究では,実際のp値の使われ方としては,ある閾値以下であるかどうかが重要となる点に着目し,p値が閾値以下であるかどうかのみを正確に判定するアルゴリズムの構築を試みた.集合の包除原理を用いると,一次(単体)の項はp値の上界を,二次の項は下界を,三次の項は再び上界を与えることから,一次の近似で棄却できる場合や,二次の近似で棄却できない場合,三次の近似で棄却できる場合などは,その時点で判定できることが分かった.更に,二次,三次等の高次相関の組合せ数が膨大となることから,より低次の相関情報から,計算する高次相関項を絞り込むことを考えたが,現実的なアルゴリズムの構築にまでは至らなかった. 次に,各事象が三値以上の値を取り得る場合は,順序関係がある場合とない場合があることに着目し,順序関係がある場合にこれを利用して効率の良いアルゴリズムが構築できないか試みた.これはより基本的な問題として,順序回帰と呼ばれる問題があるため,これを研究した.こちらは,従来ある複数の閾値を組み合わせたモデルを排し,ロジスティック回帰モデルを複数組み合わせた確率モデルを構築することができた.また,全サンプルデータを解に反映させるのではなく,一部の重要なデータだけを反映させることで,より汎用的な解を得ることを目的とする疎なBayes学習アルゴリズムを構築できた.また,この研究を手伝った学生(長島 主尚)を2013年1月8日~3月27日の期間,英国King’s College LondonのACC Coolen教授の元へ派遣し,研究を進めた. 次に,SNPデータはhaplotype推定されていた方がより検定の検出力が向上するため,haplotype推定問題にも取り組んだ.こちらも,先の高次相関問題と共通の側面を持つ,モーメント母関数を用いたアルゴリズムの構築を試みた.結果,高次相関まで全て計算できるような規模の小さい問題については,現実的なアルゴリズムの構築ができた.また,推定精度は従来のEMアルゴリズムによる方法に劣るものの,計算量をサンプル数に対して比例でしか増加しない高速アルゴリズムを構築することができた.また,この研究の学会発表を行った学生(小野 司寿加)が IEEE Computational Intelligence Society Japan Chapter より Young Researcher Award を受賞することができた.

  • 多体相互作用モデルのモデル選択に関する情報論的研究


     View Summary

     多体相互作用モデル,特に二体結合モデルで,その結合が疎な場合の研究を進めた.その結果,以下の三つの系で新しい知見得られ,また手法が開発でき,それぞれ成果発表を行った.また,モデル選択の領域にまでは十分踏み込むことができなかった. 低密度パリティ検査符号の復号問題を解析した.対象にした系は厳密には六体であるが,低次偶数体という点では共通点が多い.このような系では,条件によってスピングラス相と呼ばれる特徴的なマクロ状態をとるが,その状態を主成分解析したところ,結合が密の系と同様の三角形構造が生ずることが分かった.また,磁場下では,この三角形構造の大きさが磁場に応じて小さくなることが分かった.このことについて成果発表を行った. haplotype推定問題での推定手法の開発を行った.この系ではかなり異なったタイプの二体結合モデルを構築し,最良解を近似的に求める一手法を開発した.その後,この二体結合モデルは系のサイズが比較的小さいことが多いため,厳密に解くことが不可能ではない場合があることが分かり,厳密解を求めるアルゴリズムを構築し,成果発表を行った. 脳の一次視覚野からの視覚画像推定を行う推定手法を開発した.この系では事前分布に隣り合うスピン同士のみに二体結合があるというモデルが構築されており,以前から良く研究されている.この系に対し,一次視覚野で行っていると言われるGaborフィルタをかけ,フィルタ出力からの原画像推定を行う具体的な推定手法を開発した.結果,質的には期待通りの推定結果が得られ,成果発表を行った.

  • 遺伝子 haplotype 推定アルゴリズムの開発


     View Summary

     複数の遺伝母集団が想定される場合に,SNPデータからhaplotype推定を行う手法をEMアルゴリズムに基づいて構成した. 近年,黒人のみに処方可能な薬剤といった人種依存薬が開発されている.一般に投薬対象を限定すれば効果や副作用がより明確に分かるため,投薬対象限定により,従来捨てられてきた薬剤候補が復活する可能性や,今後の薬剤開発において開発が成功する確率が高くなると思われる.しかし,人種は社会的に分かり易い区分であるが,混血の場合など難しい場合もある.薬剤の効能・副作用という観点からは,薬剤のターゲット・代謝等に関わる諸遺伝子のhaplotypeによって,適用を区分する方が理にかなっていると思われる.従来,一塩基多型(SNP)データからターゲット遺伝子のhaplotypeを推定する際に,人種の違いのような複数の遺伝母集団を仮定して推定する手法がなかったため,これを行う一手法をEMアルゴリズムに基づいて構成した.また,計算課程で近似を用いることで必要メモリ量を少なくした.複数遺伝子座での人工的SNPデータに対して本手法を適用したところ,正しくdiplotype及び起源遺伝母集団を推定した.本手法は遺伝子座数が20~30を超えると計算量爆発により計算しきれなくなるため,今後この点を改善する手法が求められる.また,交差の可能性を考慮していないため,この点についても同様である.

Overseas Activities 【 display / non-display

  • ランダム化比較試験における割付乱数系列および独立性検定の研究


    英国   King's College London


Syllabus 【 display / non-display

display all >>