2025/05/03 更新

写真a

ワン ジンファン
汪 金芳
所属
国際学術院 国際教養学部
職名
教授
 

現在担当している科目

 

特定課題制度(学内資金)

  • データサイエンスの手法を用いた個別最適化管理手法の開発

    2024年   Shigetoshi Hosaka

     概要を見る

    本研究は、特定の健康状態、特に糖尿病や糖尿病予備群を対象とした最適な個別化管理のために、統計的推論と機械学習的予測を統合するプロジェクトの一環として行われたものである。本研究では、従来のクラスタリング手法の限界を克服し、個人レベルでのT2D(2型糖尿病)リスクの不均一性をより精緻に捉える新しい予測型クラスタリング法を提案した。この手法は、個人ごとの特徴量の重要度プロファイルをもとに集団を分割し、個別化された予防および治療戦略の基盤を提供する。本研究では、民間医療データ会社JMDCより提供された19,953人分の健康診断データを用いた。このうち、空腹時血糖値の基準(126 mg/dL以上)により3,196人がT2D患者と判定された。まず、ランダムフォレスト分類器を用いてT2Dの有無を予測した後、LIME(Local Interpretable Model-agnostic Explanations)を用いて各個人における特徴量の重要度を算出した。これらの重要度ベクトルに対してK-meansクラスタリングを適用し、類似した重要度パターンを持つ個人をグループ化した。さらに、各クラスタのセントロイドに対してロジスティック回帰を適用することで、クラスタごとのT2Dリスクを推定した。また、各クラスタにおける併存疾患(高血圧症、脂質異常症など)の有病率も分析対象とした。LIMEを用いた予測型クラスタリングにより、7つのT2Dリスクフェノタイプが同定された。これらは順に、「健康型」、「軽度脂質異常型」、「脂質異常型」、「高血圧型」、「軽度代謝異常型」、「中等度代謝異常型」、「重度代謝異常型」と命名され、それぞれT2Dのリスクが漸増する傾向にあった。この分類は、従来の単純なクラスタリングとは異なり、臨床的な解釈可能性および介入対象の特定において優れており、将来的には個別化された予防や治療戦略の設計に資する有力な手法となる可能性がある。

  • 最適な血糖値予測モデルの構築について

    2023年   Shigetoshi Hosaka

     概要を見る

    Purpose:In data science, two distinct cultures exist: model-based statistics and algorithm-based machine learning. Statistical models offer interpretability, whereas machine learning algorithms are known for their predictive prowess. This research is part of a larger project of combining statistical inference with machine learning prediction to make optimal personalized management for subjects with specific conditions such as prediabetes. Our framework generalize a recently proposed health improvement framework [1]. Methods:An iterative algorithm that fuses state-of-the-art machine learning predictors like XGBoost with statistical inference using Bayesian linear model is proposed. We have done comprehensive case studies focusing on prediabetes management, leveraging health checkup data from a large hospital in Edogawa Ward, Tokyo. Clinically, an individual is diagnosed with type 2 diabetes if the glucose level exceeds 126 mg/dL and with prediabetes if the level is between 100-125 mg/dL. For glucose levels under 100 mg/dL, the individual is considered normal. To effectively manage prediabetes, we proposed XGBoost to make both precise and robust forecasts of glucose levels using sequentially modified risk factors associated with lifestyle, like Body Mass Index (BMI) and systolic blood pressure. Main Conclusions:In a Spanish cohort study [2], 41% of prediabetes remained prediabetic, 23% progressed to diabetes, and 36% returned to normoglycemia. Employing our model initially constructed for glucose level, but based on a closely related outcome of HbA1c, significant improvements were observed: merely 3.5% remained prediabetic, 7% progressed to diabetes, and a remarkable 89.5% reverted to normoglycemia. The main findings were presented in Wang and Hosaka (2023) [3]. We will explore applications of the proposed method for personalized management in other areas such as constructing strategies for the prevention and reduction of juvenile delinquency. [1] Nakamura, K., et al., Nature Communications, 2021, 12:3088; https://www.nature.com/articles/s41467-021-23319-1[2] Miquel B., et al., Nutrients 2020, 12(5), 1538; https://doi.org/10.3390/nu12051538[3] Wang, J. and Hosaka, S. (2023). The 12th conference of the Asian Regional Section of the International Association for Statistical Computing (IASC-ARS), 6–8 December, 2023, Macquarie University, NSW, Australia.