2024/05/28 更新

写真a

タナカ クミコ
田中 久美子
所属
理工学術院 基幹理工学部
職名
教授
学位
博士
ホームページ

経歴

  • 2023年04月
    -
    継続中

    早稲田大学   理工学術院 基幹理工学部 情報理工学科   教授

  • 2016年04月
    -
    2023年03月

    東京大学   先端科学技術研究センター   教授

  • 2012年04月
    -
    2016年03月

    九州大学 大学院 システム情報科学研究院   教授

  • 2007年04月
    -
    2012年03月

    東京大学 大学院 情報理工学系研究科   准教授

  • 2005年04月
    -
    2007年03月

    東京大学 大学院 情報理工学系研究科   助教授

  • 2003年03月
    -
    2005年03月

    東京大学 情報基盤センター   助教授

  • 2000年03月
    -
    2003年02月

    東京大学 大学院 情報学環・学際情報学府   講師

  • 1997年04月
    -
    2000年03月

    工業技術院 電子技術総合研究所   技官

▼全件表示

学歴

  • 1993年04月
    -
    1997年03月

    東京大学   大学院工学系研究科情報工学専攻博士課程  

  • 1994年06月
    -
    1995年05月

    フランスLIMSI-CNRS   客員研究員  

  • 1991年04月
    -
    1993年03月

    東京大学   大学院工学系研究科情報工学専攻修士課程  

  • 1987年04月
    -
    1991年03月

    東京大学   工学部   計数工学科  

委員歴

  • 2021年
    -
    継続中

    Association for Computational Linguistics  常時査読委員

  • 2018年
    -
    継続中

    大川情報通信基金  大川出版賞審査委員

  • 2022年
    -
     

    JST  AIP 関連4 領域評価評価委員(ACT-I 評価委員)

  • 2022年
    -
     

    Conference on Computational Linguistics (COLING),  査読委員

  • 2021年
    -
    2022年

    Large Resources and EvaluationConference (LREC),  査読委員

  • 2021年
    -
     

    JSPS  科研費国際共同研究B 審査委員

  • 2021年
    -
     

    North American Chapter of Annual Conference on Computational Linguistics (NAACL)  査読委員

  • 2021年
    -
     

    Empirical Methods for Natural Language Processing  査読委員

  • 2021年
    -
     

    Open Semiotics  査読委員

  • 2019年
    -
    2021年

    Entropy  査読担当

  • 2020年
    -
     

    Lingua  査読委員

  • 2020年
    -
     

    Semiotica  査読委員

  • 2020年
    -
     

    Conference on Computational Linguistics (COLING),  査読委員

  • 2017年
    -
    2020年

    Annual Conference on Computational Linguistics (ACL)  査読委員

  • 2019年
    -
     

    文部科学省  AIMap 評価委員会委員

  • 2019年
    -
     

    PACLING  査読委員

  • 2018年
    -
     

    Large Resources and EvaluationConference (LREC)  査読委員

  • 2017年
     
     

    International Conference on Computational Linguistics (COLING)  査読委員

  • 2016年
    -
     

    Empirical Methods for Natural Language Processing  査読委員

  • 2016年
    -
     

    Computational Linguistics for Linguistic Complexity (CL4LC)  Program committee

  • 2014年
    -
    2015年

    言語処理学会  理事

  • 2013年
    -
    2015年

    ACM SIGCHI Conference  査読委員

  • 2014年
    -
     

    Annual Conference on Computational Linguistics (ACL)  査読委員

  • 2014年
    -
     

    International Conference on Computational Linguistics (COLING),  査読委員

  • 2013年
    -
    2014年

    International Workshop for Speech and Language Processing for Assistive Technologies  Program committee

  • 2013年
    -
     

    電子情報通信学会  常任査読委員

  • 2013年
    -
     

    Mobile HCI Conference  査読委員

  • 2013年
    -
     

    ACM UIST Symposium  査読委員

  • 2013年
    -
     

    Paci c Association for Computational Linguistics  Program committee

  • 2012年
    -
     

    情報処理学会  シニア査読委員

  • 2012年
    -
     

    Annual Conference on Computational Linguistics (ACL)  査読委員

  • 2006年
    -
    2012年

    情報処理学会  査読委員

  • 2011年
    -
     

    International Conference on Informatics and Semiotics in Organizations  Program committee

  • 2011年
    -
     

    Workshop on Advances in Text Input Methods,  Program committee

  • 2010年
    -
    2011年

    International Workshop for Speech and Language Processing for Assistive Technologies  Program committee

  • 2010年
    -
     

    Annual Conference on Computational Linguistics (ACL)  査読委員

  • 2009年
    -
    2010年

    言語処理学会大会  プログラム委員

  • 2008年
    -
    2010年

    言語処理学会  評議員

  • 2008年
    -
    2010年

    言語処理学会  編集委員

  • 2008年
    -
    2009年

    論文誌「言語処理」,「教育と学習を支援する自然言語処理  特集号編集委員

  • 2008年
    -
     

    言語処理学会大会  「教育と学習を支援する自然言語」ワークショップ 企画委員、大会実行委員委員

  • 2007年
    -
    2008年

    International Conference on Computer Processing of Oriental Languages  Program committee

  • 2007年
    -
     

    Pacific Association for Computational Linguistics  Program committee

  • 2007年
    -
     

    Workshop on Computational Japanese Studies  Organizer

  • 2007年
    -
     

    Annual Conference on Computational Linguistics (ACL)  査読委員

  • 2006年
    -
     

    Paci c Association for Computational Linguistics  Co-chair

  • 2006年
    -
     

    Asia Information Retrieval Symposium  Program committee

  • 2004年
    -
    2006年

    応用数理学会  編集委員

  • 2004年
    -
    2005年

    International Joint Conference on Natural Language Processing  査読委員

  • 2004年
    -
     

    言語処理学会大会  プログラム委員

  • 2004年
    -
     

    International Joint Conference on Natural Language Processing  Session Organizer

  • 2003年
    -
     

    International Workshop on Language Modeling for Text Entry Methods (Workshop of Conference of the European Chapter of the Association for Computational Linguistics)  Program committee

  • 2003年
    -
     

    Pacific Association for Computational Linguistics  Program committee

  • 2001年
    -
    2002年

    ソフトウエア科学会  企画委員

  • 2000年
    -
    2002年

    言語処理学会  評議員

  • 2001年
    -
     

    International Conference on Computer Processing of Oriental Languages  査読委員

  • 2001年
    -
     

    Natural language Processing Paci c Rim  査読委員

  • 2001年
    -
     

    Pacific Association for Computational Linguistics  Program committee

  • 2000年
    -
    2001年

    電子情報通信学会  「思考と言語」研究会, 幹事補佐

  • 2000年
    -
    2001年

    情報処理学会  「知能と複雑系」研究会委員

▼全件表示

所属学協会

  •  
     
     

    ACL

  •  
     
     

    言語処理学会

  •  
     
     

    情報処理学会

研究分野

  • 知能情報学   計算言語学・自然言語処理 / 数理情報学   言語の複雑系科学 / ソフトウェア   自然言語インターフェース / 言語学   計量言語学

研究キーワード

  • 計算言語学

  • 言語の複雑系科学

  • 計量言語学

  • 数理言語学

  • 自然言語処理

  • 多言語処理

  • 言語ソフトウエア

  • 情報検索・抽出

  • 情報記号論

▼全件表示

受賞

  • 第75回毎日出版文化賞

    2021年11月   毎日新聞社   「言語とフラクタル」  

    受賞者: 田中久美子

  • 2011年度論文賞

    2012年03月   言語処理学会   「文書量に不変な定数-Yule のK, Golcher のVM」  

    受賞者: 木村大翼.田中久美子.

  • 第19回大川出版賞受賞

    2011年03月   公益財団法人 大川情報通信基金   「記号と再帰」  

    受賞者: 田中久美子

  • Best paper award

    2011年02月   16th International Conference on Intelligent User Interfaces (IUI)   ”picoTrans: An icon-driven user interface for machine translation on mobile devices”  

    受賞者: Wei Song, Andrew Finch, Kumiko Tanaka-Ishii, and Eiichiro Sumita.

  • 第32回サントリー学芸賞(思想・歴史部門)

    2010年12月   サントリー文化財団   「記号と再帰」  

    受賞者: 田中久美子

  • 文部科学大臣表彰若手科学者賞

    2008年04月   文部科学省  

    受賞者: 田中久美子

  • WWW Conference Best Presentation Award

    2005年05月   International World Wide Web Conference (WWW)   ”A Multilingual Usage Consultation Tool Based on Internet Searching -More than a Search Engine, Less than QA-"  

    受賞者: 田中久美子,中川裕志

  • Best paper award

    2003年08月   International Conference of Pacific Association for Computational Linguistics (PACLING)   "Categorization of movies using comments"  

    受賞者: Kumiko Tanaka-Ishii, Michiko Abe, and Hiroshi Nakagawa.

▼全件表示

メディア報道

  • 毎日出版文化賞授賞

    新聞・雑誌

    毎日新聞  

    2021年12月

  • 毎日出版文化賞受賞者発表

    新聞・雑誌

    執筆者: 本人以外  

    毎日新聞  

    2021年11月

  • 次世代人

    新聞・雑誌

    読売新聞  

    2011年01月

  • サントリー学芸賞受賞報道

    新聞・雑誌

    各新聞社  

    2010年11月

  • 東京大学: 教育環境革新のプロジェクトを報告

    新聞・雑誌

    毎日新聞  

    2005年07月

  • かな漢字変換ソフトの実力

    新聞・雑誌

    日経バイト  

    page 87  

    2003年12月

  • 4 キー文字入力

    新聞・雑誌

    DIME  

    page 49  

    2001年09月

  • 携帯メールで親指の負担を軽くする?

    新聞・雑誌

    i モードSTYLE  

    page 34  

    2001年08月

  • キー4つでメール入力

    新聞・雑誌

    読売新聞  

    2001年06月

  • より速く、より賢く効率的に!進化するケータイの日本語入力環境

    新聞・雑誌

    日経モバイル  

    page 23  

    2001年05月

▼全件表示

 

論文

  • Strahler number of natural language sentences in comparison with random trees

    田中久美子, 田中輝

    Journal of Statistical Mechanics: Theory and Experiment   2023 ( 12 ) 123403  2023年12月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • Co-Training Realized Volatility Prediction Model with Neural Distributional Transformation

    杜鑫, 守山魁, 田中久美子

    4th ACM International Conference on AI in Finance    2023年11月  [査読有り]

    DOI

    Scopus

  • Predictability of Post-Earnings Announcement Drift with Textual and Contextual Factors of Earnings Calls

    アンディ・チャン, 田中久美子

    4th ACM International Conference on AI in Finance    2023年11月  [査読有り]

    DOI

    Scopus

  • Modeling Momentum Spillover with Economic Links Discovered from Financial Documents

    アンディ・チャン, 田中久美子

    4th ACM International Conference on AI in Finance    2023年11月  [査読有り]

    DOI

    Scopus

  • Semantic Field of Words Represented as Nonlinear Functions

    杜鑫, 田中久美子

    36th Conference on Advances in Neural Information Processing Systems    2022年11月  [査読有り]

  • Stock portfolio selection balancing variance and tail risk via stock vector representation acquired from price data and texts.

    杜鑫, 田中久美子

    Knowledge-Based Systems,   249   108917 - 108917  2022年08月  [査読有り]

    DOI

    Scopus

  • Menzerath's law in the syntax of languages compared with random sentences

    田中久美子

    Entropy,   23 ( 6 ) 661 - 661  2021年05月  [査読有り]

    担当区分:筆頭著者, 責任著者

    DOI

    Scopus

  • A COMPARISON OF TWO FLUCTUATION ANALYSES FOR NATURAL LANGUAGE CLUSTERING PHENOMENA —TAYLOR vs. EBELING & NEIMAN METHODS—

    KUMIKO TANAKA-ISHII, SHUNTARO TAKAHASHI

    Fractals   29 ( 02 ) 2150033 - 2150033  2021年03月  [査読有り]  [国際誌]

    担当区分:筆頭著者

    DOI

  • Stock embeddings acquired from news articles and price history, and an application to portfolio optimization

    杜鑫, 田中久美子

    Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics (ACL) Long Papers     3353 - 3363  2020年07月  [査読有り]

  • Entropy rate estimation for english via a large cognitive experiment using mechanical turk

    Gen Ren,高橋峻太郎,田中久美子

    Entropy   21 ( 12 )  2019年12月  [査読有り]

  • Evaluating computational language models with scaling properties of natural language

    高橋峻太郎, 田中久美子

    Computational Lingusitics   45 ( 3 )  2019年10月  [査読有り]

  • Addendum: Another Explanation About the Bounds of the Taylor Exponent

    田中久美子, 小林達

    Journal of Physics Communications   3 ( 8 )  2019年08月  [査読有り]

    担当区分:筆頭著者

  • Modeling financial time-series with generative adversarial networks

    高橋峻太郎, 陳昱, 田中久美子

    Physica A: Statistical Mechanics and its Applications   527  2019年08月  [査読有り]

    DOI

    Scopus

  • Taylor's law for linguistic sequences and random walk models

    田中久美子, 小林達

    Journal of Physics Communications   2 ( 11 )  2018年11月  [査読有り]

    担当区分:筆頭著者

  • Cross Entropy of Neural Language Models at Infinity—A New Bound of the Entropy Rate

    高橋峻太郎, 田中久美子

    Entropy   20 ( 11 ) 839 - Online Journal  2018年11月  [査読有り]

  • Long-Range Correlation Underlying Childhood Language and Generative Models

    田中久美子

    Frontiers Psychology    2018年09月  [査読有り]

    DOI

    Scopus

  • Extraction of templates from phrases using sequence binary decision diagrams

    平野大貴, 田中久美子, Andrew Finch

    Natural Language Engineering   24   1 - 33  2018年07月  [査読有り]

  • Taylor's Law for Human Linguistic Sequences

    小林達, 田中久美子

    Annual Conference of Association for Computational Lingusitics     1138 - 1148  2018年07月  [査読有り]

  • Do Neural Nets Learn Statistical Laws behind Natural Language?

    高橋峻太郎, 田中久美子

    PLoS One   12 ( 12 ) e0189326 - Online Journal  2017年12月  [査読有り]

    DOI

    Scopus

  • Inducing a Bilingual Lexicon from short Parallel Multiword Sequences

    Andrew Finch, 原田泰佑, 田中久美子, 隅田英一郎

    ACM Transactions on Asian Low-Resource Language Information Processing   16 ( 3 )  2017年03月  [査読有り]

  • Long-Range Memory in Literary Texts: On the Universal Clustering of the Rare Words.

    田中久美子, Armin Bunde

    PLoS One   11 ( 11 ) e0164658 - Online Journal  2016年11月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • Entropy Rate Estimates for Natural Language—A New Extrapolation of Compressed Large-Scale Corpora

    高比良亮祐, 田中久美子, Łukasz Dębowski

    Entropy   18 ( 10 ) 364 - Online Journal  2016年10月  [査読有り]

    DOI

    Scopus

  • Computational constancy measures of texts – Yule’s K and R´enyi’s entropy

    田中久美子, 粟飯原俊介

    Computational Linguistics   41 ( 3 ) 481 - 502  2015年  [査読有り]

    担当区分:筆頭著者

    DOI

  • Sentence Hedge Detection without Cue Annotation: A Heuristic Cue Selection Approach

    Andre Kenji Horie, 田中久美子

    自然言語処理   21 ( 1 ) 27 - 40  2014年03月  [査読有り]

  • picoTrans: An Intelligent icon-driven interface for cross-lingual communication

    Wei Song, Andrew Finch, 田中久美子, Keiji Yasuda, 隅田英一郎

    ACM Transactions on Interactive Intelligent Systems   3 ( 1 ) 1 - 31  2013年04月  [査読有り]

    DOI

    Scopus

  • Speaking Louder Than Words with Pictures across Languages.

    Andrew Michael Finch, Wei Song,田中久美子,隅田英一郎

    AI magazine   34 ( 2 ) 31 - 47  2013年  [査読有り]

  • Verb Temporality Analysis using Reichenbach's Tense System

    Andre Kenji Horie, 田中久美子, Mitsuru Ishizuka

    Proceedings of International Conference for Computational Linguistics (COLING)     471 - 482  2012年12月  [査読有り]

  • Information Bias in English Words

    田中久美子

    Journal of Quantitative Linguistics   19 ( 1 ) 77 - 94  2012年01月  [査読有り]

    DOI

    Scopus

  • Text Segmentation by Language Using Minimum Description Length

    山口洋, 田中久美子

    Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics     969 - 978  2012年  [査読有り]

  • Word familiarity and frequency

    田中久美子, 寺田博資

    Studia Linguistica   65 ( 1 ) 96 - 116  2011年03月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • 文書量に不変な定数: YuleのK, GolcherのVM

    木村大翼, 田中久美子

    自然言語処理   18 ( 2 ) 119 - 137  2011年  [査読有り]

    DOI CiNii

  • Sorting Texts by Readability

    田中久美子, 手塚智史, 寺田博視

    Computational Linguistics   36 ( 2 ) 203 - 227  2010年06月  [査読有り]

    担当区分:筆頭著者

    DOI

  • Multilingual Spectral Clustering Using Document Similarity Propagation

    Dani Yogatama,田中久美子

    Proceedings of the Cnference on Empirical Methods in Natural Language Processing (EMNLP)     871 - 879  2009年08月  [査読有り]

  • Kansuke: A logograph look-up interface based on a few modified stroke prototypes

    田中久美子, Julian Godon

    ACM Transactions on Computer-Human Interaction   16 ( 2 ) 11:1 - 11:7  2009年06月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • An Instance vs. the Instance

    田中久美子

    Journal of Minds and Machines   19 ( 1 ) 117 - 128  2009年02月  [査読有り]

    DOI

    Scopus

  • TypeAny : 言語判別を用いた多言語入力システム

    江原遥, 田中久美子

    自然言語処理 = Journal of natural language processing   15 ( 5 ) 151 - 167  2008年10月

     概要を見る

    近年,国際化に伴い,多くの言語を頻繁に切り替えて入力する機会が増えている.既存のテキスト入力システムにおいては,言語が切り替わるたびに,ユーザーが手動で,テキスト入力ソフトウェア(IME)を切り替えなければならない点が,ユーザーにとって負担になっていた.この問題を解決するために,本論文では,多言語を入力する際にユーザーの負担を軽減するシステム,TypeAnyを提案する.TypeAnyは,ユーザーが行うキー入力からユーザーが入力しようとしている言語を判別して,IMEの切り替えを自動で行う.これによって,ユーザーがIMEを切り替える操作量が減るため,複数の言語をスムーズに切り替えながら入力することが可能になる.本研究では,隠れマルコフモデルを用いて言語の判別をモデル化し,モデルにおける確率をppM法を用いて推定することでTypeAnyを実装し,その有用性を評価した.その結果,人工的なコーパスにおける3言語間の判別において,96.7% の判別精度を得た.また,実際に多言語を含む文書を用いて実験したところ,切り替えに必要な操作の数が,既存の手法に比べて93%減少したComputer users increasingly need to produce text written in multiple languages. However, typical computer syste...

    DOI CiNii

  • From phoneme to morpheme ---another verification using corpus in English and Chinese

    田中久美子, Zhihui Jin

    Studia Linguistica   62 ( 2 ) 155 - 179  2008年07月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • Multilingual Text Entry using Automatic Language Detection

    江原遥,田中久美子

    Proceedings of International Joint Conference on Natural Languate Processing     441 - 448  2008年  [査読有り]

  • Pinyomi: Dictionary lookup via orthographic associations

    Lars Yencken, Zhihui Jin, 田中久美子

    Proceedings of the 10th Conference of the Pacific Association for Computational Linguistics     13 - 21  2007年01月  [査読有り]

  • Multilingual phrase-based concordance generation in real-time

    田中久美子, 石井裕一郎

    Information Retrieval   10 ( 3 ) 275 - 295  2007年01月  [査読有り]

    担当区分:筆頭著者

    DOI

    Scopus

  • Dyadic versus triadic sign models in functional and object-oriented computer programming paradigms

    田中久美子

    Semiotica   2006 ( 158 ) 213 - 232  2006年04月  [査読有り]

    DOI

    Scopus

  • Word-based text entry techniques using adaptive language models

    田中久美子

    Journal of Natural Language Engineering   13 ( 1 ) 51 - 74  2006年02月  [査読有り]

    DOI CiNii

    Scopus

  • Kansuke: A Kanji Look-Up System Based on a Few Stroke Prototypes

    田中久美子,Julian Godon

    In International Conference on the Computer Processing of Oriental Languages (TOCHI)     310 - 320  2006年  [査読有り]

    担当区分:筆頭著者

  • Entering Japanese with a Few Button Device

    田中 久美子

    情報処理学会論文誌   46 ( 6 ) 691 - 696  2005年06月  [査読有り]  [招待有り]

    CiNii

  • 閻魔 Webインタフェースによるプログラミング教育支援システム

    田中 久美子, 筧 一彦, 武市 正人

    コンピュータ & エデュケーション   18   69 - 75  2005年

    担当区分:筆頭著者

    DOI CiNii

  • A Multilingual Usage Consultation Tool Based on Internet Searching -More than a Search Engine, Less than QA-

    田中久美子, 中川裕志

    the International World Wide Web Conference Committee (IW3C2)     363 - 371  2005年  [査読有り]

    担当区分:筆頭著者

     概要を見る

    Best presentation award

  • Entering Japanese with a Few Button Device

    田中 久美子, 犬塚 祐介, 武市 正人

    情報処理学会論文誌   44 ( 2 ) 433 - 442  2003年02月  [査読有り]

    担当区分:筆頭著者

     概要を見る

    本稿では文字入力用に4つだけのキーを用いて自由な日本語文章の入力を行うシステムとその効率を報告する.本システムは動的な言語モデルに基づいて予測的に入力を行うものである。応用としては,小型機器類における入力や,高齢者や障害者のための簡易文書入力システムが考えられる.さまざまな実験の結果,4つのキーを用いたとしても,学習を用いれば現行の携帯電話における文書入力に匹敵する効率で入力が可能であることが分かった.

    CiNii

  • Categorization of movies using comments

    田中久美子, Michiko Abe, 中川裕志

    Proceedings of International Conference of Pacific Association for Computational Linguistics     221 - 229  2003年  [査読有り]

    担当区分:筆頭著者

  • Acquiring vocabulary for predictive text entry through dynamic reuse of a small user corpus

    田中久美子, 早川大地, 武市正人

    ACL '03 Proceedings of the 41st Annual Meeting on Association for Computational Linguistics   1   407 - 414  2003年  [査読有り]

    担当区分:筆頭著者

  • 携帯電話における日本語入力 : 子音だけで日本語が入力できるか

    田中 久美子, 犬塚 祐介, 武市 正人

    情報処理学会論文誌   43 ( 10 ) 3087 - 3096  2002年10月  [査読有り]

    担当区分:筆頭著者

     概要を見る

    本稿では,携帯電話のための子音漢字変換による日本語入力方式を議論する.子音漢字変換では,ユーザが子音列を入力し,これを子音漢字変換ソフトウエアが漢字混じりの日本語に直接変換する.従来のかなを入力する方式では1かなあたり複数回キー入力を行う必要があるのに対し,子音入力を用いると,1かなあたり1回だけの入力で済む.一方で,子音漢字変換を行うと,かな漢字変換の7倍にものぼる候補を扱わざるをえない.そこで,本研究においては,隠れマルコフモデルを用いた言語モデルにPPM(Prediction by Partial Match)を融合させた動的な言語モデルを用いてユーザの語彙選択の傾向を学習させることにより,入力効率を追求した.その結果,現行のかな入力方式に対して打鍵数を半減させることができた.ユーザ実験を行った結果でも,現行の方式よりも短時間で入力を行うことができることが分かった.

    CiNii

  • Entering Text with a Four Button Device

    田中 久美子, 犬塚 祐介, 武市 正人

    The 19th International Conference on Computational Linguistics     988 - 994  2002年  [査読有り]

    担当区分:筆頭著者

  • Japanese input system with digits --Can Japanese be input only with consonants?

    田中 久美子, 犬塚 祐介, 武市 正人

    Human Language Technology Conference     211 - 218  2001年  [査読有り]

    担当区分:筆頭著者

  • Multi-Agent Explanation Strategies in Real-Time Domains

    Kumiko Tanaka-Ishii, Ian Frank

    The 36th Annual Meeting for Association of Computational Linguistics     158 - 165  2000年  [査読有り]

    担当区分:筆頭著者

    DOI

  • 第三言語を介した対訳辞書の作成(<特集>並列処理)

    田中久美子, 梅村恭司, 岩崎秀哉

    情報処理学会論文誌   39 ( 6 ) 1915 - 1924  1998年06月  [査読有り]

    担当区分:筆頭著者

     概要を見る

    第三言語を介して対訳辞書を自動作成するアルゴリズムを論じ, 現在の対訳辞書との比較により抽出結果を検討する.和英辞典と英仏辞典から英語(第三言語)を仲介として和仏辞典を作成する際には, 英語において機械的に辞書を合体させるだけでは第三言語の語の多義性により不適当な訳語が生じる.したがって, 正しい訳語のみを自動抽出する手法が必要となる.本研究では, 訳語関係のグラフ, 語の形態素が持つ表意を利用した手法を提案する.実際に既存の中辞典規模の電子辞書を用いて名詞, 動詞, 形容詞に対して実験を行い, 既存の辞書にはない訳語が得られるという有効性を示した.

    CiNii

  • Reactive Content Selection in the Generation of Real-time Soccer Commentary

    田中久美子, Koiti Hasdida, Itsuki Noda

    Proceedings of International Conference on Computational Linguistics (COLING)     1282 - 1288  1998年  [査読有り]

    担当区分:筆頭著者

  • Extraction of Lexical Translations from Non-Aligned Copora

    田中久美子, 岩崎英哉

    The 16th International Conference on Computational Linguistics     580 - 585  1996年  [査読有り]

    担当区分:筆頭著者

    DOI

  • Construction of a Bilingual Dictionary Intermediated by a Third Language

    田中久美子, 梅村恭司

    The 15th International Conference on Computational Linguistics     297 - 303  1994年  [査読有り]

    担当区分:筆頭著者

    DOI

▼全件表示

書籍等出版物

  • Open Semiotics. Volume 1: Epistemological and Conceptual Foundations

    Kumiko Tanaka-Ishii( 担当: 分担執筆,  担当範囲: Self-similar structure of sign systems: Not a metaphor.)

    Editions L'Harmattan  2023年06月 ISBN: 9782140305252

  • 言語とフラクタル

    田中久美子( 担当: 単著)

    東大出版会  2021年05月 ISBN: 9784130802574

     概要を見る

    「壊れたフラクタル」?――これほど複雑・多様かつ変化する人間のことばにあって,どんな時代の,どんな言語の,どんなジャンルでも成り立つという「統計的言語普遍」.現代の計算機言語学が提示する不思議を検証し,その意味を考えることから,人間の記号使用の深奥に迫ってゆく.

  • Statistical Universals of Language: Mathematical Chance vs. Human Choice

    田中久美子( 担当: 単著)

    Springer  2021年05月 ISBN: 9783030593766

    DOI

  • Information Theory and Language

    Geng Ren, Shuntaro Takahashi, Kumiko Tanaka-Ishii( 担当: 分担執筆,  担当範囲: chapter 9, Entropy rate estimation for english via a large cognitive experiment using mechanical turk.)

    MDPI  2020年12月

  • Interdisciplinary Perspective on Math Cognition

    田中久美子( 担当: 分担執筆,  担当範囲: Machine vs. structure of language via statistical universals, Chapter 4)

    Springer  2019年09月

  • これからのウィトゲンシュタイン -刷新と応用のための14 篇

    田中久美子( 担当: 分担執筆,  担当範囲: 機械は『言語ゲーム』をプレイできるか)

    リベルタス叢書  2016年11月 ISBN: 9784905208051

  • 科学と文化をつなぐ

    田中久美子( 担当: 分担執筆,  担当範囲: 第1章 間は記号か-ゼロ記号再考-)

    東京大学出版会  2016年03月 ISBN: 9784130603157

  • International Handbook of Semiotics

    田中久美子( 担当: 分担執筆,  担当範囲: Semiotics of Computing: Filling the Gap Between Humanity and Mechanical Inhumanity)

    Springer  2015年05月

  • Language Production, Cognition, and the Lexicon

    田中久美子( 担当: 分担執筆,  担当範囲: Consonants as Skeleton of Language: Statistical Evidences Through Text Production)

    Springer  2014年11月

  • Semiotic and Cognitive Science Essays on the Nature of Mathematics 2012

    田中久美子( 担当: 分担執筆,  担当範囲: Dyadic vs. Triadic Sign Models Through Computer Programs)

    Lincom GmbH  2012年 ISBN: 9783862883325

     概要を見る

    https://www.amazon.com/Semiotic-Cognitive-Science-Essays-Mathematics/dp/3862883329

  • 記号と再帰

    田中 久美子

    東京大学出版会  2010年06月 ISBN: 4130802518

     概要を見る

    第32回サントリー学芸賞(思想・歴史部門)、第19回大川出版賞

    ASIN

  • Semiotics of Programming

    Kumiko Tanaka-Ishii

    Cambridge University Press  2010年05月 ISBN: 0521736277

  • こころと言葉―進化と認知科学のアプローチ

    ( 担当: 分担執筆,  担当範囲: 言語の文節に普遍的に観察される統計的性質)

    東京大学出版会  2008年11月 ISBN: 4130830481

    ASIN

  • ソシュール一般言語学講義―コンスタンタンのノート

    フェルディナン・ド ソシュール( 担当: 共訳)

    東京大学出版会  2007年03月 ISBN: 413080250X

    ASIN

  • Text Entry Systems ---Accessibility, Mobility, Universality---

    Scott MacKenzie, Kumiko Tanaka-Ishii, editors

    Morgan Kaufmann (Elsevier)  2007年

     概要を見る

    Co-authored chapters 2, 5, 10, 11, 13.

  • 数理工学への誘い

    ( 担当: 分担執筆,  担当範囲: 携帯電話に日本語を入力するには ――自然言語の数理)

    日本評論社  2002年09月 ISBN: 4535783543

    ASIN

▼全件表示

講演・口頭発表等

  • Towards Quantifying the Complexity of Natural Language Sentence Structure

    Kumiko Tanaka-Ishii  [招待有り]

    Complexity in Language Variation and Change (COMPILA 2023)   (東京都目黒区)  Yoshifumi Kawasaki (University of Tokyo, Japan) David Sanchez (Institute for Cross-Disciplinary Physics and Complex Systems IFISC, Mallorca, Spain) Marco Patriarca (National Institute of Chemical Physics and Biophysics, Tallinn, Estonia)  

    発表年月: 2023年08月

    開催年月:
    2023年08月
     
     

     概要を見る

    This event is supported by JSPS KAKENHI Grant Number JP23K12152 (Grant-in-Aid for Early-Career Scientists: Application of computational linguistic techniques to Medieval and Modern Spanish texts; PI: Yoshifumi KAWASAKI).

  • Human Signs through Semiotics of Computing

    Kumiko TANAKA-ISHII  [招待有り]

    Clare Hall Philosophy and History SIG Seminar  

    発表年月: 2023年02月

  • Bonsai, Coastline and Language: Scale-Free Property of Natural Language

    Kumiko TANAKA-ISHII  [招待有り]

    Clare Hall Colloquium  

    発表年月: 2022年11月

  • 言語を複雑系として捉える試み

    田中久美子  [招待有り]

    言語処理学会大会  

    発表年月: 2022年03月

    開催年月:
    2022年03月
    -
     
  • 複雑系の視点からの言語とプログラムの差異

    田中久美子  [招待有り]

    ソフトウエア技術者会議(SEA)  

    発表年月: 2022年02月

    開催年月:
    2022年02月
    -
     
  • 複雑系科学の観点からの言語研究の試み

     [招待有り]

    NLP コロキウム  

    発表年月: 2021年10月

    開催年月:
    2021年10月
    -
     
  • Long Memory underlying Language

    田中久美子  [招待有り]

    International Conference on Quantitative Linguistics  

    発表年月: 2021年09月

    開催年月:
    2021年09月
    -
     
  • 自然言語の長相関

    田中久美子  [招待有り]

    応用数理学会大会  

    発表年月: 2021年09月

    開催年月:
    2021年09月
    -
     
  • 自然言語の中にひそむ数理的普遍

    田中久美子  [招待有り]

    数学シンポジウムさきがけCREST シンポジウム  

    発表年月: 2020年02月

    開催年月:
    2020年02月
    -
     
  • 自然言語の数理的普遍

    田中久美子  [招待有り]

    計算力学シンポジウム  

    発表年月: 2019年12月

    開催年月:
    2019年12月
    -
     
  • Towards a Philosophical grounding of Universal Statistical Properties Underlying Human Language: Mirroring Nature and Rule-Following

    田中久美子  [招待有り]

    科学基礎論学会  

    発表年月: 2018年06月

    開催年月:
    2018年06月
    -
     
  • 「ことば」はどのようにフラクタルか

    田中久美子  [招待有り]

    応用数理学会. ものづくり研究会  

    発表年月: 2018年02月

    開催年月:
    2018年02月
    -
     
  • プログラムはどうフラクタルか

    田中久美子  [招待有り]

    プログラミングシンポジウム  

    発表年月: 2018年01月

    開催年月:
    2018年01月
     
     
  • 言語の長相関に内在する再帰的生成過程

    田中久美子  [招待有り]

    認知科学大会第34回大会  

    発表年月: 2017年09月

    開催年月:
    2017年09月
    -
     
  • Generative Models Producing Power Laws of Language

    田中久美子  [招待有り]

    Statistics of Languages: Theories and Experiments. Wawsaw.  

    発表年月: 2017年07月

    開催年月:
    2017年07月
     
     
  • 言語ゲームの原初形式を掴みうるか: 機械を道具として

    田中久美子  [招待有り]

    これからのウィトゲンシュタインシンポジウム  

    発表年月: 2016年12月

    開催年月:
    2016年12月
     
     
  • Computational Constancy Measures of Texts

    田中久美子  [招待有り]

    Language Modeling at IPIAN, Poland (hosted by Dr. Lukasz Debowski)  

    発表年月: 2015年01月

    開催年月:
    2015年01月
    -
     
  • 記号と再帰-記号論と情報科学-

    田中久美子  [招待有り]

    ソフトウエア工学の基礎研究会(FOSE)  

    発表年月: 2013年11月

    開催年月:
    2013年11月
    -
     
  • User Interface Design for International Communication

    田中久美子  [招待有り]

    International Collaboration Symposium  

    発表年月: 2013年11月

    開催年月:
    2013年11月
    -
     
  • Semiotics of Void

    田中久美子  [招待有り]

    HCII  

    発表年月: 2013年07月

    開催年月:
    2013年07月
     
     
  • Semiotics of Programming

    田中久美子  [招待有り]

    Semiotics in Information Science and Mathematics, University of Toronto, (hosted by Prof. Marcel Danesi)  

    発表年月: 2011年03月

    開催年月:
    2011年03月
     
     
  • Two Language Learning Applications Using Search Engines

    田中久美子  [招待有り]

    Invited Talk at Google  

    発表年月: 2010年09月

    開催年月:
    2010年09月
    -
     
  • 言語処理を用いた語学教育支援|二つの観点からの取り組み|

    田中久美子

    『言語処理技術の深化と理論・応用 の新展開』2009 年度科研・合同シンポジウム  

    発表年月: 2009年10月

    開催年月:
    2009年10月
    -
     
  • 記号とは何か?

    田中久美子  [招待有り]

    言語処理学会若手の会  

    発表年月: 2009年09月

    開催年月:
    2009年09月
    -
     
  • Predictive Entry Systems using Statistical Language Models

    田中久美子  [招待有り]

    Japan- America Frontiers Engineering Symposium, funded by JST and PNAS  

    発表年月: 2008年11月

    開催年月:
    2008年11月
    -
     
  • A Multilingual Usage Consultation Tool based on Internet Searching

    田中久美子  [招待有り]

    Charles University Prague, Czech Republic (Hosted by Prof. Vladislav Kubon)  

    発表年月: 2006年03月

    開催年月:
    2006年03月
    -
     
  • Usage Consultation Tool based on Web Search Engine

    田中久美子

    Yahoo Japan, (in Japanese Hosted by Researcher F. Kido)  

    発表年月: 2005年12月

    開催年月:
    2005年12月
    -
     
  • Mathematical Models behind Natural Language Entry Systems

    田中久美子

    Keio University (in Japanese, Hosted by Prof. S. Ishizaki)  

    発表年月: 2005年11月

    開催年月:
    2005年11月
    -
     
  • Information Bias in Text

    田中久美子

    Schloss Dagstuhl, International Conference and Research Center for Computer Science, Germany (Hosted by Dr. K. Harbusch)  

    発表年月: 2005年09月

    開催年月:
    2005年09月
    -
     
  • E-learning System for Foreign Language Learning

    田中久美子

    University of Tokyo Symposium on E-learning (reported by Mainichi Newspaper)  

    発表年月: 2005年07月

    開催年月:
    2005年07月
    -
     
  • Predictive Text Entry System for Small Mobile Devices using Adaptive Language Models

    田中久美子

    University of Nantes, France (Hosted by Dr. B.Daille)  

    発表年月: 2005年03月

    開催年月:
    2005年03月
    -
     
  • Predictive Text Entry System for Small Mobile Devices using Adaptive Language Models

    田中久美子

    University of Linchoping, Sweden (Hosted by Dr. K. McGee)  

    発表年月: 2005年03月

    開催年月:
    2005年03月
    -
     
  • Language Modeling for Natural Language Entry Systems

    田中久美子

    IRISA/University of Renne, France (Hosted by Dr. A. Morin)  

    発表年月: 2004年09月

    開催年月:
    2004年09月
    -
     
  • Text Entry and Language Models

    田中久美子

    University of Montreal, France (Hosted by Prof. V. Prince)  

    発表年月: 2003年09月

    開催年月:
    2003年09月
    -
     
  • Language Modeling for Text Entry Systems

    田中久美子

    University of Nancy, France (Hosted by Prof. K. Smaili)  

    発表年月: 2003年03月

    開催年月:
    2003年03月
    -
     
  • Entering Text with A Four-Button Device

    田中久美子

    University of Koblenz-Landau, Germany (Hosted by Prof. K. Harbusch)  

    発表年月: 2003年03月

    開催年月:
    2003年03月
    -
     
  • 統計的自然言語

    田中久美子  [招待有り]

    神奈川県理数教育セミナー2002  

    発表年月: 2002年12月

    開催年月:
    2002年12月
    -
     
  • Entering Text with A Four-Button Device

    田中久美子

    IBM Watson Research Center, USA (Hosted by Dr. J. Chai)  

    発表年月: 2002年11月

    開催年月:
    2002年11月
    -
     
  • Entering Text with A Four Button Device

    田中久美子

    LORIA, France (Hosted by Prof. K. Smaili)  

    発表年月: 2001年10月

    開催年月:
    2001年10月
    -
     
  • Real-Time Discourse Generation

    田中久美子

    AT&T Bell Labs (Hosted by Dr. M. Nagata)  

    発表年月: 2001年03月

    開催年月:
    2001年03月
    -
     
  • Automatic Commentary System for Robocup Soccer Simulation League

    田中久美子

    Nagoya, Symposium on Multi-media Software Systems  

    発表年月: 1999年12月

    開催年月:
    1999年12月
    -
     
  • Automatic Commentary System for Robocup Soccer System

    田中久美子  [招待有り]

    RoboCup Workshop (with Prof. Hitoshi Matsubara, Future University of Hakodate)  

    発表年月: 1998年07月

    開催年月:
    1998年07月
    -
     

▼全件表示

共同研究・競争的資金等の研究課題

  • 価格と文書に基づく経済対象のベクトル表現とその応用

    日本学術振興会  科学研究費助成事業 基盤研究(B)

    研究期間:

    2021年04月
    -
    2026年03月
     

    田中(石井)久美子, 新谷元嗣, 宮尾祐介

  • 自然言語の非線形性の計算論モデル

    国立研究開発法人科学技術振興機構  戦略的創造研究推進事業(CREST)「数学・数理科学と情報科学の連携・融合による情報活用基盤の創出と社会課題解決に向けた展開」領域

    研究期間:

    2021年
    -
    2026年03月
     

    田中(石井)久美子,宮尾祐介,峯島宏次

  • 冪則の観点からの高度技術の評価方法に関する研究

    日本学術振興会  科学研究費助成事業 挑戦的研究(開拓)

    研究期間:

    2020年07月
    -
    2025年03月
     

    田中(石井)久美子, チン ユ

  • 東京証券取引市場株式のポートフォリオ最適化技術の検証, PoC 構築, 事業化の 検討, ならびに社会実装

    東京大学  東京大学Gapファンドプログラム

    研究期間:

    2020年04月
    -
    2021年09月
     

    田中(石井)久美子

  • 冪則からみる実社会の共進化研究 -AIは非平衡な複雑系を擬態しうるか-

    独立行政法人科学技術振興機構  社会技術研究開発/人と情報のエコシステム

    研究期間:

    2017年10月
    -
    2021年03月
     

    田中(石井)久美子, チン ユ, 七丈 直弘

  • 言語の計測可能な不変量の探求

    独立行政法人科学技術振興機構  戦略的創造研究推進事業(さきがけ)「社会的課題の解決に向けた数学と諸分野の協働」領域

    研究期間:

    2014年
    -
    2017年
     

    田中(石井)久美子

  • 教師なし手法に基づく多言語形態素解析に関する研究

    日本学術振興会  科学研究費助成事業 挑戦的萌芽研究

    研究期間:

    2012年04月
    -
    2016年03月
     

    田中(石井) 久美子

     概要を見る

    与えられた文書に対して、目的に応じて文書内の単語単位を同定し、その範疇を定める処理は言語処理の要素技術である。たとえば、形態素解析の他、文書内の異言語部分を同定する処理などがある。本研究では、境界・範疇を同定する教師無し手法を考案する。三つの成果が得られた。第一に、文書内に埋め込まれた異言語部分を圧縮を用いて判定する方法を考案し、実用レベルにあることを示した。第二に、編集距離をBayes手法により拡張し、同じ意味を表す部分に対訳corpusを切り分ける方法を工夫した。第三に、最小オートマトンを用いて文のパターンを解析する手法を考案し、単位の切れ目と範疇を同定するための大規模な検証を行った。

  • WEB文書の動的な読解支援システムに関する研究

    日本学術振興会  科学研究費助成事業 基盤研究(A)

    研究期間:

    2008年04月
    -
    2014年03月
     

    田中(石井) 久美子

     概要を見る

    インターネット文書の読解支援を動的に行うためのユーザインターフェース技術ならびに自然言語処理上の研究を行った。特に、ユーザがweb文書をブラウザで閲覧している際に、文書部分に関してアクションをとると、関連する情報を取得してユーザに動的に提示するweb mash up技術を中心に研究を進めた。内容は、web mash upをブラウザと連携して行うクライアントと、関連情報を抽出するサーバの研究に分かれる。クライアントについては特許を取得し産学連携上の成果につながり、プロトタイプを共に構築した学生が起業しその会社が育った。また、サーバに関しては関連情報を抽出する手法に関して種々の研究成果が挙がった。

  • 文書の自動難易度判定に関する研究

    日本学術振興会  科学研究費助成事業 挑戦的萌芽研究

    研究期間:

    2008年
    -
    2010年
     

    田中(石井) 久美子

     概要を見る

    本研究では、機械学習に基づく文書難易度判定の新しい手法を提案し、ある文書をユーザが与えると、その文書と難易度的に類似する文書を主要新聞記事サイトから獲得し、ユーザに提示するweb上のシステムを作ることを目的とした。既存研究としては、分類、あるいは回帰によるモデル化が行われてきたが、これでは、学習に必要な正解データを多言語で十分に確保することは難しい。本研究では、文書集合が与えられたときに、その集合に順序構造を導入することで難易度判定を行うことを提案した。
    検証は英日両方で行い、実際のシステムは英語、日本語で稼働させ、さらに中国語やスペイン語での構築を試みた。アイデアの根本部分については、有効性が十分検証され、言語処理分野の世界的な最高峰の英文論文誌Computational Linguisticsの論文として、採録となり、分野においてこれ以上の学術的な成果はないと考える。
    最終年度は、アイデアに関わる付随問題の検討に費やされた。まず、提案手法をより広い視野としての機械学習手法、語学学習の中で位置付け、この点を上記論文に加筆し、論文は6月に出版された。また、素性に相対頻度以外の統計量を追加し、アイデアの検証を行った。その背景には、本研究のための基礎研究があり、それらはいずれも雑誌論文として最終年度に出版するに至ったものである。第一は、莫大量のデータで計測された単語頻度が単語の難易度とどの程度相関するかを検証した。第二に、文書の複雑さを表す指標について研究を行った。これら二種類の指標と、文法的特性に関する指標などを追加して根幹アイデアを再検証し、実際に精度が向上することが示された。
    プロトタイプシステムは、実用に向けての再実装を行ったが、公開するには至っていない。というのも、検索対象として想定していたのは新聞で日々クロールされ集められるが、その難易度は均質にすぎ、検索対象としてのデータとして十分に難易度が異なるものではなかったのである。つまり、検索の対象とするデータが十分に得られないという予想外の問題が起きたため、システムは公開には至らなかった。この点は、たとえばユーザが文書を提供し合うなどソーシャルな枠組みなどを新たに考案する必要があるであろう。
    本研究は最初の2年間で最も重要な研究部分を終え、三年目は実用化のための機器類以外にはさほど費用を必要としなかった。このため、最終年度は残余分を返却するが、研究成果としては十二分に挙がったと自負している。
    最後に、3年間ご支援いただいた、本科研に関わる審査員や事務の皆様に、心より感謝申し上げます。

  • Webを用いた語学教育システムにおける文書評価方法に関する研究

    日本学術振興会  科学研究費助成事業 若手研究(A)

    研究期間:

    2005年
    -
    2007年
     

    田中(石井) 久美子

     概要を見る

    本科研の当初の目的は、学内の語学学習のために構築途中にあったレポートシステム「天神」を完成させ、学生の学習や作文を支援する言語処理ルーチンを研究することにあった。本課題申請時には、代表者は情報基盤センターに所属しており、学内における教育を支援するソフトウエアを構築・運用することが任務の-つであった。ところが、平成17年度から所属が情報理工学系研究科に異動となり、学内任務が変更となった。学内の大規模サービスを運用するためのインフラ基盤を失い、語学担当教員の協力が必ずしも得られなくなった。「天神」ソフトウエア自体は、予定通り2005年度中に完成させたが、現在では学内の利用者が減り、2008年度夏学期をもって学内のサービスを終了予定である。
    以上のような事情をふまえ、語学学習に関する類似の別研究を行い、以下の成果を上げた。
    ○動的な用例辞書「端言」システムは、語学を学習するユーザが外国語で作文をする際に、語用の正確さを吟味する上で有用な用例を、動的にwebから獲得するシステムである。web関連ソフトウエアの国際会議最高峰WWWにおいて2005年にBest Presentation Awardを受賞した他、英文ジャーナルlnformation Retrievalに2007年に論文が掲載された。本システムは科研費にて導入したサーバ上で稼働中である。
    ○非漢字圏外国人のための漢字検索システム「漢輔」は、外国人が漢字について何ら予備知識がなくとも漢字を検索することができるシステムである。言語処理学会大会優秀発表賞を受賞した他、ユーザインターフェースにおける英文ジャーナルTOCHIに論文が2008年に採録となった。本システムは科研費にて導入したサーバ上で稼働中である。
    ○課題最終年度の3月に、言語処理学会大会付帯のワークショップとして「教育・学習を支援する言語処理ワークショップ」を主催し、分野のリーダーシップをとった。これを受け、現在、国内学術論文誌「自然言語処理」において「教育・学習」関連の特集号を企画しており、鋭意活動中である。
    最後に、本研究課題の審査・採録・遂行に関わったみなさまに感謝の意を表します。

  • 分かり易さ向上のためのテキストコンテンツ変換に関する研究

    日本学術振興会  科学研究費助成事業 特定領域研究

    研究期間:

    2004年
    -
    2005年
     

    中川 裕志, 黒橋 禎夫, 田中(石井)久美子, 吉田 稔, 清田 陽司

     概要を見る

    本年度の研究では,特定領域研究初年度から続けて収集しているWeb新聞記事と携帯端末向け新聞記事の対応付けコーパスを対象にし,携帯端末向け新聞記事で頻繁に使われる短縮された簡潔な表現をWeb新聞記事から生成するための言い換えパターンの抽出の研究を進展させた.
    Step:1 携帯文の文末表現(2形態素以内で意味のとれる表現)の候補集合の作成
    Step:2 Step1の候補集合の表現を文末に含む携帯文とそれに対応するWeb文集合を抽出
    Step:3 Step2で作成した各Web文集合において,形態素解析した結果を文末からの形態素列マッチングによって、言い換えパターンを抽出した。
    Step:4 Step3の結果を形態素列sのスコア:W(s)として次の式を用いた.
    W(s)=BackBranch(s)×頻度(s)×log(長さ(s)-1)
    BackBranch(s)はsの直ぐ左に接続する形態素の種類数,長さ(s)はsを構成する形態素数である.
    この結果、上位200位程度の順位までの表現に対する言い換えでスコアW(s)が第1位のものは,70%程度の正解率、上位3位までの言い換えでは50%強の正解率の平均である.昨年の結果では,サ変名詞の上位10位までの言い換えは90%に近い正解率であり,100位までみると80%強の正解率であった.また,700位程度までは50%の正解率であるが,それ以降,正解率は漸減する.この結果,我々が使用した3年間にわたって収集した88333文対のデータで機械的に取り出せ,スクリーニングにかかる人手が小さい言い換え候補は,大雑把に言って1000種類程度の文末表現に対応するものと考えられる.
    なお、これ以外にもカタカナ異表記の自動抽出、Webからの用例検索システム、図書抄録の縮約方式、XML文書への情報ハイディングなどの研究を行い、成果を得た。

  • 分かり易さ向上のためのテキストコンテンツ変換に関する研究

    日本学術振興会  科学研究費助成事業 特定領域研究

    研究期間:

    2003年
     
     
     

    中川 裕志, 吉田 稔, 田中(石井)久美子, 黒橋 禎夫

     概要を見る

    この研究では,Web新聞記事と携帯端末向け新聞記事の対応付けコーパスを対象に次の研究を行った。
    (1)まず携帯記事の文とWeb記事の記事対応付けを行い、サンプル調査では100%の精度で対応付けできる方法を用いて記事対応をつけた。次に携帯記事とWeb記事における文同士の対応を、出現する名詞の一致度に着目する方法で行い、93%の精度で対応付けることに成功した。この結果、88,333組の文対応コーパスを抽出した。
    (2)上記のコーパスを用いて帯端末向け新聞記事で頻繁に使われる短縮された簡潔な表現をWeb新聞記事から生成するための言い換えパターンの抽出を行った。本年度は特に携帯記事の文末での出現頻度が38%の割合であるサ変名詞で終了する名詞止めがWeb記事においてどのような表現であるかを抽出する言い換え抽出を行った。サンプルデータでは抽出された言い換えのうち最も順位の高いもので90%、3位までの言い換えで60%の精度で抽出できることが分かった。この言い換えデータは記事に要約や縮約を自動化するための言語資源として使える。
    (3)昨年度から続けているWeb記事の自動要約を引き続き行った。本年度はWeb記事と携帯記事の対応コーパスを教師データとしてSVMを用いた学習によって削除する部分を決める方法を実験した。この結果、いくつかの分野で精度の向上が見られた。
    (4)Web上のデータを利用する以下の多言語用例検索ツール:Kiwiシステムについて引き続き改善、評価実験を行った。日英仏の3言語でこのシステムを使って用例検索する方法と検索エンジンを使う方法を比較し、正解率で30%程度の上昇が見られることが分かった。

  • 少数キーによるテキスト入力手法の開発と評価に関する研究

    日本学術振興会  科学研究費助成事業 萌芽研究

    研究期間:

    2002年
    -
    2003年
     

    武市 正人, 田中(石井)久美子

     概要を見る

    本研究の目的は、効果的な少数キーによるテキスト入力の新たな方式を提案し、その有効性を評価することである。この方式は、積極的に「曖昧さ」を導入することによってキーの個数を削減することと、その曖昧さを解消するために利用者ごとに語彙辞書を個別化することを効果的に組み合わせるという発想に基づくものである。本研究期間を通じて、日本語テキスト入力のための10個のキー入力システム(Touch-Me-Key 10)、日本語テキスト入力のための4個のキー入力システム(Touch-Me-Key 4)、非英語、非漢字の言語(タイ語等)に対するテキスト入力システム、数個(4個程度)のキーに相当する入力システムのプロトタイプの作成と評価した。とくに、平成15年度には、前年度より進めていた少数キーによる入力方式の活用に有効なテキスト入力方式を追究し、従来の方式の入力辞書を用いるものではない構成法として、いわゆる「辞書なし」のSancDic方式を提案した。本方式は、これまでの「辞書」による入力単語の同定を行なわないので、新規単語や口語体にも適用できるという特徴を有している。少数キー入力における「辞書なし」入力の有効性を確認し、これらの成果を国際会議ACL2003で発表するとともに、論文誌にも公表した。

  • モバイル環境における理解容易なテキスト生成のための自然言語処理に関する研究

    日本学術振興会  科学研究費助成事業 特定領域研究

    研究期間:

    2002年
     
     
     

    中川 裕志, 田中(石井)久美子, 黒橋 禎夫

     概要を見る

    モバイル環境においてユーザインタフェースの主要な役割を果たす携帯端末におけるテキスト情報の扱いについて研究を続けている.昨年からWebにおいて通常のパソコンをターゲットにしている新聞記事と,iモード端末をターゲットにしている新聞記事を2年間に渡って収集した。こうして収集した2種の新聞記事コーパスを同一のトピックを扱うものを自動的に対応付けしたた対応付けコーパスを利用して,自動要約の研究を進めた.目的はパソコン向けの長い記事からiモードのような携帯端末向けのコンパクトな記事を自動要約によって生成する方法である(代表者:中川が担当).まず,1日のあるジャンル(政治、経済など)の記事集合に対して、各単語のtf^*idfを計算する.一方、記事の先頭3文を掛かり受け解析し、枝の先の単語をtf^*idfの小さなものから削る。100文字要約で原文の70%,50文字要約で原文の50%程度の情報を保持することが対応コーパスを用いた評価実験で示された.また,要約のような短い記事を携帯端末において音声出力するシステムについても基礎的な検討(代表者:中川,分担者:黒橋が担当)を始め、主観評価実験の結果、iモード記事そのものよりは、Web記事中から対応する文を選択しする方法が良いとこが分かった.これに加え,ユーザインタフェースの一環として携帯端末によるユーザに優しい入力方式の研究も行った(分担者:田中が担当).

  • 大規模災害救助の状況を対象としたリアルタイム実況自動生成の研究

    日本学術振興会  科学研究費助成事業 基盤研究(B)

    研究期間:

    2001年
    -
    2002年
     

    松原 仁, 大沢 英一, 田中(石井)久美子, 田所 諭, 田中 莞爾, IAN Frank

     概要を見る

    大規模災害時には時々刻々と変化する状況の中で情報を得て瞬時に適切な判断を行なうことが求められるが、必要な情報が入手できずに困ることがある一方で、はいってくる不確実で膨大な情報から適切なものを選択することができずに困ることも多い。また、被災者、救助者、指揮者、ボランティアなど立場によって必要な情報が異なる。音声によってリアルタイムに相手の立場に応じた適切な実況を行なうことができれば、音声言語によって被災者を適切に誘導したり、救助者に適切な指示を与えることが可能になる。本研究では、大規模災害救助の研究プロジェクトであるロボカップ・レスキューで開発中のシミュレータを対象として、そのシミュレータ上でリアルタイムで実況を生成する技術の確立を目指した。2年目の最終年度として、(1)大規模災害救助という緊急性を要する対象のリアルタイム推論、(2)立場、能力、有する情報などが異なるエージェントそれぞれに適切に情報を提供するためのマルチエージェント化、(3)災害救助時における情報の管理(不確実で膨大な情報から必要なものだけを取捨選択する手法の確立)、(4)リアルタイム実況生成、という本研究の基本的な要素技術を確立した。本研究を進める上で問題となった、(1)情報が不均質であること、(2)情報を伝達する相手が多様であること、(3)相手に適切な行動を促すための実況であること、(4)より緊急性が高いこと、をシステムの中でいかに解決するかに対する具体的な解を得た。これらの研究結果に基づいて各モジュールを連結したRescue-MIKEというシステムを作成し,デモを重ねることによって作成したシステムの有効性を確認した.

  • 音韻のゆらぎの解析に基づく表現豊かな音声合成に関する研究

    日本学術振興会  科学研究費助成事業 若手研究(B)

    研究期間:

    2001年
    -
    2002年
     

    田中(石井) 久美子

     概要を見る

    今年度は、去年度解析した間と韻律の規則を用いて、実際に音声合成を行った。内容はサッカーの自動実況であり、結果として自由な文章の生成には程遠いものにとどまっている。しかし、韻律に変化を与えた方が、より状況を豊かに表現することができ、観客に与える印象も異なることがわかった。
    具体的には、まずはサッカーの実況のためのデータを用意する。これはテンプレートによる生成と、文法による生成の中間的な方式によるもので、組み合わせにより多くの内容を生成することができる。テンプレートには、強勢の可能性のあるところにマークを付けておく。その上でサッカーの状況に合わせてこのマークを用いて、間と韻律を制御する。
    本研究の結果、1997年から行っているサッカーの実況に関して、表現豊かな合成ができるようになった。かつては、常に同じ合成を用いており、ボールが中央にある状況とゴール時の実況はまったく同じであった。したがって観客の実況システムへの関心には限界があった。ところが、本成果を用いると、ゴールが入った瞬間などは韻律が上がり、間も変化する。これにより、観客も実況と共に感情を状況に移入することができるようになった。本システムのように読み上げの韻律や間を多少制御するだけで、大きく実況の印象が異なる。一方で、たとえば、40対0の状況下に、さらに1点得点した場合でも、同じように表現豊かに実況してしまう。このような「機械的な表現の豊かさ」は避けなければならない。結局、表現の豊かさは意味と深く関係しており、表層的な処理には限界がある。また、音声合成上は、現状では強勢の制御を行っていないため、英語での生成などには問題がある。また、現状では、サッカーの実況および物語以外の内容に用いるには限界がある。今後はこれまでの成果をベースにこれらの点をさらに改良していきたい。

  • モバイル環境向けコンテンツ開発のための自然言語処理に関する研究

    日本学術振興会  科学研究費助成事業 特定領域研究(C)

    研究期間:

    2001年
     
     
     

    中川 裕志, 渡部 聡彦, 田中(石井)久美子, 黒橋 禎夫

     概要を見る

    携帯端末の多様化、進化を受けて、携帯端末向けのコンテンツ開発のために既存のテキストコンテンツを自然言語処理によって変換する。特に高圧縮率の自動要約に加え言い換えを加味した処理を行う。具体例としては、名詞句(固有名詞など)の言い換え、構文的言い換え、とりわけ体言止め、助詞止めなどが重要になる。このような処理を実現するためには、要約元の文書と要約ないし言い換え結果を集めたコーパスが必要になる。そのために以下に述べる言語資源の収集をした。
    (1)収集:インターネットでPCを想定した新聞記事(1日200記事以上)と、i-モード端末を対象にした新聞記事(1日40記事程度)が毎日発信されている。ただし、i-モード記事は1日で消えてしまう。そこで、これを4月以来、毎日収集した。
    (2)対応付け 収集した記事群で1日単位にPC向け記事とi-モード記事の対応付けを行う。この対応付けを行うと、PC記事の言い換え、要約の言語データとしてi-モード記事を対応させる対応付けコーパスができる。i-モード記事中の名詞とPC向け記事中の名詞を調べ、3x(PC記事見出しとi-モード記事の名詞一致数)+(PC記事本文とi-モード記の名詞一致数)の値が35以上の場合を対応が付いたとすることにより、現在までの実験で80%近いi-モード記事を100%の精度で対応付けができた。そこで、この方法で1年分の対応付けコーパスを完成した。
    このように収集した対応付けコーパスを利用して形態素解析、構文解析を利用する小規模な要約実験を行い良好な結果を得た。

  • テキストコーパスからの専門用語抽出に関する研究

    日本学術振興会  科学研究費助成事業 基盤研究(C)

    研究期間:

    2000年
    -
    2001年
     

    中川 裕志, 田中(石井)久美子

     概要を見る

    本年度は、NTCIR1のTMRECタスクで配布された用語抽出テストコレクションを利用して専門分野コーパスからの専門用語抽出の研究に取り組んだ。過去に行われた用語抽出方法は、多くの場合、用語のテキスト集合での出現頻度を利用するものであった。この研究では、むしろ今まで注意が払われてこなかった語彙空間における用語の性質を考慮する方法を検討した。提案した用語抽出方法は、専門用語の85%を占める複合語と、その構成要素である単名詞の関係を統計的に処理するものである。例えば、「人間情報システム」「社会情報システム」など「情報」という単名詞の左右に多様な名詞が付着して複合語である専門用語が構成されるとき、「情報」という単名詞の専門用語としての重要性は、その左方、および右方に付着する名詞の種類数によって定義した。さらにこうして得た個々の単名詞の重要度を幾何平均することによって、複合名詞の重要度を定義した。具体的な用語抽出システムとしては、(1)日本語コーパスを形態素解析、(2)複合語すなわち名詞連続を用語候補として抽出、(3)上記の重要度を各候補に対して計算、(4)TRMRCテストコレクションによる精度の評価、を行った。この結果、提案した用語抽出システムは、NTCIR1の参加チームに比べて上位の精度を出すことが確認された。また、この用語抽出方法を利用した日英対訳表現の抽出へむけて、用語抽出システムの英語適応化も行い、その動作を確認した。

▼全件表示

Misc

  • 言語はファイナンス工学にどのように寄与し得るか—大規模言語モデル ChatGPT とそれを支える AI 技術の盲点—

    田中久美子

    証券アナリストジャーナル   61 ( 11 ) 73 - 82  2023年11月  [招待有り]

    担当区分:筆頭著者

    記事・総説・解説・論説等(大学・研究所紀要)  

  • 言語と計算

    田中久美子, 峯島宏次

    現代思想7月号 特集:〈計算〉の世界   2023 ( 7 ) 140 - 151  2023年06月  [招待有り]

    担当区分:筆頭著者

    記事・総説・解説・論説等(学術雑誌)  

  • 言語の長相関と文構造

    田中久美子

    数学セミナー8月号   60 ( 718 ) 32 - 36  2021年07月

    記事・総説・解説・論説等(学術雑誌)  

  • 言語の数理研究への誘い

    田中久美子

    数学セミナー3月号   59 ( 701 ) 8 - 12  2020年02月

    記事・総説・解説・論説等(学術雑誌)  

  • ガードナーとスマリヤン

    田中久美子

    数学セミナー11月号   58 ( 697 )  2019年10月

  • 数は使用か

    田中久美子

    数学セミナー5月号   58 ( 690 )  2019年04月

  • 言語のエントロピーレート

    田中久美子

    数学セミナー10月号   57 ( 683 ) 77 - 81  2018年09月

  • 言語に内在するゆらぎ

    田中久美子

    数学セミナー9月号   57 ( 682 ) 72 - 77  2018年08月

  • 言語の経験則

    田中久美子

    数学セミナー8月号   57 ( 681 ) 68 - 73  2018年07月

  • 数理工学への誘い 携帯電話に日本語を入力するには--自然言語の数理

    田中 久美子

    数学セミナ-   40 ( 10 ) 57 - 61  2001年10月

    CiNii

▼全件表示

産業財産権

  • 情報処理装置、その制御方法、プログラム、ならびに、学習済モデル

    特許PCT/JP2021/003815

    杜キン, 石井久美子

    権利者: 東京大学

    特許権

  • 抽出装置、抽出方法、ならびに、プログラム

    石井久美子, 平野大貴

    特許権

  • ウェブ文書を表示する端末装置が実行するプログラム,

    特許第5360842号

    石井久美子

    権利者: 東京大学

    特許権

  • 検索システム

    特許第6144133 号

    石井久美子, 長尾真, 粟飯原俊介

    権利者: 九州大学

    特許権

  • 発話の評価方法及び装置、発話を評価するためのコンピュータプログラム

    東京大学知的財産部管理番号23B12Z002-1

    Daniel Heffernan, 石井久美子

    権利者: 東京大学

    特許権

  • 確認システム、情報提供システム、ならびに、プログラム

    特許第4877831号

    石井久美子

    権利者: 東京大学

    特許権

  • 文字入力装置、文字入力方法、ならびに、プログラム

    特許第4706021号

    石井久美子

    権利者: 東京大学

    特許権

  • 漢字仮名交じり入力装置、漢字仮名交じり入力方法、ならびに、情報記憶媒体

    特許第4423369 号

    石井久美子

    権利者: 東京大学

    特許権

  • 文字列入力装置、ならびに、プログラム

    特許第4096093 号

    武市正人, 石井久美子

    権利者: 東京大学

    特許権

  • Check System, Information Providing System, and Computer-Readable Information Recording Medium Containing a Program

    特許第4877831 号

    Kumiko ISHII

    権利者: 東京大学

    特許権

  • 単語列入力装置、単語列入力方法、ならびに、プログラム

    特許特許第3777477 号

    石井久美子, 武市正人

    権利者: 東京大学

    特許権

  • 文字列入力装置、ならびに、プログラム

    石井久美子, イアン・フランク

    特許権

  • 抽出装置、用例検索装置、ならびに、プログラム

    中川裕志, 石井久美子

    特許権

  • ユーザ辞書生成登録システム、辞書サーバー、端末、ユーザー辞書生成方法、ユーザ辞書 登録方法、ならびに、情報記録媒体

    武市正人, 石井久美子

    特許権

▼全件表示

 

現在担当している科目

▼全件表示

担当経験のある科目(授業)

  • アルゴリズムA

    早稲田大学  

    2023年04月
    -
    継続中
     

  • プログラミングA

    早稲田大学  

    2023年04月
    -
    継続中
     

  • 人工知能B

    早稲田大学  

    2023年04月
    -
    継続中
     

  • 数理言語情報論

    早稲田大学  

    2023年04月
    -
    継続中
     

  • 東京大学計数工学科数理情報工学特論I

    東京大学  

    2020年
    -
    2022年
     

  • 東京大学学際情報学府数理言語学概論

    東京大学  

    2017年
    -
    2022年
     

  • 東京大学情報理工学系研究科数理言語情報論

    東京大学  

    2016年
    -
    2022年
     

  • 東京大学先端学際工学特別講義

    東京大学  

    2016年
    -
     
     

  • 九州大学工学部電気工学科人工知能

    九州大学  

    2015年
    -
    2016年
     

  • 九州大学大学院システム情報科学研究院機械学習概論

    九州大学  

    2014年
    -
    2016年
     

  • 九州大学工学部電気工学科技術表現法

    九州大学  

    2014年
    -
    2016年
     

  • 東京大学大学院情報理工学系研究科計算言語学

    東京大学  

    2009年
    -
    2011年
     

  • 東京大学大学院学際情報学府数理言語学概論

    東京大学  

    2004年
    -
    2011年
     

  • 東京大学計数工学科数理情報工学演習第一C(プログラミング演習)

    東京大学  

    2003年
    -
    2011年
     

  • 東京大学大学院情報理工学系研究科ロバストソフトウェア論

    東京大学  

    2005年
    -
    2008年
     

  • 東京大学大学院学際情報学府情報数理概論

    東京大学  

    2000年
    -
    2003年
     

  • 東京大学計数工学科数理情報工学演習第一A(プログラミング演習)

    東京大学  

    2000年
    -
    2003年
     

  • 東京大学計数工学科 数理情報工学特論第一

    東京大学  

    2001年
    -
     
     

▼全件表示

 

他学部・他研究科等兼任情報

  • 理工学術院   大学院基幹理工学研究科

学内研究所・附属機関兼任歴

  • 2023年
    -
    2024年

    理工学術院総合研究所   兼任研究員

  • 2023年
    -
    2024年

    国際情報通信研究センター   兼任研究員

特定課題制度(学内資金)

  • 自然言語の数理モデルとその応用研究

    2023年   杜 鑫

     概要を見る

    &nbsp; 本研究では、深層学習に基づく機械学習を利用し、1. 自然言語の特性を数理モデルとして記述し、2. その特性を満たす機械学習技術を研究している。それらの成果を3. 言語情報を利用した数理ファイナンスに応用している。 応募者は本年度に早稲田大学の基幹理工学部情報理工学科に着任し、研究室の立ち上げを行った。研究室における研究では、GPUサーバを利用する必要がある。本費用を学外のGPUサーバの使用費として活用した。具体的には、深層学習を利用する、新しい検索エンジンの基礎特性を探究し、方式の改良を研究するために用い、研究室メンバーが利用した。得られた成果はトップ会議に投稿中である。 また、研究室ではさまざまな言語資源を利用しているが、その契約費用として活用した。