2022/08/07 更新

写真a

シライ カツヒコ
白井 克彦
所属
理工学術院
職名
名誉教授

学歴

  •  
    -
    1968年

    早稲田大学   工学研究科   電気工学  

  •  
    -
    1968年

    早稲田大学  

  •  
    -
    1963年

    早稲田大学   工学部   電気工学  

  •  
    -
    1963年

    早稲田大学  

学位

  • 早稲田大学   博士(工学)

  • 早稲田大学   工学博士

経歴

  • 1975年
    -
    継続中

    早稲田大学 教授

  • 1975年
    -
     

    - Waseda University, Professor

  • 1970年
    -
    1975年

    早稲田大学 助教授

  • 1970年
    -
    1975年

    早稲田大学

  • 1968年
    -
    1970年

    早稲田大学 専任講師

  • 1968年
    -
    1970年

    早稲田大学

▼全件表示

所属学協会

  •  
     
     

    情報処理学会

  •  
     
     

    日本音声言語医学会

  •  
     
     

    IEEE

  •  
     
     

    日本音響学会

  •  
     
     

    言語処理学会

  •  
     
     

    計測自動制御学会

  •  
     
     

    電気学会

  •  
     
     

    電子情報通信学会

  •  
     
     

    日本ロボット学会

  •  
     
     

    人工知能学会

▼全件表示

 

研究分野

  • 知能情報学

Misc

  • Instantaneous Phase Analysis Using Artificial Neural Networks forAutomatic Speech Recognition

    Yotaro Kubo, Shigeki Okawa, Akira Kurematsu, Katsuhiko Shirai

    Proc. NCSP'07   Shanghai,China   321 - 324  2007年

  • Automatic music selection method adapted to the user's preference,

    Kentaro Hikosaka, Toru Taniguchi, Yotaro Kubo, Masaaki Honda, Katsuhiko Shirai

    Proc. NCSP'07   Shanghai,China   477 - 480  2007年

  • 放送配信に向けたオーディオ符号化方式AACのビット配分による品質改善

    久保, 誉田, 白井, 小森, 清山, 都木

    日本音響学会 2007年春期全国大会 講演論文集   3--P--13   623 - 624  2007年

  • 長時間瞬時位相分析を用いた話し言葉音声認識

    久保, 大川, 榑松, 白井

    日本音響学会 2007年春期全国大会 講演論文集   3--10--9   121 - 122  2007年

  • 人物の姿勢推定を目的とした距離画像と3次元モデルとのフィッティング

    結城章昌, 村上真, 白井克彦

    Proc.of the 2007 IEICE General Conference   D-12-70   (CD-ROM)  2007年

  • ロボットを用いたインタビュー形式の対話における非言語情報の分析

    原田奈津樹, 村上真, 白井克彦

    Proc.of the 2007 IEICE General Conference   D-5-16   (CD-ROM)  2007年

  • 狭帯域解析信号と非線形識別を用いた音声認識

    久保, 大川, 榑松, 白井

    電子情報通信学会,信学技法   SP2007--22   85 - 90  2007年

  • 子供を対象とする音声対話インタフェースの検討

    田畠大嗣, 榑松明, 白井克彦

    FIT2007 第6回情報科学技術フォーラム   J-040   479 - 480  2007年

  • 適応的処理を用いた音声認識利用による楽曲検索システムの設計

    大山博延, 榑松明, 白井克彦

    FIT2007 第6回情報科学技術フォーラム   E-072   323 - 324  2007年

  • ロボットから人に話しかけるための話しかけ判断モデルの構築

    牛山聡, 松井和教, 村上真, 白井克彦

    FIT2007 第6回情報科学技術フォーラム   J-049   503 - 504  2007年

  • A Study on Temporal Features Derived by Analytic Signal

    Y. Kubo, S. Okawa, A. Kurematsu, K. Shirai

    Proc. of Interspeech 2007   Antwerpen   1130 - 1133  2007年

  • AMとFMの長時間分析に基づく音声認識

    久保, 大川, 榑松, 白井

    電子情報通信学会,信学技法   SP2007--91   31 - 36  2007年

  • Sinusoidal trajectoryを利用した音楽中の音声検出法

    谷口 徹, 白井克彦

    電子情報通信学会技術研究報告   SP2007-11   13 - 18  2007年

  • Instantaneous Phase Analysis Using Artificial Neural Networks forAutomatic Speech Recognition

    Yotaro Kubo, Shigeki Okawa, Akira Kurematsu, Katsuhiko Shirai

    Proc. NCSP'07   Shanghai,China   321 - 324  2007年

  • Automatic music selection method adapted to the user's preference,

    Kentaro Hikosaka, Toru Taniguchi, Yotaro Kubo, Masaaki Honda, Katsuhiko Shirai

    Proc. NCSP'07   Shanghai,China   477 - 480  2007年

  • A Study on Temporal Features Derived by Analytic Signal

    Y. Kubo, S. Okawa, A. Kurematsu, K. Shirai

    Proc. of Interspeech 2007   Antwerpen   1130 - 1133  2007年

  • 発話間単語共起関係に基づく補正信頼度を用いた音声認識

    松本宗也, 谷口徹, 白井克彦, 榑松明

    言語処理学会第12回年次大会 口頭発表(音声言語・対話)   NLP2006   (CD-ROM)  2006年

  • 声質分析に基づく表情豊かな歌声合成

    塩崎崇, 誉田雅彰, 白井克彦

    日本音響学会春季研究発表会講演論文集   2-2-9   707 - 708  2006年

  • 時間的特徴を用いた音響信号中の音カテゴリ検出

    谷口徹, 誉田雅彰, 大川茂樹, 白井克彦

    日本音響学会春季研究発表会講演論文集   2-4-16   293 - 294  2006年

  • 蒙古??言-文字的自?化?理

    伊??瓦, ?玉?, 上?一知, 大川茂樹, 章森, 井佐原均, 白井克彦

    中国中文信息学会会刊   Vol.20,No.4   56 - 62  2006年

  • SPECTRAL FREQUENCY TRACKING FOR CLASSIFYING AUDIO SIGNALS

    Toru Taniguchi, Mikio Tohyama, Katsuhiko Shirai

    Proc. of 2006 IEEE International Symposium on Signal Processing and Information Technology     300 - 303  2006年

    DOI

  • ロボットの状況判断モデル構築のための人物動作分析

    松井和教, 市川貴浩, 誉田雅彰, 村上真, 白井克彦

    FIT2006   (CD-ROM)   375 - 376  2006年

  • ディジタルアクタシステム実現のための感情表出モデルの構築

    島尻絵里奈, 松井和教, 板野貴之, 村上真, 誉田雅彰, 白井克彦

    FIT2006   (CD-ROM)   235 - 236  2006年

  • デジタルカメラワークによるサッカー映像生成

    鈴木健司, 誉田雅彰, 村上真, 白井克彦

    FIT2006   (CD-ROM)   137 - 138  2006年

  • 自在な笑い声・喋り笑いを生成する笑い声フィルタの構築

    芳賀寿昭, 誉田雅彰, 白井克彦

    日本音響学会秋季研究発表会講演論文集     173 - 174  2006年

  • 放送配信に向けた音声符号化方式AACの音質改善

    久保陽太郎, 誉田雅彰, 白井克彦

    日本音響学会秋季研究発表会講演論文集     279 - 280  2006年

  • ユーザの嗜好に適応させた選曲システムの提案

    彦坂健太郎, 谷口徹, 誉田雅彰, 白井克彦

    情報処理学会研究報告   2006-MUS   19 - 24  2006年

  • SPECTRAL FREQUENCY TRACKING FOR CLASSIFYING AUDIO SIGNALS

    Toru Taniguchi, Mikio Tohyama, Katsuhiko Shirai

    Proc. of 2006 IEEE International Symposium on Signal Processing and Information Technology     300 - 303  2006年

    DOI

  • Construction of the Walking Motion Model for Animated Characters' Motion

    T. Morino, D. Osafune, T. Itano, K. Shirai, M. Murakami

    Proc. of the IASTED International Conference on Internet and Multimedia Systems and Applications (EuroIMSA 2005)     1 - 6  2005年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Segments in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of Interspeech2005     589 - 592  2005年

  • 音声・楽器音・歌声が重畳した音響信号中のカテゴリ識別

    谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦

    信学技報   SP2004-153   49 - 54  2005年

  • Construction of the Walking Motion Model for Animated Characters' Motion

    T. Morino, D. Osafune, T. Itano, K. Shirai, M. Murakami

    Proc. of the IASTED International Conference on Internet and Multimedia Systems and Applications (EuroIMSA 2005)     1 - 6  2005年

  • 可変長セグメントパタンマッチングに基づく楽音の音高・楽器推定

    彦坂 健太郎, 椿 雅也, 谷口 徹, 誉田 雅彰, 白井 克彦

    日本音響学会春季研究発表会講演論文集   vol.I, 3-7-18   599 - 600  2005年

  • 音声・楽器音・歌声が混在した音響信号中の音カテゴリ識別

    谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦

    日本音響学会春季研究発表会講演論文集   vol.I, 3-P-13   265 - 266  2005年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Segments in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of Interspeech2005     589 - 592  2005年

  • 分析合成系を用いた笑い声の音響的特徴の分析

    芳賀寿昭, 誉田雅彰, 白井克彦

    日本音響学会秋季研究発表会講演論文集   1-6-9   239 - 240  2005年

  • Sinusoidal Segment の時間的特徴を用いた音声・楽器音・歌声が混在した音響信号中の音カテゴリ検出

    谷口徹, 安達了慈, 大川茂樹, 誉田雅彰, 白井克彦

    日本音響学会秋季研究発表会講演論文集   2-6-5   267 - 268  2005年

  • Construction of the Walking Motion Model for Animated Characters' Motion

    T. Morino, D. Osafune, T. Itano, K. Shirai, M. Murakami

    Proc. of the IASTED International Conference on Internet and Multimedia Systems and Applications (EuroIMSA 2005)     1 - 6  2005年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Segments in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of Interspeech2005     589 - 592  2005年

  • Construction of the Walking Motion Model for Animated Characters' Motion

    T. Morino, D. Osafune, T. Itano, K. Shirai, M. Murakami

    Proc. of the IASTED International Conference on Internet and Multimedia Systems and Applications (EuroIMSA 2005)     1 - 6  2005年

  • Sounds of speech based spoken document categorization: A subword representation method

    WD Qu, K Shirai

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS   E87D ( 5 ) 1175 - 1184  2004年05月

     概要を見る

    In this paper, we explore a method to the problem of spoken document categorization, which is the task of automatically assigning spoken documents into a set of predetermined categories. To categorize spoken documents, subword unit representations are used as an alternative to word units generated by either keyword spotting or large vocabulary continuous speech recognition (LVCSR). An advantage of using subword acoustic unit representations to spoken document categorization is that it does not require prior knowledge about the contents of the spoken documents and addresses the out of vocabulary (OOV) problem. Moreover, this method works in reliance on the sounds of speech rather than exact orthography. The use of subword units instead of words allows, approximate matching on inaccurate transcriptions, makes "sounds-like" spoken document categorization possible. We also explore the performance of our method when the training set contains both perfect and errorful phonetic transcriptions, and hope the classifiers can learn from the confusion characteristics of recognizer and pronunciation variants of words to improve the robustness of whole system. Our experiments based on both artificial and real corrupted data sets show that the proposed method is more effective and robust than the word based method.

  • Sounds of speech based spoken document categorization: A subword representation method

    WD Qu, K Shirai

    IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS   E87D ( 5 ) 1175 - 1184  2004年05月

     概要を見る

    In this paper, we explore a method to the problem of spoken document categorization, which is the task of automatically assigning spoken documents into a set of predetermined categories. To categorize spoken documents, subword unit representations are used as an alternative to word units generated by either keyword spotting or large vocabulary continuous speech recognition (LVCSR). An advantage of using subword acoustic unit representations to spoken document categorization is that it does not require prior knowledge about the contents of the spoken documents and addresses the out of vocabulary (OOV) problem. Moreover, this method works in reliance on the sounds of speech rather than exact orthography. The use of subword units instead of words allows, approximate matching on inaccurate transcriptions, makes "sounds-like" spoken document categorization possible. We also explore the performance of our method when the training set contains both perfect and errorful phonetic transcriptions, and hope the classifiers can learn from the confusion characteristics of recognizer and pronunciation variants of words to improve the robustness of whole system. Our experiments based on both artificial and real corrupted data sets show that the proposed method is more effective and robust than the word based method.

  • Analysis of the phone level contributions to objective evaluation of English speech by non-natives

    Yasuo Suzuki, Makiko Muto, Katsuhiko Shirai, Yoshinori Sagisaka

    Proc. of INTERSPEECH-2004     1673 - 1676  2004年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Components in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of International Symposium on Speech Technology and Processing Sytems(iSTEPS-2004)   Vol.-II   184 - 187  2004年

  • SPEECH SCENE CLUSTERING--EDITING AND RETRIEVING FOR MEETING AND AUDIO DATA

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    ICSLT2004     17 - 19  2004年

  • AUTOMATICALLY OBTAIN A CORPUS FOR MINORITY LANGUAGE

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    COCOSDA2004     17 - 19  2004年

  • 第17回全国大会特別講演 人工知能が描く未来

    安西 祐一郎, 白井 克彦

    人工知能学会誌   19巻1号   70 - 83  2004年

  • 日本人英語発話の客観評価モデル作成に向けた音響特徴量の分析

    鈴木康郎, 前木大樹, 白井克彦, 武藤牧子, 匂坂芳典

    日本音響学会春季研究発表会講演論文集   3-7-19,vol.I   319 - 320  2004年

  • 心理的距離尺度に基づく実音色から有限音色空間への写像

    椿 雅也, 李 而立, 谷口 徹, 大川 茂樹, 誉田 雅彰, 白井 克彦

    日本音響学会春季研究発表会講演論文集   1-9-6,vol.I   673 - 674  2004年

  • 高調波パターンを用いた音声・楽器音・歌声の識別

    谷口 徹, 安達 了慈, 大川 茂樹, 誉田 雅彰, 白井 克彦

    日本音響学会春季研究発表会講演論文集   vol.I,2-P-30   389 - 390  2004年

  • TVサッカー動画像の要約生成のための自動Indexing

    川口 克則, 稲葉 大樹, 大平 茂輝, 村上 真, 白井 克彦

    情報処理学会第66回全国大会   1Z-1,(CDROM)  2004年

  • Katakana Variants Detection for Information Retrieval

    Weidong Qu, Katsuhiko Shirai

    情報処理学会研究報告   2004-NL-162   125 - 130  2004年

  • モーションキャプチャデータを用いた多様な歩行動作制御手法の検討

    板野 貴之, 森野 岳宏, 長船 大毅, 誉田 雅彰, 村上 真, 白井 克彦

    FIT2004   (CD-ROM)  2004年

  • 韻律情報を利用した文章入力システムのための韻律制御モデル

    大久保 崇, 菊池 英明, 白井 克彦

    日本音響学会秋季研究発表会講演論文集,3-1-12,vol.I     133 - 134  2004年

  • 音声対話における発話の感情判別

    小林 季実子, 菊池 英明, 白井 克彦

    日本音響学会秋季研究発表会講演論文集   2-5-5,vol.I   281 - 282  2004年

  • サッカー映像における近景切替の要因分析

    加賀 明久, 白井 克彦, 誉田 雅彰, 村上 真, 大平 茂輝

    FIT2004   (CD-ROM)  2004年

  • 音響信号処理に基づくサッカー映像のインデクシング手法

    塩崎 崇, 大平 茂輝, 誉田 雅彰, 白井 克彦

    FIT2004   (CD-ROM)  2004年

  • An Online Language Model Adaptation for Speech Recognition

    Weidong Qu, Katsuhiko Shirai

    日本音響学会秋季全国大会   1-P-16,vol.I   193 - 194  2004年

  • Analysis of the phone level contributions to objective evaluation of English speech by non-natives

    Yasuo Suzuki, Makiko Muto, Katsuhiko Shirai, Yoshinori Sagisaka

    Proc. of INTERSPEECH-2004     1673 - 1676  2004年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Components in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of International Symposium on Speech Technology and Processing Sytems(iSTEPS-2004)   Vol.-II   184 - 187  2004年

  • SPEECH SCENE CLUSTERING--EDITING AND RETRIEVING FOR MEETING AND AUDIO DATA

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    ICSLT2004     17 - 19  2004年

  • AUTOMATICALLY OBTAIN A CORPUS FOR MINORITY LANGUAGE

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    COCOSDA2004     17 - 19  2004年

  • Analysis of the phone level contributions to objective evaluation of English speech by non-natives

    Yasuo Suzuki, Makiko Muto, Katsuhiko Shirai, Yoshinori Sagisaka

    Proc. of INTERSPEECH-2004     1673 - 1676  2004年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Components in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of International Symposium on Speech Technology and Processing Sytems(iSTEPS-2004)   Vol.-II   184 - 187  2004年

  • SPEECH SCENE CLUSTERING--EDITING AND RETRIEVING FOR MEETING AND AUDIO DATA

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    ICSLT2004     17 - 19  2004年

  • AUTOMATICALLY OBTAIN A CORPUS FOR MINORITY LANGUAGE

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    COCOSDA2004     17 - 19  2004年

  • Katakana Variants Detection for Information Retrieval

    Weidong Qu, Katsuhiko Shirai

    情報処理学会研究報告   2004-NL-162   125 - 130  2004年

  • An Online Language Model Adaptation for Speech Recognition

    Weidong Qu, Katsuhiko Shirai

    日本音響学会秋季全国大会   1-P-16,vol.I   193 - 194  2004年

  • Analysis of the phone level contributions to objective evaluation of English speech by non-natives

    Yasuo Suzuki, Makiko Muto, Katsuhiko Shirai, Yoshinori Sagisaka

    Proc. of INTERSPEECH-2004     1673 - 1676  2004年

  • Discrimination of Speech Musical Instruments and Singing Voices Using the Temporal Patterns of Sinusoidal Components in Audio Signals

    Toru Taniguchi, Akishige Adachi, Shigeki Okawa, Masaaki Honda, Katsuhiko Shirai

    Proc. of International Symposium on Speech Technology and Processing Sytems(iSTEPS-2004)   Vol.-II   184 - 187  2004年

  • SPEECH SCENE CLUSTERING--EDITING AND RETRIEVING FOR MEETING AND AUDIO DATA

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    ICSLT2004     17 - 19  2004年

  • AUTOMATICALLY OBTAIN A CORPUS FOR MINORITY LANGUAGE

    Idomuso Dawa, Katsuhiko Shirai, Hitoshi Isahara

    COCOSDA2004     17 - 19  2004年

  • Refining the Concept Network for Automatically Chinese ThesaurusConstruction

    Weidong Qu, Katsuhiko Shirai

    EALPIIT2003     1 - 4  2003年

  • A REAL TIME LANGUAGE AND DIALECT IDENTIFICATION BASED ON THE VQ ERROR OF THE ACOUSTIC FEATURE AND PROSODIC CUES

    I.Dawa, K.Shirai

    15th International Congress of Phonetic Science     1377 - 1380  2003年

  • Statistical estimation of phoneme's most stable point based on universal constraints

    Shigeki Okawa, Katsuhiko Shirai

    Proc. European Conference on Speech Communication and Technology   PTuBf6   781 - 784  2003年

  • Belief Learning in Certainty Inference Factor Model and its Application to Text Categoraization

    Weidong Qu, Katsuhiko Shirai

    Fourth IEEE Pacific-Rim Conference On Multimedia   (CD-ROM)  2003年

    DOI

  • 箏曲の歌の旋律型とリズム型

    出口 幸子, 白井 克彦

    電子情報通信学会 人工知能と知識処理研究会 技術研究報告   AI2002-60   77 - 82  2003年

  • 音声/音楽信号の識別とセグメンテーション手法の検討

    谷口 徹, 安達 了慈, 大川 茂樹, 白井 克彦

    日本音響学会春季研究発表会講演論文集   vol.I 3-6-9   345 - 346  2003年

  • 英語発話リズム客観評価に向けた音響特徴の分析

    前木 大樹, 内藤 拓郎, 近藤 亜希, 白井 克彦, 匂坂 芳典

    日本音響学会春季講演論文集   vol.1   355 - 356  2003年

  • 日本人英語発話のリズム客観評価モデル

    近藤 亜希, 前木 大樹, 白井 克彦, 匂坂 芳典

    日本音響学会春季講演論文集   vol.1   353 - 354  2003年

  • HMMを用いた音声・音楽自動識別の検討

    安達 了慈, 谷口 徹, 白井 克彦

    日本音響学会2003年春季研究発表会講演論文集   2003/6/10   347 - 348  2003年

  • Refining the Concept Network for Automatically Chinese ThesaurusConstruction

    Weidong Qu, Katsuhiko Shirai

    言語処理学会弟9回年次大会論文集     153 - 154  2003年

  • Belief Learning in Certainty Inference for Text Categoraization

    Weidong Qu, Katsuhiko Shirai

    情報処理学会弟65回全国大会論文集     27 - 28  2003年

  • 日本人英語の韻律分析と発音自動評価システムの構築

    白井 克彦, 内藤 拓郎, 前木 大樹, 近藤 亜希, 匂坂 義典

    特定領域研究「高等教育改革に資するマルチメディアの高度利用に関する研究」報告書   pp.225-230   225 - 230  2003年

  • IT化と人間性の維持

    白井 克彦

    電子情報通信学会誌   Vol.86,No5   364 - 371  2003年

  • 箏曲の歌における旋律とリズムの知識表現

    出口 幸子, 白井 克彦

    人工知能学会論文誌   18   153 - 160  2003年

    DOI CiNii

  • 人物動作における感情表出モデル構築に向けたディジタルアクタ学習システムの設計

    大隈 健史, 長船 大毅, 森野 岳宏, 村上 真, 白井 克彦

    第9回画像センシングシンポジウム講演論文集     427 - 432  2003年

  • フィールド情報に基づくサッカー映像インデクシングと要約手法の検討

    稲葉 大樹, 川口 克則, 平林 衛, 大平 茂輝, 白井 克彦

    第9回画像センシングシンポジウム講演論文集     421 - 426  2003年

  • 要約済異種メディアを利用した一般向け映像要約規則の抽出

    平林 衛, 稲葉 大樹, 川口 克則, 大平 茂輝, 白井 克彦

    人工知能学会 全国大会(第17回)論文集   2C1-03,,(CD-ROM)  2003年

  • モーションキャプチャデータを用いた歩行動作の分析と制御

    長船 大毅, 森野 岳宏, 大隈 健史, 村上 真, 白井 克彦

    人工知能学会 全国大会(第17回)論文集   2C3-04,,(CD-ROM)  2003年

  • 基本動作制御モデル構築のための歩行動作の分析・生成

    森野 岳宏, 大隈 健史, 長船 大毅, 村上 真, 白井 克彦

    人工知能学会 全国大会(第17回)論文集   2C3-03,(CD-ROM)  2003年

  • 箏曲の歌における旋律パターンの分析と応用

    出口 幸子, 白井 克彦

    人工知能学会 全国大会(第17回)論文集   2C3-07,(CD-ROM)  2003年

  • HMMを用いた音声・音楽識別

    谷口 徹, 安達 了慈, 大川 茂樹, 白井 克彦

    信学技報   vol.103 No.331,SP2003-92   47 - 52  2003年

  • 多面的安全性に着目した安全性の評価モデル

    金子 格, 白井 克彦

    情報処理学会Computer Security Symposium 2003(CSS2003)論文集     325 - 330  2003年

  • 音声対話における韻律を用いた話題境界検出

    大久保 崇, 菊池 英明, 白井 克彦

    信学技報   SP,Vol.103,No.519   235 - 240  2003年

  • Refining the Concept Network for Automatically Chinese ThesaurusConstruction

    Weidong Qu, Katsuhiko Shirai

    EALPIIT2003     1 - 4  2003年

  • A REAL TIME LANGUAGE AND DIALECT IDENTIFICATION BASED ON THE VQ ERROR OF THE ACOUSTIC FEATURE AND PROSODIC CUES

    I.Dawa, K.Shirai

    15th International Congress of Phonetic Science     1377 - 1380  2003年

  • Statistical estimation of phoneme's most stable point based on universal constraints

    Shigeki Okawa, Katsuhiko Shirai

    Proc. European Conference on Speech Communication and Technology   PTuBf6   781 - 784  2003年

  • Belief Learning in Certainty Inference Factor Model and its Application to Text Categoraization

    Weidong Qu, Katsuhiko Shirai

    Fourth IEEE Pacific-Rim Conference On Multimedia   (CD-ROM)  2003年

    DOI

  • Refining the Concept Network for Automatically Chinese ThesaurusConstruction

    Weidong Qu, Katsuhiko Shirai

    言語処理学会弟9回年次大会論文集     153 - 154  2003年

  • Belief Learning in Certainty Inference for Text Categoraization

    Weidong Qu, Katsuhiko Shirai

    情報処理学会弟65回全国大会論文集     27 - 28  2003年

  • The new prospect and a new way for communication in spoken and written of Mongolian of the world in the twety-first century

    Idomuco Dawa, Kazutomo Uezono, Katsuhiko Shirai

    International academic conference ``Celebrate the 330-th anniversary of Ayuka-Khan   Kalmykia''  2002年

  • The Temperament Scale and Mode of Koto Music

    Sachiko Deguchi, Eleanor Selfridge-Field, Katsuhiko Shirai

    International Congress of the Musicalogical Society of Japan 2002    2002年

  • Automatic phone segment alignment using statistical deviations from manual transcriptions

    Toru Hayakawa, Hiroaki Kato, Yoshinori Sagisaka, Katsuhiko Shirai

    FIRST PAN-AMERICAN/IBERIAN MEETING ON ACOUSTICS    2002年

  • 音声対話システム汎用プラットフォームにおける韻律情報を用いた対話制御

    白井 克彦, 菊池 英明

    Proceedings for 2001 2nd Plenary Meeting and Symposium on Prosody and Speech Processing     3 - 96  2002年

  • 音声対話システム汎用プラットフォームの構築

    白井 克彦

    公開シンポジウム 音声言語による人間-機械対話システムの高度化と新展開 資料集   pp.81-88  2002年

  • 音声対話にもとづく学術情報検索システムの評価

    藤崎, 中川, 河原, 広瀬, 白井, 大野, 菊池, 阿部, 桐山

    公開シンポジウム 音声言語による人間-機械対話システムの高度化と新展開 資料集   pp.89-92  2002年

  • 放送音源における音声・音楽区間セグメンテーション手法の検討

    谷口 徹, 安達 了慈, 白井 克彦

    日本音響学会2002年春季研究発表会講演論文集   2003/10/9   319 - 320  2002年

  • 自動音韻セグメンタの時間精度評価 ―ラベル尤度との相関と誤差の音韻文脈依存性―

    早川 徹, 加藤 宏明, 匂坂 芳典

    日本音響学会2002年春季研究発表会講演論文集   2003/10/8   317 - 318  2002年

  • 様々な雑音環境下におけるマルチバンド型音声認識の性能評価

    塩田 大輔, 王 大可, 大川 茂樹, 白井 克彦

    日本音響学会2002年春季研究発表会講演論文集   3-P-4   173 - 174  2002年

  • 特徴量レベルでの統合法に基づくマルチバンド型モデルによる雑音環境下音声認識

    大川 茂樹, 白井 克彦

    情報処理学会論文誌   Vol.43 No.07-005   2046 - 2054  2002年

  • 音声対話における心的状態変化の予測をともなうメタ発話生成機構

    菊池 英明, 白井 克彦

    情報処理学会論文誌   Vol.43 No.07-014   2130 - 2137  2002年

  • 準聴覚心理的に正規化した圧縮比によるオーディオ符号化の評価

    金子 格, 白井 克彦

    日本音響学会誌   58巻8号   477 - 484  2002年

    DOI

  • VQベクトル誤差による実時間言語(方言)自動識別システムの開発

    伊・達瓦, 白井 克彦

    日本音響学会2002年秋季研究発表会講演論文集   3-Q-4   161 - 162  2002年

  • 自由文話者識別法

    白井 克彦, 達瓦 伊徳木草

    白井研究室委託研究報告    2002年

  • ユビキタス・マルチメディアの融合を目指すMPEG-21標準化の動向

    金子 格, 白井 克彦, 阪本 秀樹

    情報処理学会学会誌   Vol.43 No.9-008   981 - 987  2002年

  • アノテーションに基づくビデオ検索システムの提案

    大平 茂輝, 長尾 確, 白井 克彦

    情報処理学会研究報告   SLP-43-6   33 - 39  2002年

  • 携帯情報端末を用いた音声によるマルチメディア検索システム

    大平 茂輝, 長尾 確, 白井 克彦

    人工知能学会研究会資料   SIG-SLUD-A202-08   51 - 54  2002年

  • 音声・音楽識別を目的とした特徴量の検討

    谷口 徹, 大川 茂樹, 白井 克彦

    電子情報通信学会技術報告   Vol.102 No.529 SP2002-135   87 - 91  2002年

  • The new prospect and a new way for communication in spoken and written of Mongolian of the world in the twety-first century

    Idomuco Dawa, Kazutomo Uezono, Katsuhiko Shirai

    International academic conference ``Celebrate the 330-th anniversary of Ayuka-Khan   Kalmykia''  2002年

  • The Temperament Scale and Mode of Koto Music

    Sachiko Deguchi, Eleanor Selfridge-Field, Katsuhiko Shirai

    International Congress of the Musicalogical Society of Japan 2002    2002年

  • Automatic phone segment alignment using statistical deviations from manual transcriptions

    Toru Hayakawa, Hiroaki Kato, Yoshinori Sagisaka, Katsuhiko Shirai

    FIRST PAN-AMERICAN/IBERIAN MEETING ON ACOUSTICS    2002年

  • 蒙古語多方言語音識別及共享識別模型探索

    伊・達瓦, 大川茂樹, 白井克彦, 共著

    中央民族大学   , 4   114 - 121  2001年

  • 蒙古語主要方言的声学和音律特征分析分類

    伊・達瓦, 大川茂樹, 白井克彦, 共著

    民族語文,2001年第一期     26 - 32  2001年

  • Human Face Extraction using Genetic Algorithm with Similarity of Subspace Method as a Fitness Value

    M. Murakami, M. Yoneyama, K. Shirai

    ISPA2001     144 - 148  2001年

  • Accurate Face Extraction and the Pose Detection using Subspace Method and Genetic Algorithm

    M. Murakami, M. Yoneyama, K. Shirai

    SOCO2001 CD-ROM    2001年

  • The Multi-Lateral Security Framework for the Ubiquitous Internet Multimedia

    I. Kaneko, K. Shirai

    IASTED IMSA2001    2001年

  • Multi-Class Composite N-gram Language Model using Multiple Word Clusters and Word Successions

    S. Isogai, K. Shirai, H. Yamamoto, Y. Sagisaka

    EUROSPEECH 2001   , 1   25 - 28  2001年

  • Pronunciation Variant Analysis using Speaking Style Parallel Corpus

    H. Nakajima, I. Hirano, Y. Sagisaka, K. Shirai

    EUROSPEECH 2001   , 1   65 - 68  2001年

  • A Robust News Speech Articles Classification for Video on Demand

    Weidong Qu, Katsuhiko Shirai

    IEEE ICICS2001    2001年

  • The Multi-Lateral Security Framework for the Ubiquitous Audiovisual Services

    I. Kaneko, K. Shirai

    IEEE Systems,Man,and Cybernetics Conference 2001    2001年

  • Characterizing Audio Compression Algorithms using Reference Psychoacoustic Noise Allocation

    I. Kaneko, K. Shirai

    IEEE ICICS2001     488 - 492  2001年

  • 予測や予備運動が指運動の反応時間に与える影響

    小松昭男, 蝶間林利男, 白井克彦

    ヒューマンインタフェース学会論文誌   , 3   39 - 46  2001年

  • 楽譜情報に基づいた箏曲の音律と音階の分析

    出口幸子, 白井克彦

    情報処理学会論文誌   , 42   642 - 649  2001年

  • 多面的安全性のためのXMLによるコンテンツ保護記述

    金子格, 白井克彦

    情報処理学会研究報告   , EIP, 12-2   1 - 6  2001年

  • 基準となる聴覚心理を用いたオーディオ圧縮の特性評価

    金子格, 白井克彦

    日本音響学会 電気音響研究会    2001年

  • 聴覚障害者向け字幕付きテレビ番組の自動制作システム

    門馬隆雄, 沢村英治, 福島孝博, 丸山一郎, 江原暉将, 白井克彦

    電子情報通信学会論文誌   , J84-D-II   888 - 897  2001年

  • 多次元心的状態を扱う音声対話システムの構築

    鈴木堅悟, 青山一美, 菊池英明, 白井克彦

    情報処理学会研究報告   , SLP, 37-3   13 - 18  2001年

  • 聴覚障害者向け字幕番組の制作技術

    江原 暉将, 沢村 英治, 福島 孝博, 丸山 一郎, 和田 裕二, 門馬 隆雄, 白井 克彦

    情報処理学会自然言語処理研究会資料 NL144-17     121 - 126  2001年

  • 蒙古語多方言語音識別及共享識別模型探索

    伊・達瓦, 大川茂樹, 白井克彦, 共著

    中央民族大学   , 4   114 - 121  2001年

  • 蒙古語主要方言的声学和音律特征分析分類

    伊・達瓦, 大川茂樹, 白井克彦, 共著

    民族語文,2001年第一期     26 - 32  2001年

  • Human Face Extraction using Genetic Algorithm with Similarity of Subspace Method as a Fitness Value

    M. Murakami, M. Yoneyama, K. Shirai

    ISPA2001     144 - 148  2001年

  • Accurate Face Extraction and the Pose Detection using Subspace Method and Genetic Algorithm

    M. Murakami, M. Yoneyama, K. Shirai

    SOCO2001 CD-ROM    2001年

  • The Multi-Lateral Security Framework for the Ubiquitous Internet Multimedia

    I. Kaneko, K. Shirai

    IASTED IMSA2001    2001年

  • Multi-Class Composite N-gram Language Model using Multiple Word Clusters and Word Successions

    S. Isogai, K. Shirai, H. Yamamoto, Y. Sagisaka

    EUROSPEECH 2001   , 1   25 - 28  2001年

  • Pronunciation Variant Analysis using Speaking Style Parallel Corpus

    H. Nakajima, I. Hirano, Y. Sagisaka, K. Shirai

    EUROSPEECH 2001   , 1   65 - 68  2001年

  • A Robust News Speech Articles Classification for Video on Demand

    Weidong Qu, Katsuhiko Shirai

    IEEE ICICS2001    2001年

  • The Multi-Lateral Security Framework for the Ubiquitous Audiovisual Services

    I. Kaneko, K. Shirai

    IEEE Systems,Man,and Cybernetics Conference 2001    2001年

  • Characterizing Audio Compression Algorithms using Reference Psychoacoustic Noise Allocation

    I. Kaneko, K. Shirai

    IEEE ICICS2001     488 - 492  2001年

  • 蒙古語多方言語音識別及共亨識別模型的探討

    OIRRAT STUDIES. XinJiang CHINA    2000年

  • 声楽・音律特性分析分類蒙古語主要方言

    民族語文, 中国社会科学院    2000年

  • Research Perspective of the TAO Project on TV Closed Captions for the Hearing Impaired People

    国際シンポジウム「話し言葉工学」の構築を目指して    2000年

  • 音声対話システム汎用プラットフォームの検討

    情報処理学会研究報告   2000-SLP-30, pp-7-12  2000年

  • 音声対話システム汎用プラットフォームの検討

    音声言語情報処理   SIG-SLP, 30-2, pp.7-12  2000年

  • 対話効率の向上を目的とした音声対話制御のモデル化

    ヒューマンインタフェース学会誌   Vol.2, No.2, pp.145-152  2000年

  • 音声対話システム汎用プラットフォームにおける行動管理部の構築

    人工知能学会全国大会(第14回)   06-08, pp.134-137  2000年

  • Accurate Extraction of Human Face Area using Subspace Method and Genetic Algorithm

    Proc. of International Conference Multimedia and Expo, New York    2000年

  • 情報理論に基づくモンゴル語口語から文語への交換処理手法

    日本音響学会講演論文集   2-1-19, pp.211-212  2000年

  • AUTOMATIC CATEGORIZATION FOR NEWS SPOKEN DOCUMENTS

    日本音響学会講演論文集   2-Q-27, pp.143-144  2000年

  • Using machine learning method and subword unit representations for spoken document categorization

    Proc. of International Conference on Spoken Language Processing (ICSLP)    2000年

  • Modeling of Spoken Dialogue Control for Improvement of Dialogue Efficiency

    Proc. of IEEE Int'l. Conference on Systems, Man and Cybernetics    2000年

  • Improvement of Dialogue Efficiency by Dialogue Control Model According to Performance of Processes

    Proc. of Int'l. Conference on Spoken Language Processing    2000年

  • DESIGNING A DOMAIN INDEPENDENT PLATFORM OF SPOKEN DIALOGUE SYSTEM

    Proc. of International Conference on Spoken Language Processing (ICSLP)    2000年

  • Controlling Non-verbal Information in Speaker-change for Spoken Dialogue

    2000 IEEE International Conference on Systems Man and Cybernetics (SMC2000)   pp.1354-1359  2000年

  • Building and Application of Mongolian Multi-Dialectal Speech Database

    COCOSDA 2000 Workshop    2000年

  • 高度デジタルAVフレームワークの多面的安全性とその特性

    情報処理学会論文誌   Vol. 41, No. 11-008  2000年

  • 筝曲の歌におけるメリスマの表現

    情報処理学会研究報告   MUS-38, pp.21-26  2000年

  • 多重クラスTrigram構築のための効率的な自動クラスタリング手法

    電子情報通信学会技術報告   NLC2000-64, pp.103-107  2000年

  • DESIGNING A DOMAIN INDEPENDENT PLATFORM OF SPOKEN DIALOGUE SYSTEM

    Proc. of International Conference on Spoken Language Processing (ICSLP)    2000年

  • Controlling Non-verbal Information in Speaker-change for Spoken Dialogue

    2000 IEEE International Conference on Systems Man and Cybernetics (SMC2000)   pp.1354-1359  2000年

  • Building and Application of Mongolian Multi-Dialectal Speech Database

    COCOSDA 2000 Workshop    2000年

  • Japanese Large-Vocabulary Continuous-Speech Recognition Using a Newspaper Corpus and Broadcast News

    Speech Communication 28   pp.155-166  1999年

    DOI

  • MuSE: A Web-based Lorean Children's Folk Song Retrieval System

    IOS Press/Ohmsha   pp.752-755  1999年

  • Controlling Dialogue Strategy According to Performance of Processes

    ESCA Workshop, Session5.2   pp.85-88  1999年

  • 蒙古語七個元音声頻特性計算机分析

    中国声学学会声学学報/中国科学院声学研究所   24;1, pp.94-97《中国語文》  1999年

  • 人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御

    情報処理学会誌論文誌   40;2, pp.487-496  1999年

  • システムの処理性能を考慮した対話制御方法の検討

    人工知能学会 言語・音声理解と対話処理研究会予稿集   pp.1-6  1999年

  • 発音学習を目的とした英語CAIシステムの構築

    電子情報通信学会総合大会講演論文集   D-15-44  1999年

  • 相対的な英語能力評価を目的とした英語学習システム

    電子情報通信学会総合大会講演論文集   D-15-43  1999年

  • 字幕提示タイミングずれに対する許容の主観評価

    電子情報通信学会総合大会講演論文集   A-14-22  1999年

  • 音声対話システムにおける処理性能と対話戦略の関係についての一考察

    日本音響学会講演論文集   pp.109-110  1999年

  • マルチバンド音声認識における部分帯域への重み付けの検討

    日本音響学会講演論文集   pp.119-120  1999年

  • ホップフィールドニューラルネットワークを用いた表情に依存しない個人認識

    電子情報通信学会総合大会講演論文集   D-12-93  1999年

  • パラメトリック固有空間法を用いた顔方向認識に最適な特徴抽出の検討

    電子情報通信学会総合大会講演論文集   D-12-90  1999年

  • AICを用いた重要語抽出手法の提案

    電子情報通信学会総合大会講演論文集   D-5-6  1999年

  • Design of Mongolian Speech Database Considering Dialectal Characteristics

    Dawa Idomuso, Okawa Shigeki, Shirai Katsuhiko

    The Journal of the Acoustical Society of Japan(E)   20; 3, pp.181-188 ( 3 ) 181 - 188  1999年

     概要を見る

    In this paper, aiming at the advancement of speech research for Mongolian language, we discuss design and collection of Mongolian speech database. Mongolian, one of the most spoken oriental languages, has several dialectal variations in its phonetic and graphic systems because of the historical and the geographical background. This causes a significant obstacle to develop their culture and education. Furthermore, unlike the other major languages, the basis of linguistic and phonetic research has not been investigated well yet. In this study, therefore, we first analyze fundamental characteristics of Mongolian spoken language in order to define phoneme labels. Next, we design the Mongolian speech database by collecting actual native speech. Lastly, we apply the database to a simple word recognition experiment.

    DOI CiNii

  • Design and Assessment of Mongolian Dialectal Speech Input System

    ORIENTAL COCOSDA'99 PROCEEDINGS   pp.45-48  1999年

  • Evaluation of Annotation Schemes for Japanese Discourse

    Proceedings of the Workshop "Towards Standards and Tools for Discourse Tagging"   pp.26-34  1999年

  • A Study of Feature Extraction for Facial Pose Detection using Parametric Eigenspace Method

    6th International Workshop on System, Signals and Image Processing   pp46-49  1999年

  • 箏曲異種楽譜の比較による歌の旋律分析

    音楽情報科学   99-MUS-31, pp.85-90  1999年

  • Proposal and Evaluation of Significant Word Selection Method based on AIC

    Proceesings of the First NTCIR Workshop on Research in Japanese Text Retrieval and Term Recognition   pp.109-116  1999年

  • An Introduction to Mongolian Phonetic-Linguistic Model on the Acoustic Properties of Mongolian Language

    ICPhS 99   3, pp.1657-1660  1999年

  • 課題遂行対話における対話潤滑語の認定

    人工知能学会誌   14; 5, pp.900-906  1999年

  • 情報量を基準としたモンゴル語主要二大方言の音響特徴の分析

    日本音響学会講演論文集   3-Q-1, pp.119-120  1999年

  • 情報家電で必要となるセキュリティと技術的側面

    情報処理学会全国大会   5D  1999年

  • Improving recognition Correct Rate of Important Words in Large Vocabulary Speech Recognition

    6th European Conference on Speech Communication and Technology:EUROSPEECH'99   1, pp.511-514  1999年

  • Improved DTW Approach for Speech Patterns with Multiple Stages

    日本音響学会講演論文集   3-Q-9, pp.135-136  1999年

  • A Recombination Strategy for Multi-band Speech Recognition Based on Mutual Information Criterion

    6th European Conference on Speech Communication and Technology:EUROSPEECH'99   2, pp.603-606  1999年

  • A Post-Processing of Speech for Hearing Impaired Integrate into Standard Digital Audio Decoders

    6th European Conference on Speech Communication and Technology:EUROSPEECH'99   3, pp.1071-1074  1999年

  • Essentials for Developing Chinese Computing Environment with Multiple Encodeing Protocols

    Multi-lingual Information Processing and Asian Language Processing:MAL'99    1999年

  • 箏曲における歌の音階に関する考察

    音楽情報科学   99-MUS-33, pp.33-40  1999年

  • マルチバンド型音声認識のための部分帯域特徴量の情報量評価

    電子情報通信学会技術報告   SP99-97, pp.25-30  1999年

  • ヒューマノイドロボットにおけるマルチモーダル会話インタフェース

    電子情報通信学会技術報告   SP99-113, pp.121-126  1999年

  • Speech Enhancement Based on Neural Predictive Hidden Markov Model

    An International Journal, A Publication of the European Association for Signal Processing(EURASIP),Signal Processing 65   pp.373-381  1998年

    DOI

  • 音声による人間と機械の対話

    オーム社    1998年

  • 問題自動作成機能を持った英語CAIシステムの構築と評価

    電子情報通信学会総合大会講演論文集   D-15-50/P286  1998年

  • 対話向け漸進的音声合成機の設計

    日本音響学会講演論文集   1-7-9/P197-198  1998年

  • 時間的制約を考慮した対話制御方法の検討

    日本音響学会講演論文集   3-6-16/P113-114  1998年

  • 一般調和解析に基づく音声合成における周波数・音素長変換

    日本音響学会講演論文集   1-7-5/P189-190  1998年

  • 岩波講座 言語の科学 2 音声

    岩波書店    1998年

  • 人間とロボットのコミュニケーションにおける非言語情報の利用

    情報処理学会音声言語情報処理研究会資料   21-7, pp.69-74  1998年

  • Multimodal Communication Between Human and Robot

    Proc. Of International Wireless and Telecommunications Symposium (IWTS)   pp.322-325  1998年

  • Automatic Generation of Closed-Caption on TV Programs for the Hearing Impaired

    Proc. Of International Wireless and Telecommunications Symposium (IWTS)   pp.318-321  1998年

  • 人間型対話インタフェースにおけるまばたき制御の検討

    人工知能学会全国大会(第12回)予稿集   15-14, pp.242-245  1998年

  • 時間的制約を考慮した対話制御方法の実現方法

    人工知能学会全国大会(第12回)予稿集   37-07,pp.677-678  1998年

  • 方言間の差異を考慮したモンゴル語音声データベースの構築

    日本音響学会講演論文集   1-R-28, pp.173-174  1998年

  • 子音調音時の舌口蓋接触圧の観測

    日本音響学会講演論文集   2-P-18,pp.321-322  1998年

  • Controlling Gaze of Humanoid in Communication with Human

    Proc. Of International Conference on Intelligent Robots and Systems (IROS)   1, pp.255-260  1998年

  • 非言語的現象の分析と対話処理 -電子メール討論-

    日本音響学会誌   54;11, pp.812-817  1998年

    DOI

  • Use of Nonverbal Information in Communication between Human and Robot

    Proc. Of International Conference on Spoken Language Processing (ICSLP)   pp.2351 - 2354  1998年

  • 対話の状態変化における統計的モデル化

    情報処理学会音声言語情報処理研究会   pp.131-137  1997年

  • 対面および非対面における対話の違い-頭の振りの役割分析-

    情報処理学会音声言語情報処理研究会   pp.105-112  1997年

  • 人間型対話ロボットにおける非言語情報の役割

    情報処理学会研究会報告   97-SLP-15;pp.67-73  1997年

  • 語学用知的CAIにおける音韻変動知識処理

    電子情報通信学会論文誌   3;pp.811-819  1997年

  • ロボットとの対話における非言語情報の役割

    日本音響学会春季講演論文集   2-Q-1;pp.141-142  1997年

  • ニュース音声を対象とした大語彙連続音声認識

    日本音響学会春季講演論文集   2-6-11;pp.65-66  1997年

  • Sound Technologies and Humanoid Research

    International Symposium on Simulation, Visualization and Auralization for Acoustic Research and Education (ASVA) '97 Proceedings   P253-260  1997年

  • Difference in Visual Information between Face to Face and Telephone Dialogues

    International Conference on Acoustic, Speech and Signal Processing (ICASSP) '97 Proceedings   2/P1499-1502  1997年

  • ロボットとの対話における非言語情報の役割

    人工知能学会全国大会論文集   21-06/P433-436  1997年

  • シソーラスに基づく統計言語モデルの検討

    電子情報通信学会技術研究報告   SP97-26/P59-66  1997年

  • The Role of Non-Verbal Information in Spoken Dialogue between a Man and a Robot

    International Conference on Speech Processing (ICSP) '97 Proceedings   2/P539-544  1997年

  • Spoken Dialogue in Multimodal Human Interface

    International Conference on Speech Processing (ICSP) '97 Proceedings   1/P13-20  1997年

  • 量子化誤差を評価基準としたスペクトル変換による教師なし話者適応

    日本音響学会講演論文集   1-1-16/P31-32  1997年

  • 複数ユーザとロボットの対話における非言語情報の役割

    日本音響学会講演論文集   3-1-13/P111-112  1997年

  • 意味分類を利用した統計的言語モデルの検討

    日本音響学会講演論文集   2-1-8/P63-64  1997年

  • モンゴル語音韻の分類および認識性能の評価

    日本音響学会講演論文集   2-Q-7/P129-130  1997年

  • ニュース音声認識システムの検討

    日本音響学会講演論文集   3-1-13/P103-104  1997年

  • 自由会話における時間的制約の影響の分析

    電子情報通信学会技術研究報告   SP97-55/P31-36  1997年

  • 花開く音声処理技術

    情報処理学会誌   38;11/P971-975  1997年

  • ヒューマノイド - 人間形高度情報処理ロボット

    情報処理学会誌   38;11/P959-969  1997年

  • 複数のタスクの対話コーパスに基づいた対話管理に関する発話の分析

    日本音響学会春季研究発表会講演論文集   1-P-2  1996年

  • 複合作業における音声の有効性に関する検討

    日本音響学会春季研究発表会講演論文集   1-P-13  1996年

  • 新聞記事読み上げタスクを用いた大語彙連続音声認識における音響モデルの検討

    日本音響学会春季研究発表会講演論文集   37841  1996年

  • 構内案内ロボットにおける音声とジェスチャーの統合に関する検討

    日本音響学会春季研究発表会講演論文集   1-P-15  1996年

  • 音素認識誤り傾向の統計的分法に関する一考察

    日本音響学会春季研究発表会講演論文集   37750  1996年

  • 音声認識技術を利用した日本語発音学習システム

    電子情報通信学会総合大会   D-692  1996年

  • 音韻コンテキストを考慮した統計的音韻中心の拡張に関する検討

    日本音響学会春季研究発表会講演論文集    1996年

  • マルチメディアCAIシステム“MUSEE”

    電子情報通信学会総合大会   D-736  1996年

  • HMMの状態遷移情報を利用した話者適応に関する考察

    日本音響学会春季研究発表会講演論文集   37032  1996年

  • PARTHENONを用いたAALタイプ5のATMチップの設計

    第8回PARTHENON研究会   8;pp.33-40  1996年

  • 作文演習用知的CAIにおける教育効果

    電子情報通信学会論文誌   J79-D-2;6  1996年

  • 作文演習用知的CAIにおける音声合成の適用と評価

    電子情報通信学会論文誌   J79-D-2,No.6;pp.1158-1165  1996年

  • 複合作業下における音声インタフェースの有効性

    人工知能学会研究会資料   SIG-SLUD-9601,pp.1-8  1996年

  • 対話中の顔の動きの分析とその役割

    人工知能学会全国大会   17-07,pp493-496,  1996年

  • 音声対話モデルと対話系のアーキテクチャ

    人工知能学会全国大会(第10回)   S3-04,pp.59-62,  1996年

  • The Development of E-MUSE:the Multimedia System for Education in English at Waseda University

    ED-MEDIA 96    1996年

  • 蒙古語方言7母音のフォルマント周波数分析

    日本音響学会秋季研究発表会講演論文集   1-p-22;pp.325-326  1996年

  • 発話文を単位としたワードスポッティングによる意図抽出

    日本音響学会秋季研究発表会講演論文集   1-3-12,pp.23-24  1996年

  • エルゴディックHMMによる対話のモデル化と評価

    日本音響学会秋季研究発表会講演論文集   1-3-2;pp.3-4  1996年

  • Recognition of Facial Expressions Using Associative Memory

    Proc. of Seventh IEEE Digital Signal Processing Workship   pp.243-246  1996年

  • 大学教育における英語学習用CAIシステムの運用と評価

    教育工学研究会   *ET96-70,pp.29-36  1996年

  • 音声認識技術を利用した日本語発音学習システム

    教育工学研究会   ET96-71,pp.37-44  1996年

  • 音声認識技術を利用した日本語学習システム

    電子情報通信学会技術報告   ET96-71;pp.37-44  1996年

  • 英語教育支援システムにおける実験適用とその評価

    電子情報通信学会技術報告   ET96-72;pp.45-52  1996年

  • Spoken dialogue interface in a dual task situation

    ICSLP'96   1;pp.382-385  1996年

  • Modeling of Spoken Dialogue with and without Visual Infomation

    ICSLP'96   1;pp.188-191  1996年

  • Estimation of statistical phoneme center considering phonemic environments

    ICSLP'96   2;pp.1069-1072  1996年

  • Analysis of head movements and itss role in spoken dialogue

    Proc. of Forth International Conference on Spoken Language Processing   4;pp.2167-2170  1996年

  • Modeling of Spoken Dialogue

    3rd Joint Meeting Acoustical society of America and Acoustical society of Japan    1996年

  • 並列HMM法とスペクトルサブトラクションによる非定常雑音環境下における音声認識

    電子情報通信学会論文誌   D-11-j78-7  1995年

  • 中国語読解支援システムCHIDAOの設計

    信学技報   ET95-42  1995年

  • 音声合成を実現した作文演習用知的CAIシステム

    信学技報   ET95-41  1995年

  • セミ連続型音韻中心間HMMによる話者適応型音声認識

    電子情報通信学会音声研究会資料   SP5-39  1995年

  • Extraction of Speaker's Feeling Using Facial Image and Speech

    Proc. 4th IEEE International Workshop on Robot and Human Communication Roman'95    1995年

  • PARTHENONを利用したATMチップの設計

    第6回パルテノン研究会資料集/    1995年

  • Estimation of Statistical Phoneme Center and Its Application to Accurate Phoneme Modeling

    Proc. Eurospeech'95   TUpm2E.7  1995年

  • A Design System for Special Purpose Processors Based on Architectures for Distributed Processint

    Proc. European Design Automation Conference with EURO-VHDL'95 (EURO-DAC'95)    1995年

  • Linguistic Intelligent CAI System Using Speech Data-Base

    IEICE TRANS FUNDAMENTALS   E-78-A-11  1995年

  • 協調問題解決におけるコーパスに基づく対話モデル

    人工知能学会研究会資料   SIG-SLUD-9501-3  1995年

▼全件表示

産業財産権

  • 連続音声認識装置および方法

    特許権

     概要を見る

    特開2001-109491

受賞

  • 日本ロボット学会フェロー

    2006年  

  • 日本放送協会放送文化賞

    2005年  

  • 電子情報通信学会フェロー(情報・システム ソサイエティ)

    2001年  

  • 人工知能学会功績賞

    2001年  

共同研究・競争的資金等の研究課題

  • マルチモーダルコミュニケーションにおける音声とジェスチャの統合についての研究

    研究期間:

    1997年
    -
    2000年
     

  • Integration of Speech with Gesture in Multimodal Communication

    研究期間:

    1997年
    -
    2000年
     

  • 非母国語話者のための韻律を包含する発音学習システムに関する研究

    研究期間:

    1999年
     
     
     

  • Development of Pronunciation Learning System Including Prosody for Non-Native Speaker

    研究期間:

    1999年
     
     
     

  • マルチモーダルインタフェースを持つ知的CAIの語学教育への応用に関する研究

    研究期間:

    1995年
    -
    1997年
     

  • Application of Intelligent CAI System with Multimodal Interface to Language Teaching

    研究期間:

    1995年
    -
    1997年
     

  • ヒューマンインタフェースの研究

  • マルチモ-ダルインタフェ-スを持つ知的CAIの語学教育への応用に関する研究

  • VLSIア-キテクチャ設計

  • 音声言語処理

  • Language Education based on ICAI system with Multi-modal Interface

  • Design of VLSI Architecture

  • Spoken Language Processing

▼全件表示

 

委員歴

  • 1998年
    -
     

    人工知能学会  会長

  • 1993年
    -
    1996年

    人工知能学会  理事,編集委員

  • 1988年
    -
    1996年

    電気学会  論文委員

  • 1988年
    -
    1996年

    人工知能学会  理事,編集委員

  • 1984年
    -
    1996年

    計測自動制御学会  企画委員,論文委員

  • 1974年
    -
    1996年

    電子情報通信学会  学会賞委員,論文委員,東京支部評議員

  • 1989年
    -
    1990年

    日本ロボット学会  理事

▼全件表示