2025/05/29 更新

写真a

キクチ ヒデアキ
菊池 英明
所属
人間科学学術院 人間科学部
職名
教授
学位
博士(情報科学) ( 早稲田大学 )

所属学協会

  •  
     
     

    ヒューマンインタフェース学会

  •  
     
     

    情報処理学会

  •  
     
     

    電子情報通信学会

  •  
     
     

    人工知能学会

  •  
     
     

    日本音響学会

研究分野

  • 感性情報学 / ヒューマンインタフェース、インタラクション / 知能情報学

研究キーワード

  • 音声科学、音声対話、ヒューマンエージェントインタラクション

受賞

  • 情報処理学会第53回全国大会大会優秀賞

    1996年03月  

 

論文

  • 雑談音声対話システムによる繰返し発話の多様性がユーザの共感と対話継続欲求に与える効果

    楊 潔, 菊池 浩史, 菊池 英明

    知能と情報   36 ( 4 ) 713 - 721  2024年11月

     概要を見る

    大規模言語モデルの登場により,ユーザの対話システムへの対話意欲の課題が解消されつつあるが,まだ十分とはいえない.ユーザの対話意欲を向上させるためには,対話システムによる共感的応答が有効であるとされている.また,繰返し発話には共感を示す機能があり,ユーザの対話意欲の向上に影響を与えると示唆されている.そこで,本研究では共感機能を持つ繰返し発話に着目し,対話ロボットによる繰返し発話の多様性がユーザの対話継続欲求に与える効果を検証する.GPT-4をベースに,繰返し発話を自動生成する雑談音声対話ロボットを構築し,対話実験を行った.その結果,ロボット行動特性不安感が強い被験者ほど,多様性の十分に高い繰返し発話を生成する対話ロボットに対する,被験者の知覚された共感及び対話継続欲求の評価が有意に高いことが確認できた.

    DOI

  • オプティカルフローを用いたreal-time MRI映像における調音運動検出・提示手法—A Method for Detecting and Displaying Articulation Movements in Real-time MRI Movies Using Optical Flow—特集 2022年電子・情報・システム部門大会

    大浦 杏奈, 浅井 拓也, 菊池 英明

    電気学会論文誌. C, 電子・情報・システム部門誌 = IEEJ transactions on electronics, information and systems   143 ( 7 ) 686 - 693  2023年07月

  • 雑談対話ロボットの言語的協同によるユーザの共感促進と対話継続欲求の向上

    楊 潔, 菊池 英明

    情報処理学会論文誌   62 ( 2 ) 772 - 781  2021年02月

     概要を見る

    言語的協同は対話参加者が相手の発話の一部を繰り返すなどの発話によって対話に参与する行為であり,対話の成功に重要な役割を果たす.本研究では人間同士の自由対話における繰返し型の言語的協同の特徴を明らかにしたうえで,対話ロボットによる言語的協同がユーザに与える効果を検証する.大学(院)生38人を対象としてWizard of Oz法による人間・ロボットの対話実験を行った.一対話中の繰返し発話の頻度によって実験の条件を低頻度・中頻度・高頻度に分け,同じ被験者が実験群(繰返し発話)と対照群(相槌)ですべての頻度条件の実験に参加した.被験者は対話ごとに共感と対話継続欲求に関わる3つの項目に対する5段階評価を行った.その結果から,高頻度の言語的協同は共感促進と対話継続欲求の向上に効果があることを明らかにした.また,言語的協同の頻度が高いほど共感の効果が顕著であることが分かった.被験者の属性と関連付けた分析から,ロボットへの否定的態度が強い・ロボットへの不安感が強いほど言語的協同の効果が高まることが示唆された.
    Linguistic alignment refers to the act in which participant participates utterance such as repeating the utterance of her partner and it plays an important role in a successful dialogue. In this research, we investigated feature values of linguistic alignment especially repeating utterance in human-human non-task-oriented dialogue. Based on the obtained feature values, we verified the influence on users by chat-oriented dialogue robot with linguistic alignment. We conducted a control experiment between human and robot using Wizard of Oz method for 38 subjects. According to the frequency of linguistic alignment during one dialogue, the experimental conditions were divided into low, medium, and high frequency. For each frequency condition, the same subject participated in both experimental group (repetition) and control group (backchannel). After each experiment, the subjects were required to answer three questions relating to empathy and desire of continuing dialogue using five-point Likert scale. As a result, the effect on users' empathy and desire of continuing dialogue by chat-oriented dialogue robot with linguistic alignment is investigated. Besides, it was found that the higher the frequency of linguistic alignment, the more remarkable the effect of empathy. Furthermore, it was suggested that the more negative and anxious the users' attitude toward the robot, the higher the effect of linguistic alignment.

    DOI CiNii

  • 日本語における言い間違いの発達過程-5-13歳児及び成人を対象とした発話誘発課題による検証-

    Iwamoto Kyoji, Kikuchi Hideaki, Mazuka Reiko

    音声研究   25  2021年

    J-GLOBAL

  • 歌唱音声における声質の特徴と想起される色の関係

    金礪 愛, 菊池 英明

    日本感性工学会論文誌   17 ( 1 ) 109 - 118  2018年

    DOI CiNii

  • Vowels in infant-directed speech: More breathy and more variable, but not clearer

    Kouki Miyazawa, Takahito Shinya, Andrew Martin, Hideaki Kikuchi, Reiko Mazuka

    COGNITION   166   84 - 93  2017年09月  [査読有り]

     概要を見る

    Infant-directed speech (IDS) is known to differ from adult-directed speech (ADS) in a number of ways, and it has often been argued that some of these IDS properties facilitate infants' acquisition of language. An influential study in support of this view is Kuhl et al. (1997), which found that vowels in IDS are produced with expanded first and second formants (F1/F2) on average, indicating that the vowels are acoustically further apart in IDS than in ADS. These results have been interpreted to mean that the way vowels are produced in IDS makes infants' task of learning vowel categories easier. The present paper revisits this interpretation by means of a thorough analysis of IDS vowels using a large-scale corpus of Japanese natural utterances. We will show that the expansion of F1/F2 values does occur in spontaneous IDS even when the vowels' prosodic position, lexical pitch accent, and lexical bias are accounted for. When IDS vowels are compared to carefully read speech (CS) by the same mothers, however, larger variability among IDS vowel tokens means that the acoustic distances among vowels are farther apart only in CS, but not in IDS when compared to ADS. Finally, we will show that IDS vowels are significantly more breathy than ADS or CS vowels. Taken together, our results demonstrate that even though expansion of formant values occurs in spontaneous IDS, this expansion cannot be interpreted as an indication that the acoustic distances among vowels are farther apart, as is the case in CS. Instead, we found that IDS vowels are characterized by breathy voice, which has been associated with the communication of emotional affect. (C) 2017 Elsevier B.V. All rights reserved.

    DOI

    Scopus

    42
    被引用数
    (Scopus)
  • Assigning a Personality to a Spoken Dialogue Agent by Behavior Reporting

    Yoshito Ogawa, Hideaki Kikuchi

    NEW GENERATION COMPUTING   35 ( 2 ) 181 - 209  2017年04月  [査読有り]

     概要を見る

    A method to assign a personality to a spoken dialogue agent is proposed and evaluated. The proposed method assigns a personality using agent reporting about behavior independent of interaction with a user. The proposed method attempts to assigning complex personalities. For this purpose, we have defined a behavior report dialogue and designed a personality assigning method using behavior reporting. The proposed method consists of three steps: collecting stereotypes between a personality and behavior through a questionnaire, designing the behavior report dialogue from the collected stereotypes, and agent reports about behavior at the start of interactions with a user. Experimental results show that the proposed method can assign a personality by repeating the behavior report dialogue, (the assigned personality is equivalent to the personality determined by the collected stereotypes) and that reporting behavior influences the assigned personality. In addition, we verified that the proposed method can assign "kind", "judicious" and the five basic personalities defined in the Tokyo University Egogram Second Edition.

    DOI

    Scopus

    2
    被引用数
    (Scopus)
  • 母語対話の話者交替タイミング

    市川 熹, 大橋 浩輝, 仲 真紀子, 菊池 英明, 堀内 靖雄, 黒岩 眞吾

    科学・技術研究   5 ( 1 ) 113 - 122  2016年

     概要を見る

    母語話者の話者交替時の重複タイミング現象である話者移行適格場(TRP)に注目し、日本語と英語について、それぞれの母語話者とその言語を十分に習得している非母語話者の実時間対話を分析した。両言語ともに、対話者が母語話者の組み合わせ以外ではTRPの制約が成立していなかった。このことは、非母語話者が発信している言語情報は話者交替の予告情報にはならず、言語情報の裏に必然的に存在するプロソディにあることを示唆している。また日本語母語話者の5歳児と6歳児と成人の対話を分析し、さらに先行研究結果を参考にしたところ、日本語母語のTRPの制約は5歳児ころまでに獲得されることが推察された。母語話者の話者交替タイミング制御のモデルを提案した。

    DOI CiNii

  • 音声言語コーパスにおける speaking style の自動推定―転記テキストに着目して―

    沈 睿, 菊池 英明

    自然言語処理   21 ( 3 ) 445 - 464  2014年

     概要を見る

    近年,計算機技術の進歩に伴って大規模言語データの蓄積と処理が容易となり,音声言語コーパスの構築と実用化の研究が盛んに行われている.我々は,speaking style に関心を持つ利用者に音声言語コーパスを探しやすくさせるために,音声言語コーパスの speaking style の自動推定を目指している.本研究では,1993 年に Eskenazi が提唱した speaking style の 3 尺度を導入し,従来の文体・ジャンルの判別や著者推定などの自然言語処理の分野で用いられた言語の形態論的特徴を手がかりとし,音声に付随する書き起こしテキスト(本論文では転記テキストと呼ぶ)に着目した speaking style 推定モデルの構築を試みた.具体的な手続きとしては,はじめに様々な音声言語コーパスから音声に付随する転記テキストを無作為に抽出する.次にこれらの転記テキストを刺激として用い,3 尺度の speaking style の評定実験を行う.そして,評定結果を目的変数,転記テキストの品詞・語種率と形態素パタンを説明変数とし,重回帰分析により 3 尺度それぞれの回帰モデルを求める.交差検定を行った結果,本研究の提案手法によって 3 尺度の内 2 尺度の speaking style 評定値を高い精度で推定できることを確認した.

    CiNii

  • 知識獲得モデルとしての自己組織化マップ:-連続音声からの教師なし音素体系の学習-

    宮澤 幸希, 白勢 彩子, 馬塚 れい子, 菊池 英明

    知能と情報   26 ( 1 ) 510 - 520  2014年

     概要を見る

    人の知識獲得のプロセスを計算論的に検証する目的で,大脳皮質感覚野の情報処理を模擬した自己組織化マップが用いられる.本論文の目的は,自己組織化マップを用いて,人の乳児が母国語の音素体系を獲得する過程を計算論的に解析することである.先行研究では自然な入力信号の分布特性(音素の出現頻度やフレーム数)が十分に考慮されていなかった.本研究では,自然な連続音声を入力としてシミュレーション実験を行なった.実験の結果,100秒程度の日本語の連続音声から,5 %(/u/)~92%(/s/)の精度で音素体系が獲得可能であることが示された.

    DOI CiNii

  • 演技指示の工夫が与える音声表現への影響 : 表現豊かな演技音声表現の獲得を目指して

    宮島 崇浩, 菊池 英明, 白井 克彦, 大川 茂樹

    音声研究   17 ( 3 ) 10 - 23  2013年12月

     概要を見る

    This paper explains the procedure to enhance the expressiveness in acted speech. We designed our own "format of acting script" referring to the theory of drama and created 280 acting scripts. We presented these acting scripts as acting directions to three actresses and collected 840 speech data. For comparison, using typical emotional words as acting directions, we also collected 160 speech data from each actress. Then, we compared tendencies of various features of each data type and each speaker and found that our acting scripts are effective on the enhancement of expressiveness in acted speech psychologically/acoustically.

    DOI CiNii

  • Learning Phonemic Vowel Length from Naturalistic Recordings of Japanese Infant-Directed Speech

    Ricardo A. H. Bion, Kouki Miyazawa, Hideaki Kikuchi, Reiko Mazuka

    PLoS ONE   8 ( 2 ) e51594 - e51594  2013年02月

    DOI

    Scopus

    29
    被引用数
    (Scopus)
  • 音声生成を前提としたテキストレベルでのキャラクタ付与

    沈睿, 菊池 英明, 太田 克己, 三田村 健

    情報処理学会論文誌   53 ( 4 ) 1269 - 1276  2012年04月

     概要を見る

    近年,擬人化インタフェースの研究開発がさかんに行われ,ユーザとそれらの人工物とのインタラクションが重要視されている.インタラクションを促進する手段の1つとして,ユーザにパートナ感や愛着を感じさせるため,エージェントのキャラクタ付与の必要性が高まっている.筆者らは,自動車内でロボティクス・エージェントが運転のサポートや情報コンテンツの提供などを行うインタフェースの開発を進めている.そこでは,音声メディアの利用が前提となり,音声表現によるエージェントのキャラクタ付与が必要である.本稿では,ユーザにおけるキャラクタ像の形成を制御することを目的として,テキストレベルでのキャラクタ付与の手法を検討する.まず,(1)自発音声に対する印象評定を行い,高い評価が得られた音声の転記テキストを集めた.続いて,(2)これらの転記テキストからキャラクタ像の形成に有効な言語パターンの抽出を行った.最後に,(3)これらの言語パターンをニュートラル文章に適用してキャラクタ付与文章を生成し,それに対する印象評定実験を行って言語パターンの有効性を検証した.その結果,抽出された言語パターンがキャラクタ像の形成に有効であることが分かり,本研究のアプローチの有効性が示された.Recently, the research in anthropomorphic interfaces is being conducted actively. Interactions between human users and those artifacts are considered of great importance. To make users have more partner feelings and favorable impressions, the characterization of agents, which is also one of the ways to enhance interactions, are becoming necessary. On the premise of using speech media, we attempt the characterization of Anthropomorphic vehicles interfaces that give routing and driving assistance by speech representation. In this paper, to control the formation of the types of impressions that perceived by users, the proposal is made to characterize anthropomorphic vehicles by text control. (1) Conducted an impression rating on spontaneous speeches and picked out the transcriptions of those speeches that were highly rated. (2) Extracted linguistic patterns that help to form impressions from the transcriptions. (3) Adapted those linguistic patterns into neutral texts to generate pattern-loaded texts, and using these texts, conducted an impression assessment to verify the effectiveness of those linguistic patterns. As a result, we found that those extracted linguistic patterns are effective in forming impressions and the approach in this study is considered feasible.

    CiNii

  • 同一対象を叙述した話し言葉と書き言葉の比較—Comparison between Spoken and Written Utterances Describing the Same Object—人とエージェントのインタラクション論文特集

    高松 亮, 菊池 英明

    電子情報通信学会論文誌. A, 基礎・境界 = The IEICE Transactions on Fundamentals of Electronics, Communications and Computer Sciences (Japanese edition). A / 電子情報通信学会 編   95 ( 1 ) 146 - 156  2012年01月

    CiNii

  • 自動車運転環境下におけるユーザーの受諾行動を促すシステム提案の検討

    宮澤 幸希, 影谷 卓也, 沈 睿, 菊池 英明, 小川 義人, 端 千尋, 太田 克己, 保泉 秀明, 三田村 健

    人工知能学会論文誌   25 ( 6 ) 723 - 732  2010年

     概要を見る

    In this study, we aim at clarification of the factor that promotes an user's acceptance of suggestion from an interactive agent in driving environment. Our aim is to figure out how human beings accept the encouragement from interaction objects, and also which kinds of dialogues or action controls are necessary for the design of car navigation system which makes suggestion and requests to drivers. Firstly, we had an experiment for collecting dialogue between humans in driving simulation environment, then we analyzed the drivers' acceptance and evaluation for the navigators. As the results, we found that the presence and reliability of the navigator highly relate to the acceptance of suggestion from the navigator. When navigators were next to drivers, the rate of drivers' suggestion acceptance rose. However, the stress of drivers increased. In addition, based on the linguistic and acoustic analysis of the navigators' utterances, we found out some points of designing system utterance of suggestion to promote user's acceptance. We found that expressing the grounds of suggestions, showing the exact numbers, and the wide pitch ranges, all highly relate to the acceptance of suggestions.

    DOI CiNii

    Scopus

  • 肯定的/否定的発話態度の認識とその音声対話システムへの応用

    藤江真也, 江尻康, 菊池英明, 小林哲則

    電子情報通信学会論文誌   J88-D-II ( 2 ) 489 - 498  2005年03月

     概要を見る

    音声による人間同士の対話は, 発話に含まれる言語情報に加え, 発話者の心的状態や対話調整的情報が韻律や顔表情, 頭部動作によって付加的に表現されることで円滑に進む.これら, 発話に付随して生起し, 言語情報の円滑な伝達を補助する情報をパラ言語情報と呼ぶ.本論文では, パラ言語情報として, 韻律と頭部ジェスチャに現れる発話者の発話態度を取り上げ, それぞれの認識手法を提案するとともにそれらを活用した対話ロボットを実現する.韻律による発話態度の認識は, 態度が肯定的か否定的かを, F_0パターンと音素の継続長を用いて識別する.頭部ジェスチャによる認識は, 肯定的動作をうなずき, 否定的動作をかしげと首振りとして定め, これら三つの動作をオプティカルフローを特徴量としHMMを確率モデルとして用いることによって認識する.実験により, これらの手法が人と同等の認識能力をもつことを示すとともに, これらを組み込んだ対話ロボットが従来にないリズムある効率的な対話を実現することを示す.

    CiNii

  • 日本語話し言葉コーパスの音声ラベリング(<特集>音声学と音声工学)

    菊池 英明, 前川 喜久雄, 五十嵐 陽介, 米山 聖子, 藤本 雅子

    音声研究   7 ( 3 ) 16 - 26  2003年

     概要を見る

    In an attempt to construct a large-scale database of spontaneous speech, the authors planned to give segmental and prosodic labels to spontaneous Japanese speech. This paper reports the method of this labeling and its performance. First, the performance of automatic segmental labeling by Hidden Markov Model was verified. Sample speech of about four hour long was automatically phoneme labeled and compared to the results of hand-labeling. It turned out that average of label boundary difference with hand labeled data was 14.3[ms]. Second, the performance of prosodic labeling by newly proposed labeling scheme named X-JToBI (eXtended J_ToBI) was verified. The analysis of labeled data showed that newly added inventories appeared in the data of spontaneous speech and rate of inter-labeler agreement increased in nearly all types of labels.

    DOI CiNii

  • 音声対話における心的状態変化の予測をともなうメタ発話生成機構

    菊池英明, 白井克彦

    情報処理学会論文誌   Vol.43, No.7 ( 7 ) 2130 - 2137  2002年07月

     概要を見る

    音声対話制御において,コミュニケーションの調整をはかるメタ的な発話の生成は重要な課題である.音声対話では,音声メディアの特性によって情報の授受とコミュニケーションの調整を同じチャネルで行うために時間のリソースを適切に分配する必要があるが,行為遂行中にも対話の状況や相互の心的状態が変化するためリソースの適切な分配は容易ではない.本研究では,ユーザの目標を協調的に達成するための計画立案の枠組みの中で,対話における相互の心的状態を認識・予測しながら,状況に適したメタ発話を生成する機構を提案する.具体的には,まず対話における状況を表現するための多次元心的状態モデルを定義する.多次元にすることにより各次元の独立性を高め,複雑な制御を可能にするとともにメンテナンス効率を向上させる.この多次元心的状態モデルを用いて認識・予測した心的状態を表す.次に,プラニングにおいて心的状態を参照しながらあらかじめ記述されたプラニングルールに従って目標を達成するために最適な行為を決定する機構を実現する.提案した機構を音声対話検索システムに導入し,評価実験を行った結果,対話の円滑さ向上に効果があることが確認できた.本稿では心的状態として発話権の状態およびシステム内部の処理状態を扱い,状態提示発話を適切に出力することを具体的に示したが,本機構では一般的な心的状態表現およびメタ発話行為を扱っている.
    In controlling spoken dialogues,it is important to generate meta-utterances which coordinate communication.To realize smooth conversation between human and machine,time resources should be appropriately divided into speakers because exchanges for problem-solving and coordinating communication are done in same channel.This is a feature of the speech dialogue medium.This research will propose the mechanism of generating meta-utterances with predicting changes of mental states in spoken dialogues.At first,we defined the model of multi-dimensional mental states for expressing situation in dialogues.By multi-dimensionality,independency of each dimension of states and efficiency of maintenance of them can be improved.Mental states, which are recognized and predicted, will be expressed by using this model.At next, we described the mechanism,which determine an appropriate action to achieve a goal by planning with the planning rules.These rules, in advance, are described with referring each dimension of mental states.By the preliminary experiments,we confirmed that the proposed model is efficient for improvement of smoothness of conversation and efficiency of problem-solving.

    CiNii

  • 「日本語話し言葉コーパス」における書き起こしの方法とその基準について

    小磯花絵, 土屋菜緒子, 間淵洋子, 斉藤美紀, 籠宮隆之, 菊池英明, 前川喜久雄

    日本語科学   Vol.9 ( 9 ) 43 - 58  2001年04月

     概要を見る

    国立国語研究所青山学院大学/国立国語研究所東京都立大学/国立国語研究所東京大学/国立国語研究所国立国語研究所国立国語研究所国立国語研究所国立国語研究所,通信総合研究所,東京工業大学では,科学技術振興調整費開放的融合研究制度『話し言葉の言語的・パラ言語的構造の解明に基づく「話し言葉工学」の構築』プロジェクトにおいて,自発性の高い話し言葉の情報処理基盤技術の確立を目標に活動を進めている。現在国立国語研究所では,このプロジェクトの一環として,モノローグを対象とした大規模な日本語話し言葉コーパスを作成している。このコーパスには,約700時間(約700万語に相当)の音声,書き起こしテキスト,および品詞や分節音,韻律などの情報が含まれる予定である。本稿では,本コーパスの書き起こしの方法とその基準について紹介する。

    DOI CiNii

  • 日本語話し言葉コーパスの設計

    前川喜久雄

    音声研究   4月2日 ( 2 ) 51 - 61  2000年08月

    CiNii

  • 対話効率の向上を目的とした音声対話制御のモデル化

    菊池 英明, 白井 克彦

    ヒューマンインタフェース学会誌   Vol.2, No.2 ( 2 ) 39 - 46  2000年05月

    CiNii

  • 課題遂行対話における対話潤滑語の認定

    中里 収, 田本 真詞, 菊池 英明, 吉村 隆, Shu Nakazato, Masafumi Tamoto, Hideaki Kikuchi, Takashi Yoshimura, Dept. of Management and Information Sciences faculty of International Studies Meio University, Media Information Laboratory NTT Communication Science Laboratories, Graduate School of Science and Engineering Waseda University

    人工知能学会誌   Vol.14, No.5 ( 5 ) 900 - 906  1999年09月

     概要を見る

    The Discourse Tagging Working Group has discussed and implemented several methods for tagging dialogue data over the past two years. In this report, our subgroup proposes a method for tagging 'lubricant' words, and show its application to discourse segmentation. We focus on utterances which help smooth the progress of conversation but do not themselves contribute to the objective of the dialogue. This class of utterances include discourse markers, fillers and acknowledgement tokens. Our aim is to formulate a means to tag such utterances. In order to clarify the classification of lubricant words, we first conducted a tagging experiment using the definition from the functional view. The results showed the diversity of the vocabularies identified as lubricant words, but nonetheless suggested the usefullness of lexical information regarding a limited subclass of the words. Thus, we can develop an automatic means to tag lubricant words based on their lexical information. Next, we applied our lubricant words tagging to discourse segmentation. We performed an experiment to check expected correlations between the discourse marker tags and the discourse segment tags. As a result, 64% of the discourse markers were indeed found to be located immediately after topic boundaries, compared to a chance level of 30%. The automatically extracted discourse markers are thus effective for the recognition of discourse segments.

    CiNii

  • 人間型ロボットの対話インタフェースにおける発話交替時の非言語情報の制御

    横山真男

    情報処理学会論文誌   Vol.40, No.2 ( 2 ) 487 - 496  1999年02月

    CiNii

  • 情報のら旋成長を支援するコミュニケーション形電子図書館

    芦沢 実, 菊池 英明, 三科 雄介, 藤澤 浩道, 日高 稔, 山崎 直子, 櫻井 彰人

    電子情報通信学会論文誌   Vol.J81-D-II, No.5 ( 5 ) 1014 - 1024  1998年05月

     概要を見る

    電子図書館は, サイバースペースの重要な構成要素の一つである.我々は, 利用者の視点から電子図書館のサービスを検討し, 情報のら旋形成長を支援するコミュニケーション形電子図書館システムのプロトタイプを開発した.このシステムは, WWWに接続し, 仮想個人図書館Webshelf, 情報公開サーバ, ハイパメディアアーカイブWebarchiveからなる.Webshelfは, 利用者が, WWWの情報を仮想的に個人化し, 利用者自身の視点で情報を組織化し, その組織化情報に基づいて新しい情報を創造し, 情報公開サーバで公開することを支援する.Webarchiveは, 情報の揮発性問題対策の一手法であり, 仮想的に個人化した情報のリンクの一貫性を維持する.

    CiNii

  • 音声対話インタフェースにおける発話権管理による割り込みへの対処

    菊池 英明, 工藤 育男, 小林 哲則, 白井 克彦

    電子情報通信学会論文誌   Vol.J77-D-II, No.8 ( 8 ) 1502 - 1511  1994年08月

     概要を見る

    音声を利用したマルチモーダルインタフェースのベースシステムとなる音声対話インタフェースにおいて,ユーザに発話のタイミングに関する自由を保証するための割込みの扱いについて検討した.ユーザに割込みを許すとき,従来のように1文を単位としてシステムの発話を計画するのでは,計画した発話内容と実際に発話した内容あるいはユーザが受け取った内容の間に差異が生じる.そこで,発話の計画の単位を,1文中の伝えるべき情報と定め,対話中に話者間でやりとりされる発話権を管理することにより,どの情報が受聴されたかを常に把握する方式を提案した.実験の結果,提案した方式によって,システムが計画した発話とユーザが受聴した発話の差異をなくしながら,スムーズな割込みへの対処が被験者の半数以上に認められた.また,割込みに対処することにより,ユーザのタスク完了までの所用時間は7%減少し,積極的な話題提起数が21%増えるなど,インタフェースの利便性が向上することが確認された.

    CiNii

  • Three Different LR Parsing Algorithm for Phoneme-Context-Dependent HMM-Based Continuous Speech Recognition

    NAGAI Akito, Sagayama Shigeki, Kita Kenji, Kikuchi Hideaki

    IEICE Trans. Inf. &amp; Sys.   Vol.E76-D, No.1   29 - 37  1993年01月

     概要を見る

    This paper discusses three approaches for combining an efficient LR parser and phoneme-context-dependent HMMs and compares them through continuous speech recognition experiments. In continuous speech recognition, phoneme-context-dependent allophonic models are considered very helpful for enhancing the recognition accuracy. They precisely represent allophonic variations caused by the difference in phoneme-contexts. With grammatical constraints based on a context free grammar (CFG), a generalized LR parser is one of the most efficient parsing algorithms for speech recognition. Therefore, the combination of allophonic models and a generalized LR parser is a powerful scheme enabling accurate and efficient speech recognition. In this paper, three phoneme-context-dependent LR parsing algorithms are proposed, which make it possible to drive allophonic HMMs. The algorithms are outlined as follows: (1) Algorithm for predicting the phonemic context dynamically in the LR parser using a phoneme-context-independent LR table. (2) Algorithm for converting an LR table into a phoneme-context-dependent LR table. (3) Algorithm for converting a CFG into a phoneme-context-dependent CFG. This paper also includes discussion of the results of recognition experiments, and a comparison of performance and efficiency of these three algorithms.

    CiNii

▼全件表示

書籍等出版物

  • "感情の音声表出", 石井克典監修「IoHを指向する感情・思考センシング技術」

    菊池英明

    CMC出版  2019年 ISBN: 9784781314303

  • "音声対話システム", 白井克彦編著「音声言語処理の潮流」

    菊池英明

    コロナ社  2010年

  • “Outline of J_ToBI”, in "COMPUTER PROCESSING OF ASIAN SPOKEN LANGUAGES"

    KIKUCHI Hideaki

    Americas Group Publications,U.S.  2010年 ISBN: 0935047727

  • "音声コミュニケーションの分析単位 -ToBI-", 坊農真弓, 高梨克也編,「多人数インタラクションの分析手法」

    菊池英明

    オーム社  2009年

  • "韻律を利用した対話状態の推定", 広瀬啓吉 編「韻律と音声言語情報処理」

    菊池英明, 白井克彦

    丸善  2006年 ISBN: 4621076744

  • "Voicing in Japanese," Van de Weijer, Nanjo, Nishihara (Eds.)

    MAEKAWA Kikuo, KIKUCHI Hideaki

    Mouton de Gruyter, Berlin and New York  2006年

  • "Spoken Language Systems", S. Nakagawa et al. (Eds.)

    HATAOKA Nobuo, ANDO Haru, KIKUCHI Hideaki

    Ohmsha/IOS Press  2005年 ISBN: 427490637x

▼全件表示

講演・口頭発表等

  • 日常会話音声においてポップアウト評価に影響を与える 音響特徴量の検討

    萬谷 和樹, 菊池 英明

    音声コミュニケーション研究会資料   音声コミュニケーション研究委員会  

    発表年月: 2024年09月

    開催年月:
    2024年09月
     
     

     概要を見る

    雑音・騒音環境下において通りやすい声「ポップアウトボイス」に注目する.先行研究においてポップアウトボイスは背景雑音など妨害音の中で目立って知覚される音声と定義されている.ポップアウトボイスに関連すると予想される要素として,「言語的特徴」「スペクトル形状」「反響の程度」「背景雑音の種類や性質」などが挙げられている.そこで本研究では背景雑音の種類や大きさに注目し,日常会話を収録した音声を対象に,背景雑音によってポップアウト評価に影響を与える音響特徴量がどのように異なるかを検討する.

  • 音声信号から real-time MRI 調音運動動画を 推定するモデルの構築と検証- 発話者独立型モデルの構築に向けて -

    大浦 杏奈, 菊池 英明

    音声コミュニケーション研究会資料   音声コミュニケーション研究委員会  

    発表年月: 2024年09月

    開催年月:
    2024年09月
     
     

     概要を見る

    音声信号から調音運動を逆推定する技術はAAI(Acoustic-to-articulatoryinversion)と呼ばれる.最新のAAI研究では,発話者1名のrtMRI(real-timeMRI)動画を用いた発話者依存型モデルが構築されている.本研究では,モデル構築時とは異なる発話者の音声信号をモデルに入力し,推定された調音運動動画の妥当性を目視により分析し検証した.その結果,異なる発話者のモデルでも調音運動らしい運動は観察されるものの,同話者のモデルによる結果とは音声学的に構造が異なる調音運動が推定されていることが確認された.したがって,現状のモデルで多話者を扱うには限界がある可能性が示された.今後は定量的な評価指標を用いた分析を実施し,発話者に依存しない独立型モデルの構築に取り組む.

  • 語用論的対話方策を使用するルールベースの対話システム

    楊 潔, 菊池 浩史, 中下 咲帆, 藤後 英哲, 菊池 英明

    人工知能学会研究会資料 言語・音声理解と対話処理研究会   一般社団法人 人工知能学会  

    発表年月: 2022年12月

    開催年月:
    2022年12月
     
     

     概要を見る

    本稿は談話研究の知見を活用し、SUNABAでマルチモーダル対話システムを作成した。謝罪対話と自由対話に分け、シチュエーションに適するかつ人らしさが感じられる工夫をした。謝罪対話の部分では、人同士の謝罪場面における語用論的方策、使用率及び方策の順番を参考に、システム発話を作成した。また、被謝罪側による応答の種類に応じて条件分岐を作成した。さらに、共感を示す発話や非流暢性発話など、人らしさを高めるための工夫をした。一方、自由対話の部分では、システムによる質問や暗黙的な話題転換などの方策を用いて、システム主導の対話シナリオを作成した。音声(ピッチ、音量、話速)とジェスチャについては、連続で同じ調整の応答にならない制御を基本指針とした。また、謝罪の流れに応じた想起される謝罪側の欲求を考慮して制御を行った。評価の結果、本システムは予選で四位の評価を得た。

  • 音声対話システムの応答音声のパラ言語情報に対するユーザの許容評価モデルの検討

    菊池 浩史, 楊 潔, 菊池 英明

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2022年

    開催年月:
    2022年
     
     

     概要を見る

    現在、日本は高齢者の単独世帯や介護・子守り現場、コロナ禍における外出自粛などの社会背景から対話相手の需要が高まっている。会話の頻度が低くなることで健康の低下が懸念される。このような対話相手の需要に音声対話システムの活用が期待される。雑談相手となる対話システムの役割の一つに心的状態の共有がある。ユーザが表出した心的状態に対して、ユーザが許容できないパラ言語情報での応答を対話システムがすることによって対話が破綻し、ユーザの対話継続欲求が下がる問題がある。このような破綻の問題は人間と共生する音声対話システムを実現するための障壁となる。本研究は、このような破綻の問題の解決を目指す。我々はこれまでに、ユーザ発話とシステム応答が表出する快不快状態に着目し、ユーザ発話へのシステム応答に対する許容範囲の存在を、多様なユーザ発話を用いて確認した。本稿では、ユーザ発話に表出される快不快状態によって許容されるシステム応答の傾向が異なることを示したうえで、許容されるシステム応答を出力可能にするための快不快状態に基づく許容評価モデルについて述べる。

  • 雑談対話システムにおけるユーザの許容範囲を考慮した多様な同調応答の検討

    菊池 浩史, 楊 潔, 菊池 英明

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2021年

    開催年月:
    2021年
     
     

     概要を見る

    現在、日本は高齢者の単独世帯が増えている。高齢者の単独世帯において、会話の頻度が低くなっている。会話の頻度が低くなることで健康の低下が懸念される。さらにコロナ禍において、外出自粛が求められ人と話す機会が減った。人と話す機会が減ることで、精神的な健康が損なわれている。このような対話相手の需要に音声対話システムの活用が期待される。雑談相手となる対話システムの役割の一つに心的状態の共有がある。ユーザが表出した心的状態に対して、ユーザが許容できないパラ言語情報での応答を対話システムがすることによって、ユーザの対話継続欲求が下がる問題がある。本研究は、このような破綻の問題の解決を目指す。我々はこれまでにユーザ発話へのシステム応答に対する許容範囲の存在を、一名の話者によるユーザ発話音声を用いて確認した。本稿では、ユーザ発話の話者を増やして許容範囲の存在を確認する実験について述べる。9名の話者によるユーザ発話音声を収録したうえで、収録された音声とシステム応答による汎用性の高い相槌を接続した音声刺激に対して、聴取評価実験を行い、多様なユーザ発話での許容範囲を調査した。

  • 雑談対話システムの応答に対するユーザの許容範囲の調査—パラ言語情報に着目して

    菊池 浩史, 楊 潔, 菊池 英明

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2020年

    開催年月:
    2020年
     
     

     概要を見る

    現在、日本は超高齢化社会を迎えつつある。独居高齢者は他人と会話する頻度が低く、また、困ったときに頼れる人がいない傾向がある。そうした独居高齢者などの社会的孤立解消に対話エージェントの活用が期待される。雑談相手となる対話システムの役割の一つに心的状態の共有がある。ユーザが表出した心的状態に対して、ユーザが許容できないパラ言語情報での応答を対話システムがすることによって、ユーザの対話継続欲求が下がるという問題が存在する。本研究はこのような破綻の問題の解決を目指す。ユーザとシステムの対話を想定して、固定したユーザ発話と汎用性の高い相槌の「そうですか」というシステム発話を接続した音声刺激を用意し、聴取評価実験を行なった。分析を通してパラ言語情報に着目した応答多様性の許容範囲を調査した。許容範囲において、ユーザ発話の快不快状態とシステム発話の快不快状態にはある程度の相関が見られた。調査結果の考察から、ユーザ発話への相槌応答のパラ言語情報の特徴を許容範囲にするための指針の提案につなげる。

  • 対話ロボットの言語的協同によるユーザの共感と対話継続欲求に及ぼす影響

    楊 潔, 菊池 英明

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2020年

    開催年月:
    2020年
     
     

     概要を見る

    言語的協同は対話参加者が繰り返し発話などを通じて相手に似せた方法で対話に参与する行為である。本研究では人間同士の自由対話における繰り返し型の言語的協同の特徴量を分析した上で、ユーザの属性を考慮にいれて対話ロボットによる言語的協同がユーザに与える効果を検証する。大学(院)生38人を対象としてWOZ法による対話実験を行なった。実験の条件は一対話中の協同発話の頻度によって低頻度・中頻度・高頻度に分け、頻度条件ごとに実験群(協同発話)と対照群(相槌)を設けた。被験者は対話ごとに共感と対話継続欲求に関わる三つの項目に対する5段階評価を行なった。その結果から、高頻度の言語的協同は共感促進と対話継続欲求2の向上に効果があると考えられた。また、本実験の範囲で、言語的協同の頻度が高いほど共感の効果が顕著であることが考えられた。最後に、ロボットへの否定的態度が強いユーザ・ロボットへの不安感が強いユーザほど言語的協同の効果が高まることが示唆された。

  • 対話ロボットの言語的協同による共感促進の効果とユーザの対話継続欲求への影響

    楊 潔, 菊池 英明

    人工知能学会研究会資料 言語・音声理解と対話処理研究会   一般社団法人 人工知能学会  

    発表年月: 2019年11月

    開催年月:
    2019年11月
     
     
  • 音声学的手法に基づいた子どもの発話速度の発達過程の解析

    岩本教慈, 岩本教慈, 近藤綾子, 菊池英明, 菊池英明, 馬塚れい子

    電子情報通信学会技術研究報告  

    発表年月: 2018年

    開催年月:
    2018年
     
     
  • 音楽ジャンル印象を考慮したメロディ自動編曲

    伊藤, 康佑, 金礪, 愛, 菊池, 英明

    第79回全国大会講演論文集   情報処理学会  

    発表年月: 2017年03月

    開催年月:
    2017年03月
     
     

     概要を見る

    本稿では,日本のポピュラー音楽のメロディ聴取時における,音楽ジャンル印象を考慮した自動編曲手法の提案を行う.従来の編曲手法と異なり,音楽ジャンル印象に基づいた編曲を行う点,複数の音楽ジャンルが混在したメロディの編曲を行う点から,多様な編曲結果を得ることを目標としている.日本人の被験者を対象とした印象評価実験を行い,メロディの特徴から音楽ジャンル印象の推定を行うモデルの構築を行った.また,モデルの構築結果を考慮し,ユーザが入力したメロディに対し,音楽ジャンル印象を任意の値に調節したメロディへ編曲を行うことができる,メロディ自動編曲システムの開発を行った.

  • 日本語対話における母語話者と非母語話者の話者交替についての差異

    張,雪薇, 菊池,英明

    社会言語科学会第39回研究大会  

    発表年月: 2017年03月

    開催年月:
    2017年03月
     
     
  • 音声学的手法に基づいた児童の発話速度の発達過程の解析

    岩本教慈, 近藤綾子, 菊池英明, 馬塚れい子

    日本音響学会研究発表会講演論文集(CD-ROM)  

    発表年月: 2017年

    開催年月:
    2017年
     
     
  • Humor utterance generation for non-task-oriented dialogue systems

    Shohei Fujikura, Yoshito Ogawa, Hideaki Kikuchi

    HAI 2015 - Proceedings of the 3rd International Conference on Human-Agent Interaction   Association for Computing Machinery, Inc  

    発表年月: 2015年10月

    開催年月:
    2015年10月
     
     

     概要を見る

    We propose a humor utterance generation method that is compatible with dialogue systems, to increase "desire of continuing dialogue". A dialogue system retrieves leading-item: noun pairs from Twitter as knowledge and attempts to select the most humorous reply using word similarity, which reveals that incongruity can be explained by the incongruity-resolution model. We consider the differences among individuals, and confirm the validity of the proposed method. Ex-perimental results indicate that high-incongruity replies are significantly effective against low-incongruity replies with a limited condition.

  • Constructing the corpus of infant-directed speech and infant-like robot-directed speech

    Ryuji Nakamura, Kouki Miyazawa, Hisashi Ishihara, Ken'ya Nishikawa, Hideaki Kikuchi, Minoru Asada, Reiko Mazuka

    HAI 2015 - Proceedings of the 3rd International Conference on Human-Agent Interaction   Association for Computing Machinery, Inc  

    発表年月: 2015年10月

    開催年月:
    2015年10月
     
     

     概要を見る

    The characteristics of the spoken language used to address infants have been eagerly studied as a part of the language acquisition research. Because of the uncontrollability factor with regard to the infants, the features and roles of infantdirected speech were tried to be revealed by the comparison of speech directed toward infants and that toward other listeners. However, they share few characteristics with infants, while infants have many characteristics which may derive the features of IDS. In this study, to solve this problem, we will introduce a new approach that replaces the infant with an infant-like robot which is designed to control its motions and to imitate its appearance very similar to a real infant. We have now recorded both infant-and infantlike robot-directed speech and are constructing both corpora. Analysis of these corpora is expected to contribute to the studies of infant-directed speech. In this paper, we discuss the contents of this approach and the outline of the corpora.

  • スペクトル包絡の伸長による乳児音声の合成手法の提案とその評価

    岩本教慈, 宮澤幸希, 金礪愛, 馬塚れい子, 菊池英明

    日本音響学会研究発表会講演論文集(CD-ROM)  

    発表年月: 2015年

    開催年月:
    2015年
     
     
  • 母語(日本語)獲得と年長園児の話者交替タイミング—Mother Tongue ( Japanese ) Acquisition and Talker Alternation Timing of Elder Nursery School Child

    市川 熹, 川端 良子, 菊池 英明

    日本音響学会研究発表会講演論文集 日本音響学会 編   東京 : 日本音響学会  

    発表年月: 2014年

    開催年月:
    2014年
     
     
  • 非タスク指向対話システムにおけるマイクロブログを用いたユーモア発話の自動生成(マイクロブログ,第5回集合知シンポジウム)

    藤倉 将平, 小川 義人, 菊池 英明

    電子情報通信学会技術研究報告. NLC, 言語理解とコミュニケーション   一般社団法人電子情報通信学会  

    発表年月: 2013年11月

    開催年月:
    2013年11月
     
     

     概要を見る

    本研究では非タスク対話システムにTwitterを用いてユーモア発話を自動生成させることを目指している.これまでに対話継続欲求の高いシステムのデザイン手法の確立を目的とし,「次回も対話を行いたい」と感じる要因を分析した.その中でユーモアを扱うことは対話継続欲求について有効であることが示された.本論文ではTwitterからアイテム述語ペア,修飾-名詞ペアを抽出し,それを対話システムの知識とすることで,システムがリアリティの高い応答を行いユーモアを生成する手法を提案した.また評価実験において提案手法を用いる対話システムがユーモアを生成できることを確認した.

  • 音声対話システムに対するインタラクション継続欲求(オーガナイズドセッション:対話システムの評価【評価・分析】,音声・言語・対話,一般)

    菊池 英明, 宮澤 幸希, 小川 義人, 藤倉 将平

    電子情報通信学会技術研究報告. SP, 音声   一般社団法人電子情報通信学会  

    発表年月: 2013年09月

    開催年月:
    2013年09月
     
     

     概要を見る

    音声対話システムの実用化が進む中で、日常で用いられるシステムやエンターテイメント性を要求されるシステムにおいては,ユーザが長期間利用し続けられる,対話継続欲求の高いデザインが求められると考え、3つの雑談対話システム構築を通じて対話継続欲求の向上を目指してきた。ユーモア発話の生成や、システム発話の発話速度の制御、そしてユーザ発話からのパーソナリティ推定に応じた発話生成がいずれも対話継続欲求の向上に効果的であることを確認した。従来、タスク指向の対話システムにおいてはタスク達成時間など効率が重視されることが多かったが、非タスク指向の対話システムではこのようなインタラクション継続欲求を高めるデザイン方法の確立が重要と考える。

  • E-037 音声から疲労程度を推定するスマートフォン用アプリケーションの開発(E分野:自然言語・音声・音楽)

    青木 由希, 宮島 崇浩, 菊池 英明, 塩見 格一

    情報科学技術フォーラム講演論文集   FIT(電子情報通信学会・情報処理学会)運営委員会  

    発表年月: 2013年08月

    開催年月:
    2013年08月
     
     
  • J-054 ロボット発話の話速・無音区間長の制御によるパーソナリティ認知と対話継続欲求の向上(J分野:ヒューマンコミュニケーション&インタラクション,一般論文)

    竹矢 有輝, 小川 義人, 菊池 英明

    情報科学技術フォーラム講演論文集   FIT(電子情報通信学会・情報処理学会)運営委員会  

    発表年月: 2013年08月

    開催年月:
    2013年08月
     
     
  • 音声対話における親密度と話し方の関係(力触覚の計算,手,一般)

    中里 収, 大城 裕志, 菊池 英明

    電子情報通信学会技術研究報告. HIP, ヒューマン情報処理   一般社団法人電子情報通信学会  

    発表年月: 2013年03月

    開催年月:
    2013年03月
     
     

     概要を見る

    本研究では,人の話し方は親密度によってどのように変化するのかを調べた.評価に使用するデータとして,大学生の初対面の時の対話データ(低親密度)と知り合って6ヶ月後の対話データ(高親密度)の2種類の対話データを準備した.その後,3ペアの話者に対して評価実験を行い,被験者が話し方の印象を評価し,4つの因子「快活さ」「好ましさ」「話し上手」「速さ感」を抽出した.初対面の時の話し方の印象と,知り合って半年経過した時の話し方の印象を比較した結果,低親密度のデータでは話し相手にかかわらず因子ごとの得点は同じ傾向になり,親密度が高くなると話し相手によって得点が変化した.特に,親密度が高くなると「話し上手」因子の得点が高くなる傾向が見られた.

  • エージェントによるユーザ特性の把握が愛着感に与える影響(オーガナイズドセッション(一般講演),音声アプリケーション,一般)

    小川 義人, 原田 花歩, 菊池 英明

    電子情報通信学会技術研究報告. SP, 音声   一般社団法人電子情報通信学会  

    発表年月: 2013年02月

    開催年月:
    2013年02月
     
     

     概要を見る

    本研究では、エージェントによるユーザ特性の把握がエージェントへの愛着感および対話継続欲求に与える影響を考察する。近年、音声対話システムをユーザに長く使い続けてもらうための戦略が活発に研究されている。我々は、音声の韻律情報からユーザの活性度を推定し、推定結果に基づく発話へのユーザ応答より実際の活性度を取得、韻律と実際の活性度を次回以降の推定に用いる学習データとして蓄積し、徐々に推定精度を向上させていく音声対話システムを提案する。被験者実験の結果より、提案手法を用いることであらかじめ作成した判別基準のみを用いる手法よりも安定して状態判別精度が向上すること、状態判別精度が高いほどユーザはシステムが自分の特性を把握していると感じ、よりシステムに愛着を抱く傾向があることが明らかになった。

  • 対話システムと心的負担

    市川 熹, 滝沢 恵子, 菊池 英明, 大橋 浩輝, 堀内 靖雄, 黒岩 眞吾

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2013年

    開催年月:
    2013年
     
     

     概要を見る

    &lt;p&gt;高齢者や障害者をユーザとして想定した場合,ユーザへの負荷が小さいシステムが必要となる.しかし,現状の多くのシステムでは自然な対話が実現できておらず,ユーザに負担を課している.本研究では,非母語・母語対話における話者交替のタイミングを分析し,非母語話者-母語話者間で話者交替の様相が異なることを示す.この結果は,母語の対話では,参与者が互いに負荷を軽減するように話者交替を行っているこが示唆された.&lt;/p&gt;

  • ポピュラー音楽のための歌唱音声評価尺度の構築 : アマチュア歌唱における検討(オーガナイズドセッション「多様な音声・歌声の合成に向けて」,音声・言語・対話,一般)

    金礪 愛, 菊池 英明

    電子情報通信学会技術研究報告. SP, 音声   一般社団法人電子情報通信学会  

    発表年月: 2013年01月

    開催年月:
    2013年01月
     
     

     概要を見る

    歌声に関する研究の発展に伴い、多様な歌声の印象を適切に評価できる尺度の需要は益々高まると考えられるため、本研究では「ポピュラー音楽における歌唱音声評価尺度」の構築を行った。今回は、アマチュア歌唱音声に対する有効性を検討し、3因子×4語、計12語からなる歌唱音声評価尺度を構築し、信頼性を確認した。また、歌唱音声評価に関わる因子として、話声とは異なる、歌唱音声独特の因子が観察された。

  • マルチタイムスケール音韻獲得モデルを用いた対乳児音声の特性解析

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    聴覚研究会資料   日本音響学会聴覚研究委員会  

    発表年月: 2012年03月

    開催年月:
    2012年03月
     
     
  • 音声の発話者印象情報の知覚・認知モデル構築—Modeling of perception and cognition process of impressions of speaker

    佐藤 安里, 菊池 英明, 市川 熹

    電子情報通信学会技術研究報告 = IEICE technical report : 信学技報   東京 : 電子情報通信学会  

    発表年月: 2012年03月

    開催年月:
    2012年03月
     
     
  • マルチタイムスケール音韻獲得モデルを用いた対乳児音声の特性解析

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    電子情報通信学会技術研究報告. SP, 音声   一般社団法人電子情報通信学会  

    発表年月: 2012年03月

    開催年月:
    2012年03月
     
     

     概要を見る

    我々は自然な連続音声からの音韻獲得モデルを提案する.提案法は人が音声の時間的な変化を知覚するメカニズムを模擬しており,教師なしで入力された言語の音韻の数と境界を推定することができる.本研究では,人の言語獲得研究において議論される,対乳児発話音声(Infant Directed Speech, IDS)の特徴である「変動性」の役割を明確にするため,提案モデルを使用して対成人音声(Adult Directed Speech, ADS)とIDSを入力とした学習を行い,結果を比較した.その結果,IDSはADSに比べて無声破裂子音の認識率が有意に高かった.そのため,IDSは非定常な音素の音響特徴を強調し,その獲得を補助する可能性が示された.

  • パラ言語情報の音声知覚 : 小学生と大学生の比較—Perception of Paralinguistic Information in Speech : A Comparison between Elementary School Children and University Students

    有賀 亮, 菊池 英明

    論叢 : 玉川大学教育学部紀要 / [玉川大学教育学部] [編]   町田 : 玉川大学教育学部  

    発表年月: 2012年

    開催年月:
    2012年
     
     
  • 音声コーパスの類似性可視化システムの改良

    石本祐一, 板橋秀一, 山川仁子, 沈睿, 菊池英明, 松井知子

    日本音響学会2011年春季研究発表会講演論文集  

    発表年月: 2011年03月

    開催年月:
    2011年03月
     
     
  • The multi timescale phoneme acquisition model of the self-organizing based on the dynamic features

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    Proceedings of Interspeech  

    発表年月: 2011年

    開催年月:
    2011年
     
     
  • The Multi Timescale Phoneme Acquisition Model of the Self-Organizing Based on the Dynamic Features

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    Proceedings of INTERSPEECH 2011  

    発表年月: 2011年

    開催年月:
    2011年
     
     
  • 連続音声からの音韻カテゴリ獲得モデルに関する考察

    宮澤 幸希, 三浦 英朗, 菊池 英明, 馬塚 れい子

    人工知能学会全国大会論文集   一般社団法人 人工知能学会  

    発表年月: 2011年

    開催年月:
    2011年
     
     

     概要を見る

    <p>健常な乳児は生後一年以内に母国語の音韻を獲得する。乳児は周囲の成人の言語入力に基づいた学習を行っていると考えられるが、詳細なメカニズムは明らかになっていない。そこで我々では、自然な連続音声の入力と、ヒトの認知能力を模擬したニューラルネットワークモデルによる音韻体系範疇化のシミュレーションを行っている。本研究では、母音と子音を音声の動的特徴に基づいて同一のモデルで取り扱う手法について報告する。</p>

  • 音声インタフエース評価のための音声からの心情推定

    袋 菜津子, 菊池 英明

    ヒューマンインタフェース学会論文誌   ヒューマンインタフェース学会  

    発表年月: 2010年11月

    開催年月:
    2010年11月
     
     
  • Unsupervised learning of vowels from continuous speech based on self-organized phoneme acquisition model

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    Proceedings of Interspeech  

    発表年月: 2010年

    開催年月:
    2010年
     
     
  • 印象語から想起した音声情報の特徴量空間の分析—Analysis of feature space of voice information recalled from impression words

    宮島 崇浩, 菊池 英明, 榑松 明

    言語・音声理解と対話処理研究会 / 人工知能学会 [編]   東京 : 人工知能学会  

    発表年月: 2009年03月

    開催年月:
    2009年03月
     
     
  • 対乳児発話の母音の時間構造-理研日本語母子会話コーパスを用いた分析-

    宮澤 幸希, 菊池 英明, 馬塚 れい子

    電子情報通信学会技術研究報告 Vol.109, No.308  

    発表年月: 2009年

    開催年月:
    2009年
     
     
  • 印象空間における音声と文字の対応関係の分析—Analysis on relationship between voice and characters using impression space

    宮島 崇浩, 菊池 英明, 榑松 明

    言語・音声理解と対話処理研究会 / 人工知能学会 [編]   東京 : 人工知能学会  

    発表年月: 2008年07月

    開催年月:
    2008年07月
     
     
  • 『日本語話し言葉コーパス』のXML文書—話し言葉の日本語 ; 日本語話し言葉コーパス

    菊池 英明

    日本語学   東京 : 明治書院  

    発表年月: 2008年04月

    開催年月:
    2008年04月
     
     
  • 日本語話し言葉コーパスを利用した句末境界音調に関する一考察—A study of prosodic phrase boundary in the corpus of spontaneous Japanese

    谷口 未希, 菊池 英明

    言語・音声理解と対話処理研究会 / 人工知能学会 [編]   東京 : 人工知能学会  

    発表年月: 2007年07月

    開催年月:
    2007年07月
     
     
  • B10. アクセント句を単位としてみた自発音声の韻律特徴 : 韻律境界強度の予備的分析(研究発表,日本音声学会2007年度(第21回)全国大会発表要旨)

    前川 喜久雄, 菊池 英明

    音声研究   日本音声学会  

    発表年月: 2007年

    開催年月:
    2007年
     
     
  • 韻律情報を用いた発話態度認識とその対話システムへの応用

    八木大三, 藤江真也, 菊池英明, 小林哲則

    日本音響学会2005年春季研究発表会講演論文集  

    発表年月: 2005年03月

    開催年月:
    2005年03月
     
     
  • 早稲田大学eスクールの実践:大学教育におけるeラーニングの展望

    向後千春, 松居辰則, 西村昭治, 浅田匡, 菊池英明, 金群, 野嶋栄一郎

    第11回日本教育メディ ア学会年次大会発表論文集  

    発表年月: 2004年10月

    開催年月:
    2004年10月
     
     
  • 韻律情報を利用した文章入力システムのための韻律制御モデル

    大久保崇, 菊池英明, 白井克彦

    日本音響学会2004年秋季研究発表会講演論文集  

    発表年月: 2004年09月

    開催年月:
    2004年09月
     
     
  • 音声対話における発話の感情判別

    小林季実子, 菊池英明, 白井克彦

    日本音響学会2004年秋季研究発表会講演論文集  

    発表年月: 2004年09月

    開催年月:
    2004年09月
     
     
  • 日本語話し言葉コーパス

    竹内和広

    国立国語研究所  

    発表年月: 2004年03月

    開催年月:
    2004年03月
     
     
  • 韻律情報を用いた肯定的/否定的態度の認識

    八木大三, 藤江真也, 菊池英明, 小林哲則

    日本音響学会2004年春季研究発表会講演論文集  

    発表年月: 2004年03月

    開催年月:
    2004年03月
     
     
  • アイヌ語音声データベース

    早稲田大学語学教育研究所  

    発表年月: 2004年03月

    開催年月:
    2004年03月
     
     
  • Spoken Dialogue System Using Prosody As Para-Linguistic Information

    FUJIE Shinya, YAGI Daizo, MATSUSAKA Yosuke, KIKUCHI Hideaki, KOBAYASHI Tetsunori

    proc. of SP2004(International Conference Speech Prosody,2004)  

    発表年月: 2004年03月

    開催年月:
    2004年03月
     
     
  • Corpus of Spontaneous Japanese: Design, Annotation and XML Representation

    Kikuo Maekawa, Hideaki Kikuchi, Wataru Tsukahara

    International Symposium on Large-scale Knowledge Resources (LKR2004)  

    発表年月: 2004年03月

    開催年月:
    2004年03月
     
     
  • 音声対話における韻律を用いた話題境界検出

    大久保崇, 菊池英明, 白井克彦

    電子情報通信学会技術報告  

    発表年月: 2003年12月

    開催年月:
    2003年12月
     
     
  • パラ言語の理解能力を有する対話ロボット

    藤江真也, 江尻康, 菊池英明, 小林哲則

    情報処理学会音声言語情報処理研究会   一般社団法人情報処理学会  

    発表年月: 2003年10月

    開催年月:
    2003年10月
     
     

     概要を見る

    音声対話における人間同士のやり取りは,発話に含まれる言語情報だけでなく,それを補助する別の情報も活用して行なわれていると考えられる.この発話に付随して生成され言語情報の円滑な伝達を補助する情報をパラ言語情報と呼ぶ.本論文では,パラ言語情報として,韻律情報を用いた態度認識と画像情報を用いた頭部ジェスチャの認識手法を示すとともに,それを用いた対話システムを構築する.前者は,発話者の態度が肯定的か否定的かを,F0パターンと音素アライメントを用いて識別する.後者は頷き,傾げ,横振りの3ジェスチャを,オプティカルフローを特徴量,left to right HMMを確率モデルとして用いることによって認識する.実験結果からこれらの手法が,パラ言語情報としてユーザの態度を表すのに十分な性能を持っていることを示す.The human-human interactions in a spoken seem to use not only linguistic information in the utterances but also some sorts of additional information supporting linguistic information. We call these sorts of additional information "para-linguistic information". In this paper, we present a recognition method of attitudes by prosodic information, and a recognition method of head gestures. In the former method. in order to recognize two attitudes, such as "positive" and "negative", F0 pattern and phoneme alignment are introduced as features. In the latter method, in order to recognize three gestures, such as "nod", "tilt" and "shake", left-to-right HMM is introduced as the probabilistic model as well as optical flow is introduced as features. Experimental results show that these methods are sufficient to recognize user's attitude as para-linguistic information. Finally, we show a proto-type spoken dialogue system using para-linguistic information and how these sorts of information contribute the efficient conversation.

  • パラ言語情報を用いた音声対話システム

    藤江真也, 八木大三, 菊池英明, 小林哲則

    日本音響学会2003年秋季研究発表会講演論文集  

    発表年月: 2003年09月

    開催年月:
    2003年09月
     
     
  • Use of a large-scale spontaneous speech corpus in the study of linguistic variation

    MAEKAWA Kikuo, KOISO Hanae, KIKUCHI Hideaki, YONEYAMA Kiyoko

    proc. of 15th Int'l Congress of Phonetic Sciences  

    発表年月: 2003年08月

    開催年月:
    2003年08月
     
     
  • Evaluation of the effectiveness of "X-JToBI": A new prosodic labeling scheme for spontaneous Japanese speech

    KIKUCHI Hideaki, MAEKAWA Kikuo

    proc. of 15th Int'l Congress of Phonetic Sciences  

    発表年月: 2003年08月

    開催年月:
    2003年08月
     
     
  • 自発音声コーパスにおけるF0下降開始位置の分析

    籠宮隆之, 五十嵐陽介, 菊池英明, 米山聖子, 前川喜久雄

    日本音響学会2003年春季研究発表会講演論文集  

    発表年月: 2003年03月

    開催年月:
    2003年03月
     
     
  • 『日本語話し言葉コーパス』(CSJ)のXML検索環境

    塚原渉, 菊池英明, 前川喜久雄

    第3回話し言葉の科学と工学ワークショップ講演予稿集  

    発表年月: 2003年02月

    開催年月:
    2003年02月
     
     
  • XMLを利用した『日本語話し言葉コーパス』(CSJ)の整合性検証

    菊池英明, 塚原渉, 前川喜久雄

    第3回話し言葉の科学と工学ワークショップ講演予稿集  

    発表年月: 2003年02月

    開催年月:
    2003年02月
     
     
  • Performance of segmental and prosodic labeling of spontaneous speech

    Kikuchi, H, K. Maekawa

    proc. of the ISCA &amp; IEEE Workshop on Spontaneous Speech Processing and Recognition (SSPR2003)  

    発表年月: 2003年02月

    開催年月:
    2003年02月
     
     
  • Recognition of para-linguistic information and its application to spoken dialogue system

    S Fujie, Y Ejiri, Y Matsusaka, H Kikuchi, T Kobayashi

    ASRU'03: 2003 IEEE WORKSHOP ON AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING ASRU '03   IEEE  

    発表年月: 2003年

    開催年月:
    2003年
     
     

     概要を見る

    The human-human interactions in a spoken dialogue seem to use not only linguistic information in the utterances but also some sorts of additional information supporting linguistic information. We call these sorts of additional information "para-linguistic information". In this paper, we present a recognition method of attitudes by prosodic information, and a recognition method of head gestures. In the former method, in order to recognize two attitudes, such as "positive" and "negative", F0 pattern and phoneme alignment are introduced as features. In the latter method, in order to recognize three gestures, such as "nod", "tilt" and "shake", left-to-right HMM is introduced as the probabilistic model as well as optical flow is introduced as features. Experiment results show that these methods are sufficient to recognize user's attitude as para-linguistic information. Finally, we show a proto-type spoken dialogue system using para-linguistic information and how these sorts of information contribute the efficient conversation.

  • 日本語自発音声韻律ラベリングスキームX-JToBIの能力検証

    菊池英明, 前川喜久雄

    人工知能学会言語・音声理解と対話処理研究会  

    発表年月: 2002年11月

    開催年月:
    2002年11月
     
     
  • 自発音声韻律ラベリングスキームX-JToBIによるラベリング精度の検証

    菊池英明, 前川喜久雄

    日本音響学会2002年春季研究発表会講演論文集  

    発表年月: 2002年09月

    開催年月:
    2002年09月
     
     
  • 大規模自発音声コーパス『日本語話し言葉コーパス』の仕様と作成

    籠宮隆之, 小磯花絵, 小椋秀樹, 山口昌也, 菊池英明, 間淵洋子, 土屋菜穂子, 斎藤美紀, 西川賢哉, 前川喜久雄

    国語学会2002年度春季大会要旨集  

    発表年月: 2002年05月

    開催年月:
    2002年05月
     
     
  • 日本語自発音声の韻律ラベリング体系: X-JToBI

    前川喜久雄, 菊池英明, 五十嵐陽介

    日本音響学会2002年春季研究発表会講演論文集  

    発表年月: 2002年03月

    開催年月:
    2002年03月
     
     
  • 自発音声に対する音素自動ラベリング精度の検証

    菊池英明, 前川喜久雄

    日本音響学会2001年春季研究発表会講演論文集  

    発表年月: 2002年03月

    開催年月:
    2002年03月
     
     
  • 日本語自発音声の韻律ラベリングスキーム: X-JToBI

    菊池英明, 前川喜久雄, 五十嵐陽介

    第2回話し言葉の科学と工学ワークショップ講演予稿集  

    発表年月: 2002年02月

    開催年月:
    2002年02月
     
     
  • 自発音声に対する音素自動ラベリング精度の検証

    菊池英明, 前川喜久雄

    第2回話し言葉の科学と工学ワークショップ講演予稿集  

    発表年月: 2002年02月

    開催年月:
    2002年02月
     
     
  • X-JToBI: an extended j-toBI for spontaneous speech.

    Kikuo Maekawa, Hideaki Kikuchi, Yosuke Igarashi, Jennifer J. Venditti

    proc. 7th International Congress on Spoken Language Processing (ICSLP2002)   ISCA  

    発表年月: 2002年

    開催年月:
    2002年
     
     
  • X-JToBI : 自発音声の韻律ラベリングスキーム

    前川 喜久雄, 菊池 英明, 五十嵐 陽介

    情報処理学会研究報告. SLP, 音声言語情報処理   一般社団法人情報処理学会  

    発表年月: 2001年12月

    開催年月:
    2001年12月
     
     

     概要を見る

    本稿では日本語の韻律ラベリングスキームであるJ_ToBIを拡張した新スキーム、X-JToBI(eXtended J_ToBI)を提案する。新スキームでは分節音ラベリングが実施されていることを前提として、J_ToBIの問題点であったtoneラベル位置と物理的イベントの不一致を解消した。さらに自発音声の韻律ラベリングを実施するために必要とされる多くの拡張を施した。この拡張には、BPMインベントリの拡張と表示方法の変更、BIラベルの詳細化、フィラー用ラベルの提案、卓立のラベリング法などが含まれる。

  • 自発音声コーパスにおける印象評定とその要因

    籠宮隆之, 槙洋一, 菊池英明, 前川喜久雄

    日本音響学会2001年秋季研究発表会講演論文集  

    発表年月: 2001年09月

    開催年月:
    2001年09月
     
     
  • 多次元心的状態を扱う音声対話システムの構築

    鈴木堅悟, 青山一美, 菊池英明, 白井克彦

    情報処理学会音声言語情報処理研究会  

    発表年月: 2001年06月

    開催年月:
    2001年06月
     
     
  • 自発音声に対するJ_ToBIラベリングの問題点検討

    菊池英明, 籠宮隆之, 前川喜久雄, 竹内京子

    日本音響学会2001年春季研究発表会講演論文集  

    発表年月: 2001年03月

    開催年月:
    2001年03月
     
     
  • 日本語音声への韻律ラベリング

    菊池英明

    人工知能学会研究会資料   東京 : 人工知能学会  

    発表年月: 2001年02月

    開催年月:
    2001年02月
     
     
  • 音声対話に基づく知的情報検索システム

    菊池英明, 阿部賢司, 桐山伸也, 大野澄雄, 河原達也, 板橋秀一, 広瀬啓吉, 中川聖一, 堂下修二, 白井克彦, 藤崎博也

    情報処理学会音声言語情報処理研究会   一般社団法人情報処理学会  

    発表年月: 2001年02月

    開催年月:
    2001年02月
     
     

     概要を見る

    本稿では、キー概念検索・未知語処理・ユーザモデルおよびシステムモデルに基づく対話管理・知識獲得を主な機能として有する、音声対話に基づいた知的情報検索システムを提案する。また、各機能を実装したデモシステムを構築し、学術情報検索に適用する方法について検討した結果を述べる。This paper presents an intelligent system for information retrieval based on human-machine dialogue through spoken language with novel features such as use of key concepts, unknown word processing, dialogue management through user and system modeling, and automatic acquisition of knowledge to adapt the system to individual users. It then describes and experimental system for academic information retrieval constructed to implement these features and to demonstrate their feasibility.

  • 『日本語話し言葉コーパス』の構築における計算機利用

    前川喜久雄, 菊池英明, 籠宮隆之, 山口昌也, 小磯花絵, 小椋秀

    日本語学, 明治書院   明治書院  

    発表年月: 2001年

    開催年月:
    2001年
     
     
  • 『日本語話し言葉コーパス』の書き起こし基準について

    小磯花絵, 土屋菜穂子, 間淵洋子, 斉藤美紀, 籠宮隆之, 菊池英明, 前川喜久雄

    電子情報通信学会技術報告  

    発表年月: 2000年12月

    開催年月:
    2000年12月
     
     
  • モノローグを対象とした自発音声コーパス:その設計について

    第14回日本音声学会全国大会予稿集  

    発表年月: 2000年10月

    開催年月:
    2000年10月
     
     
  • Overview of an Intelligent System for Information Retrieval Based on Human-Machine Dialogue through Spoken Language

    proc. of Int'l. Conference on Spoken Language Processing  

    発表年月: 2000年10月

    開催年月:
    2000年10月
     
     
  • Improvement of Dialogue Efficiency by Dialogue Control Model According to Performance of Processes

    proc. of Int'l. Conference on Spoken Language Processing  

    発表年月: 2000年10月

    開催年月:
    2000年10月
     
     
  • Designing a Domain Independent Platform of Spoken Dialogue System

    AOYAMA K.

    proc. of Int'l. Conference on Spoken Language Processing  

    発表年月: 2000年10月

    開催年月:
    2000年10月
     
     
  • 大規模話し言葉コーパスにおける発話スタイルの諸相---書き起こしテキストの分析から---

    籠宮 隆之, 菊池 英明, 小磯 花絵, 前川 喜久雄

    日本音響学会2000年秋季研究発表会講演論文集  

    発表年月: 2000年09月

    開催年月:
    2000年09月
     
     
  • 音声対話システム汎用プラットフォームにおける行動管理部の構築

    平野 泉, 青山 一美, 菊池 英明

    人工知能学会全国大会(第14回)   東京 : 人工知能学会  

    発表年月: 2000年06月

    開催年月:
    2000年06月
     
     
  • 音声対話システム汎用プラットフォームの検討

    青山一美

    情報処理学会音声言語情報処理研究会   東京 : 情報処理学会  

    発表年月: 2000年02月

    開催年月:
    2000年02月
     
     
  • Modeling of spoken dialogue control for improvement of dialogue efficiency

    H Kikuchi, K Shirai

    SMC 2000 CONFERENCE PROCEEDINGS: 2000 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN & CYBERNETICS, VOL 1-5   IEEE  

    発表年月: 2000年

    開催年月:
    2000年
     
     

     概要を見る

    In this research, we aim at the establishment of a method of controlling dialogues in accordence with the changes of performance in computation. So that the system takes the most suitable dialogue strategy according to performance in computation, it needs to calculate evaluation functions modeled with performance in computation in the inside all time. In this paper, we model dialogue control centered on 'system transparency' with computation time and accuracy of system's processes. Then, we simulate this model by controlling dialogue strategies. We also confirm effectiveness of the model by preliminary experiment using the prototype of spoken dialogue system.

  • Controlling non-verbal information in speaker-change for spoken dialogue

    K Aoyama, M Yokoyama, H Kikuchi, K Shirai

    SMC 2000 CONFERENCE PROCEEDINGS: 2000 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN & CYBERNETICS, VOL 1-5   IEEE  

    発表年月: 2000年

    開催年月:
    2000年
     
     

     概要を見る

    In this research, we focus on two main topics about the model for use of non-verbal information. The first topic is the clarification of the difference of the model between using non-verbal information by human beings and using non-verbal information by robot. The other topic is the clarification of the difference of the model between the CG robot and the real robot. As a result, we clarified the strength of constraint and naturalness of various types of non-verbal information. We also confirmed that appropriate output timing of non-verbal information with the CG robot is the start of utterances. This is the same as the usage of non-verbal information in human-human dialogue. Moreover, pie confirmed non-verbal information made speaker-change more smoothly for the humanoid robot than in the case of the CG robot.

  • Improving Recognition Correct Rate of Important Words in Large Vocabulary Speech Recognition

    proc. of Eurospeech  

    発表年月: 1999年09月

    開催年月:
    1999年09月
     
     
  • Controlling Dialogue Strategy According to Performance of Processes

    proc. of ESCA Workshop Interactive Dialogue in Multi-modal Systems  

    発表年月: 1999年05月

    開催年月:
    1999年05月
     
     
  • 音声対話システムにおける処理性能と対話戦略の関係についての一考察

    菊池 英明, 小林 哲則, 白井 克彦

    日本音響学会講演論文集  

    発表年月: 1999年03月

    開催年月:
    1999年03月
     
     
  • システムの処理性能を考慮した対話制御方法の検討

    菊池英明

    人工知能学会 言語・音声理解と対話処理研究会予稿集  

    発表年月: 1999年02月

    開催年月:
    1999年02月
     
     
  • A post-processing of speech for hearing impaired integrate into standard digital audio decoders.

    Shinichi Hoshino, Itaru Kaneko, Hideaki Kikuchi, Katsuhiko Shirai

    proc. of Eurospeech   ISCA  

    発表年月: 1999年

    開催年月:
    1999年
     
     
  • Use of Nonverbal Information in Communication between Human and Robot

    Proc. Of International Conference on Spoken Language Processing (ICSLP)  

    発表年月: 1998年12月

    開催年月:
    1998年12月
     
     
  • 非言語的現象の分析と対話処理 −電子メール討論

    菊池 英明, 伊藤 克亘, 川端 豪

    日本音響学会誌   一般社団法人日本音響学会  

    発表年月: 1998年11月

    開催年月:
    1998年11月
     
     
  • 人間型対話インタフェースにおけるまばたき制御の検討

    人工知能学会全国大会論文集  

    発表年月: 1998年06月

    開催年月:
    1998年06月
     
     
  • 時間的制約を考慮した対話制御方法の実現方法

    人工知能学会全国大会論文集  

    発表年月: 1998年06月

    開催年月:
    1998年06月
     
     
  • 人間とロボットのコミュニケーションにおける非言語情報の利用

    情報処理学会音声言語情報処理研究会資料  

    発表年月: 1998年05月

    開催年月:
    1998年05月
     
     
  • Multimodal Communication Between Human and Robot

    Proc. Of International Wireless and Telecommunications Symposium (IWTS)  

    発表年月: 1998年05月

    開催年月:
    1998年05月
     
     
  • 時間的制約を考慮した対話制御方法の検討

    菊池 英明, 杉田 洋介, 白井 克彦

    日本音響学会講演論文集  

    発表年月: 1998年03月

    開催年月:
    1998年03月
     
     
  • Controlling gaze of humanoid in communication with human

    H Kikuchi, M Yokoyama, K Hoashi, Y Hidaki, T Kobayashi, K Shirai

    1998 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS - PROCEEDINGS, VOLS 1-3   IEEE  

    発表年月: 1998年

    開催年月:
    1998年
     
     

     概要を見る

    This paper describes controlling robot's gaze which has relation to smoothness of turn-taking in communication. We considered the role of gaze in dialogues between human beings and examined it by CG simulation and our humanoid Also we analyzed the features of gaze movement in dialogues by plural persons and confirmed that controlling gaze is efficient in confirmation of communication channel by implementing it on the humanoid.

  • 自由会話における時間的制約の影響の分析

    菊池 英明, 杉田 洋介, 白井 克彦

    電子情報通信学会技術研究報告   一般社団法人電子情報通信学会  

    発表年月: 1997年10月

    開催年月:
    1997年10月
     
     

     概要を見る

    音声対話、特に自由会話において話者の発話計画に影響すると考えられる時間的制約に関して、対話コーパスを対象に分析を行なった。話者が発話の番を所有する時間を計測し、各状況における傾向を調べることにより、時間的制約が対話に与える影響を詳細化することを試みた。その結果、聴者としての時間的制約の影響は明確な個人差をもって対話に現れることがわかった。さらに発話の機能や対話様式、参加者の積極性などの要因が時間的制約の影響に変化を与えることが示された。

  • 音声を利用したマルチモーダルインタフェース

    畑岡 信夫, 菊池 英明

    電子情報通信学会誌   東京 : 電子情報通信学会  

    発表年月: 1997年10月

    開催年月:
    1997年10月
     
     

     概要を見る

    資料形態 : テキストデータ プレーンテキスト コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌

  • 複数ユーザとロボットの対話における非言語情報の役割

    横山 真男, 菊池 英明, 白井 克彦

    日本音響学会講演論文集  

    発表年月: 1997年09月

    開催年月:
    1997年09月
     
     
  • The Role of Non-Verbal Information in Spoken Dialogue between a Man and a Robot

    International Conference on Speech Processing (ICSP) '97 Proceedings  

    発表年月: 1997年08月

    開催年月:
    1997年08月
     
     
  • ロボットとの対話における非言語情報の役割

    横山

    人工知能学会全国大会論文集  

    発表年月: 1997年06月

    開催年月:
    1997年06月
     
     
  • 音響学会員のためのインターネット概説

    菊池 英明, 畑岡 信夫

    日本音響学会誌   一般社団法人日本音響学会  

    発表年月: 1996年08月

    開催年月:
    1996年08月
     
     
  • 情報処理学会第53回全国大会大会優秀賞

    発表年月: 1996年03月

    開催年月:
    1996年03月
     
     
  • ハイパーメディア共有アーキテクチャにおけるバージョン管理方式

    菊池

    情報処理学会全国大会講演論文集  

    発表年月: 1996年03月

    開催年月:
    1996年03月
     
     
  • ハイパーメディア共有アーキテクチャ

    情報処理学会全国大会講演論文集  

    発表年月: 1996年03月

    開催年月:
    1996年03月
     
     
  • Extensions of World-wide Aiming at the construction of a "Virtual Personal Library"

    proc. of Seventh ACM Conf. on Hypertext  

    発表年月: 1996年03月

    開催年月:
    1996年03月
     
     
  • User interface for a digital library to support construction of a ''virtual personal library''

    H Kikuchi, Y Mishina, M Ashizawa, N Yamazaki, H Fujisawa

    PROCEEDINGS OF THE INTERNATIONAL CONFERENCE ON MULTIMEDIA COMPUTING AND SYSTEMS   I E E E, COMPUTER SOC PRESS  

    発表年月: 1996年

    開催年月:
    1996年
     
     
  • Multimodal Interface Using Speech and Pointing Gestures, and Its Applications for Interior Design and PC Window Manipulation

    proc. of IWHIT95 (International Workshop on Human Interface Technology 95)  

    発表年月: 1995年10月

    開催年月:
    1995年10月
     
     
  • 音声とペンを入力手段とするマルチモーダルインタフェースの構築

    情報処理学会音声言語情報処理研究会  

    発表年月: 1995年07月

    開催年月:
    1995年07月
     
     
  • 仮想個人図書館の構築を支援するユーザインタフェースの開発

    電子情報通信学会春季大会講演論文集  

    発表年月: 1995年03月

    開催年月:
    1995年03月
     
     
  • Agent-typed multimodal interface using speech, pointing gestures and CG

    H ANDO, H KIKUCHI, N HATAOKA

    SYMBIOSIS OF HUMAN AND ARTIFACT: FUTURE COMPUTING AND DESIGN FOR HUMAN-COMPUTER INTERACTION   ELSEVIER SCIENCE PUBL B V  

    発表年月: 1995年

    開催年月:
    1995年
     
     
  • 音声・ポインティング・CGによるエージェント型ユーザインタフェースの試作と評価

    安藤

    第10回ヒューマンインタフェースシンポジウム論文集  

    発表年月: 1994年10月

    開催年月:
    1994年10月
     
     
  • マルチモーダルウインドウシステムの構築

    菊池

    第10回ヒューマンインタフェースシンポジウム論文集  

    発表年月: 1994年10月

    開催年月:
    1994年10月
     
     
  • 音声・ポインティング・CGによるエージェント型ユーザインタフェースシステム

    電子情報通信学会秋季大会講演論文集  

    発表年月: 1994年09月

    開催年月:
    1994年09月
     
     
  • 音声対話システムにおける発話権の制御

    電子情報通信学会春季大会講演論文集  

    発表年月: 1993年03月

    開催年月:
    1993年03月
     
     
  • ナビゲーションシステムにおける音声対話インタフェースの構成

    菊地英明

    人工知能学会言語・音声理解と対話処理研究会  

    発表年月: 1992年10月

    開催年月:
    1992年10月
     
     
  • 自然な模擬対話を収録するために

    菊池英明

    音声対話のモデル化とその機械処理関する総合的研究研究成果報告書  

    発表年月: 1992年

    開催年月:
    1992年
     
     
  • 自然な模擬対話の収録のために

    菊池英明

    文部省科研費総合研究A「音声対話のモデル化とその機械処理に関する総合的研究」研究成果報  

    発表年月: 1992年

    開催年月:
    1992年
     
     

▼全件表示

共同研究・競争的資金等の研究課題

  • リアルタイムMRI動画による日本語調音運動データベースの構築と公開

    日本学術振興会  科学研究費助成事業

    研究期間:

    2020年04月
    -
    2024年03月
     

    前川 喜久雄, 定藤 規弘, 斎藤 純男, 籠宮 隆之, 竹本 浩典, 石本 祐一, 吉永 司, 北村 達也, 菊池 英明, 桂田 浩一, 小林 哲則, 西川 賢哉

     概要を見る

    本研究は医療用MRI装置でリアルタイム撮像された大量の日本語調音運動データをその検索環境とともに一般公開することによって、日本語調音音声学の未解明問題について広くオープンな議論を行うための研究インフラを提供しようとするものである。リアルタイムMRI動画には声道の全体形状が高解像度で記録されている。わけても従来可視化がほぼ不可能であった軟口蓋から咽頭を経て喉頭に到る声道後部が鮮明に観察できる点は、音声研究史上画期的であり、音声学者・音声生成研究者の永年の夢を実現したデータである。外国人に対する日本語音声教育教材としても高い価値が認められる

  • 認知症高齢者に有効なソーシャルワーク面談のプロトコル開発

    日本学術振興会  科学研究費助成事業

    研究期間:

    2019年04月
    -
    2022年03月
     

    加瀬 裕子, 牧野 遼作, 菊池 英明

     概要を見る

    認知症高齢者にたいしては回想的話題がコミュニケーションを促進することが明らかだが、その際には、面談技術が問題となる。ソーシャルワーク面談は、人を支援する技術だが、その構成要素である技術や効果は測定されず、可視化されていない。本研究では、認知症高齢者に有効なソーシャルワーク面談の要素技術を抽出し、言語工学を応用した評価方法を用いて認知症高齢者との面談技術についての基本型の開発を行う。【意義と目的】 介護職員の介護負担となる認知症の行動・心理症状を予防・緩和する方法の一つは、「認知症高齢者のコミュニケーションの促進」である。コミュニケーションによって、認知症を患う高齢者が脳への良い刺激を受けることは脳科学研究によって実証されている。特に、回想的話題が認知症高齢者のコミュニケーションを促進することが明らかだが、その際には、面談技術が問題となる。ソーシャルワーク面談は、MCOモデルにより人を支援する技術だが、その構成要素である技術や効果は測定されず、可視化されていない。本研究では、認知症高齢者に有効なソーシャルワーク面談の要素技術を抽出し、その要素技術と回想的会話を連携させたプロトコルを作成することを目的とする。言語工学の成果である①発話単位認定②形態素解析③係り受け解析により、認知症高齢者の会話を評価し、動機・能力・機会のアセスメント状況、回想的話題、非言語コミュニケーションの測定を行い、認知症高齢者に有効なソーシャルワーク面談のプロトコルの作成を試みた。【方法】認知症高齢者との面談に10年以上の経験のあるソーシャルワーカー2名を招き、認知症を患ってはいるが自立生活が可能なケアハウス入居者3名との面談を実施した。各30分程度の面談(6パターン)を録画および音声収録を行い、データ化を実施した。収集したデータは文字化および画像解析が進行中である。PerlmanのMCO(本人の動機・能力・機会をアセスメントする)モデルを援用し面談行動コード化システムを構築することを試みた。非言語的コミュニケーション分析については、音声科学において定評のあるソフトを使用し、声の高さや会話のスピードを分析するとともに、行動解析を行った。高齢者に聞きやすい音声、傾聴態度、語りを促す身体的動き質問方法などを分析中である。2020年2月末に研究協力者のソーシャルワーカー10名に連絡をして、ソーシャルワーク面談をビデオ収録する準備ができたところで、実施する直前に新型コロナウイルスの蔓延により高齢者施設(ケアハウス)への立ち入り禁止措置が行われるようになった。そのため予定されていた実験場所の確保と研究参加を承諾してくれた高齢者に面会することが、不可能となり、6事例のみのデータ収集となった。新型コロナウイルス渦の鎮静以降、以下のとおり対処したい。①【実験参加者の確保】実験場を変更してデータを収集する。社会福祉協議会、社会福祉法人、NPO法人に依頼し、熟練した福祉援助相談員(ソーシャルワーカー)を20名確保する。また、老人福祉施設等に依頼し模擬面談対象者を募集する。②【模擬面談の分析】新しいデータの収集と名別に、申請者らが過去に収集した書き起こしテキストデータ(認知症高齢者10名と配偶者10名600時間分)の言語学的分析を行い、回想的会話が認知症高齢者のコミュニケーション促進に及ぼす影響の程度、および、その内容の分析を行う

  • バーチャルリアリティ環境におけるオラリティの運用の検討

    研究期間:

    2017年07月
    -
    2020年03月
     

     概要を見る

    本年度は昨年度に引き続き、バーチャルリアリティ空間におけるオラリティを構成する要因(エージェントの視覚的特徴、コミュニケーションのインタラクティブ性、垂直方向の距離知覚、空間の非現実性)を心理学実験により検討した。研究1では、バーチャルリアリティ空間で対面したエージェントに対する適切なパーソナルスペースの推定に関する実証実験のデータ収集を行った。昨年度収集したデータと合わせて、対面するエージェントの視覚的な特徴(性別、人間またはロボット、身長差)がパーソナルスペースに影響することを確認した。研究2では、一次救命処置訓練をテーマにバーチャルリアリティ環境でのインタラクティブ性が訓練受講者の心理に及ぼす影響を検討した。実験では、エージェントが倒れてしまった場面で周囲の人物への声がけを行いながらAEDを用いる手続きを体験しながら学習した。受講者の声がけの音響特徴に合わせて、周囲のエージェントの振る舞いが変更するようにプログラムされており、受講者は自らの声がけによるインタラクティブな状況変化を体験した。その結果、同様の学習をビデオ視聴に行う場合と比べて、一次救命処置に対するより高い自己効力感と訓練方法に対する高い興味が示された。研究3では昨年度まで実施していたバーチャルリアリティ空間内の距離近く推定に関する実験を一部拡張し、垂直方向の距離推定を行った。その結果、奥行き方向と垂直方向では距離推定のバイアスが異なることが示された。研究4ではバーチャルリアリティ空間の非現実性が体験者の心理に及ぼす影響を検討した。3つの環境(草原、海、宿泊施設)を模したバーチャルリアリティ空間にお風呂を設置し、現実空間でお風呂に入っている参加者に提示した。その結果、非現実的なバーチャルリアリティ空間のお風呂と現実のお風呂のギャップにより参加者のリラックス度合いに変化が生まれることがわかった。本年度は、前年度までに行った対面コミュニケーションや空間知覚に関して、バーチャルリアリティ空間内の注意位置を計測しながら実験的検討を行う予定であった。注視点計測機能のあるヘッドマウントディスプレイを用いた検討を実施したが、注視点の推定精度が当初の予想よりも低いため検証実験の準備に想定以上の時間を要した。さらにコロナウイルス感染拡大の影響で被験者を伴う予備実験の実施を断念せざるを得なかった。これにより当初予定していた検証実験が未実施となった。実施が延期された視点計測を伴うバーチャルリアリティ環境におけるオラリティを構成する要因の検討を実施予定である。実験データをまとめるとともに、最終年度として、4年間で得られた知見を統合して、バーチャルリアリティ環境におけるオラリティに関わる要因の特徴を考察する

  • リアルタイムMRIおよびWAVEデータによる調音音声学の精緻化

    日本学術振興会  科学研究費助成事業

    研究期間:

    2017年04月
    -
    2020年03月
     

    前川 喜久雄, 斎藤 純男, 藤本 雅子, 竹本 浩典, 北村 達也, 菊池 英明, 籠宮 隆之

     概要を見る

    3年の研究期間を通して、ほぼ当初計画どおりに研究を推進することができた。現在までに収集したリアルタイムMRI動画による日本語の調音運動データは東京方言が16名分(うち男性10名)、近畿方言が5名分(うち男性3名)である。収録内容は時期により少しずつ異なるが、最終状態で、単独モーラ142項目、特殊モーラを含む単語151項目、2モーラの組み合わせ676項目等であり、1名あたり約1時間の発話を収録した。これらのMRI動画データは、同時に収録した音声データと合成してAVIおよびMP4形式動画ファイルに編集して共同研究者の利用に供した。日本語以外にはモンゴル語バーリン方言のデータを3名分(すべて女性)収録した。発話内容は、モンゴル語の特徴である母音調和の分析に特化してあり、1名あたり約600語分の調音運動データを収集した。リアルタイムMRI動画の収集作業と並行して、調音器官(舌、上下唇、下顎、口蓋、咽頭壁など)の輪郭を自動抽出するための技術開発も実施した。現在、話者を特定した場合は、少量の学習データを用いた機械学習によって、人手作業と遜色のない精度での輪郭自動抽出が可能になっている。収集したデータに対する予備的分析の結果は、日本語の語末撥音の調音位置が従来の定説とは異なることを報告した論文、モンゴル語母音調和においては、舌根と咽頭壁の距離が重要な特徴となることを定量的に確認した論文、日本語ワ行子音の調音は主に両唇の接近によって実現されており、軟口蓋の関与がほとんど認められないことを確認した論文、さらに国際音声学協会のハンドブックに記載されている日本語ラ行子音の記述には誤りが多く、実態に即していないことを報告した論文などを執筆し公開した。令和元年度が最終年度であるため、記入しない。令和元年度が最終年度であるため、記入しない

  • コーパス言語学的手法に基づく会話音声の韻律特徴の体系化

    研究期間:

    2016年04月
    -
    2020年03月
     

     概要を見る

    本研究課題の目的は、コーパス言語学的手法に基づき、独話や朗読音声との比較を通し、会話音声の韻律体系を実証的に検証・確立することである。この目的に向け、最終年度にあたる今年度は、次のことを実施した。①これまで、独話用に開発した韻律ラベリング基準X-JToBIを日常会話用に拡張することを検討してきたが、今年度はそれを作業マニュアルとしてまとめ上げ、今後、ラベリング結果とともに公開できるよう準備した。②代表者が構築を主導する『日本語日常会話コーパス』のうち16時間の会話を対象に、2次チェックまで含めて韻律ラベリングを実施した。③16時間のラベリング結果に基づき、『日本語話し言葉コーパス』の独話(講演)との比較を通して、日常会話の韻律の特性について分析を行い、以下のことを明らかにした:ア)上昇成分を伴うBPM(上昇調・上昇下降調など)が学会講演で多く雑談では少ない傾向が見られる、イ)BPMの内訳を見ると、学会講演ではアクセント句末での上昇調が多いのに対し、雑談では上昇下降調が多い、ウ)線形判別分析を用いてこれらの句末音調・BI値の特徴からレジスター(雑談・学会講演・模擬講演)を推定するモデルを構築し、各変数がレジスターの判別にどのように寄与するかを検討した結果、正解率は82.1%と、高い確率で3つのレジスターが句末音調・BI値の特徴から判別できることなどが分かった。以上の結果から、学会講演ではイントネーション句内において上昇調で卓立させたアクセント句が複数継起する発話スタイルをとることが多いのに対し、日常会話では上昇下降調などを伴うアクセント句は複数継起することは少なく単独でイントネーション句を構成する、つまり韻律的には細ぎれの発話スタイルが多いと考えることができる。令和元年度が最終年度であるため、記入しない。令和元年度が最終年度であるため、記入しない

  • 音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定

    研究期間:

    2014年04月
    -
    2017年03月
     

     概要を見る

    本研究の目的は、音声対話システムの発話の音声言語的特徴制御によるユーザのインタラクション欲求向上について検証することである。エージェントに対する印象の強さはユーザごとに個人差がある可能性がある。模擬的な共同タスク環境を設計したうえで被験者実験を行い、個人の特性とエージェントに対する印象の関係を明らかにした。さらに、具体的な音声言語的特徴制御の例としてユーモアを扱い、ユーモア発話生成がユーザのインタラクション欲求向上に与える影響を、対話システム開発を通じて検証した。ユーモアを含まない発話文を選択する手法よりも提案したユーモア発話生成手法の方がユーザの対話継続欲求を向上できることが示された

  • インタラクティブ性の有無を考慮した話し言葉・書き言葉間の変換のための基礎的研究

    研究期間:

    2013年04月
    -
    2016年03月
     

     概要を見る

    本研究は、画像についての説明を、話し言葉か書き言葉か、対話か独話かの、合計4通りの条件(モード)について、データの収録方法の開発、データの収集と整備、ならびに4種類のモード間の自動変換アルゴリズムを将来開発するための基礎として、各モード間の差異についての知見の発見と集約を行なうものである。得られたデータから、文章のスタイルを表す多くのパラメータの、話し言葉と書き言葉における差が、独話より対話の方が少ないことから、即時的な文の生成や、発話に対する受け手の理解状況への注意などの対話の持つ特性が、話し言葉と書き言葉それぞれの特徴を減少させることが示唆された

  • 音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定

    科学研究費助成事業(早稲田大学)  科学研究費助成事業(基盤研究(C))

    研究期間:

    2014年
    -
    2016年
     

  • 音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定

    科学研究費助成事業(早稲田大学)  科学研究費助成事業(基盤研究(C))

    研究期間:

    2014年
    -
    2016年
     

     概要を見る

    本研究の目的は、音声対話システムの発話の音声言語的特徴制御によるユーザのインタラクション欲求向上について検証することである。エージェントに対する印象の強さはユーザごとに個人差がある可能性がある。模擬的な共同タスク環境を設計したうえで被験者実験を行い、個人の特性とエージェントに対する印象の関係を明らかにした。さらに、具体的な音声言語的特徴制御の例としてユーモアを扱い、ユーモア発話生成がユーザのインタラクション欲求向上に与える影響を、対話システム開発を通じて検証した。ユーモアを含まない発話文を選択する手法よりも提案したユーモア発話生成手法の方がユーザの対話継続欲求を向上できることが示された

  • アイヌ語諸方言の資料整備と音声音韻・文法・語彙の方言差の分析

    日本学術振興会  科学研究費助成事業

    研究期間:

    2012年04月
    -
    2015年03月
     

    奥田 統己, 白石 英才, 菊池 英明

     概要を見る

    アイヌ語の人称表示の方言差を観察し、方言間の距離が近いことでこれまで知られてきた沙流方言と千歳方言の動詞の人称表示体系に、重要な差異のあることを確認し、この事実が示唆するアイヌ語の人称表示の一般的な傾向および歴史的背景を考察した。アイヌ語の叙事詩のなかに現れる親族語彙について、沙流方言のテキストと静内方言のテキストのなかでの用法の違いを調査した。アイヌ語音声データベースのシステムを試験的に構築した。アイヌ語音声データベースに入力するレコードの整備を進めた。アイヌ語のテキストをデータベース化する際に、動詞内部をできる限り形態素ごとに区切り、そこにタグをつけていく作業を試み、その結果を評価した

  • 円滑な母語対話を可能としている物理的要因の非母語話者対話との対比による探索

    日本学術振興会  科学研究費助成事業

    研究期間:

    2012年04月
    -
    2015年03月
     

    黒岩 眞吾, 市川 熹, 堀内 靖雄, 菊池 英明, 仲 真紀子, 大橋 浩輝, 川端 良子, 滝沢 恵子

     概要を見る

    母語対話の話者交替時には、話者移行適格場TRPに制約された重複発話が多数観測される。これは、母語対話の心的負担を軽減させるメカニズムによるものと思われる。日本人母語話者ではプロソディに話者交替の予告情報が存在していた。成人の日英両母語話者と非母語話者の話者交替タイミングには差異が見いだされ、予告情報は言語情報ではなく、主に物理量のプロソディにあることが示唆された。日本語母語5歳児と成人母語話者の対話では個人差が若干存在するが、6歳児では成人母語話者との差異がなかった。母語プロソディ獲得臨界期の生後18ヶ月までに予告機能基盤の獲得が進み、6歳頃までに母語の話者交替の機能が獲得されると思われる

  • 音声学的測定法と計算論モデル手法を融合した対乳児発話音声の解析

    日本学術振興会  科学研究費助成事業

    研究期間:

    2009年
    -
    2011年
     

    馬塚 れい子, 菊池 英明, 市川 熹, 田嶋 圭一, 宮澤 幸希

     概要を見る

    本研究は、母親が乳児に話しかける際の話し方、対乳児発話(Infant-Directed Speech, IDS)に含まれる音声がどのような特徴をもち、それが乳児の音声獲得にどのような役割を果たしているのかを音声学的解析手法と、音響特性に基づいた数理モデルを用いた解析手法を融合して解析した。母音の質の違いにつては対乳児発話であっても対成人発話であってもSOMを用いたモデルで獲得が可能なことが分かったが、長短母音の違いは母音の長さ情報のみからの獲得は困難であることが分かった

  • 対話状況に応じた自発的コミュニケーション機構の研究

    日本学術振興会  科学研究費助成事業

    研究期間:

    2005年
    -
    2007年
     

    白井 克彦, 榑松 明, 誉田 雅彰, 小林 哲則, 菊池 英明, 大川 茂樹

     概要を見る

    本研究では,現実の多様な対話状況に対応するために,能動的にインタラクションを行うコミュニケーション機構の検討を行った.従来の対話システム研究は,情報端末のインタフェースとして特定のタスクを効率よくこなすことを目的としていたが,対話を自発的に開始・継続する対話システムへと発展させるためにこのシステム機構の研究を行う.そのために,動画像・音声による人物認識と対話内容認識を目指す(i)対話状況把握の研究,対話システムがどのように対話を開始し,継続,終了すべきかをモデリングする(ii)自発的コミュニケーション制御モデルの研究,そして,どのようにシステムの意図を表出するかという(iii)音声生成と動作表現の技術の大きく3種類の技術の検討を行った.(i)として,ステレオカメラによる人物姿勢推定の研究を行った.従来用いられなかった奥行き情報,人物の形状とテクスチャ情報などを同時に用いることにより,高精度な人物姿勢推定を実現した.また,対話時に話者の意図を推定する技術の研究を行った.文末特徴や単語N-gramを用いることにより,従来法より精度の高い意図推定が可能となった.(ii)として,ロボットが人に話しかける際の話しかけ判断モデル,継続モデル,終了モデルを検討した.音声・画像情報から,システムが対話相手の心的状況を推定し,対話の開始・継続・終了を行う技術を実現した.(iii)として,音声の生理的表現の一つである「笑い」を音声合成により生成する技術を検討した.人間の笑い声の音響分析に基づき,話し声から「笑い声」,「喋り笑い」の合成を実現した

  • 話し言葉コーパスに基づく言語変異現象の定量的分析

    日本学術振興会  科学研究費助成事業

    研究期間:

    2004年
    -
    2006年
     

    前川 喜久雄, 小磯 花絵, 小椋 秀樹, 菊池 英明, 傳 康晴, 日比谷 潤子

     概要を見る

    当初の計画に従って、研究期間の前半ではデータの整備をおこなった。具体的には以下のデータを新規に生成した。また既存のデータのエラー修正も実施した。1.『日本語話し言葉コーパス』コア部分(約44万語)について、韻律情報その他をアクセント句単位に再編成した韻律研究用XMLデータを設計し、作成した(担当:菊池)。2.『日本語話し言葉コーパス』の異なり語(約4万語)に対して、和語、漢語、外来語等の語種情報を付与した(小椋)。3.『日本語話し言葉コーパス』からガ行鼻濁音を含みうる語を文脈とともに切り出した鼻濁音研究用データベースを作成した(前川・日比谷)。4.『日本語話し言葉コーパス』全体(約752万語)を対照として、語形の変異現象を包括的に記録した語形変異研究用RDBを整備した(前川)。これらのデータを利用して、『日本語話し言葉コーパス』に記録された各種の言語変異現象の研究を実施した。具体的には以下の現象を分析した。1.母音の無声化(前川・菊池)2.母音の非語彙的延長(伝)3.助詞の撥音化(小磯)4.ガ行鼻濁音(日比谷)5.語形変異(前川)6.アクセント句末イントネーションのうち上昇調の変異(前川・菊池)7.文末の文体的特徴(小椋)研究成果は国際学会を含む各種学会で報告した他、3年分の成果をまとめた報告書(252頁)を刊行し

  • ブロードバンドを利用した新しい高等教育の有機的モデルとプロトタイプの開発

    日本学術振興会  科学研究費助成事業

    研究期間:

    2003年
    -
    2006年
     

    向後 千春, 浅田 匡, 菊池 英明, 西村 昭治, 野嶋 栄一郎, 鈴木 克明, 金 群

     概要を見る

    フルオンデマンドによるeラーニングのコースを実質的に成果のあるものにするためには、教員、コーチ、サポートスタッフの3種類の人的資源がそれぞれに割り当てられた仕事をこなすこと、そしてラーニング・マネジメント・システム(LMS)を含むeラーニングシステムが学習者の学習を促進するような機能をもつことが必要である。教員の仕事は大きく分けて、コースの設計、実施、評価と改善の3つに分類できる。eラーニングになってとりわけ重要なことは、コースの設計と詳細化における仕事に重心が移ることである。eラーニングにおける教員の仕事はコースの設計と詳細化という部分に重心が移った。それによってコースの実施段階では教員を補佐し、実質的に授業運営の大きな部分を担う人材が必須のものとなった。それがコーチである。コーチの仕事は、大きく分けて、学習活動の促進、雰囲気と規範作り、議論プロセスの主導の3つである。LMSについては、有償・無償のものを含めてさまざまな種類のものが利用できる。最低限、ビデオ配信、BBS、レポート・テストのやりとりができるシステムであればeラーニングを実施することができる。しかし、eラーニング授業をもっと着実なものにするためには、それぞれの機能についていっそうの工夫が必要である。将来的な学習環境について述べる。現在の環境は、学習者がLMSにログインして、そこで学習のリソースを見て、自分の手元でノートを取るというような形になっている。しかし、将来的には、Webブラウザを開けば、すぐにそこが自分の学習用のワークスペースになっているようなイメージにしたい

  • 身体、アーティファクトを用いた効果的コミュニケーション過程の分析とFDへの応用

    日本学術振興会  科学研究費助成事業

    研究期間:

    2004年
    -
    2005年
     

    保崎 則雄, 中野 美知子, 鈴木 広子, 山地 弘起, 中島 義明, 西村 昭治, 菊池 英明

     概要を見る

    本研究では、まずHough & Duncan の開発したObservational System for Instructional Analysis(OSIA)を用いて、大学の講義、小学校英語授業を録画したものを記述し、マトリックス、タイムラインに転記した。同時に、教室内発語をすべて書き起こし、さらに教員の表清分析を行ない解析した結果、以下の諸点が明らかになった。1)大学の授業のインターアクションのレベルは講義型の場合、単調な教師の説明が圧倒的に多く、小学校の授業は、教師、児童間のインターアクションのレベルは、英語授業の場合、とりわけ高く、児童の反応が多いことが、記述データの分布図(マトリックス)から再確認された。2)小学校授業でのALTは、教育経験の有無により、発語、発問と児童の解答のタイミングに違いがあり、経験の浅いALTは、絵を見せていきなり反復練習に入るのに対し、小学校での教育経験のあるALTは、提示->児童の発語という児童からの主体的な発語を中心に授業を行っており、それが、授業の活性化につながっていることが確認された。3)小学校授業において、教員の表情の緩急が授業の活性化につながっており、児童の参加態度の積極性、動機づけにも影響を与えていることが、データ、授業観察、ビデオ録画からも読み取れた。4)長い英語のフレーズよりも、短い発問、説明がより児童の学習態度には効果的である。5)褒める、ポジティブなフィードバックが英語授業のような言語教育場面においては、特に効果的である。6)アーティファクトの使用は、タイミングが合う限りにおいては、授業のテンポアップにつながる

  • 自発音声データに対する多元的アノテーション情報のXML化に関する研究

    日本学術振興会  科学研究費助成事業

    研究期間:

    2002年
    -
    2003年
     

    前川 喜久雄, 塚原 渉, 菊池 英明, 小磯 花絵, 米山 聖子, 籠宮 隆之

     概要を見る

    自然言語は「談話>文句>語>音節>モーラ>音素」の様な階層構造をなしているというのが現代言語学の基本的な仮定である。この仮定は書き言葉にはよくあてはまる。しかし、自発音声(自然な話し言葉)においては、様々な理由によって、明瞭な階層構造を認定しがたいケースが頻出する。本研究の目的は、この破綻にどのような類型が存在するかを『日本語話し言葉コーパス』に記録された膨大なデータを用いて検討し、そのような破綻を含む言語データをXML文書化する方法を考案することである。初年度には『日本語話し言葉コーパス』の転記テキストにおいて階層構造の破綻がどのように生じているかの類型化作業をおこない、一部試験的にXML文書化を実施した。本最終年度は、昨年度の成果を継承して、XML文書の仕様を確定し、『日本語話し言葉コーパス』に含まれる752万語分の転記テキスト(音声データ661時間分に該当)と形態素解析結果をXML文書化した。そのうち約50万語(44時間相当)に関しては、上記に加えて分節音とイントネーションの両面にわたる音声ラベルもXML文書中にとりこんだ。このようにして作成されたXML文書は、複雑な構造(最大で10階層、17要素、208属性)を有しているので、その検索は容易でない。そこで『日本語話し言葉コーパス』用のXML文書検索ツールを開発した。このツールは、GUIを介して検索式(XPathないしX-Query)を生成する機能とともに、検索結果をXSLでフォーマットしてユーザーが望む形式で出力する機能を有している。本ツールはJAVAで開発されているので、主要なOS上で利用できる。本研究の成果である『日本語話し言葉コーパス』のXML文書と検索ツールは『日本語話し言葉コーパス』公開版の一部として2004年6月上旬に一般公開する予定である

  • 韻律制御に主体をおいた対話システム

     概要を見る

    今年度の成果は以下の通りである。a)対話のリズムと韻律制御前年度までの成果に基づいて、対話における話題境界の判別を題材に、韻律情報におけるアクセント句単位でのパラメータを用いて統計的なモデルを学習し、オープンデータに対しても人間と同程度の判別精度が得られることを確認した。(白井・菊池)自然な対話システムを構築する上で重要なシステム側の相槌生成と話者交替のタイミングの決定を、韻律情報と表層的言語情報を用いて行う方法を開発した。この決定法を、実際に天気予報を題材にした雑談対話システムに実装し、被験者がシステムと対話することにより主観的な評価を行い、有用性を確認した。(中川)b)対話音声理解応用対話音声における繰り返しの訂正発話に関する特徴の統計的な分析結果を踏まえ、フレーズ単位の韻律的特徴の併用と訂正発話検出への適用を評価した。また、これらと併せた頑健な対話音声理解のため、フィラーの韻律的な特徴分析・モデル化の検討を行った。(甲斐)c)対話音声合成応用語彙の韻律的有標性について程度の副詞を用い、生成・聴覚の両面から分析を行い、自然な会話音声生成のための韻律的強勢制御を実現した。また、統計的計算モデルによる話速制御モデルを作成し、会話音声にみられる局所話速の分析を進め、自由な話速の制御を可能とした。さらに、韻律制御パラメータが合成音声の自然性品質に及ぼす影響を調べた。(匂坂)d)対話システム上記の成果をまとめ,対話システムを実装した。特に,顔表情の認識・生成システム,声表情の認識・生成システムなどを前年度までに開発した対話プラットホーム上に統合し,パラ言語情報の授受を可能とするリズムある対話システムを構築した。(小林

▼全件表示

産業財産権

  • 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体

    白井 克彦, 菊池 英明, 新関 一馬

    特許権

  • 音声認識装置及び音声認識用プログラム

    白井 克彦, 菊池 英明, 大久保 崇

    特許権

  • 連続音声認識装置および方法

    白井 克彦, 城崎 康夫, 菊池 英明

    特許権

 

現在担当している科目

▼全件表示

 

特別研究期間制度(学内資金)

  • 音声言語における感情・評価・態度の解析技術高度化

    2009年03月
    -
    2010年03月

    アメリカ   オハイオ州立大学

    中国   北京大学

他学部・他研究科等兼任情報

  • 人間科学学術院   大学院人間科学研究科

  • 理工学術院   大学院基幹理工学研究科

  • 附属機関・学校   グローバル・エデュケーション・センター

学内研究所・附属機関兼任歴

  • 2025年
    -
    2026年

    データ科学センター   兼任センター員

特定課題制度(学内資金)

  • 音象徴の表現力の精緻化

    2020年  

     概要を見る

    本研究では、刺激を工学的手法により作成・呈示し、その結果を心理学的な統計処理を施し解釈することで、音象徴の持つ表現力を精緻化する。具体的には、実験参加者の属性を抽象化能力の理解度という側面から、音象徴の持つ表現力の差異を明らかにする。音象徴の印象評定実験を行い、心理学的距離に差が生じ得るか検討した。印象評定実験では,Scheffe の一対比較法によって,選定した聴覚・視覚刺激の心理尺度上の距離を比較した.その結果,日本語母語話者においても,丸みを帯びた名前はブーバ顔と,角張った名前はキキ顔と強く結びつく傾向にあることが示された.

  • 音声言語コーパスへの発話スタイル属性付与のためのアノテーション規準作成と自動推定

    2020年   沈 睿

     概要を見る

    音声言語コーパスに収められたデータの発話スタイルについて、コーパス検索に適した体系を整理したうえで、主に言語処理技術により発話スタイル自動推定を可能にし、推定結果としての発話スタイルをコーパスの属性情報として活用できるようにすることを目指す。特定課題研究期間には、応募課題の発展のためにコーパスの内容を吟味してより具体的で現実的な問題を発見する。そのために、手元にあるコーパス20~30点の転記テキストデータを電子化し、プログラムなどで統一的に扱えるように形式を整えた。手元のコーパスの発話スタイルの網羅性を検討した。

  • 音声対話システム発話の音声言語的特徴制御によるインタラクション欲求向上

    2013年  

     概要を見る

    音声対話システムのシステム発話を制御することによってユーザに与える印象を変化させる技術の開発を目指している。本特定課題研究では、擬人化したシステムの自己開示によってパーソナリティを付与する手法に関する基礎研究を中心に進めた。実験を通じて、自己開示量と内容によって特定のパーソナリティを付与できることを確認した。この成果は、ヒューマンインタフェース学会論文誌に査読論文として掲載された(「自己開示による音声対話エージェントへのパーソナリティ付与」)。他にも、マイクロブログからユーモア発話を自動生成する技術(「非タスク指向対話システムにおけるマイクロブログを用いたユーモア発話の自動生成」)、発話速度あるいは無音区間長を制御する手法(「ロボット発話の話速・無音区間長の制御によるパーソナリティ認知と対話継続欲求の向上」)を検討し、それぞれによってユーザがシステムに抱く印象がどのように変化するかを実験により調査した。いずれも国内学会にて成果を発表した。ユーザ発話における音声のプロソディを解析することによってユーザの心的状態を推定して、それに応じてシステムの振舞を変えることによってユーザが抱く愛着感を変化させられることを実験により確認し、この成果を国際会議にて発表した(「Effects of an Agent Feature Comprehension on the Emotional Attachment of Users」)。いずれの研究においても、ユーザが抱く印象を変化させるこれらの手法によって、音声対話システムに対するインタラクション継続欲求が向上することを確認している。このことを一旦整理して国内学会にて発表した(「音声対話システムに対するインタラクション継続欲求」)。こうした一連の研究成果を体系化してさらに幅広く応用可能な技術を開発するために、インタラクション継続欲求とユーザ印象空間の関係を明確にする必要性が生じている。そこで最終的に、本特定課題研究を経て、2014年度科学研究費の基盤(C)に「音声対話システムに対するインタラクション欲求向上のためのユーザ印象空間の推定」というテーマを申請して採択された。

  • 生体情報を教師信号としたモデル学習による感情推定技術の高度化

    2006年  

     概要を見る

     本研究では、音声からの心的状態の推定において話者の心的状況をより高い精度で推定するため、生体情報を教師信号としたモデル学習を行う“生理心理学的アプローチの導入”を提案する。 従来の感情推定は、モデル学習の際に実験者の判断による評定結果が教師信号として用いられるため主観的方法であることが否めない。また推定の対象も基本的な感情にのみ重点が置かれてきた。 生体情報は、意図的な操作が入らず継時的な変化を捉えられることができるとされている。そのため、推定を行う際に実験の第一段階として生体信号を利用することで、多様で連続的な心情の変化を対象とすることができるようになり、またより客観的で精度の高い判断が可能になると思われる。 難度の異なる音読課題を2つ用意し、課題間における生体信号の反応の違いが音声の違いにも現れるのかを観察した。実験者の主観的評価によってストレス状態と判断された被験者の音声と、それらのうち生体信号の変化からもストレス状態にあると判断できた被験者の音声の比較を行う。 生体信号には、心的状態の推定へ利用できると思われた容積脈派(BVP)、心電図(EKG)、皮膚温(TEMP)、皮膚コンダクタンス(SC)を用いた。 音声の比較には、各音声からF0とパワーそれぞれの最大値、最小値、振幅、平均値、それに発話速度を加えた9つの特徴量を抽出し、これらを決定木学習に利用した。決定木学習には、C4.5アルゴリズムを使用し、交差検定を用いて評価を行う。 全データ(実験者の主観的評価のみによってストレス状態を判断した)で学習モデルを生成した場合平均63.9%であった判別率が、選別データ(主観的評価に加え、生体信号の変化からもストレス状態を判断した)で学習モデルを生成した場合には平均77.8%まで精度が向上した。 生体信号がストレス状態を判断するうえで一つの指標となり得ることを示唆する結果となった。本実験の結果、音声からの心的状態の推定を行う際に生体情報を利用することの有益性が実証された。