研究者詳細 - 笠原　博徳

写真a

カサハラ　ヒロノリ

笠原　博徳

Scopus 論文情報

論文数: 120 Citation: 1248 h-index: 16

Click to view the Scopus page. The data was downloaded from Scopus API in April 28, 2026, via http://api.elsevier.com and http://www.scopus.com .

Google Scholar 情報（Citations per year）

Citation: 5267 h-index: 31 i10-index: 84

Click to view the Google Scholar page.

Scopus 情報

News & Topics

2023.09.19

理工学術院・鷲崎教授がIEEE Computer Society会長に選出

所属

理工学術院基幹理工学部

職名

教授

学位

工学博士 ( 早稲田大学　電気工学（計算機システム） )
Doctor Engineering

ホームページ

http://www.kasahara.cs.waseda.ac.jp/kasahara.html.ja

経歴

2024年12月

-

継続中

IEEE Frances E. Allen Medal Committee Chair
2023年06月

-

継続中

ACM/IEEE ISCA (International Symposium on Computer Architecture) 2025 General Co-Chair
2023年01月

-

継続中

IEEE Life Fellow
2017年05月

-

継続中

日本工学アカデミー会員
2017年01月

-

継続中

IEEE Fellow
2010年01月

-

継続中

IEEE Computer Society Golden Core Member
2004年04月

-

継続中

早稲田大学アドバンストマルチコアプロセッサ研究所所長所長
1997年04月

-

継続中

早稲田大学理工学術院基幹理工学部情報理工学科教授
2020年06月

-

2024年06月

日本工学アカデミー理事
2019年05月

-

2023年05月

産業競争力懇談会（COCN）理事
2022年03月

-

2023年04月

公益財団法人国際科学技術財団 2023 Japan Prize審査委員会「エレクトロニクス、情報、通信」分野部会長代理
2020年04月

-

2022年09月

早稲田大学副総長（研究推進）
2019年06月

-

2021年05月

公益社団法人私立大学情報教育協会常務理事
2018年11月

-

2020年03月

早稲田大学副総長（研究推進、情報化推進担当）
2017年01月

-

2019年12月

IEEE Computer Society Strategic Planning Committee Chair
2018年01月

-

2018年12月

IEEE Technical Activity Board Member
2018年01月

-

2018年12月

IEEE Computer Society Board of Governors Chair
2018年01月

-

2018年12月

IEEE Computer Society 会長
2017年

-

　

日本学術会議連携会員
2015年

-

　

情報処理学会フェロー
2009年01月

-

2014年12月

IEEE Computer Society 理事
1988年04月

-

1997年03月

早稲田大学理工学部電気電子情報工学科助教授
1989年03月

-

1990年03月

Univ. of Illinois at Urbana-Champaign Center for Supercomputing R & D Visiting Research Scholar
1986年04月

-

1988年03月

早稲田大学理工学部電気工学科専任講師
1985年09月

-

1986年03月

日本学術振興会第１回特別研究員 (PD)
1985年07月

-

1985年12月

カリフォルニア大学バークレー Department of Electrical Engineering and Computer Science Visiting Scholar
1983年04月

-

1985年03月

早稲田大学理工学部電気工学科助手
2025年06月

-

継続中

ACM & IEEE ISCA (International Symposium on Computer Architecture) Steering Committee Member
2025年05月

-

継続中

公益財団法人大川情報通信基金（略称：大川財団）大川賞選定委員長
2025年05月

-

継続中

公益財団法人大川情報通信基金（略称：大川財団）理事
2021年06月

-

継続中

IEEE Frances E. Allen Medal Committee
2017年06月

-

2025年06月

公益財団法人大川情報通信基金（略称：大川財団）評議員
2018年06月

-

2024年06月

公益財団法人大川情報通信基金（略称：大川財団）大川賞審査委員
2021年01月

-

2022年09月

早稲田大学リサーチイノベーションセンター統括所長
2018年11月

-

2022年09月

早稲田大学オープンイノベーション戦略研究機構機構長
2018年11月

-

2022年09月

早稲田大学系属早稲田渋谷シンガポール校代表取締役
2018年11月

-

2022年09月

早稲田中学校・高等学校理事・評議員
2021年04月

-

2021年10月

IEEE Computer Society Election Committee Member
2020年09月

-

2020年12月

早稲田大学リサーチイノベーションセンター知財・研究連携支援部門（TLO）部門長
2019年06月

-

2020年12月

早稲田大学リサーチイノベーションセンター所長
2012年01月

-

2020年09月

IEEE Computer Society Multicore STC (Special Technical Community) Chair
2019年01月

-

2019年12月

IEEE Computer Society Nomination Committee Chair
2019年01月

-

2019年12月

IEEE Computer Society Past President
2017年01月

-

2019年12月

IEEE Computer Society Executive Committee Member
2018年11月

-

2019年05月

早稲田大学産学官研究推進センターセンター長
2018年01月

-

2018年12月

IEEE Computer Society Executive Committee Chair
2017年01月

-

2017年12月

IEEE Computer Society President Elect
2017年

-

　

Professional member of the IEEE-Eta Kappa Nu(IEEE-HKN)
2010年04月

-

2013年03月

エジプト日本科学技術大学客員教授
2011年04月

-

2011年09月

東京大学情報科学科非常勤講師

▼全件表示

学歴

1982年04月

-

1985年03月

早稲田大学大学院理工学研究科・博士課程電気工学専攻

工学博士
1980年04月

-

1982年03月

早稲田大学大学院理工学研究科・修士課程電気工学専攻

工学修士
1976年04月

-

1980年03月

早稲田大学理工学部電気工学科

工学士

委員歴

2025年06月

-

継続中

ACM & IEEE Computer Society ISCA (International Symposium on Computer Architecture) Steering Committee
2025年05月

-

継続中

大川情報通信基金理事
2025年05月

-

継続中

大川情報通信基金大川賞審査委員長
2024年12月

-

継続中

IEEE Frances E. Allen Medal Committee 委員長
2024年04月

-

継続中

文部科学省国立大学法人評価委員会臨時委員
2024年02月

-

継続中

国立研究開発法人科学技術振興機構博士後期課程学生支援事業委員会委員長
2023年06月

-

継続中

ACM / IEEE ACM/IEEEGeneral Co-Chair, ISCA2025 (International Symposium on Computer Architecture)
2023年04月

-

継続中

科学技術振興機構自己評価委員会分科会外部委員
2023年03月

-

継続中

科学技術振興機構研究成果開発事業大学発新産業創出プログラムガバニングボード委員
2023年03月

-

継続中

World Economic Forum Impact Circle: Innovation for the Public Sector Member
2023年01月

-

継続中

IEEE Life Fellow
2021年07月

-

継続中

科学技術振興機構研究成果展開事業大学発新産業創出プログラムプロジェクト推進型SBIRフェーズ1支援プログラムオフィサー（プロジェクト推進型SBIRフェーズ1支援委員会委員長）
2021年06月

-

継続中

IEEE Frances E. Allen Medal Committee
2020年06月

-

継続中

World Economic Forum Expert Network Member
2018年07月

-

継続中

IEEE-Eta Kappa Nu (IEEE-HKN) MuTau Chapter Adviser
2018年06月

-

継続中

大川情報通信基金審査委員
2018年02月

-

継続中

IEEE Eta Kappa Nu (IEEE-HKN) Professional member, IEEE-Eta Kappa Nu (IEEE-HKN)
2017年10月

-

継続中

日本学術会議日本学術会議連携会員
2017年10月

-

継続中

日本学術会議情報学委員会 ITの生む諸課題検討分科会構成員
2017年01月

-

継続中

IEEE Fellow, IEEE
2013年11月

-

継続中

オスカーテクノロジー株式会社顧問
2020年05月

-

2025年11月

科学技術振興機構ムーンショット型研究開発事業分野３, アドバイザー
2017年06月

-

2024年12月

大川情報通信基金評議員
2020年06月

-

2024年06月

日本工学アカデミー理事
2023年04月

-

2024年02月

科学技術振興機構次世代研究者挑戦的研究プログラム委員会委員長
2019年05月

-

2023年05月

産業競争力懇談会（COCN) 理事
2018年11月

-

2023年05月

ライフサイエンス・イノベーション・ネットワーク・ジャパン（LINK-J) 運営諮問委員
2022年03月

-

2023年04月

国際科学技術財団 2023 Japan Prize審査委員会「エレクトロニクス、情報、通信」分野部会長代理
2021年10月

-

2023年03月

研究基盤協議会アドバイザー
2021年05月

-

2023年03月

文部科学省公的研究費の適正な管理に関する有識者会議委員
2020年10月

-

2023年03月

文部科学省ジョブ型研究インターンシップ推進委員会委員
2019年06月

-

2023年03月

サーキュラーエコノミー推進機構（CEO) アドバイザリーボード
2020年04月

-

2022年09月

科学技術振興機構大学発新産業創出プログラム(W-SPRING) 総括責任者
2018年11月

-

2022年09月

早稲田中学校・高等学校理事・評議員
2018年11月

-

2022年09月

早稲田大学系属早稲田渋谷シンガポール校代表取締役
2021年07月

-

2022年03月

バイオインダストリー協会 Greater Tokyo Biocommunity 協議会委員
2021年01月

-

2021年12月

IEEE Computer Society Past President, IEEE Computer Society
2021年01月

-

2021年12月

IEEE Computer Society Chair of Board of Governors, IEEE Computer Society
2021年01月

-

2021年12月

IEEE Computer Society Chair of Executive Committee, IEEE Computer Society
2021年04月

-

2021年11月

ACM / IEEE ACM/IEEE Co-Chair, SC2021 Workshop on Programming Environments for Heterogeneous Computing (PEHC)
2021年02月

-

2021年11月

ACM / IEEE ACM/IEEE Committee Member, SC'21 Invited Speakers Committee
2021年05月

-

2021年11月

IEEE Computer Society Election Committee Member
2019年05月

-

2021年05月

私立大学情報教育協会常務理事
2019年06月

-

2021年02月

文部科学省科学技術・学術審議会専門委員
2020年08月

-

2020年12月

IEEE Computer Society Steering Committee Chair, IEEE InTech Forum: A Forum on the Response and Resiliency to COVID-19
2012年01月

-

2020年12月

IEEE Computer Society Chair, IEEE Computer Society Special Technical Community on Multicore
2020年07月

-

　

Other Society Chief Digital & Learning Officer, World Economic Forum :The Reimaging Learning for Higher Education Committee
2019年07月

-

2020年06月

稲盛財団京都賞先端技術部門専門委員会委員
2017年01月

-

2019年12月

IEEE Computer Society Chair of Strategic Planning (SP9) Committee
2019年01月

-

2019年08月

IEEE Computer Society Chair of Nomination Committee
2018年08月

-

2019年06月

IEEE Co-Chair of Future of Conputing, IEEE International Conference on Cloud Engineering (IC2E 2019)
2018年01月

-

2018年12月

IEEE Technical Activity Board (TAB)
2018年01月

-

2018年12月

IEEE Computer Society President, IEEE Computer Society
2017年08月

-

2018年03月

日本工学アカデミー会員
2016年04月

-

2018年03月

新エネルギー・産業技術総合開発機構（NEDO）事前評価者(ピアレビュア)
2010年04月

-

2018年03月

科学技術振興機構 JST CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出」評価委員
2017年11月

-

2017年12月

Other Society Steering Committee, The Ivannikov ISPRAS Open Conference, Institute for System Programming of the Russian Academy of Sciences
2017年01月

-

2017年12月

IEEE Computer Society Chair of Planning Committee
2017年01月

-

2017年12月

IEEE Computer Society Chair of Constitution & Bylaws Committee
2017年01月

-

2017年12月

IEEE Computer Society President Elect
2016年04月

-

2017年03月

情報処理学会情報処理学会2016年度代表会員
2016年03月

-

2017年03月

国際科学技術財団日本国際賞審査部会委員
2007年03月

-

2017年02月

文部科学省科学技術・学術審議会専門委員
2016年04月

-

2017年02月

ACM Program Committee, PPOPP 2017, the 22nd ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, Austin, Texas, USA
2011年02月

-

2017年01月

文部科学省情報科学技術委員
2015年12月

-

2016年11月

ACM / IEEE Program Committee, SC16, IEEE ACM International Conference for High Performance Computing, Networking, Storage and Analysis, Salt Palace Convention Center, Salt Lake City, Utah, USA
2016年04月

-

2016年09月

Other Society Program Committee, The 29th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2016), Rochester NY, USA
2016年02月

-

2016年03月

理化学研究所計算科学研究機構研究業績評価委員会委員
2015年04月

-

2015年09月

Other Society Program Committee, The 28th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2015), Raleigh, NC, USA
2015年06月

-

　

情報処理学会情報処理学会フェロー
2014年09月

-

2015年06月

情報処理学会情報処理学会2014年度シニア会員
2010年08月

-

2015年03月

文部科学省ハイパフォーマンス・コンピューティング・インフラ（ＨＰＣＩ）計画推進委員
2014年01月

-

2014年12月

IEEE Ad Hoc Committee on Serving Individuals in Industry Committee Member of IEEE Ad Hoc on Serving Individuals in Industry
2014年01月

-

2014年12月

IEEE Computer Society Member of Constitution & Bylaws Committees
2014年01月

-

2014年12月

IEEE Computer Society Member of Nomination Committees
2009年01月

-

2014年12月

IEEE Computer Society Board of Governors, Computer Society
2008年04月

-

2014年09月

内閣府政府調達苦情検討委員会専門委員
2014年04月

-

2014年09月

Other Society Program Committee, The 27th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2014), Intel Corporation, Hillsboro, OR, USA
2013年10月

-

2014年05月

電子情報技術産業協会 PC消費電力測定方法JIS原案作成委員会委員長
2014年01月

-

2014年03月

科学技術振興機構 JST CREST（組込みシステム用ディペンダブルＯＳ）研究領域追跡評価委員
2009年04月

-

2014年03月

新エネルギー・産業技術総合開発機構（NEDO） NEDO技術委員
2006年01月

-

2014年03月

科学技術振興機構 JST CREST「実用化を目指した組込みシステム用ディペンダブル・オペレーティングシステム」評価委員
2013年01月

-

2013年12月

IEEE The 2013 Nominations Committee
2013年04月

-

2013年09月

Other Society Program Committee, The 26th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2013), Qualcomm Research Silicon Valley, Santa Clara, CA, USA
2007年09月

-

2013年05月

電子情報技術産業協会 IT・エレクトロニクス人材育成検討会委員
2013年01月

-

2013年03月

文部科学省スーパーコンピュータ「京」事後評価委員会委員
2011年12月

-

2013年03月

日本原子力研究開発機構原子力基礎工学研究・評価委員会計算科学技術専門部会専門委員
2001年03月

-

2013年03月

文部科学省科学技術政策研究所科学技術専門家ネットワーク専門調査員
2011年12月

-

2012年11月

日本学術振興会科学研究費委員会専門委員
2012年11月

　

　

IEEE Program Committee, LASCCDCN2012, 2012 Latin America Symposium on Cloud Computing Datacenter and Networking, Mexico City, MEXICO
2012年04月

-

2012年09月

Other Society General Chair, The 25th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2012), Green Computing Systems R&D Center,Waseda University, Tokyo, Japan
2010年04月

-

2012年06月

理化学研究所次世代スーパーコンピュータ技術諮問委員
2012年06月

　

　

Other Society Program Committee, 2012 First Asia-Pacific Programming Languages and Compilers Workshop (APPLC 2012), Beijing, China
2012年06月

　

　

IEEE Program Committee, 11th IEEE/ACM International Conference on Ubiquitous Computing and Communications (IUCC 2012), Liverpool, UK
2011年04月

-

2012年02月

ACM Program Committee, PPOPP 2012, The 17th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, New Orleans, LA, USA
2010年12月

-

2011年11月

日本学術振興会科学研究費委員会専門委員
2011年10月

　

　

IEEE Program Committee, The Twentieth International Conference on Parallel Architectures and Compilation Techniques (PACT), Galveston Island, Texas, USA
2011年04月

-

2011年09月

Other Society Program Committee, The 24th International Workshop on Languages and Compilers for Parallel Computing (LCPC2011), Colorado State University, Fort Collins, Colorado, USA
2011年04月

-

2011年09月

東京大学非常勤講師
2011年03月

-

2011年09月

Other Society Program Committee, ICPP-EMS 2011 (The 2011 International Workshop on Embedded Multicore Systems), Taipei, Taiwan
2010年09月

-

2011年08月

エジプト日本科学技術大学客員教授
2011年05月

-

2011年07月

日本原子力研究開発機構原子力基礎工学研究・評価委員会専門委員
2011年06月

　

　

IEEE Program Committee, The 10th International Symposium on Parallel and Distributed Computing (ISPDC 2011), The Technical University of Cluj-Napoca, Romania
2011年03月

-

2011年05月

科学技術振興機構 JST CREST（組込みシステム用ディペンダブルＯＳ）研究領域中間評価委員
2011年05月

　

　

IEEE SYSTOR 2011 Program Committee
2011年04月

　

　

IEEE Program Committee, International Workshop on Innovative Architecture for Future Generation High-Performance Processors and Systems, Kohala Coast, Hawaii Hapuna Beach Prince Hotel
2010年12月

-

2011年03月

日本原子力研究開発機構原子力コード研究委員会委員
2009年06月

-

2011年03月

日本原子力研究開発機構「原子力分野におけるスーパーコンピューティングとモンテカルロ・シミュレーション」の合同国際会議（SNA2010+MC2010)組織委員会委員
2011年02月

-

　

新エネルギー・産業技術総合開発機構（NEDO）「グリーンネットワーク・システム技術研究開発プロジェクト（グリーンITプロジェクト）」技術委員会委員長
2009年02月

-

2011年01月

Other Society Editorial Board, The Encyclopedia of Parallel Computing (Springer)
2007年01月

-

2010年12月

IEEE Member, IEEE Japan Council Long Range Strategy Committee
2010年10月

　

　

Other Society Organizing Committee, The Joint International Conference of the 7th Supercomputing in Nuclear Application and the 3rd Monte Carlo (SNA-MC2010), Tokyo, Japan
2010年04月

-

2010年10月

Other Society Program Committee, The 23rd International Workshop on Languages and Compilers for Parallel Computing (LCPC2010), Rice University, Houston, Texas, USA
2009年12月

-

2010年06月

ACM Program Committee, ICS'10, 24th ACM International Conference on Supercomputing, Epochal Tsukuba, Tsukuba, Japan
2010年03月

-

　

経済産業省「アジア域内の知識経済化のためのＩＴ活用等支援事業（グリーンＩＴの推進）」審査委員会
2009年09月

-

2010年03月

理化学研究所次世代スーパーコンピュータ技術諮問委員
2009年09月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）「平成２１年度省エネルギー革新技術開発事業」第二次公募審査委員
2009年04月

-

2010年03月

文部科学省次世代スーパーコンピュータプロジェクト中間評価作業部会専門委員
2008年07月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）「グリーンネットワーク・システム技術研究開発プロジェクト（グリーンITプロジェクト）」採択審査委員会 NEDO技術委員
2008年07月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）平成20年度｢エネルギー使用合理化技術戦略的開発｣第2次公募」書面審査委員
2006年11月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（分野横断技術戦略検討WG）委員
2006年01月

-

2010年03月

日本原子力研究開発機構原子力コード研究委員会委員
2003年06月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術審議委員会戦略検討WG委員
2003年04月

-

2010年03月

新エネルギー・産業技術総合開発機構（NEDO）事前評価者(ピアレビュア)
2000年04月

-

2010年03月

日本原子力研究開発機構原子力コード研究委員会計算科学技術推進専門部会委員
1997年05月

-

2010年03月

日本原子力研究開発機構原子力計算科学研究評価専門部会情報技術専門部会
2010年03月

　

　

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術分野の技術ロードマップ（コンピュータ技術戦略検討ワーキンググループ）委員長
2009年10月

-

2010年03月

ACM Program Committee, 15th International Conference on Architectural Support for Programming Languages and Operating Systems (ASPLOS '10), Mar.13-17.2010, Pittsburgh, PA, USA
2009年07月

-

2009年12月

日本IBM 第２３回「日本IBM科学賞」コンピューター・サイエンス分野検討委員
2009年07月

-

2009年12月

経済産業省「データセンターの高信頼化に向けた技術開発・実証事業」審査委員
2009年12月

-

　

IEEE Program Committee, The Fifteenth International Conference on Parallel and Distributed Systems (ICPADS'09), Shenzhen, China
2009年08月

-

2009年12月

IEEE Program Committee, The 7th IEEE/IFIP International Conference on Embedded and Ubiquitous Computing (EUC-09), Vancouver, Canada
2009年01月

-

2009年12月

IEEE The 2009 Nominations Committee
2009年04月

-

2009年10月

Other Society Program Committee, The 22nd International Workshop on Languages and Compilers for Parallel Computing (LCPC 2009), University of Delaware, Newark, Delaware, USA
2009年02月

-

2009年09月

IEEE Program Committee, The 10th IEEE International Conference on High Performance Computing and Communications (HPCC-08), DaLian, China
2009年08月

-

2009年09月

新エネルギー・産業技術総合開発機構（NEDO）平成21年度「省エネルギー革新技術開発事業（旧事業名称：エネルギー使用合理化技術戦略的開発）」審査委員
2009年01月

-

2009年06月

IEEE Program Committee, The 11th IEEE International Conference on High Performance Computing and Communications (HPCC-09), Seoul, Korea
2009年01月

-

2009年06月

IEEE Program Committee, 8th International Symposium on Parallel and Distributed Computing (ISPDC'2009), Lisbon, Portugal
2006年11月

-

2009年05月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（コンピュータ技術戦略検討WG）委員長
2006年06月

-

2009年05月

情報処理学会情報処理学会論文誌シニア査読委員
2008年11月

-

2009年03月

新エネルギー・産業技術総合開発機構（NEDO）将来の進化を想定した低消費電力アーキテクチャに係わる検討委員会委員
2008年06月

-

2009年03月

海洋研究開発機構地球シミュレータ（ES2）導入技術アドバイザイリー委員会委員長
2008年01月

-

2009年03月

内閣府総合科学技術会議基本政策推進専門調査会分野別推進戦略総合ＰＴ情報通信ＰＴセキュリティ及びソフトウェア領域検討会メンバー
2008年01月

-

2009年03月

内閣府総合科学技術会議基本政策推進専門調査会分野別推進戦略総合ＰＴ情報通信ＰＴ研究開発基盤領域検討会メンバー
2004年07月

-

2009年03月

文部科学省科学技術振興調整費「重要課題解決型研究等の推進分散共有型研究データ利用基盤の整備（GRAPE-DR)」研究運営委員会委員
2009年03月

　

　

新エネルギー・産業技術総合開発機構（NEDO） IT・エレクトロニクス機器における省エネ関連技術の開発ロードマップ策定ヒアリングメンバー
2008年10月

-

2009年02月

ACM Program Committee, PPoPP2009, 14th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming, North Carolina, USA
2007年03月

-

2009年01月

文部科学省次世代スーパーコンピュータ概念設計評価作業部会専門委員
2008年07月

-

2008年12月

朝日新聞社高校生科学技術チャレンジJSEC2008審査委員
2008年09月

-

　

内閣府平成21年度科学技術関係概算要求への「資源配分方針の適用」に係る情報通信分野ヒアリング外部専門家
2008年01月

-

2008年09月

IEEE Program Committee, ICPP-2008, 2008 International Conference on Parallel Processing, Portland, Oregon
2008年03月

-

2008年06月

IEEE Program Committee, Workshop on Parallel Execution of Sequential Programs on Multi-core Architectures (PESPMA), Co-located with ISCA 2008, Beijing, China (IEEE, ACM)
2008年02月

-

2008年06月

IEEE Program Committee, HIPS 2008, 13th International Workshop on High-Level Parallel Programming Models and Supportive Environments, Miami, Florida
2008年01月

-

2008年06月

ACM Program Committee, ICS'08, 22nd ACM International Conference on Supercomputing, Island of Kos-Aegean Sea, Greece
2008年02月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「省エネルギー技術戦略における省エネ型生活情報空間創生技術及び次世代省エネデバイス技術の技術戦略に係る検討委員会」検討会座長
2005年07月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「リアルタイム情報家電用マルチコア技術の研究開発事業」実装アーキテクチャ検討委員長
2005年07月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「リアルタイム情報家電用マルチコア技術の研究開発事業」マルチコア・アーキテクチャ・API検討委員長
2005年07月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「リアルタイム情報家電用マルチコア技術の研究開発事業」研究開発推進委員長
2005年07月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「リアルタイム情報家電用マルチコア技術の研究開発事業」統合研究開発推進委員長
2005年07月

-

2008年03月

新エネルギー・産業技術総合開発機構（NEDO）「リアルタイム情報家電用マルチコア技術の研究開発事業」プロジェクトリーダー
2004年04月

-

2008年03月

情報処理学会計算機アーキテクチャ研究会運営委員
2005年12月

-

2007年12月

内閣府総合科学技術会議基本政策専門調査会分野別推進戦略（情報通信分野）セキュリティ及びソフトウェアWGメンバー
2005年12月

-

2007年12月

内閣府総合科学技術会議基本政策専門調査会分野別推進戦略（情報通信分野）研究開発基盤WGメンバー
2007年08月

-

2007年12月

朝日新聞社高校生科学技術チャレンジJSEC2007審査委員
2005年01月

-

2007年12月

IEEE Chair, IEEE Computer Society Japan Chapter
2005年01月

-

2007年12月

IEEE Board Member, IEEE Tokyo Section
2007年02月

-

2007年11月

IEEE Program Committee, SC 2007, The 2007 International Conference for High Performance Computing and Communications, Reno, Nevada (IEEE, ACM)
2007年01月

-

2007年07月

IEEE Program Committee, ISPDC 2006, 6th International Symposium on Parallel and Distributed Computing Hagenberg, Austria
2006年07月

-

2007年06月

ACM Program Committee, LCTES'07, ACM SIGPLAN/SIGBED 2007 Conference on Languages, Compilers, and Tools for Embedded Systems, San Diego, California
2007年01月

-

2007年06月

ACM Program Committee, ICS'07, 21st ACM International Conference on Supercomputing, Seattle, USA
2007年05月

-

　

新エネルギー・産業技術総合開発機構（NEDO）「次世代省エネデバイスロードマップ」監修委員
2006年08月

-

2007年03月

新エネルギー・産業技術総合開発機構（NEDO）研究評価委員会「半導体アプリケーションチッププロジェクト（高機能・高信頼性サーバー用半導体チップ）」分科会委員
2006年07月

-

2007年03月

内閣府「最先端・高性能汎用スーパーコンピュータの開発利用」プロジェクトスーパーコンピュータ戦略委員会委員
2006年06月

-

2007年03月

内閣府第5回産学官連携推進会議分科会「イノベーションの創出に向けた産学官連携の推進と人材の育成」パネリスト
2001年06月

-

2007年03月

科学技術振興機構さきがけ研究21「情報基盤と利用環境」領域アドバイザー
2000年07月

-

2007年03月

日本原子力研究開発機構原子力コード研究委員会専門委員
2006年11月

-

2007年03月

IEEE Program Committee, IPDPS 2007, 21st IEEE International Parallel & Distributed Processing Symposium, Long Beach, California USA, March 26-30, 2007
2005年04月

-

2007年03月

情報処理学会組込みシステム研究グループ運営委員会
2006年11月

-

2007年02月

経済産業省ビジネスグリッドコンピューティング事業に関する外部評価検討委員会委員
2006年08月

-

2006年12月

朝日新聞社高校生科学技術チャレンジJSEC2006審査委員
2005年12月

-

2006年10月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（分野横断技術戦略検討WG）委員
2005年12月

-

2006年10月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（コンピュータ技術戦略検討WG）委員長
2006年09月

　

　

IEEE Program Committee, PARELEC2006, International Conference on Parallel Computing in Electrical Engineering
2006年07月

　

　

IEEE Publication Chair, Twelfth International Conference on Parallel and Distributed Systems (ICPADS 2006), Minneapolis, USA
2005年11月

-

2006年03月

総務省「戦略的情報通信研究開発推進制度」専門評価委員
2004年06月

-

2006年03月

新エネルギー・産業技術総合開発機構（NEDO） NEDO技術委員
2004年06月

-

2006年03月

新エネルギー・産業技術総合開発機構（NEDO）「低消費電力型超電導ネットワークデバイスの開発」評価委員会分科会委員
2005年08月

-

2005年11月

朝日新聞社高校生科学技術チャレンジJSEC2005審査委員
2004年06月

-

2005年06月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（分野横断技術戦略検討WG）委員
2004年06月

-

2005年06月

新エネルギー・産業技術総合開発機構（NEDO）電子・情報技術戦略調査委員会（コンピュータ技術戦略検討WG）委員長
2005年01月

-

2005年06月

ACM Program Committee, ICS'05, 19th ACM International Conference on Supercomputing, Massachusetts, U.S.A
2004年12月

-

2005年03月

国際超電導産業技術研究センター SFQ素子を用いた超高速コンピューティング検討会メンバー
2004年12月

-

2005年03月

総務省「戦略的情報通信研究開発推進制度」専門評価委員
2003年06月

-

2005年03月

文部科学省科学技術振興調整費・総合研究「並列化コンパイラ向け共通インフラストラクチャの研究（COINS)」研究運営委員会委員
2004年04月

-

2005年03月

情報処理学会平成16年度代表会員
2005年02月

　

　

Other Society Program Committee, PDCN2005: the IASTED International Conference on Parallel and Distributed Computing and Networks, Innsbruck, Austria
2004年01月

-

2004年12月

情報処理学会論文誌：アドバンスト・コンピューティング・システム（ACS）編集委員会委員
2004年08月

　

　

Other Society Program Committee, ICPP04 (The 2004 International Conference on Parallel Processing), Montreal, Quebec, Canada
2004年07月

　

　

Other Society Program Committee, HPC Asia 2004 7th International Conference on High Performance Computing and Grid in Asia Pacific Region Omiya Sonic City, Tokyo Area, Japan
2003年06月

-

2004年05月

情報処理学会 SACSIS2004実行委員
2003年12月

-

2004年04月

Other Society Program Committee, HIPS04 (9th International Workshop on High-Level Parallel Programming Models and Supportive Enviroments), Santa Fe, New Mexico, USA
2003年04月

-

2004年03月

情報処理学会平成15年度代表会員
2000年04月

-

2004年03月

情報処理学会コンピュータサイエンス領域委員
2000年04月

-

2004年03月

情報処理学会計算機アーキテクチャ研究会運営委員会委員長（主査）
2004年02月

　

　

Other Society Program Committee, PDCN2005: the IASTED International Conference on Parallel and Distributed Computing and Networks, Innsbruck, Austria
2002年01月

-

2003年12月

情報処理学会論文誌：ハイパフォーマンスコンピューティングシステム（HPS）編集委員会委員
2003年10月

　

　

Other Society Program Committee, ICPP2003, International Conference on Parallel Processing 2003
2003年10月

　

　

Other Society Program Committee, ISHPC-V, The 5th International Symposium on High Performance Computing
2003年01月

-

2003年09月

日本学術振興会科学研究費委員会専門委員
2003年01月

-

2003年06月

ACM Program Committee, ICS'03, 17th ACM International Conference on Supercomputing, San Francisco, U.S.A
2002年06月

-

2003年05月

情報処理学会 SACSIS2003実行委員
2003年04月

-

　

経済産業省産業技術総合研究所・経済産業省大臣官房政策企画室共同「イノベーション・システムにおける研究開発人材に関する研究会（第7回）」講師
2002年12月

-

2003年04月

Other Society Program Committee, HIPS03, 8th International Workshop on High-Level Parallel Programming Models and Supportive Environments, held in conjunction with IPDPS2003, Nice, France
1995年05月

-

2003年04月

電子情報通信学会コンピュータシステム研究専門委員会専門委員
2002年05月

-

2003年03月

日本原子力研究所 ITBL基盤ソフトウェア評価専門部会委員
2001年08月

-

2003年03月

経済産業省 (NEDO) 「アドバンスト並列化コンパイラ技術国際協調委員会」委員長
2001年04月

-

2003年03月

株式会社半導体理工学研究センター（STARC）寄付講座テキスト作成プロジェクト STARC SoC技術教科書作成委員
2000年10月

-

2003年03月

経済産業省 (NEDO) 「アドバンスト並列化コンパイラ技術開発推進委員会」委員長
2000年10月

-

2003年03月

経済産業省 (NEDO) 「アドバンスト並列化コンパイラ技術研究会」委員長
2000年10月

-

2003年03月

経済産業省 (NEDO) 「アドバンスト並列化コンパイラ発明審査会」委員長
2000年10月

-

2003年03月

経済産業省 (NEDO) 「アドバンスト並列化コンパイラ技術委員会」委員長
2000年06月

-

2003年03月

経済産業省 (NEDO) ミレニアムプロジェクト「アドバンスト並列化コンパイラ」プロジェクトリーダー
2002年10月

-

2003年03月

電子情報通信学会英文論文誌「コンピュータシステム開発」小特集号編集委員会編集委員
2002年04月

-

2003年03月

情報処理学会平成14年度代表会員
2001年10月

-

2002年11月

日本情報処理開発協会先端情報技術研究所「ハイエンドコンピューティング技術調査ワーキンググループ」委員
2002年09月

　

　

IEEE Program Committee, PARELEC2002, International Conference on Parallel Computing in Electrical Engineering, Warsaw, Poland
2002年09月

-

　

経済産業省経済産業省大臣官房企画課政策企画室・独立行政法人経済産業研究所「子どもの幸せと自立を考える研究会」オブザーバー
2002年08月

　

　

Other Society Program Committee on Programming Methodologies & Tools, ICPP-2002, International Conference on Parallel Processing, Vancouver, British Columbia, Canada
2002年08月

　

　

Other Society Program Committee on Compilers and Languages, ICPP-2002, International Conference on Parallel Processing, Vancouver, British Columbia, Canada
2002年01月

-

2002年06月

ACM Program Committee, ICS'02, 16th ACM International Conference on Supercomputing, N.Y., U.S.A
2001年06月

-

2002年06月

情報処理学会 JSPP2002実行委員
2002年05月

　

　

Other Society Program Committee, ISHPC-Ⅳ, The 4th International Symposium on High Performance Computing
2002年02月

-

2002年05月

Other Society Program Committee, WOMPEI 2002, International Workshop on OpenMP : Experiences and Implementations
2002年04月

　

　

Other Society Program Committee, HIPS02, The 7th International Workshop on High-Level Parallel Programming Models and Supportive Environments, held in conjunction with IPDPS2002, Ft.Lauderdale, U.S.A.
2001年12月

-

2002年03月

日本情報処理開発協会「次世代電子情報基盤人材調査委員会」委員
2001年12月

-

2002年03月

日本情報処理開発協会「次世代情報人材調査研究WG委員会」委員
2000年04月

-

2002年03月

日本原子力研究所研究嘱託並列処理基本システムの研究開発
2001年04月

-

2002年03月

情報処理学会平成13年度代表会員
2002年02月

　

　

日本原子力研究所研究系職員中途採用試験研究業績評価委員
2001年06月

　

　

Other Society Organizing Committee, PDPTA'01, International Conference on Parallel Processing and Distributed Processing Techniques and Applications, Las Vegas, Nevada, U.S.A.
2000年06月

-

2001年06月

情報処理学会 JSPP2001実行委員
2000年04月

-

2001年05月

情報処理学会論文誌並列処理特集号編集委員会委員長
2000年10月

-

2001年03月

東京大学大学院理学系研究科博士学位論文審査委員
2000年10月

-

2001年03月

日本情報処理開発協会先端情報技術研究所「次世代電子情報基盤技術調査委員会」委員長
1999年10月

-

2001年03月

日本情報処理開発協会先端情報技術研究所「HECC（High End Computing and Communication）ワーキンググループ」委員
1999年06月

-

2001年03月

日本原子力研究所第4回原子力におけるスーパーコンピューティング国際会議組織委員会委員
1997年04月

-

2001年03月

東京電力株式会社学術評価委員会
1996年09月

-

2001年03月

経済産業省「産学官情報政策フォーラム」国内調査WG４（情報・システム[HPC]）主査
2001年03月

-

　

京都大学大型計算機センター第66回研究セミナー講師
2000年06月

-

2001年03月

情報処理学会著作権調査委員
2000年10月

　

　

Other Society Program Co-Chair, ISHPC'2000, International Symposium on High Performance Computing
2000年05月

-

2000年10月

Other Society Steering Committee, ISHPC2000, International Workshop on OpenMP: Experiences and Implementations
2000年09月

　

　

Other Society Steering Committee, JAERI Nuclear Supercomputing 2000
2000年08月

　

　

Other Society Program Committee, ICPP2000, International Conference on Parallel Processing 2000 The Westin Habor Castle, Toronto, Canada
2000年05月

　

　

Other Society Program Committee, HPC-Asia 2000, Beijing, China
1999年06月

-

2000年05月

情報処理学会 JSPP2000プログラム委員長
2000年04月

-

　

Other Society Editorial advisory board, Scientific Programming John Wiley & Sons, Inc.
1999年12月

-

2000年03月

日本情報処理開発協会先端情報技術研究所「超先端電子基盤技術調査委員会」委員
1999年07月

-

2000年03月

日本情報処理開発協会「スーパーコンパイラ・テクノロジ調査研究委員会並列化コンパイラWG」主査
1999年07月

-

2000年03月

日本情報処理開発協会「スーパーコンパイラ・テクノロジ調査研究委員会」委員
1999年04月

-

2000年03月

日本原子力研究所研究評価委員会専門委員計算科学技術専門部会
1997年04月

-

2000年03月

日本原子力研究所第1種客員研究員
1996年04月

-

2000年03月

情報処理学会計算機アーキテクチャ研究会連絡委員
1997年11月

-

1999年11月

Other Society Program Committee, ISHPC'97, Institute of Systems & Information Technologies/ KYUSHU, Fukuoka
1999年09月

　

　

Other Society Program Committee, ICPP'99, Aizu Univ., Fukushima, Japan
1999年06月

-

1999年07月

Other Society Program Committee, PDPTA'99, Las Vegas, Nevada, U.S.A.
1999年03月

-

1999年06月

ACM Program Committee, 13th ACM ICS Workshop on Scheduling Algorithms for Parallel/Distributed Computing -From Theory to Practice-, Rhodes, Greece
1999年01月

-

1999年06月

ACM Program Committee, ICS'99, 13th ACM International Conference on Supercomputing, Rhodes, Greece
1999年05月

　

　

Other Society Program Committee, ISHPC'99, Keihan International Plaza, Kyoto, Japan
1999年02月

-

1999年03月

日本原子力研究所研究評価委員会専門委員計算ソフト専門部会
1999年01月

-

1999年03月

日本原子力研究所研究系職員採用に係わる研究業績評価委員
1999年01月

-

1999年03月

日本情報処理開発協会「スーパーコンパイラ・テクノロジ調査研究委員会並列化コンパイラWG」主査
1999年01月

-

1999年03月

日本情報処理開発協会「スーパーコンパイラ・テクノロジ調査研究委員会」委員
1998年10月

-

1999年03月

日本原子力研究所博士研究員研究業績評価委員会（計算科学技術推進センター）委員
1996年10月

-

1999年03月

日本情報処理開発協会先端情報技術研究所「ペタフロップス・マシン研究動向調査WG」委員
1998年05月

-

1998年12月

文部科学省地球シミュレータ中間評価委員会委員
1998年03月

-

1998年09月

日本情報処理開発協会先端情報技術研究所「スーパーコンパイラシステム技術調査研究委員会」委員
1998年07月

　

　

Other Society Program Committee, PDPTA'98, Las Vegas, Nevada, U.S.A.
1998年06月

　

　

Other Society Organizing Committee, SGDC'98 The Symposium on Global Distributed Computing Toward The Year 2010, Waseda Univ., Tokyo, Japan
1997年06月

-

1998年05月

情報処理学会論文誌編集委員会Hグループ主査
1993年06月

-

1998年05月

情報処理学会論文誌編集委員
1996年01月

-

1998年03月

航空宇宙技術研究所「知的生産活動における創造性支援に関する基盤的研究」第3分科会委員
1997年09月

-

1998年03月

情報処理学会論文誌・研究会合同委員会委員
1995年04月

-

1998年03月

情報処理学会アルゴリズム研究会連絡委員
1986年04月

-

1998年03月

電気学会情報処理技術委員会幹事
1995年10月

-

1997年12月

電気学会並列処理技術動向専門調査委員会委員長
1993年01月

-

1997年12月

情報処理学会論文賞選定委員
1997年08月

　

　

Other Society Program Committee, ICPP'97, Bloomingdale, Illinois
1997年07月

-

　

日本原子力研究所研究系職員採用に係わる研究業績評価委員
1997年02月

-

1997年07月

ACM Program Committee, ICS'97, 11th ACM International Conference on Supercomputing, Vienna, Austria
1996年06月

-

1997年05月

情報処理学会論文誌編集委員会Hグループ副査
1994年04月

-

1997年03月

新情報処理開発機構（RWC）超並列アーキテクチャワークショップ委員
1996年05月

-

1997年03月

電子情報通信学会英文論文誌D「Parallel and Distributed Supercomputing」特集号（平成9年4月号）編集委員会幹事
1993年04月

-

1997年03月

情報処理学会システムソフトウェアとOS研究会連絡委員
1996年10月

　

　

IEEE Program Committee, SPDP'96, 8th Symposium on Parallel and Distributed Processing, New Orleans, Louisiana, U.S.A.
1995年11月

-

1996年05月

ACM Program Vice Chair, ICS'96, 10th ACM International Conference on Supercomputing, Philadelphia, Pennsylvania, U.S.A
1994年06月

-

1996年03月

電子情報通信学会マルチメディアインフラストラクチャ＆サービスに関する研究専門委員会委員
1993年01月

-

1995年12月

情報処理学会全国大会プログラム編成委員
1995年11月

　

　

IEEE Program Committee, ICECCS'95, First IEEE International Conference on Engineering of Complex Computer Systems, Westin Cypress Creek Hotel, Ft. Lauderdale, Florida, U.S.A
1995年02月

-

1995年07月

ACM Program Committee, ICS'95, 9th ACM International Conference on Supercomputing, Barcelone, Spain
1994年06月

-

1995年05月

情報処理学会 JSPP'95プログラム委員
1995年01月

-

1995年03月

日本原子力研究所研究評価委員会専門委員計算科学技術専門部会
1995年01月

-

1995年03月

航空宇宙技術研究所研究評価委員会専門部会専門委員（計算科学専門部会）
1995年

　

　

電気学会電子・情報・システム部門大会「マルチプロセッサ・スーパーコンピュータの動向」シンポジウム企画
1994年

-

1995年

電子情報通信学会和文論文誌D「実時間処理システムとその応用」特集号編集委員
1994年01月

-

1994年12月

情報処理学会電気連合大会プログラム委員
1994年09月

　

　

Other Society Program Committee, CONPAR'94/ VAPP VI International Conference on Parallel Processing and Vector and Parallel Processing in Computational Sciences, Linz, Austria (Springer-Verlag)
1992年10月

-

1994年09月

電気学会産業界における並列処理計算機技術動向調査専門委員会委員長
1993年11月

-

　

電気学会論文誌C11月号「並列処理技術」ゲストエディタ
1993年06月

-

　

情報処理学会論文誌査読委員
1992年06月

-

1993年05月

情報処理学会 JSPP'93プログラム委員
1992年06月

-

1993年05月

情報処理学会会誌編集委員会HWG主査
1990年06月

-

1993年05月

情報処理学会会誌編集委員
1993年01月

-

1993年03月

九州大学総合理工学研究科非常勤講師
1991年

-

1993年

電子情報通信学会コンピュータシステム研究会幹事
1992年01月

-

1992年12月

情報処理学会奨励賞選定委員
1991年06月

-

1992年05月

情報処理学会会誌編集委員会HWG副査
1988年04月

-

1991年03月

電気学会シミュレーション技術体系化調査専門委員会委員
1988年06月

-

1990年05月

情報処理学会会誌文献ニュース委員会委員
1988年04月

-

1990年03月

日本電子工業振興協会「分散計算機制御システム調査専門委員会」幹事

▼全件表示

所属学協会

2023年01月

-

継続中

IEEE Life Fellow
2018年07月

-

継続中

IEEE Eta Kappa Nu Waseda MuTau Student Chapter Adviser
2017年11月

-

継続中

IEEE Eta Kappa Nu Professional member,
2017年05月

-

継続中

公益社団法人日本工学アカデミー会員
2017年04月

-

継続中

日本学術会議連携会員
2017年01月

-

継続中

IEEE Fellow
2017年01月

-

継続中

公益財団法人大川情報通信基金評議員
2016年02月

-

継続中

IEEE Senior Member,
2015年06月

-

継続中

情報処理学会フェロー
1987年04月

-

継続中

ACM
1986年01月

-

継続中

IEEE Professional member
1983年01月

-

継続中

日本ロボット学会
1982年06月

-

継続中

IEEE Computer Society
1982年04月

-

継続中

電子情報通信学会
1982年01月

-

継続中

IEEE
1981年04月

-

継続中

情報処理学会
1982年06月

-

2024年12月

日本シミュレーション学会
2020年06月

-

2024年05月

日本工学アカデミー理事
2019年01月

-

2023年05月

一般社団法人産業競争力懇談会(COCN) 理事
2018年01月

-

2018年12月

IEEE Computer Society President
1980年04月

-

　

電気学会

▼全件表示

研究分野

計算機システム

研究キーワード

並列処理、並列化コンパイラ、マルチコアプロセッサ、グリーンコンピューティング, 計算機科学

受賞

Life Fellow

2023年01月 IEEE
テレコム先端技術研究支援センター(SCAT)表彰会長大賞

2021年01月テレコム先端技術研究支援センター(SCAT)

受賞者：笠原博徳
情報処理学会功績賞

2020年06月情報処理学会

受賞者：笠原博徳
Spirit of the IEEE Computer Society Award

2019年10月 IEEE Computer Society 世界におけるコンピュータ技術の研究・教育・標準化の発展に向けた顕著な貢献

受賞者： Hironori Kasahara
Fellow

2017年01月 IEEE

受賞者： Hironori Kasahara
情報処理学会フェロー

2015年06月

受賞者：笠原博徳
平成26年度科学技術分野の文部科学大臣表彰科学技術賞研究部門

2014年04月

受賞者：笠原博徳, 木村啓二
IEEE Computer Society Golden Core Member

2010年02月 IEEE

受賞者： Hironori Kasahara
Intel 2008 Asia Academic Forum Best Research Award

2008年10月 Intel

受賞者： Hironori Kasahara
半導体産業新聞主催第15回 LSI・オブ・ザ・イヤー 2008 準グランプリ

2008年07月
STARC(半導体理工学研究センター)共同研究賞

2005年01月
情報処理学会坂井記念特別賞

1997年
IFACワールドコングレス第1回若手著者賞

1987年 IFAC (International Federation of Automatic Control)

受賞者： Hironori Kasahara

▼全件表示

メディア報道

2024年7月10日開催未来の博士フェス2024 ～博士と創る、博士が輝く社会へ～プログラム冊子

インターネットメディア

文部科学省・科学技術振興機構(JST)

2024年07月
2024年7月10日開催未来の博士フェス2024 ～博士と創る、博士が輝く社会へ～ホームページ

インターネットメディア

科学技術振興機(JST)

2024年07月
未来の博士フェス2024 ～博士と創る、博士が輝く社会へ～」開催

インターネットメディア

文部科学省

2024年07月
早稲田大学量子技術社会実装拠点設立シンポジウム

インターネットメディア

早稲田大学量子技術社会実装拠点HP

2024年03月
アドバンストマルチコアプロセッサ研究所「IEEE ACM SC2023」に出展しました。

インターネットメディア

早大グリーン・コンピューティング・システム研究機構研究所ニュース

2024年02月
IEEE Computer Society (CS) Leaders Reveal Predictions on the Technologies to Watch in 2024: Generative AI leads expectations for the greatest impact this year

インターネットメディア

IEEE Computer Society, LOS ALAMITOS, Calif.

2024年01月
IEEE Computer Society Leaders Reveal Predictions on the Technologies to Watch in 2024

インターネットメディア

HPCwire

2024年01月
IEEE Computer Society (CS) Leaders Reveal Predictions on the Technologies to Watch in 2024

インターネットメディア

IEEE Computer Society

2024年01月
アクセラレータ付きマルチコア上でのリアルタイム制御計算の自動並列化・低消費電力化コンパイラ技術

インターネットメディア

TIER IV Workshop 2023 自動運転におけるAIコンピューティング

2023年07月
【都民が選ぶ】「教授が魅力的だと思う大学」ランキングTOP25！第1位は「東京大学」【2023年最新調査結果】第2位：早稲田大学

インターネットメディア

ねとらぼ

2023年04月
【70代以上に聞いた】「教授が魅力的だと思う大学」ランキング！第2位「早稲田大学」、第1位は？

インターネットメディア

ねとらぼ

2023年03月
RU11 special programme: Challenges and prospects for the World University Rankings: Japanese universities perspectives

その他

THE Asia Universities Summit 2022, EVENT REPORT

2022年05月
早稲田渋谷シンガポール校, 2022.04.21, 2022年度入学式が挙行されました：笠原博徳副総長には来賓としてご参加いただき、ご祝辞を賜りました

インターネットメディア

早稲田渋谷シンガポール校ホームページ

2022年04月
早稲田大学力拒逆流開放創新生態促進国際化

新聞・雑誌

亜洲週刊, 2022年第17期 2022/4/25-5/1号

2022年04月
産学橋渡しのための政策と体制 2.3.3 早稲田大学

その他

JST CRODS 調査報告書「イノベーションエコシステム形成に向けた産学橋渡しの現状と課題」, CRDS-FY2021-RR-04

2022年03月
早大が「WOI'22」：イノベーションの情報共有、カーボンニュートラル研究も

インターネットメディア

みんなの経済新聞ネットワーク,Yahoo Japan News

2022年02月
Waseda Carbon Net Zero Challenge: Advanced Research -Interview with Waseda University Senior Executive Vice President Hironori Kasahara-

インターネットメディア

Waseda Net Carbon Zero Challenge Home Page

2022年01月
Waseda Open Innovation Forum 2022 (WOI'22) Promotion Video

インターネットメディア

Waseda Univ. HP

2022年01月
ＷOIフォーラム'22 紹介ビデオ

インターネットメディア

早稲田オープン・イノベーション・フォーラム2022 ホームページ

2022年01月
The Future of Tech: 2022 Technology Predictions Revealed

その他

IEEE Computer Society

2022年01月
Computing Experts Release Scorecard for IEEE Computer Society’s 2021 Tech Predictions

インターネットメディア

HPC-Wire

2021年12月
大学の声、企業の声：早稲田大学オープンイノベーション戦略研究機構機構長笠原博徳

インターネットメディア

文部科学省オープンイノベーション機構の整備事業ホームページ

2021年12月
Waseda Carbon Net Zero Challenge カーボンニュートラル達成への取り組み:最先端研究笠原博徳副総長インタビュー

インターネットメディア

Waseda Net Carbon Zero Challenge ホームページ

2021年11月
コマツ大橋会長が早稲田大学の研究の現場を訪問

その他

早稲田大学HP

2021年10月
研究成果展開事業大学発新産業創出プログラム＜大学・エコシステム推進型スタートアップ・エコシステム形成支援＞２０２１年度採択機関の決定について

その他

科学技術振興機構

2021年10月
次世代研究者挑戦的研究プログラムにおける新規プロジェクトの決定について

その他

科学技術振興機構

2021年09月
2020年度SCAT表彰会長大賞笠原博徳教授が受賞しました【7/7 受賞記念講演】

インターネットメディア

執筆者：本人以外

早大グリーン・コンピューティング・システム研究機構研究所ニュース

2021年06月
早稲田大学時代を切り開く伝統と校風

インターネットメディア

執筆者：本人以外

朝日新聞「大学力2021」

2021年05月
研究成果展開事業大学発新産業創出プログラム＜社会還元加速プログラム（SCORE）大学推進型（拠点都市環境整備型）＞2020年度採択機関の決定について

その他

科学技術振興機構

2021年03月
早稲田大学オープンイノベーション戦略研究機構

インターネットメディア

執筆者：本人以外

早稲田大学HP

2021年03月
program of Start up incubation from COre REsearch : SCORE

インターネットメディア

執筆者：本人以外

早稲田大学HP

2021年03月
【WOI'21】早稲田オープン・イノベーション・フォーラム開催告知！

インターネットメディア

執筆者：本人以外

早稲田大学HP

2021年02月
Engineering Education in the Age of Autonomous Machines

インターネットメディア

CoRR abs/2102.07900

2021年02月
新しい世界価値の創造

インターネットメディア

Waseda Net Carbon Zero Challenge ホームページ

2021年
オックスフォード大学との研究交流促進へ

会誌・広報誌

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 238

2021年01月
60th Anniversary of the Information Processing Society of Japan (IPSJ) --60 Years of Historical Accomplishments and Advancements in Computing--

その他

執筆者：本人以外

IEEE Computer Society

2020年12月
早稲田オープン・イノベーション・フォーラム2021

その他

執筆者：本人以外

早稲田大学HP

2020年12月
イノベーションを実現する早稲田大学の研究推進 -早稲田大学HP-

その他

執筆者：本人以外

早稲田大学HP

2020年12月
Aiming to Become a 'Waseda that Shines on the World Stage': Launching Partnerships Between Industry, Government, and Academia with Building 121

その他

執筆者：本人以外

Waseda Weekly

2020年12月
イノベーションを実現する早稲田大学の研究推進

インターネットメディア

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW

2020年12月
1989年イリノイ大学での研究が想像していなかった未来を

その他

執筆者：本人以外

公益財団法人村田海外留学奨学会創設50周年記念誌 pp.38

2020年10月
イノベーションを実現する早稲田大学の研究推進

その他

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 237 pp.6

2020年10月
イノベーション・エコシステムを支える大学の役割

その他

執筆者：本人以外

Road to Silicon Valley Event Summary Report pp.5

2020年10月
世界で輝くWASEDA」を目指して 121号館から始まる産官学連

その他

執筆者：本人以外

早稲田ウィークリー

2020年10月
2020年度GITIフォーラム『ICT技術で乗り切るコロナ社会』開催

その他

執筆者：本人以外

早稲田大学HP

2020年09月
研究成果展開事業大学発新産業創出プログラム＜社会還元加速プログラム（SCORE）大学推進型＞ 2020年度採択機関の決定について

その他

執筆者：本人以外

科学技術振興機構

2020年09月
4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム

インターネットメディア

執筆者：本人以外

国立情報学研究所

2020年09月
IoTやAI人材育成へ県がコマツ、早大と協定 -読売新聞地方版-

インターネットメディア

執筆者：本人以外

読売新聞地方版

2020年09月
産学官でデジタル技術の人材育成 -NHK 石川-

インターネットメディア

執筆者：本人以外

NHK 石川

2020年09月
高度人材育成へ協力県とコマツ、早大が連携協定／石川 -毎日新聞地方版-

インターネットメディア

執筆者：本人以外

毎日新聞地方版

2020年09月
石川から先端技術人材を石川県、コマツ、早大が協定締結 -北國新聞-

インターネットメディア

執筆者：本人以外

北國新聞

2020年09月
AI技術者など育成「学校」開講石川県、コマツ、早大連携 -北陸中日新聞-

インターネットメディア

執筆者：本人以外

北陸中日新聞

2020年09月
IoTやAI人材育成へ県がコマツ、早大と協定

新聞・雑誌

執筆者：本人以外

読売新聞地方版

2020年09月
高度人材育成へ協力県とコマツ、早大が連携協定／石川

新聞・雑誌

執筆者：本人以外

毎日新聞地方版

2020年09月
石川から先端技術人材を石川県、コマツ、早大が協定締結

新聞・雑誌

執筆者：本人以外

北國新聞

2020年09月
AI技術者など育成「学校」開講石川県、コマツ、早大連携

新聞・雑誌

執筆者：本人以外

北陸中日新聞

2020年09月
産学官でデジタル技術の人材育成

テレビ・ラジオ番組

執筆者：本人以外

NHK 石川

2020年09月
石川県、コマツ、早稲田大 IoT人材育成など連携協定締結式 -MRO北陸放送-

インターネットメディア

執筆者：本人以外

MRO北陸放送

2020年09月
石川県、コマツ、早稲田大 IoT人材育成など連携協定締結式

テレビ・ラジオ番組

執筆者：本人以外

MRO北陸放送

2020年09月
笠原副総長がシンポジウムにて本学のCOVID-19についての対応に関する講演を行いました

その他

執筆者：本人以外

早稲田大学大学総合研究センター

2020年07月
University-wide agreement concluded between Oxford and Waseda

その他

執筆者：本人以外

Waseda Univ. HP

2020年04月
オックスフォード大学と大学間協定締結

その他

執筆者：本人以外

早稲田大学HP

2020年04月
University of Oxford signs Memorandum of Understanding with Waseda University

その他

執筆者：本人以外

University of Oxford HP

2020年04月
早大、産学連携施設を開設 200社超の利用見込む

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2020年04月
東京大学と連携・協力の推進に関する基本協定書締結

その他

執筆者：本人以外

早稲田大学HP

2020年03月
EECS Seminar: Green Multicore Computing

インターネットメディア

執筆者：本人以外

Samueli School of Engineering University of California, Irvine

2020年02月
How Waseda University is Helping Japan Stay Competitive

その他

執筆者：本人以外

Science Magazine, Vol. 367, Issue.6479

2020年02月
Robots, Baseball, and Bilingualism Embody Waseda University' s Culture of Scholarship

その他

執筆者：本人以外

Science Magazine, Vol.367, Issue.6478

2020年02月
Theoretical and Applied Research Help Cut Pollution

その他

執筆者：本人以外

Science Magazine, Vol.367, Issue.6476

2020年01月
Waseda University: Driving positive change in science and society

インターネットメディア

執筆者：本人以外

American Association for the Advancement of Science

2020年01月
--Parallelising Compiler for Green Multicore Computing-- Professor Hironori Kasahara (Waseda University)

その他

執筆者：本人以外

University of Oxford HP

2019年12月
世界的に活躍されている笠原博徳・副総長（研究・情報化推進）より、「早稲田大学の研究力強化に向けた取り組み～早稲田オープン・イノベーションバレー構想～」について2019年12月7日(土)商議員フォーラムにて講演がありました

インターネットメディア

西早稲田稲門会・早稲田ニュース（大学・校友会関連等）ホームページ

2019年12月
筒井瑛美『世界学術サミット参加レポート』pp.8-9

その他

執筆者：本人以外

Between:特集教育・研究の両輪と世界大学ランキング

2019年11月
犀牛鳥学聞 | 早稲田大学笠原副校長一行訪問騰訊

その他

執筆者：本人以外

騰訊高校合作

2019年11月
産業立国・日本を再興する唯一の道が、産学連携

その他

執筆者：本人以外

LINK-J Interview Column

2019年10月
レーザー笠原さん--イノベの日--

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2019年10月
新産業創出へ総力結集 --『イノベバレー構想』早大、施設連動--

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2019年09月
Baidu ABC Institute and IEEE Computer Society Sign Memorandum of Understanding and Secure Global Partner Program

その他

執筆者：本人以外

MarketWatch

2019年08月
Gallery of 2019 Winners: IEEE Computer Society's Board of Governors Honors Newest Award Recipients

その他

執筆者：本人以外

Computer, IEEE CS

2019年06月
IEEE Computer Society Awards Presentations

その他

執筆者：本人以外

Computer, IEEE CS

2019年06月
前田建設工業株式会社 ICI総合センターを見学

その他

執筆者：本人以外

早稲田大学HP

2019年05月
Multigrain Parallelization and Compiler/Architecture Co-design for 30 Years, Hironori Kasahara, pp.22

その他

執筆者：本人以外

Springer Nature Switzerland AG 2019, LNCS (Lecture Notes in Computer Science) 11403, Languages and Compilers for Parallel Computing, -- 30th International Workshop, LCPC 2017, College Station, TX, USA, October 11?13, 2017, Revised Selected Papers

2019年04月
Thank you Prof. Vivek Sarkar @GerogiaTech GT Computing for visiting @Waseda_Univ and giving a talk

その他

執筆者：本人以外

早稲田大学 Twitter

2019年03月
Computer Society marks Russia's 70th anniversary in computer science

その他

執筆者：本人以外

Computer, IEEE CS

2018年12月
Welcome to SC18 Supercomputing Conference, with world's fastest temporary network at 4.02 terabytes a second. How fast is that? Enough to download Netflix's entire HD movie library in 45 seconds.

その他

執筆者：本人以外

Computer, IEEE CS

2018年12月
IEEE Computer Society Brings Tencent and Waseda University Together for Special Event

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2018年12月
Tencent Travels to IEEE Computer Society President's Research Center in Japan to Discuss Supercomputing, Robotics under Global Partner Program

その他

執筆者：本人以外

Computer, IEEE CS

2018年12月
Gallery of 2018 IEEE Computer Society Award Winners

その他

執筆者：本人以外

Computer, IEEE CS

2018年12月
早稲田大世界トップ級狙うより優れた教員採用に力早稲田大学新総長田中愛治氏に聞く外国籍教員に固執せず、大学院拡充見直す

新聞・雑誌

執筆者：本人以外

日本経済新聞

2018年12月
51st International Symposium on Microarchitecture (Micro-51): Record attendance, Rau Award winner, and a sake casket-opening ceremony, all in Japan

その他

執筆者：本人以外

Computer, IEEE CS

2018年11月
Hironori Kasahara congratulated ISP RAS and IEEE Computer Society Russia with the 70th anniversary of IT

インターネットメディア

執筆者：本人以外

ISP RAS HP (Ivannikov Institute for System Programming of the RAS)

2018年11月
ACM Ken Kennedy Award

その他

執筆者：本人以外

ACM HP

2018年11月
Vice President, Executive Vice President,Executive Directors and Auditors 副総長、常任理事、理事および監事

インターネットメディア

執筆者：本人以外

早稲田大学HP

2018年11月
Vice President, Executive Vice President, Executive Directors and Auditors

インターネットメディア

執筆者：本人以外

早稲田大学HP

2018年11月
オスカーテックコンパイラ顧客の逐次プログラムを並列化

その他

執筆者：本人以外

電波新聞

2018年10月
2018中国計算机大会在杭州隆重挙行"

その他

執筆者：本人以外

大会新聞CNCC News

2018年10月
"Global AI Narratives" (ケンブリッジ大学) ケンブリッジ大学とのAIに関する国際ワークショップ（招待制）

インターネットメディア

執筆者：本人以外

高橋利枝オフィシャルウェブサイト

2018年09月
Global AI Narratives - Tokyo Workshop (invitation only: up to 40)

インターネットメディア

執筆者：本人以外

Toshie Takahashi Official Website

2018年09月
30年の粘りが生んだ：マルチコアCPUの"真価"を引き出す自動並列化ソフト

インターネットメディア

執筆者：本人以外

EE Times Japan

2018年08月
国重成功主弁ACM ICS-2018大会

インターネットメディア

執筆者：本人以外

中国科学院計算技術研究所

2018年07月
組込み向けマルチ・メニーコアソフトウェア開発テクニカルセミナー開催のお知らせ

インターネットメディア

執筆者：本人以外

ガイオ・テクノロジー株式会社

2018年07月
情報学の分野における若手研究者を表彰～情報処理学会とIEEE-CSによる表彰制度を新設～

インターネットメディア

執筆者：本人以外

Dream News

2018年07月
［プレスリリース］情報学の分野における若手研究者を表彰～情報処理学会とIEEE-CS による表彰制度を新設～

インターネットメディア

執筆者：本人以外

情報処理学会

2018年07月
Name of HKN Chapter

インターネットメディア

執筆者：本人以外

IEEE HP

2018年07月
世界的に活躍している教授陣から直接学べ高いレベルの研究ができることが魅力

インターネットメディア

執筆者：本人以外

早稲田大学HP

2018年07月
Proxor and IEEE Computer Society (CS) to co-host the COMPSAC 2018 Software Developer-Java Programming T1 Challenge

インターネットメディア

執筆者：本人以外

Proxor and IEEE Computer Society (CS)

2018年06月
"協調設計"にとらわれず、ユーザー最適の製品を作る -日経XTECH-

インターネットメディア

執筆者：本人以外

日経XTECH

2018年04月
"協調設計"にとらわれず、ユーザー最適の製品を作る

その他

執筆者：本人以外

日経エレクトロニクス

2018年04月
Meet Hironori Kasahara, The 2018 President of the IEEE Computer Society

その他

執筆者：本人以外

Interface, IEEE CS

2018年04月
会見IEEE計算机協会2018年主席笠原博德。他的計劃是什麼?

その他

執筆者：本人以外

IEEE計算机協会

2018年03月
Computer and IEEE Micro Magazines Highlight Intel's Loihi, a Revolutionary Neuromorphic 'Self-Learning' Chip

その他

執筆者：本人以外

KSLA NEWS12

2018年03月
Meet Hironori Kasahara, The 2018 President Of The IEEE Computer Society. What Are His Plans?

その他

執筆者：本人以外

Computer, IEEE CS

2018年03月
Now Accepting Nominations for Computer Society Officer Positions

その他

執筆者：本人以外

Interface, IEEE CS

2018年03月
Hironori Kasahara Edit Profile computer science educator

インターネットメディア

執筆者：本人以外

Prabook

2018年01月
新入正会員のご紹介

その他

執筆者：本人以外

EAJ News

2017年12月
Future of Green Multicore Computing

インターネットメディア

執筆者：本人以外

Dipartimento di Elettoronica

2017年07月
Message from the CAP 2017 Organizing Committee

インターネットメディア

執筆者：本人以外

COMPSAC 2017

2017年07月
Automatic Cache and Local Memory Optimization for Multicores

インターネットメディア

執筆者：本人以外

17th INTERNATIONAL FORUM ON MPSoC

2017年07月
2017年新Fellow授賞式と懇親会［Bulletin106号］

その他

執筆者：本人以外

IEEE 東京支部

2017年05月
2016年度下半期研究関連記事閲覧数ランキング早稲田の研究力が世界で評価されています

インターネットメディア

執筆者：本人以外

早稲田大学HP

2017年04月
5年先行く並列ソフト技術、デスバレーの先に巨大市場

インターネットメディア

執筆者：本人以外

日経テクノロジーオンライン

2017年04月
Cool Chips, Low Power Multicores, Open the Way to the Future

インターネットメディア

執筆者：本人以外

COOL CHIPS2017

2017年04月
未来のコンピューターが作る、その先の未来とは？-- 『戦略的コンピューティングイニシアティブ』を開催 --

インターネットメディア

執筆者：本人以外

早稲田大学HP

2017年04月
Beyond the future created by computers -- International SISA Workshop 'Extreme-Scale HPC and Big Data Systems: A Pathway to Their Convergence and Beyond' --

インターネットメディア

執筆者：本人以外

Waseda Univ. HP

2017年04月
ソフトウェアの並列化技術を提供するベンチャーのオスカーテクノロジー株式会社への出資を決定

インターネットメディア

執筆者：本人以外

株式会社産業革新機構HP

2017年03月
INCJ to invest in Oscar Technology Corporation A venture company providing software parallelization technology

インターネットメディア

執筆者：本人以外

Innovation Network Corporation of Japan HP

2017年03月
70年の歴史上初めて米国・カナダ以外から選出 --理工学術院笠原教授がIEEE Computer Society会長に--

その他

執筆者：本人以外

CAMPUS NOW

2017年02月
米国のExascaleプロジェクトの基本計画が明らかに

インターネットメディア

執筆者：本人以外

マイナビニューステクノロジー

2017年01月
70年の歴史上初めて米国・カナダ以外から選出 --理工学術院笠原教授がIEEE Computer Society会長に--

インターネットメディア

執筆者：本人以外

読売新聞

2017年01月
International Workshop on A Strategic Initiative of Computing: Systems and Applications (SISA): Integrating HPC, Big Data, AI and Beyond

インターネットメディア

執筆者：本人以外

Japan ROBOT Database System

2017年01月
International Workshop on A Strategic Initiative of Computing: Systems and Applications (SISA): Integrating HPC, Big Data, AI and Beyond

インターネットメディア

執筆者：本人以外

早稲田大学スーパーグローバル大学創成支援(SGU)

2016年12月
International Workshop on A Strategic Initiative of Computing: Systems and Applications (SISA): Integrating HPC, Big Data, AI and Beyond

インターネットメディア

執筆者：本人以外

SGU, Waseda University

2016年12月
The future of tech: 16 trends for 2017 through 2022

インターネットメディア

執筆者：本人以外

Health Data Management

2016年12月
理工、笠原教授が世界最大の研究者・技術者組織IEEEフェローに選出

インターネットメディア

執筆者：本人以外

iptops.com

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

Yahoo finance

2016年12月
理工学術院、笠原教授が世界最大の研究者・技術者組織IEEEフェローに選出

インターネットメディア

執筆者：本人以外

早稲田大学HP

2016年12月
理工学術院、笠原教授が世界最大の研究者・技術者組織IEEEフェローに選出

インターネットメディア

執筆者：本人以外

早稲田大学理工学術院

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

EconoTimes

2016年12月
IEEE Computer Society Predicts the Future of Tech for 2017 and Next Five Years

インターネットメディア

執筆者：本人以外

Yahoo singapore finance

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

The Sacramento Bee

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

StreetInsider

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

Silicon Valley Business Journal

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

San Francisco Business Times

2016年12月
IEEE Computer Society Predicts the Future of Tech for 2017 and Next Five Years

インターネットメディア

執筆者：本人以外

PR Newswire

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

Pittsburgh Post-Gazette

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

New York Business Journal

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

MarketWatch

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

ITBusinessNet

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

infoTECH Spotlight

2016年12月
IEEE Computer Society Predicts the Future of Tech for 2017 and Next Five Years

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

EE Times

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

Denver Business Journal

2016年12月
IEEE Computer Society expects blockchain technology to reach adoption in 2017

インターネットメディア

執筆者：本人以外

Boston Business Journal

2016年12月
2017 Newly Elevated Fellows

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2016年12月
IEEE Computer Society Japan Chapter Young Author Award 2016 及び笠原教授2018年会長就任記念の基調講演会

インターネットメディア

執筆者：本人以外

IEEE Computer Society Tokyo/Japan Joint Chapter

2016年11月
西電承弁｜HPC NPC等一大波國際學術會議來襲

インターネットメディア

執筆者：本人以外

必品文章網

2016年10月
西電承弁｜HPC NPC等一大波國際學術會議來襲

インターネットメディア

執筆者：本人以外

西電承弁

2016年10月
西電承弁第十三届網絡与并行計算国際会議

インターネットメディア

執筆者：本人以外

西安電子科技大学学術信息網

2016年10月
西電承弁第十三届網絡与并行計算国際会議

インターネットメディア

執筆者：本人以外

西安電子科技大学新聞網

2016年10月
IEEE Computer Society elects its first president from Japan in its 70-year history

インターネットメディア

執筆者：本人以外

早稲田大学HP

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に70年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

Faculty of Science and Engineering, Waseda University

2016年10月
IEEE Computer Society elects its first president from Japan in its 70-year history

インターネットメディア

執筆者：本人以外

早稲田大学 Facebook

2016年10月
早稲田大学の笠原教授が世界コンピュータ学会会長に北米以外から初選出

インターネットメディア

執筆者：本人以外

大学ジャーナルONLINE

2016年10月
早稲田大学の笠原教授が世界コンピュータ学会会長に北米以外から初選出

インターネットメディア

執筆者：本人以外

IT記者会レポート

2016年10月
笠原教授がIEEE（アイ・トリプル・イー）Computer Societyの2018年会長に選出されました

インターネットメディア

執筆者：本人以外

早大グリーン・コンピューティング・システム研究機構研究所ニュース

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に７０年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

早稲田大学HP

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に70年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

日本の研究.com

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に７０年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

特許業界・知的財産業界情報トップスiptops.com

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に70年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

早稲田大学理工学術院

2016年10月
理工学術院・笠原教授がIEEE Computer Society会長に70年の歴史上初めて北米以外から選出

インターネットメディア

執筆者：本人以外

早稲田大学 Facebook

2016年10月
Hironori Kasahara Voted 2017 IEEE Computer Society President-Elect

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2016年09月
2016 IEEE Computer Society Election Results -- Hironori Kasahara selected 2017 President-Elect (2018 President)--

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2016年09月
IEEE Computer Society Election Opens on 01 August 2016

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2016年07月
ウーラ・レポート（第１回）：スマート社会を拓くグリーン・コンピューティング --産学連携による社会実装にむけて--

インターネットメディア

執筆者：本人以外

早稲田大学HP

2016年04月
パーソン＝早稲田大学理工学術院教授笠原博徳氏グリーンICT実現へ独自マルチコア技術確立

新聞・雑誌

執筆者：本人以外

化学工業日報

2016年04月
最速・省エネの両立を目指したマルチコアプロセッサ及び並列化コンパイラの製品化

その他

執筆者：本人以外

塔

2016年03月
Passionately pursuing research and inspiring students for over 30 years

インターネットメディア

執筆者：本人以外

WASEDA ONLINE

2016年02月
Pursuing Excitement for Over 30 Years -早稲田ウィークリー-

インターネットメディア

執筆者：本人以外

早稲田ウィークリー

2016年02月
Pursuing Excitement for Over 30 Years

その他

執筆者：本人以外

早稲田ウィークリー

2016年02月
30年以上続くワクワク感--目指していることは変わらない--

その他

執筆者：本人以外

早稲田ウィークリー

2016年02月
30年以上続くワクワク感--目指していることは変わらない--

インターネットメディア

執筆者：本人以外

早稲田ウィークリー

2016年01月
Gaudiot Voted 2016 Computer Society President-Elect, pp.102-103

その他

執筆者：本人以外

Computer, IEEE Computer Society

2015年12月
環境に優しい低消費電力コンピューター技術社会実装へ製品化開始 --車、スマホからガン治療まで--

新聞・雑誌

執筆者：本人以外

科学新聞

2015年11月
早稲田大学笠原・木村研究室

インターネットメディア

執筆者：本人以外

Embedded Technology 2015

2015年11月
自動車・携帯電話・がん治療まで応用可能なマルチコアプロセッサ及び並列化コンパイラ、社会実装へ

インターネットメディア

執筆者：本人以外

早稲田大学HP

2015年11月
Japanese ambassador welcomed opportunities for UD-Japan collaborations focus of visit

インターネットメディア

執筆者：本人以外

UDaily, University of Delaware

2015年11月
自動車・携帯電話からがん治療まで環境にやさしく電力の少ないコンピュータ技術の製品化が開始 --世界初で米国特許済み、低消費電力マルチコア産官学連携研究が社会実装へ--

インターネットメディア

執筆者：本人以外

共同通信PRワイヤー

2015年11月
自動車・携帯電話・がん治療まで応用可能なマルチコアプロセッサ及び並列化コンパイラ、社会実装へ【早稲田大学】

インターネットメディア

執筆者：本人以外

Automotive Engineers' Guide

2015年11月
オスカーテックコンパイラ顧客の逐次プログラムを並列化

その他

執筆者：本人以外

電波新聞

2015年10月
注目の組込みシステム最新技術--オスカーテックコンパイラ顧客の逐次プログラムを並列化--

新聞・雑誌

執筆者：本人以外

電波新聞

2015年10月
Global computing collaboration

インターネットメディア

執筆者：本人以外

UDaily, University of Delaware

2015年09月
「一般社団法人情報処理学会」から６名の本学研究者が同時受賞

インターネットメディア

執筆者：本人以外

早稲田大学HP

2015年06月
[フェロー対象業績] 自動並列化コンパイラとコンパイラ協調型マルチコアプロセッサ技術に対する貢献

インターネットメディア

執筆者：本人以外

一般社団法人情報処理学会

2015年06月
低電力消費とハイパフォーマンスコンピューティングの両立に向けて：早稲田大学

インターネットメディア

執筆者：本人以外

IT media

2015年06月
IEEE Computer Society 2022 Report: In Era of Seamless Intelligence, Information Will Be Gathered by Our Senses

インターネットメディア

執筆者：本人以外

Forward Geek

2014年11月
Roger Fujii Voted 2015 IEEE Computer Society President-Elect

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2014年10月
Technology in 2022: A Report from the IEEE

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2014年10月
IEEE Report shows how ingrained IoT has become in our future

インターネットメディア

執筆者：本人以外

Rethink Internet of Things

2014年10月
What will our world look like in 2022? --IEEE Computer Society

インターネットメディア

執筆者：本人以外

@godwin. Caruana

2014年09月
IEEE: 23 technologies that could make 2022 look a whole lot different

インターネットメディア

執筆者：本人以外

Smart itiies Council

2014年09月
IEEE Computer Society Looks to the Future with Report on Top Technologies for 2022 -Cloud Computing-

インターネットメディア

執筆者：本人以外

Cloud Computing

2014年09月
IEEE Picks Top 23 Technologies for 2022

インターネットメディア

執筆者：本人以外

eweek

2014年09月
IEEE Visualises The Technology Landscape in 2022

インターネットメディア

執筆者：本人以外

Computer Business Review

2014年09月
Candidates Approved for 2014 IEEE Computer Society Election -i-Newswire.com-

インターネットメディア

執筆者：本人以外

i-Newswire.com

2014年06月
平成26年度科学技術分野の文部科学大臣表彰に本学から３名理工・笠原教授、木村教授、高等研・田邊助教 -Yomiuri Online-

インターネットメディア

執筆者：本人以外

Yomiuri Online

2014年04月
平成26年度科学技術分野の文部科学大臣表彰に本学から３名理工・笠原教授、木村教授、高等研・田邊助教 -早稲田大学ニュース-

インターネットメディア

執筆者：本人以外

早稲田大学ニュース

2014年04月
平成26年度科学技術分野の文部科学大臣表彰に本学から３名理工・笠原教授、木村教授、高等研・田邊助教 -レスポンス-

インターネットメディア

執筆者：本人以外

レスポンス

2014年04月
早稲田大学平成26年度科学技術分野の文部科学大臣表彰に本学から３名理工・笠原教授、木村教授、高等研・田邊助教 -共同通信PRワイヤー-

インターネットメディア

執筆者：本人以外

共同通信PRワイヤー

2014年04月
Three Waseda professors receive Education Minister 2014 Commendations for Science and Technology

インターネットメディア

執筆者：本人以外

The Japan News by The Yomiuri Shimbun

2014年04月
平成26年度科学技術分野の文部科学大臣表彰に本学から３名理工・笠原教授、木村教授、高等研・田邊助教

その他

執筆者：本人以外

早稲田大学プレスリリース,

2014年04月
平成26年度科学技術分野の文部科学大臣表彰科学技術賞受賞者一覧

インターネットメディア

執筆者：本人以外

文部科学省

2014年04月
早稲田大学笠原博徳・木村啓二研究室の優れた研究成果を産業界とリンク

インターネットメディア

執筆者：本人以外

オスカーテクノロジー株式会社

2014年
IEEE Computer Society Looks to the Future with Report on Top Technologies for 2022

インターネットメディア

執筆者：本人以外

iReach by PR Newswire

2014年
President Elect

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2014年
IEEE predicts Top Technologies for 2022

インターネットメディア

執筆者：本人以外

eweek

2014年
Candidates Approved for 2014 IEEE Computer Society Election

インターネットメディア

執筆者：本人以外

Calameo

2014年
IEEE predicts top technologies for 2022

インターネットメディア

執筆者：本人以外

Bicsi South Pacific

2014年
マルチコア用ソフト並列化オスカーテクノロジー

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2013年12月
イーソル、プログラム並列化支援サービスの研究を早稲田大学と共同で開始

インターネットメディア

執筆者：本人以外

YAHOO! JAPAN ニュース

2012年11月
イーソル、早稲田大学と共同で「OSCARコンパイラ」を用いたマルチコアプロセッサ向けプログラム並列化支援サービスに向けた共同研究を開始

インターネットメディア

執筆者：本人以外

ValuePress!

2012年11月
イーソル、プログラム並列化支援サービスの研究を早稲田大学と共同で開始

インターネットメディア

執筆者：本人以外

Pixiv

2012年11月
イーソルなど、マルチコア向けプログラム並列化支援サービスの研究を開始

インターネットメディア

執筆者：本人以外

nikoniko news

2012年11月
イーソルなど、マルチコア向けプログラム並列化支援サービスの研究を開始

インターネットメディア

執筆者：本人以外

マイナビニュース

2012年11月
イーソル、プログラム並列化支援サービスの研究を早稲田大学と共同で開始

インターネットメディア

執筆者：本人以外

msn topics

2012年11月
イーソルなど、マルチコア向けプログラム並列化支援サービスの研究を開始

インターネットメディア

執筆者：本人以外

Mapionニュース

2012年11月
イーソルなど、マルチコア向けプログラム並列化支援サービスの研究を開始

インターネットメディア

執筆者：本人以外

Livedoor NEWS

2012年11月
イーソル、プログラム並列化支援サービスの研究を早稲田大学と共同で開始

インターネットメディア

執筆者：本人以外

japan.internet.com

2012年11月
イーソル、早稲田大学と共同で「OSCARコンパイラ」を用いたマルチコアプロセッサ向けプログラム並列化支援サービスに向けた共同研究を開始

インターネットメディア

執筆者：本人以外

製品ナビ

2012年11月
イーソル、プログラム並列化支援サービスの研究を早稲田大学と共同で開始

インターネットメディア

執筆者：本人以外

excite.news

2012年11月
イーソルなど、マルチコア向けプログラム並列化支援サービスの研究を開始

インターネットメディア

執筆者：本人以外

excite.news

2012年11月
イーソル、早稲田大学と共同で「OSCARコンパイラ」を用いたマルチコアプロセッサ向けプログラム並列化支援サービスに向けた共同研究を開始

インターネットメディア

執筆者：本人以外

イーソル株式会社プレスリリース

2012年11月
US Patent Issued to Hitachi, Renesas Electronics, Waseda University on June 12 for 'Data Transfer Unit in Multi-Core Processor' (Japanese Inventors)

インターネットメディア

執筆者：本人以外

HighBeam RESEARCH

2012年06月
マルチコアプロセッサシステムを高性能化並列プログラムの高速・低消費電力動作が可能に

新聞・雑誌

執筆者：本人以外

科学新聞

2012年05月
マルチコアプロセッサ向け並列プログラムソフトウェア標準「OSCAR API」の評価環境にイーソルの「eT-Kernel Multi-Core Edition」が採用

インターネットメディア

執筆者：本人以外

Tech -On! Nikkei BP

2012年05月
早稲田大学を中心に策定された、マルチコアプロセッサ向け並列プログラムのソフトウェア標準「OSCAR API」の評価環境に、イーソルのマルチコア対応「リアルタイムOS eT-Kernel Multi-Core Edition」が採用

インターネットメディア

執筆者：本人以外

製品ナビ

2012年05月
マルチコアプロセッサシステム上で並列プログラムの高速・低消費電力動作が可能理工・笠原研、世界初のソフトウェア標準(OSCAR API ver. 2.0)を開発・無料公開 -早大グリーン・コンピューティング・システム研究機構研究所ニュース-

インターネットメディア

執筆者：本人以外

早大グリーン・コンピューティング・システム研究機構研究所ニュース

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

YAHOO! JAPAN ニュース

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

webapi.jpn.com

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

unwired job professional.jp

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

prtimes.jp

2012年04月
ホモジニアス/ヘテロジニアスマルチコア対応「OSCAR API ver.2.0」を公開

インターネットメディア

執筆者：本人以外

PC Watch

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

マイナビニュース

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

media jam

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

livedoorニュース

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

Infoseekニュース

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

HosPit119.net

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

Hatena Bookmark

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

excite.news

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

choix.jp

2012年04月
早大、ソフトウェア標準「OSCAR API ver.2.0」を開発

インターネットメディア

執筆者：本人以外

apiclip.blogspot.jp

2012年04月
マルチコアプロセッサシステム上で並列プログラムの高速・低消費電力動作が可能理工・笠原研、世界初のソフトウェア標準(OSCAR API ver. 2.0)を開発・無料公開

その他

執筆者：本人以外

早稲田大学プレスリリース

2012年04月
高性能スマホ効率開発早大、日立などとソフト無料公開

新聞・雑誌

執筆者：本人以外

日経産業新聞

2012年04月
イーソルの「eT-Kernel Multi-Core Edition」が、マルチコアプロセッサ向けソフトウェア標準「OSCAR API」の評価環境に採用

インターネットメディア

執筆者：本人以外

markezine.jp

2012年04月
イーソルの「eT-Kernel Multi-Core Edition」が、マルチコアプロセッサ向けソフトウェア標準「OSCAR API」の評価環境に採用

インターネットメディア

執筆者：本人以外

高知県プレス

2012年04月
イーソルの「eT-Kernel Multi-Core Edition」が、マルチコアプロセッサ向けソフトウェア標準「OSCAR API」の評価環境に採用

インターネットメディア

執筆者：本人以外

ipadnews.jp

2012年04月
イーソルの「eT-Kernel Multi-Core Edition」が、マルチコアプロセッサ向けソフトウェア標準「OSCAR API」の評価環境に採用

インターネットメディア

執筆者：本人以外

イーソル株式会社プレスリリース

2012年04月
Oscar API 仕様書ダウンロード

その他

執筆者：本人以外

早稲田大学情報理工学科笠原研究室

2012年04月
マルチコア・システムの潜在能力は開発ツール群とOSの協調で引き出す

インターネットメディア

執筆者：本人以外

日経BP Tech-on 特別座談会

2011年07月
Securing a competitive advantage for Japan through green IT which supports a low-carbon society

インターネットメディア

執筆者：本人以外

Asia Research News

2011年06月
究極の高性能・節電コンピュータで日本の未来を切り拓け -CYBERNET NEWS, No.133 SUMMER-

インターネットメディア

執筆者：本人以外

CYBERNET NEWS, No.133 SUMMER

2011年06月
究極の高性能・節電コンピュータで日本の未来を切り拓け

その他

執筆者：本人以外

CYBERNET NEWS, No.133 SUMMER, pp.4-7

2011年06月
早大が研究開発センター開設

新聞・雑誌

執筆者：本人以外

映像新聞

2011年05月
グリーン・コンピューティング・システム研究開発センターをオープン記念シンポジウムでメニーコア技術など産学共同の先端研究を報告

インターネットメディア

執筆者：本人以外

早稲田大学HPトップページ

2011年05月
プロジェクト研究最前線

インターネットメディア

執筆者：本人以外

WASEDA研究特区

2011年05月
研究力「WASEDA研究特区」

インターネットメディア

執筆者：本人以外

読売オンライン

2011年05月
早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立 -Unwired Job Professional -

インターネットメディア

執筆者：本人以外

Unwired Job Professional

2011年05月
早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立 -midashi.jp -

インターネットメディア

執筆者：本人以外

midashi.jp

2011年05月
早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立 -media jam-

インターネットメディア

執筆者：本人以外

media jam

2011年05月
早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立 -Hatena Bookmark -

インターネットメディア

執筆者：本人以外

Hatena Bookmark

2011年05月
早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立 -ファーストキャリアトレーディングのシステム開発-

インターネットメディア

執筆者：本人以外

ファーストキャリアトレーディングのシステム開発

2011年05月
【レポート】「早大、未来のグリーン・コンピューティング実現に向けた研究開発拠点を設立」

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2011年05月
スーパーテクニカルサーバ「SR16000シリーズ」にハイエンドモデル「SR16000 モデルVM1」をラインアップ

その他

執筆者：本人以外

日立はいたっく, 2011年Spring 5月号, pp.17

2011年05月
早大・名大環境技術開発へ拠点

新聞・雑誌

執筆者：本人以外

日経産業新聞

2011年05月
低消費電力ＩＴ機器研究拠点を公開早大

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2011年05月
早稲田大学シンポジウム開催

インターネットメディア

執筆者：本人以外

東進ドットコム

2011年05月
早稲田大学シンポジウム開催

インターネットメディア

執筆者：本人以外

TOSHIN TIMES 教育情報Express

2011年05月
グリーン・コンピューティングの研究開発拠点が竣工

その他

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 196 pp.4

2011年05月
早稲田大学40号館

その他

執筆者：本人以外

新建築社新建築 4月号, pp.101

2011年04月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

Qlep北海道

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

ニュースリリースポータル News2u.net

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

Mapion? ニュース

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

Livedoorニュース

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

IT業界プレスリリース情報

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

Infoseekニュース

2011年03月
【スーパーテクニカルサーバ新製品】日立、「SR16000モデルVM1」を販売開始。早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

IMPRESS BUSINESS MEDIA

2011年03月
日立、スーパーテクニカルサーバSR16000シリーズに新モデル「VM1」を追加

インターネットメディア

執筆者：本人以外

IT Leaders

2011年03月
日立、科技計算スパコンの新モデル発売－理論ピーク性能6.4倍」

インターネットメディア

執筆者：本人以外

asahi.com

2011年03月
スーパーテクニカルサーバ「SR16000シリーズ」に「SR16000 モデルVM1」を追加早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

その他

執筆者：本人以外

日立ニュースリリース

2011年03月
理論ピーク性能6.4倍科学技術計算スパコン早大に納入

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2011年03月
科学技術計算向けに新サーバー

新聞・雑誌

執筆者：本人以外

化学工業日報

2011年03月
POWER7プロセッサ搭載スーパーテクニクカルサーバー新モデル追加

新聞・雑誌

執筆者：本人以外

電波新聞

2011年03月
日立、スーパーテクニカルサーバー「SR16000シリーズ」に「SR16000 モデルVM1」を追加早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

日経プレスリリース

2011年03月
株式会社日立製作所スーパーテクニカルサーバ「SR16000シリーズ」に「SR16000 モデルVM1」を追加：早稲田大学の「グリーン・コンピューティング・システム研究開発センター」に先行納入

インターネットメディア

執筆者：本人以外

日刊工業新聞Business Line

2011年03月
日立、スーパーテクニカルサーバー「SR16000シリーズ」に「SR16000 モデルVM1」を追加

インターネットメディア

執筆者：本人以外

Bluecom

2011年03月
次世代マルチコアプロセッサの並列化で日本の技術を世界のトップに

インターネットメディア

執筆者：本人以外

Waseda理工OnLine受験生版

2010年10月
【MPSoC】SH4のマルチコアSoCの低電力化，日立とルネサスそれぞれがハードとソフトの試みを紹介

インターネットメディア

執筆者：本人以外

Nikkei Electronics Tech On

2010年06月
Putting Japanese Technology at the Top of the World with Parallelization of Next Generation Multicore Processors.

インターネットメディア

執筆者：本人以外

innovations report

2010年05月
最高レベルの性能・低消費電力処理を実現次世代家電向けLSIを開発

インターネットメディア

執筆者：本人以外

WASEDA ONLINE (YOMIURI ONLINE) キャンパスナウ

2010年05月
Waseda University's Prof. Kasahara is seeding the next revolution in eco-friendly computing, by Hugh Ashton

その他

執筆者：本人以外

ACCJ Journal (American Chamber of Commerce in Japan)

2010年02月
The Japanese supercomputer next generation shelved?

インターネットメディア

執筆者：本人以外

Science Knowledge

2010年02月
Knowledge Co-Creation Profiles of researchers Putting Japanese Technology at the Top of the World With Parallelization of Next Generation Multicore Processors

インターネットメディア

執筆者：本人以外

Daily Yomiuri Online Waseda Online

2010年02月
次世代スパコン計算違い転用・借用でコスト削減

新聞・雑誌

執筆者：本人以外

朝日新聞

2010年02月
次世代家電向けLSIを共同開発業界最高レベルの性能・低消費電力処理を実現しました」

その他

執筆者：本人以外

早稲田大学プレスリリース

2010年02月
次世代マルチコアプロセッサの並列化で日本の技術を世界のトップに

インターネットメディア

執筆者：本人以外

WASEDA ONLINE

2010年02月
LSI 電力性能2倍カーナビ向け高速で画像検索

新聞・雑誌

執筆者：本人以外

日経産業新聞

2010年02月
異種のマルチコア型LSI最高レベルの電力性能ルネサスなど達成

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2010年02月
ヘテロジニアスマルチコア型LSI開発 1W当たり37GOPS達成

新聞・雑誌

執筆者：本人以外

電波新聞

2010年02月
業界最高レベルの電力性能比37GOPS/Wを実現した次世代情報家電向けヘテロジニアスマルチコアLSIを開発 -Jpubb-

インターネットメディア

執筆者：本人以外

Jpubb

2010年02月
次世代情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

テクノフィーチャー

2010年02月
ルネサスら，次世代情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

Semiconductor Japan Net

2010年02月
ルネサス：ヘテロジニアスマルチコアの組み込み用プロセッサ

インターネットメディア

執筆者：本人以外

PC Watch

2010年02月
ルネサステクノロジや日立など、次世代テレビやレコーダー向けの高性能マルチコアLSIを開発

インターネットメディア

執筆者：本人以外

NIKKEI NET

2010年02月
ルネサスなど、次世代情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

日刊工業新聞

2010年02月
ISSCC 2010 - ルネサスら、ヘテロジニアスマルチコア型システムLSIを開発

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2010年02月
ルネサステクノロジや日立など、次世代情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

IT+PLUS

2010年02月
ルネサステクノロジや日立など、次世代テレビやレコーダー向けの高性能マルチコアLSIを開発

インターネットメディア

執筆者：本人以外

ファイル・ウェブ

2010年02月
ルネサスら、ヘテロジニアスマルチコア型システムLSIを開発

インターネットメディア

執筆者：本人以外

Feed Archive

2010年02月
業界最高レベルの電力性能比37GOPS/Wを実現,次世代情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

ELISNET

2010年02月
ルネサス、37GOPS/Wの情報家電向けヘテロジニアスマルチコアLSIを開発

インターネットメディア

執筆者：本人以外

EDR, LLC

2010年02月
ISSCC 2010 - ルネサスら、ヘテロジニアスマルチコア型システムLSIを開発

インターネットメディア

執筆者：本人以外

BIO IMPACT

2010年02月
業界最高レベルの性能比37GOPS/Wを実現した次世代情報家電向けヘテロジニアスマルチコアLSIを開発」

その他

執筆者：本人以外

ルネサステクノロジプレスリリース

2010年02月
業界最高レベルの電力性能比37GOPS/Wを実現した次世代情報家電向けヘテロジニアスマルチコアLSIを開発

その他

執筆者：本人以外

日立プレスリリース

2010年02月
並列ソフトウェアの時代：第二部並列化プログラム、成功させるためのポイント

インターネットメディア

執筆者：本人以外

EE Times Japan

2009年12月
Wasedauniversitetet Japan bygger super-cpu

インターネットメディア

執筆者：本人以外

Newsbrook

2009年11月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

MCU BBS

2009年11月
UPCRC Illinois: Research Seminar-Hironori Kasahara,Waseda University

インターネットメディア

執筆者：本人以外

PARALLEL@ILLINOIS

2009年10月
Japanese researchers downplay super CPU effort

インターネットメディア

執筆者：本人以外

ZDNet

2009年10月
Njujork podneo tuzbu protiv Intel-a

インターネットメディア

執筆者：本人以外

PC Press info

2009年10月
Intel bi tong tan cong bang du an super CPU

インターネットメディア

執筆者：本人以外

Newsad.org

2009年10月
सात Chipmakers सिम्मिलत हों हाथ नई ूोसेसर िवकिसत करनेके िलए

インターネットメディア

執筆者：本人以外

GURUPERL.net

2009年10月
Japanese researchers downplay super CPU effort

インターネットメディア

執筆者：本人以外

Design Analysis

2009年10月
Panasonic: Projekat upravljanja energijom u kuci

インターネットメディア

執筆者：本人以外

PC Press info

2009年10月
Japanese researchers have used parallel chip

インターネットメディア

執筆者：本人以外

Joomla Onair

2009年10月
Japanese researchers harness parallel chips

インターネットメディア

執筆者：本人以外

ZDNet UK

2009年09月
Japanisches Projekt soll Standard-API fur MulticoreProzessoren entwickeln

インターネットメディア

執筆者：本人以外

ZDNet News

2009年09月
Japanese Researchers Downplay Super CPU Effect

インターネットメディア

執筆者：本人以外

communications of the ACM

2009年09月
Japanese Researchers Downplay Super CPU Effect

インターネットメディア

執筆者：本人以外

CACM (Communications of the ACM)

2009年09月
Japanese researchers downplay super CPU effort

インターネットメディア

執筆者：本人以外

ZDNet Asia

2009年09月
Full Coverage: Japanese researchers downplay super CPU effort

インターネットメディア

執筆者：本人以外

Newstin

2009年09月
「デジタル家電向けCPUの規格統一」に見る「地道な取り組み」 -@IT-

インターネットメディア

執筆者：本人以外

@IT

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

World Tech Magazine

2009年09月
Cac hang Nhat phat trien CPU tiet kiem dien nang

インターネットメディア

執筆者：本人以外

VietnamPlus

2009年09月
Intel to get a new competitor by 2012

インターネットメディア

執筆者：本人以外

Techie-buzz AMD

2009年09月
Giappone: maxi-allenza nei microprocessori contro

インターネットメディア

執筆者：本人以外

Swissinfo.ch

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Striker

2009年09月
Seven Chipmakers Join Hands to Develop New ProcessorTake on Intel and AMD

インターネットメディア

執筆者：本人以外

softpedia

2009年09月
Japan spending $42m to develop solar-powered 'super CPU'

インターネットメディア

執筆者：本人以外

silobreaker

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

OSNews

2009年09月
Japanese electronics giants set to make microprocessor

インターネットメディア

執筆者：本人以外

NordicHardware

2009年09月
Japanese Firms In CPU Alliance To Unseat Intel

インターネットメディア

執筆者：本人以外

Nikkei.com

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

NexGadget

2009年09月
Cac hang Nhat phat trien CPU tiet kiem dien nang

インターネットメディア

執筆者：本人以外

Kinhte hop, tac viet nam

2009年09月
Intel Atom dev program launched, seeks to inspire netbookcentric applications

インターネットメディア

執筆者：本人以外

Kev.W

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Insomnia

2009年09月
Japan lapkagyartok az Intel ellen

インターネットメディア

執筆者：本人以外

Informatika Online

2009年09月
Japan Fashions Super Chip

インターネットメディア

執筆者：本人以外

Forbes.com

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

ENGADGET

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Elanso

2009年09月
Japon elektronik devleri, Intel'e karsi bir araya geliyorlar

インターネットメディア

執筆者：本人以外

donanimhaver.com

2009年09月
Japan to Develop Super CPU

インターネットメディア

執筆者：本人以外

CDRinfo.com

2009年09月
Japan spending $42m to develop solar-powered 'super CPU'

インターネットメディア

執筆者：本人以外

Business Green

2009年09月
インテルの挑戦でしょうか？

インターネットメディア

執筆者：本人以外

@astera

2009年09月
第112回「デジタル家電向けのCPUの規格統一」に見る「地道な取り組み」

インターネットメディア

執筆者：本人以外

頭脳放談

2009年09月
Νεο πρωτοποριακό chip-επεξεργαστής

インターネットメディア

執筆者：本人以外

zefyr

2009年09月
Япония: догнать и перегнать Intel

インターネットメディア

執筆者：本人以外

DonbassUA

2009年09月
Основатели GLOBALFOUNDRIES покупают Chartered

インターネットメディア

執筆者：本人以外

3D News

2009年09月
Японцы бросят вызов Intel?

インターネットメディア

執筆者：本人以外

Понедельник, 07 Сентября, 2009

2009年09月
Японцы бросят вызов Intel?

インターネットメディア

執筆者：本人以外

Mobus news

2009年09月
Японцы бросят вызов Intel?

インターネットメディア

執筆者：本人以外

@astera

2009年09月
"सात Chipmakers सिम्मिलत हों हाथ नई ूोसेसर िवकिसत करनेके िलए"

インターネットメディア

執筆者：本人以外

GURUPERL.net

2009年09月
Linux for realtid fran Wind River

インターネットメディア

執筆者：本人以外

ELEKTRONIK

2009年09月
A japan oriasok kihivjak az Intelt

インターネットメディア

執筆者：本人以外

PROHARDVER

2009年09月
A japan oriasok kihivjak az Intelt

インターネットメディア

執筆者：本人以外

Bovito.hu

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

sketchubar

2009年09月
Эра мобильных одноядерных чипов на пороге заката

インターネットメディア

執筆者：本人以外

3DNews

2009年09月
Giganter bag plan om str?m-besparende chip

インターネットメディア

執筆者：本人以外

Ingenioren

2009年09月
日大厂結盟来勢洶洶 ARM威脇更顕迫切 Intel地位岌岌可危

インターネットメディア

執筆者：本人以外

Cibu.cn

2009年09月
Japanische Elektronikkonzerne wollen Intel-Chips durch Eigenentwicklung

インターネットメディア

執筆者：本人以外

Zdnews.de

2009年09月
Toshiba, Nec, Hitachi et Canon contre Inetel sur les processeurs

インターネットメディア

執筆者：本人以外

UNHOMME.FR

2009年09月
Asian firms eye alternative to Intel

インターネットメディア

執筆者：本人以外

SILICON INVESTOR

2009年09月
Seven Chipmakers Join Hands to Develop New

インターネットメディア

執筆者：本人以外

ERODOV.COM

2009年09月
Empresas da Asia buscam uma alternativa a Intel

インターネットメディア

執筆者：本人以外

Convergencia Digital

2009年09月
Intel e AMD, pericolo asiatico

インターネットメディア

執筆者：本人以外

Arduer.com

2009年09月
日大厂結盟来勢洶洶 ARM威脇更顕迫切 Intel地位岌岌可危

インターネットメディア

執筆者：本人以外

第五頻道論壇

2009年09月
日大廠結盟來勢洶洶 ARM威脅更顯迫切英特爾地位岌岌可危

インターネットメディア

執筆者：本人以外

財經新聞科技産業

2009年09月
日本数家電子巨頭聯合自主開発芯片対抗Intel

インターネットメディア

執筆者：本人以外

Donews

2009年09月
일본, 디지털가전 규격 통일 추진

インターネットメディア

執筆者：本人以外

esnet.go.kr

2009年09月
7 Perusahaan Jepang Hadapi AMD-Intel

インターネットメディア

執筆者：本人以外

VIVANEWS

2009年09月
Toshiba, Nec, Hitachi et Canon contre Inetel sur les processeurs

インターネットメディア

執筆者：本人以外

Ubergizmo

2009年09月
Intel bi tong tan cong bang du an super CPU

インターネットメディア

執筆者：本人以外

Trasua

2009年09月
7 Perusahaan Jepang Hadapi AMD-Intel

インターネットメディア

執筆者：本人以外

Teknologi

2009年09月
Japanske kompanije razvijaju novi mikroprocesor

インターネットメディア

執筆者：本人以外

PCPRESS

2009年09月
Waseda Unibersity at center of Efforts to Produce Super Green Processor Chip

インターネットメディア

執筆者：本人以外

Japan Higher Education Outlook (JHEO)

2009年09月
Japanske kompanije razvijaju novi mikroprocesor

インターネットメディア

執筆者：本人以外

ETH.RS

2009年09月
Asian firms eye alternative to Intel

インターネットメディア

執筆者：本人以外

C-NET

2009年09月
Report: Asian firms eye alternative chips

その他

執筆者：本人以外

CNETNews

2009年09月
Intel bi tong tan cong bang du an super CPU

インターネットメディア

執筆者：本人以外

Tien phong

2009年09月
Intel bi tong tan cong bang du an super CPU

インターネットメディア

執筆者：本人以外

THUGIAN

2009年09月
Japonski konzorcij kot konkurenca Intelu

インターネットメディア

執筆者：本人以外

Slo-tech.com

2009年09月
Japansk processor pa vej i2012

インターネットメディア

執筆者：本人以外

newsDK

2009年09月
7 Japanese Companies to Develop CPU to Compete Against AMD and Intel

インターネットメディア

執筆者：本人以外

Neowin

2009年09月
Sem Samuraev Protiv Intel Japoncy Reshili Sozdat Svoj Jenergojeffektivnyj Processor

インターネットメディア

執筆者：本人以外

Lucky Ace Poker

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Fuwuqi

2009年09月
Le gouvernement japonais se donne 2 ans pour cr er un super micro-processeur

インターネットメディア

執筆者：本人以外

Digitaladventures

2009年09月
Intel e AMD, attenti alle sette sorelle

インターネットメディア

執筆者：本人以外

Arduer.com

2009年09月
Νεο πρωτοποριακό chip-επεξεργαστής

インターネットメディア

執筆者：本人以外

zefyr

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

望見竜

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

木本之家

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Yesky

2009年09月
Seven Japanese Companies to Develop Microprocessor to Compete Against AMD and Intel

インターネットメディア

執筆者：本人以外

Xbitlaboratory

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

UPNB

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

第三媒体

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Server.ctocio

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

PCPOP.com

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

PCONLINE 太平洋社区

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Pchome

2009年09月
iaponelebi vs. Intel

インターネットメディア

執筆者：本人以外

Overclockers

2009年09月
7 Japanese companies come together to develop a super CPU to challenge Intel

インターネットメディア

執筆者：本人以外

News.xzjdw.com

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Iworks

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

IT坊

2009年09月
Japan lapkagyartok az Intel ellen

インターネットメディア

執筆者：本人以外

HOC.hu

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Engadget 中文

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Enet

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Citygf

2009年09月
Tujuh Samurai Dari Jepang

インターネットメディア

執筆者：本人以外

CHIP Online Indonesia

2009年09月
Japonsko chce vytvo it superprocesor, pr jako konkurenci Intelu

インターネットメディア

執筆者：本人以外

CDR.CZ

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Aol Tec

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

51invest.com

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

51CTO

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

新聞中心

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

PCBETA

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Ejiarui

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

8998CN

2009年09月
日本預打造'超級処理器'日本芯抗衡Intel

インターネットメディア

執筆者：本人以外

Redbots

2009年09月
Bay cong ty cong nghe Nhat lien minh san xuat vi xu ly xanh

インターネットメディア

執筆者：本人以外

Techzone-vn

2009年09月
7 Japanese companies come together to develop a super CPU to challenge Intel

インターネットメディア

執筆者：本人以外

TechFuels News

2009年09月
7 Japanese companies come together to develop a super CPU to challenge Intel

インターネットメディア

執筆者：本人以外

JBTALKS

2009年09月
Seven Samurai chipmakers set to take on Intel

インターネットメディア

執筆者：本人以外

Gadgetswow

2009年09月
日本科技企業聯手研発処理器対抗Intel

インターネットメディア

執筆者：本人以外

天涯社区

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

The Daily Tech Log

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

Ryanshooltz

2009年09月
7 Japanese companies come together to develop a super CPU to challenge Intel

インターネットメディア

執筆者：本人以外

Pclaunches

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

OSNews

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

nexgadget

2009年09月
Seven Samurai Chipmakers Set to Take on Intel

インターネットメディア

執筆者：本人以外

iRepairGuide

2009年09月
日本科技企業聯手研発処理器対抗Intel

インターネットメディア

執筆者：本人以外

Forum.esm-cn

2009年09月
Cac hang Nhat phat trien CPU tiet kiem dien nang

インターネットメディア

執筆者：本人以外

Congthuong

2009年09月
国内勢がデジタル家電向けCPUの規格統一・インテルの牙城に挑むと報道

インターネットメディア

執筆者：本人以外

ZaiDiamond

2009年09月
国内勢がデジタル家電向けCPUの規格統一・インテルの牙城に挑むと報道

インターネットメディア

執筆者：本人以外

Yahoo finance

2009年09月
国内勢がデジタル家電向けCPUの規格統一・インテルの牙城に挑むと報道

インターネットメディア

執筆者：本人以外

Stock Station

2009年09月
国内勢がデジタル家電向けCPUの規格統一・インテルの牙城に挑むと報道

インターネットメディア

執筆者：本人以外

Searchina

2009年09月
デジタル家電向けCPU、国内勢が規格統一へ

インターネットメディア

執筆者：本人以外

NIKKEI NET

2009年09月
デジタル家電向けCPU、国内勢が規格統一へ

インターネットメディア

執筆者：本人以外

日経It+Plus

2009年09月
Is Japan Gunning for Intel?

インターネットメディア

執筆者：本人以外

Fidelity

2009年09月
Japan bygger 'super-cpu'

インターネットメディア

執筆者：本人以外

Elektroniktidningen

2009年09月
Are we in for a CPU war? Japanese companies team up against Intel

インターネットメディア

執筆者：本人以外

Crunch Gear

2009年09月
デジタル家電向けCPU国内勢が規格統一

新聞・雑誌

執筆者：本人以外

日本経済新聞

2009年09月
小特集最先端メディアプロセッサが拓く映像処理 6.小面積・低消費電力を指向した動的再構成プロセッサFE-GA（日立製作所佐藤真琴氏）

その他

執筆者：本人以外

映像情報メディア学会誌, Vol.63, No.9, pp.21-23

2009年09月
Japanese researchers downplay super CPU effort

その他

執筆者：本人以外

The Invest Penang

2009年09月
OSCARコンパイラー

その他

執筆者：本人以外

小学館DIME 9月号

2009年09月
省電力・高速LSIシステム早大、東京に開発拠点産学連携で

新聞・雑誌

執筆者：本人以外

日経産業新聞

2009年08月
組み込みマルチコア進化論（5）マルチコアにおける標準表記OpenMP

インターネットメディア

執筆者：本人以外

IT MONOIST

2009年06月
性能よりも書きやすさ」，マルチコアLSIでソフトウェア設計者の心を知

インターネットメディア

執筆者：本人以外

日経Tech-On EDA Online

2009年05月
〈ネットはいま〉第２部―５ゲーム機を持ち寄る -asahi.com-

インターネットメディア

執筆者：本人以外

asahi.com

2009年02月
〈ネットはいま〉第２部―５ゲーム機を持ち寄る

新聞・雑誌

執筆者：本人以外

朝日新聞

2009年02月
情報家電用マルチコアMPU 並列処理で消費電力低減国家プロジェクトで成果日本勢の武器に

新聞・雑誌

執筆者：本人以外

日経産業新聞

2009年01月
マルチコアLSIを革新する、低消費電力化とソフトウェア生産性の向上を実現 -日立評論-

インターネットメディア

執筆者：本人以外

日立評論

2009年01月
並列化コンパイラ「OSCAR」向けのAPI、各社マルチコア用コードの自動生成が可能に -EDN Japan MAGAZINE ARTICLES, 2009年1月号-

インターネットメディア

執筆者：本人以外

EDN Japan MAGAZINE ARTICLES, 2009年1月号

2009年01月
マルチコアLSIを革新する、低消費電力化とソフトウェア生産性の向上を実現

その他

執筆者：本人以外

日立評論, Vol.91, No.1, pp.125

2009年01月
並列化コンパイラ「OSCAR」向けのAPI、各社マルチコア用コードの自動生成が可能に

その他

執筆者：本人以外

EDN Japan, No.95, pp.17

2009年01月
Information Technology Research

その他

執筆者：本人以外

早稲田大学研究活動紹介 Research Activities 20082009

2009年01月
日本流産学連携マネジメントの実現。戦術の実践へ

インターネットメディア

執筆者：本人以外

日経BP社技術事業化メールマガジン第194号～Emerging Technology Business～

2008年12月
Apple主導の「OpenCL」プロセサに自由をもたらす

その他

執筆者：本人以外

日経エレクトロニクス, No.993, pp.107-117

2008年12月
[日経産業新聞]「オスカーAPI(並列動作プログラム仕様)を一般公開―マルチコアMPUの並列動作の性能が従来の3.4倍」笠原博徳教授(情報理工学科)

インターネットメディア

執筆者：本人以外

早稲田大学理工学術院HP 理工リエゾン新着情報

2008年11月
Group Develops Standard API to Give Parallel Execution, Power Control Orders to Compiler

インターネットメディア

執筆者：本人以外

Nikkei Electronics Tech On

2008年11月
早大と国内半導体メーカー，並列実行や電力制御をコンパイラに指示する標準APIを策定

インターネットメディア

執筆者：本人以外

日経エレクトロニクス Tech On

2008年11月
早稲田大学の笠原教授ら、企業6社とのプロジェクトで実時間並列処理向けAPIを開発、2008年11月から公開

インターネットメディア

執筆者：本人以外

日経BP 先端技術事業化

2008年11月
早大、マルチコアＭＰＵ効率利用、プログラム仕様公開 -日経就職ナビ-

インターネットメディア

執筆者：本人以外

日経就職ナビ

2008年11月
早大、マルチコアＭＰＵ効率利用、プログラム仕様公開 -NIKKEI NET 株価サーチ-

インターネットメディア

執筆者：本人以外

NIKKEI NET 株価サーチ

2008年11月
早大マルチコアMPU効率利用プログラム仕様公開

新聞・雑誌

執筆者：本人以外

日経産業新聞

2008年11月
早稲田大学など、低消費電力リアルタイム並列処理を可能とするＡＰＩを開発・公開

インターネットメディア

執筆者：本人以外

TRENDLINE

2008年11月
早稲田大学など、低消費電力リアルタイム並列処理を可能とするＡＰＩを開発・公開

インターネットメディア

執筆者：本人以外

NIKKEI NET IT PLUS

2008年11月
早稲田大学など、低消費電力リアルタイム並列処理を可能とするＡＰＩを開発・公開

インターネットメディア

執筆者：本人以外

NIKKEI NET

2008年11月
＜世界初＞異なるメーカの情報家電用マルチコア上で低消費電力リアルタイム並列処理を実現するソフトウェア規格(API)を開発・公開

その他

執筆者：本人以外

早稲田大学プレスリリース

2008年11月
最新のエレクトロニクス製品の開発に貢献「第１５回 LSI・オブ・ザ・イヤー２００８」準グランプリとして選出 -WASEDA ONLINE (YOMIURI ONLINE) キャンパスナウ-

インターネットメディア

執筆者：本人以外

WASEDA ONLINE (YOMIURI ONLINE) キャンパスナウ

2008年10月
IEEE Computer Society Election, IEEE Computer Society Officers and Board of Governors Positions in 2009

インターネットメディア

執筆者：本人以外

IEEE Computer Society

2008年10月
最新のエレクトロニクス製品の開発に貢献「第１５回 LSI・オブ・ザ・イヤー２００８」準グランプリとして選出

その他

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 183

2008年10月
LSIオブ・ザ・イヤー2008 準グランプリ 8個のCPUコアと8個のRAMが独立電源遮断可能なマルチコア LSI:RP2 ソフト生産性と超低消費電力で差異化得意技術持ち寄る密接な産学連携の成果

新聞・雑誌

執筆者：本人以外

半導体産業新聞

2008年09月
やはり焦点はマルチコアのソフト開発『マイクロプロセッサ・フォーラム・ジャパン2008』から -EDN Japan MAGAZINE ARTICLES, 2008年9月号-

インターネットメディア

執筆者：本人以外

EDN Japan MAGAZINE ARTICLES, 2008年9月号

2008年09月
やはり焦点はマルチコアのソフト開発『マイクロプロセッサ・フォーラム・ジャパン2008』から

その他

執筆者：本人以外

EDN Japan, No.91, pp.19-26

2008年09月
第15回LSI・オブ・ザ・イヤー2008発表準グランプリ画期的な低消費電力LSI ～ルネサス/日立/早大

新聞・雑誌

執筆者：本人以外

半導体産業新聞

2008年07月
ECO Computer by Solar Battery? Leading edge multicore technology

インターネットメディア

執筆者：本人以外

innovations report

2008年07月
第15回LSI・オブ・ザ・イヤー2008

インターネットメディア

執筆者：本人以外

半導体産業新聞HP

2008年07月
LSI・オブ・ザ・イヤー2008 グランプリはソニーの2481万画素CMOSにルネサス、日立、早大の3者に準グランプリ

新聞・雑誌

執筆者：本人以外

半導体産業新聞

2008年07月
太陽電池で動くＥＣＯコンピュータ～世界最先端のマルチコア技術～

インターネットメディア

執筆者：本人以外

WASEDA ONLINE (YOMIURI ONLINE)

2008年07月
「LSI・オブ・ザ・イヤー 2008」準グランプリに、本学などが開発した『8個のCPUコアと8個のRAMが独立電源遮断可能なマルチコアLSI:RP2』が選出されました

インターネットメディア

執筆者：本人以外

早稲田大学HP

2008年07月
LSI・オブ・ザ・イヤーが決定

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年07月
LSIオブ・ザ・イヤー2008

インターネットメディア

執筆者：本人以外

電子ジャーナル電子デバイスとエレクトロニクス関連NEWS

2008年07月
MPSOC '08, Live from Maastricht: Got SMP? Need Auto Parallelization? Just add Multigrain OSCAR

インターネットメディア

執筆者：本人以外

Electronics Design, Strategy, News -Leibson's Law-

2008年07月
マイクロプロセッサ・フォーラム・ジャパン 2008 注目を集める小型デバイス向けプロセッサその最新技術を見に行こう

インターネットメディア

執筆者：本人以外

＠IT MONOist

2008年07月
省スペース・省電力の高性能コンピュータでソフト開発の期間短縮

その他

執筆者：本人以外

sgi news, No.43, pp.8

2008年07月
お客様事例：早稲田大学理工学術院基幹理工学部情報理工学科マルチコア用プロセッサの並列コンパイラの研究へ日本SGI が早稲田大学にミッドレンジサーバ「Altix 450」を納入省スペース・省電力の高性能コンピュータでソフト開発を期間短縮

インターネットメディア

執筆者：本人以外

日本SGI e-News

2008年06月
2．半導体アプリケーションチッププロジェクトの「リアルタイム情報家電用マルチコア技術の研究開発事業」の成果が、総合科学技術会議で、次世代IT省エネ技術として紹介

その他

執筆者：本人以外

NEDO 電子･情報技術開発部作成パンフレット p.13

2008年06月
塩沢文朗氏の流儀原点回帰の旅第３２回 "授業の場であって、開発の場"

インターネットメディア

執筆者：本人以外

大学発ベンチャー企業支援サイト Digital New Deal

2008年05月
COOL Chips XI - パネルディスカッション

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年05月
電子論評早大のマルチコア技術デジタル家電高速に

新聞・雑誌

執筆者：本人以外

日経産業新聞

2008年05月
マルチコアCPU研究状況とユーザビューから見た期待

インターネットメディア

執筆者：本人以外

第170回計算機アーキテクチャ研究会パネル討論新時代におけるマルチコア戦略（2008.5.13) 福永泰氏（日立製作所研究開発本部技師長）

2008年05月
COOL Chips XI - 省電力高性能を実現するマルチコアコンパイラ

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年05月
間近に迫るマルチコアプロセッサ時代

インターネットメディア

執筆者：本人以外

Automotive Electronics Feature

2008年05月
COOL Chips XI - 注目論文

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年05月
今年のESECの見どころを聞く

その他

執筆者：本人以外

EDN Japan, No.87, pp.72-73

2008年05月
間近に迫るマルチコアプロセッサ時代

その他

執筆者：本人以外

Automotive Electronics, 2008年第2号, pp.52-55

2008年05月
自動並列化コンパイラとの協調動作によりマルチコアLSIの低消費電力化と高性能化を実現８個のCPUコアと８個のRAMの独立電源遮断とCPUコア間の同期制御技術

その他

執筆者：本人以外

RENESAS Edge, Vol.21 pp.6

2008年04月
情報家電向けマルチコアLSIの低消費電力化技術を開発（1月28日株式会社日立製作所）

インターネットメディア

執筆者：本人以外

早稲田大学 CAMPUS NOW Online

2008年04月
資料4 最近の科学技術の動向情報爆発時代に向けた省エネルギー技術

インターネットメディア

執筆者：本人以外

第74回総合科学技術会議

2008年04月
情報家電向けマルチコアLSIの低消費電力化技術を開発（1月28日株式会社日立製作所）

その他

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 180

2008年04月
環境研究テーマ01：マルチコアLSI向け低消費電力化技術の開発

その他

執筆者：本人以外

日立製作所環境報告書2008

2008年04月
Cover Story: IT warming

インターネットメディア

執筆者：本人以外

asahi.com

2008年03月
マルチコアLSIの低消費電力化技術

インターネットメディア

執筆者：本人以外

Japan Edition Semiconductor International

2008年03月
早稲田大学笠原研究室に導入されたミッドレンジサーバ「Altix 450」研究開発への取り組みやその目的を紹介

インターネットメディア

執筆者：本人以外

SGI e-News No.94

2008年02月
IT機器省エネ急務地下に施設、節電技術・・・産官学取り組み

新聞・雑誌

執筆者：本人以外

朝日新聞

2008年02月
ユーザー探訪ミッドレンジサーバー早稲田大学笠原研究室ソフトと協調してCPUの性能を最大限発揮自動並列化コンパイラで処理速度向上プログラム開発期間を短縮

新聞・雑誌

執筆者：本人以外

電波新聞 Data Communication

2008年02月
Rock and Tukwila Are the Stars of ISSCC This Week

インターネットメディア

執筆者：本人以外

The Unix Guardian

2008年02月
早大ら，マルチコアLSIの低消費電力化技術を開発（08/2/7）

インターネットメディア

執筆者：本人以外

Semiconductor Japan Net

2008年02月
ISSCC 2008 - Tilera、タイルプロセッサ「TILE64」の詳細を発表ルネサステクノロジの8コアチップと比較

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年02月
【ISSCC 2008】コンパイラと協調して消費電力大幅減、ルネサスらが8コアLSIを開発

インターネットメディア

執筆者：本人以外

EE TIMES Japan

2008年02月
【ISSCC】コンパイラが消費電力まで考慮する時代に，早大と日立，ルネサスが技術を開発

インターネットメディア

執筆者：本人以外

日経エレクトロニクス Tech On

2008年02月
ルネサスら、並列化コンパイラによるマルチコアLSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年02月
日立・ルネサス・早大がマルチコアLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

Micro Technology Business

2008年02月
ルネサスら、並列化コンパイラによるマルチコアLSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

media jam

2008年02月
情報家電向けマルチコアLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

ELISNET

2008年02月
複数コアLSI 消費電力を削減日立などコンパイラ協議で

新聞・雑誌

執筆者：本人以外

化学工業日報

2008年02月
【ISSCC 2008前日レポート】低消費プロセッサと低コスト不揮発性メモリ (Impress Watch)

インターネットメディア

執筆者：本人以外

Yahooニュース

2008年02月
早大と日立、ルネサスが情報家電LSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

Yahooニュース

2008年02月
【ISSCC 2008前日レポート】低消費プロセッサと低コスト不揮発性メモリ (Impress Watch)

インターネットメディア

執筆者：本人以外

Yahooゲーム

2008年02月
'08/02/04 情報家電向けマルチコアLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

早稲田大学HP

2008年02月
ルネサスなど、消費電力８割以上削減、デジタル家電向けLSI

インターネットメディア

執筆者：本人以外

NIKKEI NET

2008年02月
情報処理・ソフトウエアルネサスなど、消費電力８割以上削減、デジタル家電向けLSI。年内にもサンプル出荷

インターネットメディア

執筆者：本人以外

日経ナビ2008

2008年02月
早大と日立、ルネサスが情報家電LSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

日刊工業新聞 Business Line

2008年02月
△早大と日立<6501>、ルネサスが情報家電LSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

今日の株価材料

2008年02月
【ISSCC 2008前日レポート】低消費プロセッサと低コスト不揮発性メモリ (Impress Watch)

インターネットメディア

執筆者：本人以外

infoseekニュース

2008年02月
【ISSCC 2008前日レポート】低消費プロセッサと低コスト不揮発性メモリ

インターネットメディア

執筆者：本人以外

Impress Watch

2008年02月
'08/02/04 〔日刊工業新聞〕「早大と日立、ルネサスが情報家電LSIの低消費電力技術を開発」早大笠原博徳教授（コンピュータ・ネットワーク工学科）

インターネットメディア

執筆者：本人以外

早稲田大学理工学術院HP

2008年02月
■[EDA関連ニュース]ルネサス、日立、早大が共同で並列コンパイラによるマルチコアLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

EDA関連ニュース

2008年02月
ルネサス、日立、早大が共同で並列コンパイラによるマルチコアLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

EDA Express

2008年02月
【半導体】早大/日立/ルネサス、情報家電向けLSIの低消費電力化技術を開発

インターネットメディア

執筆者：本人以外

電子ジャーナル電子デバイスとエレクトロニクス関連NEWS

2008年02月
早大と日立、ルネサスが情報家電LSIの低消費電力技術を開発

インターネットメディア

執筆者：本人以外

asahi.com

2008年02月
情報家電向けマルチコアLSIの低消費電力化技術を開発－自動並列化コンパイラとの協調による8個のCPUコアの独立電源遮断と同期技術－

その他

執筆者：本人以外

早稲田大学プレスリリース

2008年02月
情報家電向けマルチコアLSIの低消費電力化技術を開発－自動並列化コンパイラとの協調による8個のCPUコアの独立電源遮断と同期技術－

その他

執筆者：本人以外

ルネサステクノロジプレスリリース

2008年02月
情報家電向けマルチコアLSIの低消費電力化技術を開発自動並列化コンパイラとの協調による8個のCPUコアの独立電源遮断と同期技術

その他

執筆者：本人以外

日立製作所プレスリリース

2008年02月
消費電力8割以上削減デジタル家電向けLSI ルネサスなど年内にもサンプル出荷

新聞・雑誌

執筆者：本人以外

日経産業新聞

2008年02月
情報家電向けマルチコアLSI 低消費電力技術を開発早大・日立・ルネサス

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2008年02月
情報家電向け LSI消費電力低減技術を開発早大、日立など

新聞・雑誌

執筆者：本人以外

電気新聞

2008年02月
早大、日立、ルネサス低消費電力技術（マルチコアLSI向け）開発

新聞・雑誌

執筆者：本人以外

電波新聞

2008年02月
【レポート】 ISSCC 2008プレビュー - マイクロプロセサセッション

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2008年01月
日本SGI が早稲田大学・笠原研究室にミッドレンジサーバを納入研究テーマ「コンピュータの処理速度向上・ソフト開発期間短縮」に貢献

インターネットメディア

執筆者：本人以外

SGI e-News No.91

2008年01月
マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン

インターネットメディア

執筆者：本人以外

Yahooニュース

2008年01月
マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン(ITmediaエンタープライズ)

インターネットメディア

執筆者：本人以外

NEWS@nifty

2008年01月
マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン

インターネットメディア

執筆者：本人以外

livedoor ニュース

2008年01月
マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン

インターネットメディア

執筆者：本人以外

IT media エンタープライズ

2008年01月
マルチコア用自動並列コンパイラの開発を支えるデスクサイドスパコン (ITmedia)

インターネットメディア

執筆者：本人以外

infoseekニュース

2008年01月
高性能デジタル微細化の進展で新たな問題が顕在化消費電力や特性バラつきに立ち向かう

その他

執筆者：本人以外

日経エレクトロニクス, No.969 (2008.1.14号）

2008年01月
小型サーバー早大に納入日本SGI

新聞・雑誌

執筆者：本人以外

日経産業新聞

2008年01月
［経営戦略］日本SGI、早大・笠原研究室にミッドレンジサーバー「Altix 450」を納入（ＢＣＮ）

インターネットメディア

執筆者：本人以外

Yahooニュース

2007年12月
日本SGI、早大・笠原研究室にミッドレンジサーバー「Altix 450」を納入

インターネットメディア

執筆者：本人以外

webBCN

2007年12月
日本SGI、早大・笠原研究室にミッドレンジサーバー「Altix 450」を納入 [コンピュータニュース社]

インターネットメディア

執筆者：本人以外

エキサイト・ニュースプレスリリース

2007年12月
日本SGI、早大・笠原研究室にミッドレンジサーバー「Altix 450」を納入

インターネットメディア

執筆者：本人以外

asahi.com

2007年12月
日本SGI 早大笠原研究室にミッドレンジサーバー3セット納入並列化コンパイラ研究へ

新聞・雑誌

執筆者：本人以外

電波新聞

2007年12月
日本SGI が早稲田大学・笠原研究室にミッドレンジサーバ「Altix 450」を納入～省スペース・省電力のデスクサイド型高性能コンピュータでソフト開発を期間短縮～

インターネットメディア

執筆者：本人以外

セキュリティ・オンライン・ニュース

2007年12月
マルチコア用プロセッサの並列コンパイラの研究へ理工学術院笠原研究室に日本SGIがミッドレンジサーバ「Altix 450」を納入～省スペース・省電力のデスクサイド型高性能コンピュータでソフト開発を期間短縮～

その他

執筆者：本人以外

早稲田大学プレスリリース

2007年12月
マルチコア用プロセッサの並列コンパイラの研究へ日本SGI が早稲田大学・笠原研究室にミッドレンジサーバ「Altix 450」を納入省スペース・省電力のデスクサイド型高性能コンピュータでソフト開発を期間短縮

その他

執筆者：本人以外

日本SGIプレスリリース

2007年12月
9/14（金）早稲田大学125周年・理工学部100周年記念シンポジウム「イノベーティブ情報・電子・光技術」開催のご案内

インターネットメディア

執筆者：本人以外

早稲田大学理工学術院HP News ＆Topics

2007年09月
早稲田大学125周年・理工学部100周年記念シンポジウム “イノベーティブ情報・電子・光技術" 開催

インターネットメディア

執筆者：本人以外

早稲田大学HP News ＆Events

2007年09月
産学連携広告特集》「研究とニーズ結び新たな価値創出マッチングファンドでマルチコア技術開発に弾み（早稲田大学笠原研究室）

新聞・雑誌

執筆者：本人以外

日経産業新聞

2007年09月
早稲田大学、創立125周年変わる大学経営（番組内にて笠原・木村研のマルチコアに関する研究紹介）

テレビ・ラジオ番組

執筆者：本人以外

TBS Bsi グローバルナビ

2007年07月
情報家電の開発期間短縮が可能なマルチコア技術を開発

その他

執筆者：本人以外

早稲田大学広報誌 CAMPUS NOW, Vol. 173

2007年07月
ハイテクノロジー特集》「情報家電の開発期間短縮マルチコア技術を開発

新聞・雑誌

執筆者：本人以外

電波新聞

2007年06月
マルチコア向け並列化コンパイラ技術、早大や日立、ルネサスが開発

その他

執筆者：本人以外

EE Times Japan Eメールニュースレター（no.98）

2007年06月
次世代スーパーコンピュータ概念設計評価報告書

その他

執筆者：本人以外

文部科学省次世代スーパーコンピュータ概念設計評価作業部会

2007年06月
情報家電ソフト開発を短縮新たにマルチコア技術早大など

新聞・雑誌

執筆者：本人以外

日本情報産業新聞

2007年06月
マルチコア向け並列化コンパイラ技術、早大や日立、ルネサスが開発

インターネットメディア

執筆者：本人以外

EE TIMES Japan

2007年06月
情報家電ソフト開発マルチコア技術で高速処理

新聞・雑誌

執筆者：本人以外

化学工業日報

2007年06月
マルチコア技術を開発情報家電ソフト開発を効率化早大・日立など３者

新聞・雑誌

執筆者：本人以外

電経新聞

2007年06月
早大と日立など、情報家電の開発期間を短縮できるマルチコア技術を開発（日立製作所）

インターネットメディア

執筆者：本人以外

環境部情報サイト

2007年06月
早大と日立など、情報家電の開発期間を短縮できるマルチコア技術を開発（日立製作所）

インターネットメディア

執筆者：本人以外

IPNEXT

2007年06月
日立など、マルチコアLSIの開発期間を短縮する技術確立

インターネットメディア

執筆者：本人以外

Yahoo Japan News（日刊工業新聞）

2007年06月
早稲田大学ら，マルチコア技術を共同開発情報家電ソフトウェアの開発期間を短縮

インターネットメディア

執筆者：本人以外

Semiconductor Japan Net

2007年06月
早稲田大学､日立製作所､ルネサステクノロジ情報家電の開発期間短縮が可能なマルチコア技術を開発-4コア型システムLSI､並列化コンパイラ､マルチコアAPIを開発し3.4倍の速度向上を自動並列化で実現- [2007/05/31]

インターネットメディア

執筆者：本人以外

産学官研究開発コミュニティ

2007年06月
早大など、マルチコアソフト開発――デジタル家電を高性能化

インターネットメディア

執筆者：本人以外

NIKKEI NET IT PLUS

2007年06月
マルチコアSoC向け並列化コンパイル技術の実力を，日立，ルネサス，早大が披露

インターネットメディア

執筆者：本人以外

日経エレクトロニクス Tech On

2007年06月
[RENESAS] マルチコアSoC向け並列化コンパイル技術の実力を，日立，ルネサス，早大が披露

インターネットメディア

執筆者：本人以外

半導体とカーエレに関するニュース

2007年06月
日立などが情報家電の開発期間を短縮できるマルチコア技術を開発

インターネットメディア

執筆者：本人以外

Micro Technology Business

2007年06月
△日立<6501>など、マルチコアLSIの開発期間を短縮する技術確立

インターネットメディア

執筆者：本人以外

今日の株価材料

2007年06月
早大、日立など、情報家電開発期間短縮のマルチコア技術開発

インターネットメディア

執筆者：本人以外

IBTimes

2007年06月
【半導体】早大/日立/ルネサス、自動並列化技術によるマルチコア技術を開発

インターネットメディア

執筆者：本人以外

電子ジャーナル電子デバイスとエレクトロニクス関連NEWS

2007年06月
早大、日立など、情報家電開発期間短縮のマルチコア技術開発

インターネットメディア

執筆者：本人以外

CMSNAVI

2007年06月
日立など、マルチコアLSIの開発期間を短縮する技術確立

インターネットメディア

執筆者：本人以外

asahi.com

2007年06月
早大などマルチコアソフト開発デジタル家電を高性能化

新聞・雑誌

執筆者：本人以外

日経産業新聞

2007年06月
マルチコアLSIの並列処理数秒でプログラム作成日立など

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2007年06月
情報家電向けの並列処理ソフト早大・日立などが開発

新聞・雑誌

執筆者：本人以外

日本経済新聞

2007年06月
早大/日立/ルネサスソフト（情報家電）の開発期間短縮マルチコア技術開発数週間/数ヶ月を数秒/数分で処理

新聞・雑誌

執筆者：本人以外

電波新聞

2007年06月
早大と日立など、情報家電の開発期間短縮が可能なマルチコア技術を開発情報家電の開発期間短縮が可能なマルチコア技術を開発４コア型システムLSI、並列化コンパイラ、マルチコアＡＰＩを開発し３．４倍の速度向上を自動並列化で実現 -NIKKEI NET-

インターネットメディア

執筆者：本人以外

NIKKEI NET

2007年05月
日立など、情報家電の開発期間短縮が可能なマルチコア技術を開発、4コア型システムLSI、並列化コンパイラ、マルチコアAPIを開発し3.4倍の速度向上を自動並列化で実現 -松井証券個人投資家向けプレスリリース-

インターネットメディア

執筆者：本人以外

松井証券個人投資家向けプレスリリース

2007年05月
日立など、情報家電の開発期間短縮が可能なマルチコア技術を開発、4コア型システムLSI、並列化コンパイラ、マルチコアAPIを開発し3.4倍の速度向上を自動並列化で実現 -JCN Network-

インターネットメディア

執筆者：本人以外

JCN Network

2007年05月
日立など、情報家電の開発期間短縮が可能なマルチコア技術を開発、4コア型システムLSI、並列化コンパイラ、マルチコアAPIを開発し3.4倍の速度向上を自動並列化で実現 (JCN Newswire) -Infoseek マネー-

インターネットメディア

執筆者：本人以外

Infoseek マネー

2007年05月
委員会報告

その他

執筆者：本人以外

NEDO 電子・情報技術開発部電子・情報技術ロードマップ

2007年05月
情報家電の開発期間短縮が可能なマルチコア技術を開発－4コア型システムLSI、並列化コンパイラ、マルチコアAPIを開発し 3.4倍の速度向上を自動並列化で実現－

その他

執筆者：本人以外

早稲田大学プレスリリース

2007年05月
情報家電の開発期間短縮が可能なマルチコア技術を開発 ? 4コア型システムLSI,並列化コンパイラ, マルチコアAPIを開発し 3.4倍の速度向上を自動並列化で実現 ?

その他

執筆者：本人以外

ルネサステクノロジプレスリリース

2007年05月
情報家電の開発期間短縮が可能なマルチコア技術を開発 4コア型システムLSI、並列化コンパイラ、マルチコアAPIを開発し3.4倍の速度向上を自動並列化で実現

その他

執筆者：本人以外

日立製作所プレスリリース

2007年05月
研究室紹介笠原研究グループコンパイラ協調型チップマルチプロセッサ

その他

執筆者：本人以外

日経マイクロデバイス特別編集版半導体就職読本2007 未来を切り拓く半導体技術 pp.96-97

2007年05月
技術解説 SH-4Aマルチコア SMPとAMP、どちらのマルチコアにも対応可能消費電力を抑えるライトスリープモードを搭載

その他

執筆者：本人以外

RENESAS Edge Vol.17 pp.04

2007年04月
特集組込みマイコンの最先端ルネサスのマルチコアテクノロジ第1部ルネサスのマルチコアテクノロジ消費電力削減にも効果のある独自のマルチコア技術で次世代情報家電が求める高性能化のニーズに応える

その他

執筆者：本人以外

RENESAS Edge Vol.17 pp.01-03

2007年04月
特集日立の頭脳「中央研究所」の研究中研R&D 2 情報環境のステージを開く情報端末の進化を牽引する・・・マイクロプロセッサ内山邦男氏

その他

執筆者：本人以外

ひたち 2007春号 pp.13-15

2007年04月
スパコンって何をするの？ -複雑な実験や観察を肩代わり、各国で開発にしのぎ削る

新聞・雑誌

執筆者：本人以外

朝日新聞

2007年01月
スパコン最速奪還せよ

新聞・雑誌

執筆者：本人以外

朝日新聞

2006年11月
ARM Forum 2006 - Cortexファミリとマルチコア用コンパイラ (2)マルチコアコンパイラの可能性

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2006年10月
ARM Forum 2006 - Cortexファミリとマルチコア用コンパイラ (1)基調講演ではCortexファミリを紹介

インターネットメディア

執筆者：本人以外

マイコミジャーナル

2006年10月
"Fall Microprocessor Forumレポート" ルネサスがマルチコア対応のSuperHコアを開発

インターネットメディア

執筆者：本人以外

PC Watch

2006年10月
世界一の並列化コンパイラを作るマルチコア・Everywhereの21世紀プロセッサを先取り

その他

執筆者：本人以外

IBMハイパフォーマンス・コンピューティング事例紹介

2006年09月
特別テーマ事例：我が国の国際競争力の強化情報家電用リアルタイム・マルチコア

その他

執筆者：本人以外

文部科学省主催第１０回産学官連携コーディネーター全国会議（東京）

2006年09月
４．終了プロジェクトの概要 ⑲アドバンスト並列コンパイラ技術プロジェクト

その他

執筆者：本人以外

NEDO 電子・情報技術開発パンフレット, pp. 60

2006年09月
高校生の可能性を広げる！科学技術自由研究コンテスト「JSEC」高校時代に研究開発の醍醐味を知る貴重な機会

新聞・雑誌

執筆者：本人以外

朝日新聞

2006年06月
第5回産学官連携推進会議の視点・論点

インターネットメディア

執筆者：本人以外

大学発ベンチャー企業支援サイト Digital New Deal

2006年06月
「スパコンの速度はどこまで上がる？」ほっとサイエンスなっとく科学

新聞・雑誌

執筆者：本人以外

読売新聞

2006年01月
２．プロジェクトの概要半導体技術分野⑦半導体アプリケーションチッププロジェクト（情報家電分野）

その他

執筆者：本人以外

NEDO 電子・情報技術開発パンフレット, pp. 20-21

2006年01月
Part 1. だから、理工知と人の集積・ワセダ理工５つの強み「面と向かって人と話せる！これこそ東京ならではの大きな強み」

その他

執筆者：本人以外

日経BPムック「変革する大学シリーズ」早稲田大学理工学部2006-2007年度版, pp. 39

2005年12月
-学術・研究分野の現場- オピニオンリーダーの持論を知る

その他

執筆者：本人以外

PC-Webzine, Vol.165, pp.100

2005年11月
第一章科学技術の最前線に迫る「２．並列化コンパイラとマルチコアプロセッサで世界を席巻する」

その他

執筆者：本人以外

中央公論新社「研究室から語る最先端研究躍動する早稲田大学の研究活動」, pp.28-37

2005年09月
NEDO技術開発機構の委託予定先・助成金交付先に採択「リアルタイム情報家電用マルチコア技術の研究開発」早稲田大学・日立製作所・ルネサステクノロジ（プロジェクトリーダー/笠原博徳教授・ＣＳ）

インターネットメディア

執筆者：本人以外

早稲田大学理工学部リエゾンオフィス -教育/研究成果情報-

2005年07月
半導体アプリケーションチッププロジェクト（情報家電用半導体アプリケーションチップ技術開発）」の委託予定先及び助成金交付先を決定～情報家電機器の高機能化・低消費電力化に向けて

インターネットメディア

執筆者：本人以外

NEDOプレスリリース

2005年06月
"日の丸プロセッサ"連携大学早稲田大学（ＮＥＤＯマッチングファンド）先進ヘテロジニアス・マルチプロセッサ技術の研究

インターネットメディア

執筆者：本人以外

第４回産学官連携推進会議特別講演（2005.6.25) 武田健二独立行政法人理化学研究所理事前株式会社日立製作所研究開発本部研究アライアンス室長スライド11及びスライド4

2005年06月
よくわかる！技術解説「電子・情報技術分野アドバンスト並列化コンパイラ関連プロジェクトコンピュータ性能をひきだすコンパイラ」

インターネットメディア

執筆者：本人以外

NEDO

2005年01月
Japanese Universities and Research Institutes Embrace Cosy. Waseda University and Tokyo University enter into advanced compiler research with compiler development system from ACE

インターネットメディア

執筆者：本人以外

Cosy 2004 Announcement

2004年11月
HPC用自動並列化コンパイラの動向と将来課題

その他

執筆者：本人以外

第19回NEC・HPC研究会

2004年11月
日立・早大、マルチコア型プロセッサー、速く低消費電力――携帯用など開発へ

インターネットメディア

執筆者：本人以外

Nikkei Net IT Business & News

2004年10月
日立・早大ユニークな産学連携駐在員が英語でビジネスを伝授

新聞・雑誌

執筆者：本人以外

信濃毎日新聞

2004年10月
早大と日立が包括協定まずマルチプロセッサー

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2004年10月
研究開発などで日立と早大連携

新聞・雑誌

執筆者：本人以外

日本経済新聞

2004年10月
早大、日立製作所研究、教育で包括連携

新聞・雑誌

執筆者：本人以外

建設通信新聞

2004年10月
産学連携で包括協定

新聞・雑誌

執筆者：本人以外

フジサンケイビジネスアイ

2004年10月
早稲田大と日立が包括提携人・技術・情報多方面な交流推進

新聞・雑誌

執筆者：本人以外

電波新聞

2004年10月
早大と日立が包括的な産学連携協定、共同研究開発の第一弾はマルチコア型マイクロプロセッサ

インターネットメディア

執筆者：本人以外

産業動向オブザーバ

2004年09月
早大と日立が包括的な産学連携協定、半導体やロボットなどの開発を柱に

インターネットメディア

執筆者：本人以外

産学連携ビジネス

2004年09月
早大と日立が包括産学連携協定

その他

執筆者：本人以外

早稲田大学プレスリリース

2004年09月
シングルコアよりマルチコア

その他

執筆者：本人以外

日経エレクトロニクス2004/8/30号 pp.97-121

2004年08月
産学連携で人材育成：大学で現役エンジニアが講義を実施雇用のミスマッチ解消にもつながる

新聞・雑誌

執筆者：本人以外

日経産業新聞 24-25面

2004年04月
講師は一流のエンジニア教育における産学連携

その他

執筆者：本人以外

日経進学ガイド2004 －変化する大学進化する大学－

2004年01月
シングル・チップのマルチプロセサ・アーキテクチャを開発

その他

執筆者：本人以外

日経マイクロデバイス特別編集版半導体就職読本2004 未来を切り開く半導体技術 pp.18-19

2004年01月
産官学連携プロジェクトでソフト開発に成功並列コンピュータを１０倍以上高速化

インターネットメディア

執筆者：本人以外

Digital JECC NEWS

2003年05月
アドバンスト並列化コンパイラ技術の研究開発

その他

執筆者：本人以外

Focus NEDO 第9号（5月号）

2003年05月
IT競争力強化に向けた産官学連携

インターネットメディア

執筆者：本人以外

朝日新聞社企画 WASEDA.COM

2003年04月
MOT（技術経営）産業界が大学に乗り込み、未来のエンジニアを育てる

その他

執筆者：本人以外

日経エレクトロニクス2003/4/17号 pp.106-107で紹介

2003年04月
各新聞社朝刊で紹介

新聞・雑誌

執筆者：本人以外

日刊工業１１面、電波新聞２面、読売新聞大阪版１０面

2003年04月
JEITA関西講座」の新規開設につい

インターネットメディア

執筆者：本人以外

JEITA

2003年03月
並列処理アプリのプログラム開発を容易に、コンパイラに新技術

インターネットメディア

執筆者：本人以外

IT Pro ニュース

2003年03月
高性能コンピュータを性能アップ－APC技術で国際シンポ最大１０．７倍に高速化・平均で３．５倍ハードの変更無しに数年先の性能得られる

新聞・雑誌

執筆者：本人以外

電波新聞

2003年03月
並列コンピュータを１０倍以上速くするソフトウエアの開発に成功

インターネットメディア

執筆者：本人以外

経済産業省報道発表

2003年03月
並列コンピュータを１０倍高速化【ＩＴ】」（13時15分

インターネットメディア

執筆者：本人以外

知財情報局 @braina.com（科学新聞社）

2003年03月
笠原早大教授ら並列コンピューターを10倍高速化コンパイラ技術開発国際シンポで成果発表へ

新聞・雑誌

執筆者：本人以外

科学新聞

2003年03月
並列電算機の能力をソフトウェアで十倍に「アドバンストコンパイラプロ」

新聞・雑誌

執筆者：本人以外

化学工業日報

2003年03月
平均3.5倍の高速化実現する並列化コンパイラ

インターネットメディア

執筆者：本人以外

KureJBC

2003年03月
富士通など、並列コンピュータを10倍以上高速化するソフトを開発

インターネットメディア

執筆者：本人以外

ZDNet News

2003年02月
コンピューター並列で処理速度10倍に、新ソフト開発

インターネットメディア

執筆者：本人以外

Yahoo Japan News（読売新聞）

2003年02月
情報処理開発協などが最新並列コンピューターの高速化ソフト

インターネットメディア

執筆者：本人以外

日本工業新聞

2003年02月
並列コンピュータの処理速度を10倍以上高速化するソフトウェアを共同開発

インターネットメディア

執筆者：本人以外

日刊工業新聞

2003年02月
早大など、処理10倍高速化できる並列コンピューター用ソフト」（6時52分

インターネットメディア

執筆者：本人以外

日経新聞 ITビジネス＆ニュース

2003年02月
“NEDO develops software speeding up computer operation 10 times"（14時46分）

インターネットメディア

執筆者：本人以外

KYODO NEWS

2003年02月
「高速演算処理ソフトを開発」日立など産学官共同で

新聞・雑誌

執筆者：本人以外

読売新聞

2003年02月
「最新並列コンピューター10倍以上に高速化」情報処理開発協などがソフト

新聞・雑誌

執筆者：本人以外

日本工業新聞

2003年02月
「処理速度10倍高速化ソフト」並列コンピューター早大など開発

新聞・雑誌

執筆者：本人以外

日経産業新聞

2003年02月
「並列計算機処理速度10倍以上に」JIPDEC並列コンパイラー開発

新聞・雑誌

執筆者：本人以外

日刊工業新聞

2003年02月
「並列コンピューター処理速度１０倍の高速ソフト開発」日立や早大など

新聞・雑誌

執筆者：本人以外

日本経済新聞

2003年02月
「並列コンピューター向け高速コンパイラー開発」NEDO

新聞・雑誌

執筆者：本人以外

化学工業日報

2003年02月
「並列コンピュータを高速化」JIPDEC、富士通などと共同開発日立がソフト開発

新聞・雑誌

執筆者：本人以外

電波新聞

2003年02月
JEITA 産学連携で「IT最前線」講座の開設を推進

インターネットメディア

執筆者：本人以外

BCN

2003年02月
並列コンピュータを１０倍以上速くするソフトウェアの開発に成功

その他

執筆者：本人以外

富士通プレスリリース

2003年02月
並列コンピュータを10倍以上速くするソフトウェアの開発に成功

インターネットメディア

執筆者：本人以外

朝日新聞企画運営

2003年02月
コンピューター並列で処理速度10倍に、新ソフト開発

インターネットメディア

執筆者：本人以外

読売新聞

2003年02月
処理速度を最高10倍アップNEDO、新ソフト開発

インターネットメディア

執筆者：本人以外

京都新聞

2003年02月
日立製作所、並列コンピュータの処理速度を10倍以上高速化するコンパイラを共同開発

インターネットメディア

執筆者：本人以外

PCWeb

2003年02月
並列コンピュータを10倍速くするソフトウェアを開発

インターネットメディア

執筆者：本人以外

nth dimension

2003年02月
平均3.5倍の高速化実現する並列化コンパイラ」（19時12分

インターネットメディア

執筆者：本人以外

日経BP

2003年02月
福島民報 Web掲載

インターネットメディア

執筆者：本人以外

福島民報

2003年02月
並列コンピュータを10倍以上速くするソフトウェアの開発に成功

インターネットメディア

執筆者：本人以外

同志社大学

2003年02月
第3部科学技術の振興に関して講じた施策第2章科学技術の重点化戦略第2節国家的・社会的課題に対応した研究開発の重点化2. 情報通信分野に掲載

インターネットメディア

執筆者：本人以外

平成14年版科学技術白書

2002年06月
産学協力でＩＴ技術者養成

テレビ・ラジオ番組

執筆者：本人以外

NHK

2002年04月
産学連携で大学で講義初回の講義風景、学生へのインタビューが映像として流れました。

テレビ・ラジオ番組

執筆者：本人以外

NHK 経済最前線

2002年04月
産学連携でIT技術者を育成

テレビ・ラジオ番組

執筆者：本人以外

NHK

2002年03月
JEITA寄付講座「ＩＴ最前線」の開講

インターネットメディア

執筆者：本人以外

日本私立大学連盟HP

2002年03月
JEITA 産学連携で「IT最前線」講座の開設を推進(WebBCN)

インターネットメディア

執筆者：本人以外

Mycom PC Web

2002年03月
JEITA 産学連携で「IT最前線」講座の開設を推進

新聞・雑誌

執筆者：本人以外

朝日新聞

2002年03月
電機メーカー技術者派遣、東大・早大などでＩＴ講座

新聞・雑誌

執筆者：本人以外

読売新聞

2002年03月
JEITA、IT技術者の育成で産学連携のJEITA講座“IT最前線"を開講

インターネットメディア

執筆者：本人以外

ASCII24

2002年03月
JEITA寄付講座「ＩＴ最前線」の開講

インターネットメディア

執筆者：本人以外

早稲田大学ニュースフラッシュ

2002年03月
JEITA、東大などと連携し企業の技術者が講義を行う講座「ＩＴ最前線」を開設

インターネットメディア

執筆者：本人以外

日経PressRelease

2002年03月
ＩＴ企業９社、東大など３大学で出前講座－人材育成で経産省が後押し

インターネットメディア

執筆者：本人以外

LYCOSニュース

2002年03月
JEITA講座「IT最前線」の開設について

インターネットメディア

執筆者：本人以外

JEITA

2002年03月
ＩＴ企業が東大などで講義電子情報技術産業協会

新聞・雑誌

執筆者：本人以外

山陽新聞社

2002年03月
Close up 新プロジェクト紹介：アドバンスト並列化コンパイラ技術研究開発

会誌・広報誌

執筆者：本人以外

NEDO BEST MIX vol.47

2001年03月
100倍速コンピュータ技術通産、官民で研究会

新聞・雑誌

執筆者：本人以外

日刊工業新聞

1999年02月
とかく世代交代は難しいスパコンに限界が来た超並列機時代へソフト開発これから

新聞・雑誌

執筆者：本人以外

朝日新聞

1993年12月
市場開花へ向かう超並列コンピュータ

新聞・雑誌

執筆者：本人以外

週刊コンピューターワールド

1991年04月
並列コンピュータの動向

新聞・雑誌

執筆者：本人以外

電波新聞 Data Communication

1991年01月
早大が高性能コンパイラー電算機プログラム並列処理を高速化

新聞・雑誌

執筆者：本人以外

日本工業新聞

1990年05月
並列処理コンピュータに関する研究

新聞・雑誌

執筆者：本人以外

受験講座4月号

1989年04月
この人を尋ねて -早稲田大学理工学部電気工学科助教授笠原博徳氏- 独創性が評価並列処理で新手法

新聞・雑誌

執筆者：本人以外

日本情報産業新聞

1988年10月
高速並列処理マシンを開発早稲田大学自動処理技術を確立 64CPUまで増設可能に

新聞・雑誌

執筆者：本人以外

日本情報産業新聞

1988年08月
高性能WS百台を購入ネットワーク構築

新聞・雑誌

執筆者：本人以外

科学新聞

1988年02月
第一回IFACヤング・オーサーズ・プライズを受賞した笠原博徳先生

会誌・広報誌

執筆者：本人以外

早稲田ウィークリー554号

1987年11月
オスカー（OSCAR）マルチ・プロセシングスケジューリング理論を用いた、世界有数のコンピュータ

新聞・雑誌

執筆者：本人以外

早稲田学生新聞

1987年10月
早大理工学部、汎用マルチプロセサ上で並列Prolog処理系を開発中

新聞・雑誌

執筆者：本人以外

日経AI

1987年09月
早稲田大学オープンイノベーション戦略

会誌・広報誌

大学マネジメント

▼全件表示

論文

Evaluation of Speedup and Energy with Multigrain Parallelizing Compiler

John Pickar, Tohma Kawasumi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

Principles and Practices of Building Parallel Software, Lecture Notes in Computer Science, Springer 34 - 49 2025年06月

担当区分：最終著者

DOI

Scopus
OSCAR自動並列化コンパイラによる並列化オーバヘッド削減のためのタスク融合手法を用いた実ラダーアプリケーションの並列化

川角冬馬, 見神広紀, 吉川智哉, 細見武郎, 追立真吾, 木村啓二, 笠原博徳

情報処理学会論文誌 65 ( 2 ) 539 - 551 2024年02月 [査読有り]

担当区分：最終著者

J-GLOBAL
Automatic Deep Learning Parallelization for Vector Multicore Chips with the OSCAR Parallelizing and the TVM Open-Source Deep Learning Compiler.

Fumiaki Onishi, Ryosei Otaka, Kazuki Fujita, Tomoki Suetsugu, Tohma Kawasumi, Toshiaki Kitamura, Hironori Kasahara, Keiji Kimura

LCPC 96 - 110 2023年10月 [査読有り]

DOI

Scopus
深層学習コンパイラTVMのベクトルマルチコア向けコード生成手法の検討

大西文彬, 大髙凌聖, 藤田一輝, 末次智貴, 川角冬馬, 北村俊明, 笠原博徳, 木村啓二

研究報告システム・アーキテクチャ(ARC) 2023-ARC-254 ( 8 ) 1 - 8 2023年08月

J-GLOBAL
各コアがローカルメモリを持つ組み込みベクトルマルチコアでの畳み込み層演算の評価

大高凌聖, 小池穂乃花, 磯野立成, 川角冬馬, 北村俊明, 見神広紀, 納富昭, 木村貞弘, 木村啓二, 笠原博徳

情報処理学会研究報告 2023-EMB-62 ( 32 ) 2023年03月

担当区分：最終著者

J-GLOBAL
Jetson Xavier NXにおけるORB-SLAM3の低消費電力化の検討

林頼人, 見神広紀, 納富昭, 木村貞弘, 木村啓二, 笠原博徳

信学技報, IEICE Technical Report, CPSY2022-40, DC2022-99 CPSY2022-40 ( 451(CPSY2022 34-55) ) 2023年03月

担当区分：最終著者

J-GLOBAL
The Invention of Electronic Digital Computing - Plenary Panel Summary.

John Vincent Atanasoff, Gordon Bell, Kiril L. Boyanov, Charles G. Call, Carl K. Chang, Thomas M. Conte, Vladimir Getov, John L. Gustafson, Hironori Kasahara, Dejan S. Milojicic, Michael R. Williams

IEEE John Vincent Atanasoff International Symposium on Modern Computing(JVA) 8 - 8 2023年

DOI

Scopus

2

被引用数

(Scopus)
Parallelizing Factory Automation Ladder Programs by OSCAR Automatic Parallelizing Compiler.

Tohma Kawasumi, Yuta Tsumura, Hiroki Mikami, Tomoya Yoshikawa, Takero Hosomi, Shingo Oidate, Keiji Kimura, Hironori Kasahara

Languages and Compilers for Parallel Computing - 35th International Workshop(LCPC) 123 - 138 2022年10月 [査読有り]

担当区分：最終著者

DOI

Scopus

1

被引用数

(Scopus)
OSCAR自動並列化コンパイラを用いたラダープログラムの並列性解析

津村雄太, 川角冬馬, 見神広紀, 川上大樹, 細見武郎, 追立真吾, 木村啓二, 笠原博徳

情報処理学会研究報告 2022 ( 53 ) 2022年03月

担当区分：最終著者

J-GLOBAL
ORB-SLAM3のローカルマッピングの並列化とコア割り当て手法の提案

山本一貴, 長ヶ部拓吾, 小池穂乃花, 川角冬馬, 藤田一輝, 北村俊明, 川島慧大, 納富昭, 木村貞弘, 木村啓二, 笠原博徳

信学技報 121 ( 425, CPSY2021-58 ) 79 - 74 2022年03月

担当区分：最終著者
組込みシステムにおける並列化技術動向

木村啓二, 梅田弾, 笠原博徳

システム／制御／情報 66 ( 1 ) 2 - 7 2022年01月 [査読有り] [招待有り]

担当区分：最終著者

J-GLOBAL
Parallelizing Compiler Translation Validation Using Happens-Before and Task-Set.

Jixin Han, Tomofumi Yuki, Michelle Mills Strout, Dan Umeda, Hironori Kasahara, Keiji Kimura

Ninth International Symposium on Computing and Networking 87 - 93 2021年11月 [査読有り]

DOI

Scopus
OSCAR Parallelizing and Power Reducing Compiler and API for Heterogeneous Multicores : (Invited Paper).

Hironori Kasahara, Keiji Kimura, Toshiaki Kitamura, Hiroki Mikami, Kazutaka Morita, Kazuki Fujita, Kazuki Yamamoto, Tohma Kawasumi

IEEE/ACM Programming Environments for Heterogeneous Computing(PEHC@SC) 10 - 19 2021年11月 [査読有り] [招待有り]

担当区分：筆頭著者

DOI

Scopus

6

被引用数

(Scopus)
Performance Evaluation of OSCAR Multi-target Automatic Parallelizing Compiler on Intel, AMD, Arm and RISC-V Multicores.

Birk Martin Magnussen, Tohma Kawasumi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

Languages and Compilers for Parallel Computing - 34th International Workshop(LCPC) 50 - 64 2021年10月 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
Engineering Education in the Age of Autonomous Machines.

Shaoshan Liu, Jean-Luc Gaudiot, Hironori Kasahara

CoRR abs/2102.07900 ( 4 ) 66 - 69 2021年04月 [査読有り]

担当区分：最終著者

DOI

Scopus

10

被引用数

(Scopus)
OSCARコンパイラによるMATLAB/Simulinkアプリケーションの自動並列化

古山凌, 津村雄太, 川角冬馬, 仲田優哉, 梅田弾, 木村啓二, 笠原博徳

情報処理学会第236回システム・アーキテクチャ・第194回システムとLSIの設計技術・第56回組込みシステム合同研究発表会(ETNET2021) 2021 ( ARC-244 ) 2021年03月

担当区分：最終著者

J-GLOBAL
Sparse Neural NetworkにおけるSpMMの並列/ベクトル化による高速化

田處雄大, 木村啓二, 笠原博徳

情報処理学会第236回システム・アーキテクチャ・第194回システムとLSIの設計技術・第56回組込みシステム合同研究発表会(ETNET2021) 120 ( 435(CPSY2020 50-69) ) 2021年03月

担当区分：最終著者

J-GLOBAL
早稲田大学のベンチャー創出と'Lab to Market'への期待

笠原博徳

STE Relay Column : Narratives 130, 早稲田大学オープン・イノベーション戦略研究機構科学技術と新事業創造リサーチ・ファクトリー 2021年03月 [招待有り]

担当区分：筆頭著者
Computer Education in the Age of COVID-19.

Jean-Luc Gaudiot, Hironori Kasahara

IEEE Computer(Computer) 53 ( 10 ) 114 - 118 2020年10月 [査読有り]

担当区分：最終著者

DOI

Scopus

20

被引用数

(Scopus)
Local Memory Mapping of Multicore Processors on an Automatic Parallelizing Compiler.

Yoshitake Oki, Yuto Abe, Kazuki Yamamoto, Kohei Yamamoto, Tomoya Shirakawa, Akimasa Yoshida, Keiji Kimura, Hironori Kasahara

IEICE Transactions on Electronics 103-C ( 3 ) 98 - 109 2020年03月 [査読有り] [国内誌]

担当区分：最終著者

DOI

Scopus
Compiler Software Coherent Control for Embedded High Performance Multicore

Boma A. Adhi, Tomoya Kashimata, Ken Takahashi, Keiji Kimura, Hironori Kasahara

IEICE TRANSACTIONS ON ELECTRONICS E103C ( 3 ) 85 - 97 2020年03月 [査読有り] [国内誌]

担当区分：最終著者

DOI

Scopus

2

被引用数

(Scopus)
マルチターゲット自動並列化コンパイラにおけるアクセラレータコスト推定手法の検討

山本一貴, 藤田一輝, 柏俣智哉, 高橋健, ADHI, Boma anantasatya, 北村俊明, 川島慧大, 納富昭, 森裕司, 木村啓二, 笠原博徳

情報処理学会第232回システム・アーキテクチャ・第191回システムとLSIの設計技術・第53回組込みシステム合同研究発表会（ETNET2020） 2020 ( SLDM-191 ) 2020年02月

担当区分：最終著者

J-GLOBAL
OSCAR自動並列化コンパイラとNECベクトル化コンパイラの協調によるベクトル・パーソナルスパコン上での自動ベクトル並列化

田處雄大, 見神広紀, 細見岳生, 木村啓二, 笠原博徳

情報処理学会第232回システム・アーキテクチャ・第191回システムとLSIの設計技術・第53回組込みシステム合同研究発表会（ETNET2020） 2020 ( SLDM-191 ) 2020年02月

担当区分：最終著者

J-GLOBAL
OSCARコンパイラのC++プログラム対応の検討

川角冬馬, TilmanPriesner, 野口真聖, 韓吉新, 見神広紀, 川島慧大, 田中啓士郎, 木村啓二, 笠原博徳

情報処理学会第232回システム・アーキテクチャ・第191回システムとLSIの設計技術・第53回組込みシステム合同研究発表会（ETNET2020） 119 ( 429(DC2019 98-121)(Web) ) 2020年02月

担当区分：最終著者

J-GLOBAL
Automatically Parallelizing Compiler Cooperative OSCAR Vector Multicore

Keiji Kimura, Kazuki Fujita, Kazuki Yamamoto, Tomoya Kashimata, Toshiaki Kitamura, Hironori Kasahara

International Workshop on Innovative Architecture for Future Generation High-Performance Processors and Systems 2020年02月 [査読有り]

担当区分：最終著者
巻頭言--安全と環境に配慮した世界レベルの研究推進を目指して--

笠原博徳

早稲田大学環境保全センター「環境創設40周年記念号」 3 - 3 2019年11月 [招待有り]

担当区分：筆頭著者
Cascaded DMA Controller for Speedup of Indirect Memory Access in Irregular Applications

Tomoya Kashimata, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

2019 IEEE/ACM 9TH WORKSHOP ON IRREGULAR APPLICATIONS - ARCHITECTURES AND ALGORITHMS (IA3) 71 - 76 2019年11月 [査読有り]

担当区分：最終著者

DOI

Scopus

2

被引用数

(Scopus)
Fast and Highly Optimizing Separate Compilation for Automatic Parallelization.

Tohma Kawasumi, Ryota Tamura, Yuya Asada, Jixin Han, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

17th International Conference on High Performance Computing & Simulation(HPCS) 478 - 485 2019年07月 [査読有り]

担当区分：最終著者

DOI

Scopus
Guest Editorial: Special Issue on Network and Parallel Computing for Emerging Architectures and Applications

Feng Zhang, Jidong Zhai, Marc Snir, Hai Jin, Hironori Kasahara, Mateo Valero

INTERNATIONAL JOURNAL OF PARALLEL PROGRAMMING 47 ( 3 ) 343 - 344 2019年06月

DOI

Scopus
2018 CS PRESIDENT’S MESSAGE --Collaboration for the Future--

Hironori Kasahara

Computer, January 2019, IEEE Computer Society 52 ( 1 ) 72 - 76 2019年03月 [査読有り] [招待有り]

担当区分：筆頭著者

DOI
DMAのカスケード接続による間接ロードの高速化

柏俣智哉, 北村俊明, 木村啓二, 笠原博徳

第234回システム・アーキテクチャ・第186回システムとLSIの設計技術合同研究発表会 118 ( 430(VLD2018 72-92) ) 2019年01月

担当区分：最終著者

J-GLOBAL
Performance of Static and Dynamic Task Scheduling for Real-Time Engine Control System on Embedded Multicore Processor.

Yoshitake Oki, Hiroki Mikami, Hikaru Nishida, Dan Umeda, Keiji Kimura, Hironori Kasahara

Languages and Compilers for Parallel Computing - 32nd International Workshop(LCPC) 11998 1 - 14 2019年

DOI

Scopus

1

被引用数

(Scopus)
NPC: 15th IFIP International Conference Network and Parallel Computing

Feng Zhang, Jidong Zhai, Marc Snir, Hai Jin, Hironori Kasahara, Mateo Valero

Lecture Notes in Computer Science 11276 ( LNCS ) 2018年11月
IEEE Division VIII Delegate/Director Candidates

Hironori Kasahara

Computer, IEEE Computer Society 50 ( 8 ) 94 - 95 2018年07月 [招待有り]
OSCARベクトルマルチコアアーキテクチャのコンパイルフロー構築及び評価

高橋健, 狩野哲史, 宮本一輝, 河田巧, 柏俣智哉, 牧田哲也, 木村啓二, 笠原博徳

情報処理学会第80回全国大会 80th ( 1 ) 2018年03月

担当区分：最終著者

J-GLOBAL
OSCAR ベクトルアクセラレータの FPGA 上での性能評価

柏俣智哉, Boma A. Adhi, 狩野哲史, 宮本一輝, 河田巧, 高橋健, 牧田哲也, 北村俊明, 木村啓二, 笠原博徳

情報処理学会第80回全国大会 80th ( 1 ) 2018年03月

担当区分：最終著者

J-GLOBAL
OSCARベクトルマルチコアプロセッサのための自動並列ベクトル化コンパイラフレームワーク

宮本一輝, 牧田哲也, 高橋健, 柏俣智哉, 河田巧, 狩野哲史, 北村俊明, 木村啓二, 笠原博徳

第222回システム・アーキテクチャ・第183回システムとLSIの設計技術・第47回組込みシステム合同研究発表会（ETNET2018） 117 ( 480(DC2017 89-106) ) 2018年03月

担当区分：最終著者

J-GLOBAL
Network and Parallel Computing - 15th IFIP WG 10.3 International Conference, NPC 2018, Muroran, Japan, November 29 - December 1, 2018, Proceedings

NPC 11276 2018年

DOI
Preface

Zhang, F., Zhai, J., Snir, M., Jin, H., Kasahara, H., Valero, M.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 11276 LNCS 2018年
Satisfaction and Sustainability.

Hironori Kasahara

IEEE Computer(Computer) 51 ( 1 ) 4 - 6 2018年01月 [査読有り] [招待有り]

担当区分：筆頭著者

DOI
階層アジャスタブルブロックを用いた自動マルチコア・ローカルメモリ管理とその性能評価

白川智也, 阿部佑人, 大木吉健, 吉田明正, 木村啓二, 笠原博徳

第220回システム・アーキテクチャ研究発表会2017-ARC-220(デザインガイア2017) 117 ( 278(CPSY2017 40-49) ) 2017年11月

担当区分：最終著者

J-GLOBAL
IEEE President-Elect Candidates Address Computer Society Concerns

Hironori Kasahara

Computer, IEEE Computer Society 50 ( 8 ) 96 - 100 2017年08月 [招待有り]

担当区分：責任著者
Multicore Cache Coherence Control by a Parallelizing Compiler

Hironori Kasahara, Keiji Kimura, Boma A. Adhi, Yuhei Hosokawa, Yohei Kishimoto, Masayoshi Mase

2017 IEEE 41ST ANNUAL COMPUTER SOFTWARE AND APPLICATIONS CONFERENCE (COMPSAC), VOL 1 492 - 497 2017年07月 [査読有り]

DOI

Scopus

9

被引用数

(Scopus)
Message from the CAP 2017 Organizing Committee.

Cristina Seceleanu, Hironori Kasahara, Tiberiu Seceleanu

41st IEEE Annual Computer Software and Applications Conference 458 - 458 2017年07月 [招待有り]

DOI

Scopus
大規模システムを想定したGem5 シミュレータの階層的インターコネクションネットワーク拡張

小野口達也, 林綾音, 宇高勝之, 松島裕一, 木村啓二, 笠原博徳

情報処理学会第217回システム・アーキテクチャ研究発表会 ARC-217 組込み技術とネットワークに関するワークショップ(ETNET2017) 116 ( 511(DC2016 84-108) ) 2017年03月

担当区分：最終著者

J-GLOBAL
自動車リアルタイム制御計算の複数クラスタ構成マルチコア上での並列処理

宮田仁, 島岡護, 見神広紀, 西博史, 鈴木均, 木村啓二, 笠原博徳

情報処理学会第217回システム・アーキテクチャ研究発表会 ARC-217 組込み技術とネットワークに関するワークショップ(ETNET2017) 2017年03月

担当区分：最終著者
自動並列化コンパイラのコンパイル時間短縮のための実行プロファイル・フィードバックを用いたコード生成手法

藤野里奈, 韓吉新, 島岡護, 見神広紀, 宮島崇浩, 高村守幸, 木村啓二, 笠原博徳

情報処理学会第217回システム・アーキテクチャ研究発表会 ARC-217 組込み技術とネットワークに関するワークショップ(ETNET2017) 2017年03月

担当区分：最終著者
Panel discussions: "Cool chips for the next decade".

Hideharu Amano, Tadao Nakamura, Hiroaki Kobayashi, Hironori Kasahara, Yoshiaki Hagiwara, Jeffrey L. Burns, David Brash

2017 IEEE Symposium in Low-Power and High-Speed Chips 1 - 3 2017年

DOI
Software Cache Coherent Control by Parallelizing Compiler.

Boma A. Adhi, Masayoshi Mase, Yuhei Hosokawa, Yohei Kishimoto, Taisuke Onishi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

Languages and Compilers for Parallel Computing - 30th International Workshop(LCPC) LNCS 11403. Springer, 2019 17 - 25 2017年 [査読有り]

担当区分：最終著者

DOI

Scopus
Automatic local memory management for multicores having global address space

Yamamoto, K., Shirakawa, T., Oki, Y., Yoshida, A., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 10136 LNCS 282 - 296 2017年 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
Kasahara Voted 2017 Computer Society President-Elect

Hironori Kasahara, Jean Luc Gaudiot

Computer, IEEE Computer Society 49 ( 12 ) 90 - 92 2016年12月 [招待有り]

DOI
Architecture Design for the Environmental Monitoring System over the Winter Season

Koichiro Yamashita, Takahisa Suzuki, Hongchun Li, Chen Ao, Yi Xu, Jun Tian, Keiji Kimura, Hironori Kasahara

PROCEEDINGS OF THE 14TH ACM INTERNATIONAL SYMPOSIUM ON MOBILITY MANAGEMENT AND WIRELESS ACCESS, MOBIWAC 2016 27 - 34 2016年11月 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
Reducing parallelizing compilation time by removing redundant analysis.

Jixin Han, Rina Fujino, Ryota Tamura, Mamoru Shimaoka, Hiroki Mikami, Moriyuki Takamura, Sachio Kamiya, Kazuhiko Suzuki, Takahiro Miyajima, Keiji Kimura, Hironori Kasahara

Proceedings of the 3rd International Workshop on Software Engineering for Parallel Systems(SEPS@SPLASH) 1 - 9 2016年10月 [査読有り]

担当区分：最終著者

DOI

Scopus

2

被引用数

(Scopus)
LLVMを用いたベクトルアクセラレータ用コードのコンパイル手法

丸岡晃, 無州祐也, 狩野哲史, 持山貴司, 北村俊明, 神谷幸男, 高村守幸, 木村啓二, 笠原博徳

情報処理学会2016年並列／分散／協調処理に関する『松本』サマー・ワークショップ (SWoPP松本2016) Vol.2016-ARC-221 No.4 116 ( 177(CPSY2016 10-40) ) 2016年08月

担当区分：最終著者

J-GLOBAL
OSCARコンパイラを用いた医用画像フィルタリングのマルチグレイン並列処理

奥村万里子, 柴崎大侑, 桑島昂平, 見神広紀, 木村啓二, 門下康平, 中野恵一, 笠原博徳

第153回ハイパフォーマンスコンピューティング研究発表会 2016 ( HPC-153 ) 2016年03月

担当区分：最終著者

J-GLOBAL
OSCARコンパイラを用いた医用画像3Dノイズリダクションの自動マルチグレイン並列処理

柴崎大侑, 桑島昂平, 奥村万里子, 見神広紀, 木村啓二, 門下康平, 中野恵一, 笠原博徳

第153回ハイパフォーマンスコンピューティング研究発表会 2016 ( HPC-153 ) 2016年03月

担当区分：最終著者

J-GLOBAL
OSCAR自動並列化コンパイラにおける解析時データ構造変換による並列性抽出手法

影浦直人, 和気珠実, 韓吉新, 木村啓二, 笠原博徳

第153回ハイパフォーマンスコンピューティング研究発表会 2016 ( HPC-153 ) 2016年03月

担当区分：最終著者

J-GLOBAL
組み込み向けモデルベース開発アプリケーションのプロファイル情報を用いたマルチコア用マルチグレイン並列処理

梅田弾, 鈴木貴広, 見神広紀, 木村啓二, 笠原博徳

情報処理学会論文誌 57 ( 2 ) 1 - 12 2016年02月 [査読有り]

担当区分：最終著者

　概要を見る

現在の組み込みシステム開発ではMATLAB/Simulinikに代表されるモデルベース開発ツールがよく使用されるようになっている．また，開発されたモデルの複雑化とともに，このようなツールで開発されるアプリケーションのマルチコア上での高性能化，低消費電力化の要求が高まってきている．この要求に対して，モデル中のブロック間並列性を利用した並列化の提案はされているが，ブロック間だけでなく，ブロック内の並列性を利用したアプリケーション全体の並列性を有効利用できる方式は提案されていない．そこで，本論文では逐次Cプログラムから並列化Cプログラムを生成可能なOSCAR自動並列化コンパイラを用いて，MATLAB/SimulinkからEmbedded Coderを使って自動生成されたCプログラムに対して，モデル上に現れるブロック間並列性および，ブロック内のベクトル演算やユーザカスタマイズのコードからループ並列性を抽出し，マルチグレイン並列化を行う．また，マルチグレイン並列化の際に，Simulink上で得られたプロファイル情報を使ったタスクスケジューリングを行うことによりスケジューリングの精度向上を行う．提案手法によりXeon X5670上の6コアを使い，逐次実行時間と比較して道路追従アプリケーションでは4.21倍，血管抽出アプリケーションでは5.80倍，異常検出アプリケーションでは4.10倍の速度向上率が得られた．また，道路追従アプリケーションに関しては逐次の最悪実行時の実行時間と比較して，4.81倍の速度向上率が得られた．Model-based development tools such as the MATLAB/Simulink have become popular for development of embedded systems recently. These applications require high performance and low power processing on multicores. Therefore, several researchers have proposed parallel processing of these applications utilizing parallelism among blocks in these models. However, no one proposes a method to extract all parallelism from not only among blocks but also in a block in these models. This paper proposes multigrain parallelization of C program generated by Embedded Coder from MATLAB/Simulink utilizing both coarse grain task parallelism among blocks and loop parallelism in a block including a vector operation or user's customized code using the OSCAR automatic parallelizing compiler. The compiler generates a parallelized C program from a sequential C program. The proposed method utilizes profiling information on Simulink to improve scheduling results into a multicore. It attains 4.21 times speedup for road tracking application, 5.80 times speedup for vessel detecting application and 4.10 times speedup for abnormality detecting application using six cores of Xeon X5670 compared with case of an ordinary sequential execution. Also, it attains 4.81 times speed up for road tracking application in worse case execution.

CiNii J-GLOBAL
Coarse grain task parallelization of earthquake simulator GMS using OSCAR compiler on various Cc-NUMA servers

Shimaoka, M., Wada, Y., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 9519 238 - 253 2016年 [査読有り]

担当区分：最終著者

DOI

Scopus
Multigrain parallelization for model-based design applications using the OSCAR compiler

Umeda, D., Suzuki, T., Mikami, H., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 9519 125 - 139 2016年 [査読有り]

担当区分：最終著者

DOI

Scopus

12

被引用数

(Scopus)
データ多次元整合分割によるマルチコア・ローカルメモリ管理手法

山本康平, 白川智也, 吉田明正, 木村啓二, 笠原博徳

情報処理学会第210回システム・アーキテクチャ研究発表会 Vol.2016-ARC-218 No.10 115 ( 400 ) 55 - 60 2016年01月

担当区分：最終著者

CiNii J-GLOBAL
Android video processing system combined with automatically parallelized and power optimized code by OSCAR compiler

Binh, B.D., Hirano, T., Mikami, H., Yamamoto, H., Kimura, K., Kasahara, H.

Journal of Information Processing 24 ( 3 ) 504 - 511 2016年 [査読有り]

担当区分：最終著者

DOI

Scopus
Accelerating Multicore Architecture Simulation Using Application Profile.

Keiji Kimura, Gakuho Taguchi, Hironori Kasahara

10th IEEE International Symposium on Embedded Multicore/Many-core Systems-on-Chip(MCSoC) 177 - 184 2016年 [査読有り]

担当区分：最終著者

DOI

Scopus

5

被引用数

(Scopus)
Annotatable systrace: an extended Linux ftrace for tracing a parallelized program.

Daichi Fukui, Mamoru Shimaoka, Hiroki Mikami, Dominic Hillenbrand, Hideo Yamamoto, Keiji Kimura, Hironori Kasahara

Proceedings of the 2nd International Workshop on Software Engineering for Parallel Systems(SEPS@SPLASH) 21 - 25 2015年10月 [査読有り]

担当区分：最終著者

DOI

Scopus

6

被引用数

(Scopus)
Nominees for Computer Society Officers and Board of Governors Positions in 2016

Jean-Luc Gaudiot, Hironori Kasahara

IEEE Computer Society Computer 96 - 97 2015年08月 [招待有り]
動画像デコーディングのIntelおよびARMマルチコア上での並列処理の評価

和気珠実, 飯塚修平, 見神広紀, 木村啓二, 笠原博徳

情報処理学会第170回SLDM・第36回EMB合同研究発表会（ETNET2015）組込みシステム合同研究発表会 114 ( 506(CPSY2014 162-183) ) 2015年03月

担当区分：最終著者

J-GLOBAL
自動並列化・低消費電力化された複数アプリケーションに対するマルチコア用ダイナミックスケジューリング手法

後藤隆志, 武藤康平, 平野智大, 見神広紀, 高橋宇一郎, 井上栄, 富, 木村啓二, 笠原博徳

情報処理学会第170回SLDM・第36回EMB合同研究発表会（ETNET2015）組込みシステム合同研究発表会 114 ( 506(CPSY2014 162-183) ) 2015年03月

担当区分：最終著者

J-GLOBAL
OSCAR自動並列化コンパイラを用いたリアルタイム動画像アプリケーションのHaswellマルチコア上での低消費電力化

飯塚修平, 山本英雄, 平野智大, 岸本耀平, 後藤隆志, 見神広紀, 木村啓二, 笠原博徳

情報処理学会第170回SLDM・第36回EMB合同研究発表会（ETNET2015）組込みシステム合同研究発表会 114 ( 507 ) 219 - 224 2015年03月

　概要を見る

スマートフォンやノートパソコンといったモバイル端末からデータセンタで利用されるサーバーマシンまで,あらゆる計算機において消費電力の削減が最重要課題となっている.これは、消費電力の削減によりモバイル機器においてはバッテリー持続時間の延長により利便性が大幅に向上し,またサーバーマシンにおいては膨大な電力コストや空調コストの削減が実現できるからである.これらの計算機は高性能かつ低消費電力を実現するためにマルチコアプロセッサを搭載したものが主流となっている.しかしながらマルチコアの資源を有効活用してこれらを実現するためには,プログラムの並列化が不可欠であり手動で行うには膨大な工数を必要とする.本稿では,医用・防犯・個人認証・車載などで広く利用されているリアルタイム物体認識処理に対して,OSCAR自動並列化コンパイラによるDVFS及びclock gatingによる電力制御を適用し,現在幅広く利用されているIntel Haswell Core i7-4770Kマルチコア上で評価した. Intel Haswellマルチコア上で,Webカメラからの画像の入力・人の顔の認識処理・画面描画というリアルタイムなシステム全域における消費電力の削減を行ったところ, 1PE逐次実行では電力制御なしの場合の31.06[W]から電力制御ありの場合では28.74[W]に、3PEで並列化実行した場合では電力制御なし場合のの41.73[W]から電力制御の場合では17.78[W]に消費電力を削減したことが確認され,物体認識処理におけるマルチコア用のコンパイラ自動電力制御の有用性が確認できた.

CiNii J-GLOBAL
What Will 2022 Look Like? The IEEE CS 2022 Report.

Hasan Alkhatib, Paolo Faraboschi, Eitan Frachtenberg, Hironori Kasahara, Danny B. Lange, Phillip A. Laplante, Arif Merchant, Dejan S. Milojicic, Karsten Schwan

IEEE Computer(Computer) 48 ( 3 ) 68 - 76 2015年03月 [査読有り]

DOI

Scopus

27

被引用数

(Scopus)
Evaluation of automatic power reduction with OSCAR compiler on Intel Haswell and ARM Cortex-A9 multicores

Hirano, T., Yamamoto, H., Iizuka, S., Muto, K., Goto, T., Wake, T., Mikami, H., Takamura, M., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 8967 239 - 252 2015年 [査読有り]

DOI

Scopus

3

被引用数

(Scopus)
自動並列化コンパイラによるソフトウェアキャッシュコヒーレンシ制御手法の評価

Yohei Kishimoto, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

情報処理学会第205回ARC・第147回HPC合同研究発表会（HOKKE-22）Vol.2014-ARC-213 No.19 2014 ( ARC-213 ) 2014年12月

担当区分：最終著者

J-GLOBAL
OSCAR コンパイラを用いた H.264/AVC デコーダの Android マルチコアでの低消費電力化

飯塚修平, 山本英雄, 平野智大, 後藤隆志, 見神広紀, 高橋宇一郎, 井上栄, 高村守幸, 木村啓二, 笠原博徳

情報処理学会第204回計算機アーキテクチャ研究会 2014年10月

担当区分：最終著者
グリーンコンピューティングとスマートグリッドへの期待

笠原博徳

技術雑誌スマートグリッド2014.10 「特集スマートグリッドをささえる新技術」 2 - 2 2014年10月 [査読有り] [招待有り]

担当区分：筆頭著者
グリーンコンピューティングの展望

木村啓二, 笠原博徳

技術雑誌スマートグリッド2014.10 「特集スマートグリッドをささえる新技術」 55 ( 14 ) 3 - 8 2014年10月 [査読有り] [招待有り]

担当区分：最終著者
スレッド間パイプによる逐次化を用いたハッシュ表の並列構築手法

中山誠, 山崎憲一, 田中聡(NTTドコモ, 笠原博徳

電子情報通信学会論文誌. D, 情報・システム Vol. J97-D(10) ( 10 ) 1541 - 1552 2014年10月 [査読有り]

J-GLOBAL
MATLAB/Simulinkで設計されたエンジン制御Cコードのマルチコア用自動並列化

梅田弾, 金羽木洋平, 見神広紀, 林明宏, 谷充弘, デンソー, 森裕司, 株)デンソー, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム 55 ( 8 ) 1817 - 1829 2014年08月 [査読有り]

　概要を見る

近年の自動車では安全性・快適性・環境適合性が求められ，これらを実現するために自動車制御系のソフトウェアが年々より高度化している．制御の高度化と同時に，これらを実現するソフトウェアをリアルタイムで動作させるために，プロセッサの高速化が必要である．しかし，シングルコアの動作周波数の向上が困難であることから，1コアによる処理性能向上が限界となり，今後の自動車制御系でマルチコアへの移行が進んでいくと考えられる．また，自動車制御系において開発期間の短縮および信頼性の向上のためにMATLAB/Simulinkによるモデルベース設計が普及している．しかし，現時点でこのようなモデルベース設計で自動的にコード生成されるソースコードはマルチコア上で自動的に並列処理できるまでには至っていない．そこで，本論文ではMATLAB/Simulinkによって設計された制御モデルからEmbedded Coderにより自動生成されたエンジン制御Cコードをマルチコア上で動作するための並列化手法を提案する．提案手法を用いて，従来手動ではタスク粒度が細かく並列化が困難であった条件分岐と算術代入文からなるエンジン制御CコードをOSCAR自動並列化コンパイラにて自動並列化した．RP2やV850E2R等の組み込みマルチコア上で実行したところ，2コアで最大1.91倍，4コアで最大3.76倍の性能向上が得られた．Recently, more safety, comfort and environmental feasibility are required for the automobile. Accordingly, control systems need performance enhancement on microprocessors for real-time software which realize that. However, the improvement of clock frequency has been limited by power consumption and the performance of a single-core processor which controls power has reached the limits. For these factors, multi-core processors will be used for automotive control system. Recently Model-based Design by MATLAB and Simulink has been used for developing automobile systems because of elimination time of development and improvement of reliability. However, auto-generated-code from MATLAB and Simulink has been functioned on only single core processor so far. This paper proposes a parallelization method of engine control C codes for a multi-core processor generated from MATLAB and Simulink using Embedded Coder. The engine control C code which composed of many conditional branches and arithmetic assignment statements and are difficult to parallelize have been parallelized automatically using OSCAR automatic parallel compiler. In this result, it is succeeded to attain performance improvement on RP2 and V850E2R. Maximum 1.9x speedup on two cores and 3.76x speedup on four cores are attained.

CiNii J-GLOBAL
Linux ftrace を用いたマルチコアプロセッサ上での並列化プログラムのトレース手法

福意大智, 島岡護, 見神広紀, Dominic Hillenbrand, 木村啓二, 笠原博徳

情報処理学会 2014年並列／分散／協調処理に関する『新潟』サマー・ワークショップ（SWoPP新潟2014） Vol.2014-ARC-211 No.6 2014 ( ARC-211 ) 2014年07月

担当区分：最終著者

J-GLOBAL
Android Demonstration System of Automatic Parallelization and Power Optimization by OSCAR Compiler

Bui Duc Binh, Tomohiro Hirano, Hiroki Mikami, Dominic Hillenbrand, Keiji Kimura, Hironori Kasahara

情報処理学会 2014年並列／分散／協調処理に関する『新潟』サマー・ワークショップ（SWoPP新潟2014） Vol.2014-ARC-211 No.6 2014年07月

担当区分：最終著者
小ポイントFFTのマルチコア上での自動並列化手法

古山祐樹, 見神広紀, 木村啓二, 笠原博徳

情報処理学会第201回計算機アーキテクチャ研究発表会 Vol.2013-ARC-201 113 ( 474 ) 15 - 22 2014年03月

担当区分：最終著者

　概要を見る

高速フーリエ変換(FFT)は,ディジタル信号処理や画像圧縮など様々な分野で使用される非常に応用性の高い計算アルゴリズムである.その中でも,LTE等のベースバンド処理で用いられる小ポイントのFFTプログラムは,データ転送や制御のオーバーヘッドを伴う専用ハードウェアを使用しにくく,マルチコア上での並列化の要求が高まっている.本稿では,そのような小ポイントのFFTプログラムに対しコンパイラによる自動並列化及び,false sharing回避を目的としたキャッシュ最適化を適用し,データキャッシュを持つ種々の共有メモリ型マルチコアアーキテクチャに向けて低オーバーヘッドな並列化コー.ドを生成する自動並列化手法を提案する.提案手法をOSCAR自動並列化コンパイラに実装し,32ポイントから256ポイントまでの小ポイントFFTを並列化し,8つのSH4Aコアを集積した情報家電用マルチコアプロセッサRP2上で性能評価を行ったところ,256ポイントのFFTプログラムで,逐次プログラムに対し2コア並列化で1.97倍,4コア並列化で3.9倍というスケーラブルな速度向上を得ることが出来た.また,FFTと同様にバタフライ演算を行う高速アダマール変換のプログラムにも同手法を適用し評価を行い,256ポイントのプログラムで2コア並列化で1.91倍,4コア並列化で3.32倍という高い速度向上が得られ,提案手法の有用性が確認された.

CiNii
不正侵入検知システムにおけるマルチコア上でのシグネチャ割当によるレイテンシ削減手法

山田正平, 木村啓二, 笠原博徳

情報処理学会第201回計算機アーキテクチャ研究発表会 Vol.2013-ARC-201 113 ( 474(ICD2013 138) ) 2014年03月

担当区分：最終著者

J-GLOBAL
統計的手法を用いた並列化コンパイラ協調マルチコアアーキテクチャシミュレータ高速化手法

田口学豊, 木村啓二, 笠原博徳

情報処理学会第165回SLDM・第32回EMB合同研究発表会（ETNET2014）組込み技術とネットワークに関するワークショップ 2014年03月

担当区分：最終著者
低消費電力コンピューティングを実現するマルチコア技術

木村啓二, 笠原博徳

電子情報通信学会誌 97 ( 2 ) 133 - 139 2014年02月 [査読有り] [招待有り]

担当区分：最終著者

CiNii J-GLOBAL
OSCAR compiler controlled multicore power reduction on android platform

Yamamoto, H., Hirano, T., Muto, K., Mikami, H., Goto, T., Hillenbrand, D., Takamura, M., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 8664 155 - 168 2014年 [査読有り]

担当区分：最終著者

DOI

Scopus

3

被引用数

(Scopus)
Parallelization of Tree-to-TLV Serialization

Makoto Nakayama, Kenichi Yamazaki, Satoshi Tanaka, Hironori Kasahara

2014 IEEE INTERNATIONAL PERFORMANCE COMPUTING AND COMMUNICATIONS CONFERENCE (IPCCC) 1 - 8 2014年 [査読有り]

DOI

Scopus

1

被引用数

(Scopus)
プロファイル情報を用いたAndroid 2D描画ライブラリSKIAのOSCARコンパイラによる並列化

後藤隆志, 武藤康平, 山本英雄, 平野智大, 見神広紀, 木村啓二, 笠原博徳

情報処理学会第199回ARC・第142回HPC合同研究発表会 Vol.2013-ARC-207 No.12 2013 ( 12 ) 1 - 7 2013年12月

担当区分：最終著者

　概要を見る

本論文では，スマートフォンやタブレット等で広く用いられる Android において，従来マルチコアプロセッサ上での並列化が困難で，その高速化が望まれていた 2D 描画ライブラリ Skia を，OSCAR 自動並列化コンパイラにより，プロファイラ情報に基づいた自動並列化を行う手法を開発したのでその方法を説明する．OSCAR コンパイラは Parallelizable C により記述された逐次プログラムから様々な粒度で並列化解析を行い，自動的に並列化 C ソースを出力する．しかし，Skia は Android 内のライブラリであり，利用する描画命令ルーチンにより制御フローが大きく変化するため，最適な並列化解析を行うことが困難である．そこで，本論文では Skia のような制御フローがコンパイル時に特定できないプログラムに対し，Oprofile を用いて取得したプロファイル結果を OSCAR コンパイラにフィードバックすることで，並列化対象を特定の領域に絞り，高い性能向上が得られる手法を提案する．なお，並列化対象領域が Parallelizable C コードでない場合でも，解析結果により実行コストが大きい部分から Parallelizable C に変更し，チューニングを施すことで並列化が可能となる．本手法を，描画ベンチマークとして広く使われている 0xbench を NVIDIA Tegra3 チップ（ARM Cortex-A9 4 コア）を搭載した Nexus7 上で評価を行った．並列化 Skia の実行においては，並列化部分の速度向上を正確に評価するため， Android を core0 に割り当て，残り 3 コアを Skia が利用できる形とした．評価の結果として，DrawRect で従来の 1.91 倍である 43.57 [fps]，DrawArc で 1.32 倍の 50.98[fps]，DrawCircle2 では 1.5 倍の 50.77[fps] といずれも性能向上結果が得られた．

CiNii J-GLOBAL
重複部分木情報を利用した事前圧縮を特徴とするSerDeの開発と評価

中山誠, 山崎憲一, 田中聡(NTTドコモ, 笠原博徳

電子情報通信学会論文誌. D, 情報・システム Vol. J96-D(10) ( Vol. J96-D(10) ) 2089 - 2100 2013年10月 [査読有り]

　概要を見る

ビッグデータを扱うシステムでは,ストレージ資源の節約やI/O負荷の低減のために,Serializer/Deserializer(以下,"SerDe")が利用される.従来のSerDeは,木構造データをバイト配列へ直列化し,更に既存圧縮技術を適用してデータサイズを縮小する.しかし既存圧縮技術では,大きな部分木単位で重複がある場合や重複した部分木どうしが離れている場合に,その冗長性を十分に利用した圧縮を行えない.そこで我々は,部分木どうしの等値性や重複した部分木の出現回数などの情報を利用した事前圧縮を行うSerDeを開発した.重複した部分木を含む木構造データを扱う場合,従来のSerDeと既存圧縮技術の組合せよりも性能上の優位性を示すことを,その評価結果とともに述べる.

CiNii
OSCAR API標準解釈系を用いた階層グルーピング対応ハードウェアバリア同期機構の評価

川島慧大, 金羽木洋平, 林明宏, 木村啓二, 笠原博徳

情報処理学会 2013年並列／分散／協調処理に関する『北九州』サマー・ワークショップ（SWoPP北九州2013） Vol.2013-ARC-206 No.16 2013 ( ARC-206 ) 2013年08月

担当区分：最終著者

J-GLOBAL
Androidベースマルチコア上での自動電力制御

平野智大, 武藤康平, 後藤隆志, 見神広紀, 山本英雄, 木村啓二, 笠原博徳

情報処理学会 2013年並列／分散／協調処理に関する『北九州』サマー・ワークショップ（SWoPP北九州2013） Vol.2013-ARC-206 No.23 2013 ( ARC-206 ) 2013年08月

担当区分：最終著者

J-GLOBAL
Automatic Parallelization of Hand Written Automotive Engine Control Codes Using OSCAR Compiler

Dan Umeda, Yohei Kanehagi, Hiroki Mikami, Akihiro Hayashi, Keiji Kimura, Hironori Kasahara

17th Workshop on Compilers for Parallel Computing (CPC2013), Lyon, France 2013年07月 [査読有り]

担当区分：最終著者
OSCAR API v2.1: Extensions for an Advanced Accelerator Control Scheme to a Low-Power Multicore API

Keiji Kimura, Cecilia Gonzáles-Álvarez, Akihiro Hayashi, Hiroki Mikami, Mamoru Shimaoka, Jun Shirako, Hironori Kasahara

17th Workshop on Compilers for Parallel Computing (CPC2013), Lyon, France 2013年07月 [査読有り]

担当区分：最終著者
マルチコア商用スマートディバイスの評価と並列化の試み

山本英雄, 後藤隆志, 平野智大, 武藤康平, 見神広紀, Hillenbrand Dominic, 林明宏, 木村啓二, 笠原博徳

情報処理学会第124回OS研究発表会, Vol. 2013-OS-124 No. 000310 2012 ( 6 ) 2013年02月

担当区分：最終著者

J-GLOBAL
Preface

Kasahara, H., Kimura, K.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 7760 LNCS 2013年
Languages and Compilers for Parallel Computing, 25th International Workshop, LCPC 2012, Tokyo, Japan, September 11-13, 2012, Revised Selected Papers

Hironori Kasahara, Keiji Kimura

LCPC 7760 2013年 [査読有り]

担当区分：最終著者

DOI
Evaluation of power consumption at execution of multiple automatically parallelized and power controlled media applications on the RP2 low-power multicore

Mikami, H., Kitaki, S., Mase, M., Hayashi, A., Shimaoka, M., Kimura, K., Edahiro, M., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 7146 LNCS 31 - 45 2013年 [査読有り]

担当区分：最終著者

DOI

Scopus

1

被引用数

(Scopus)
自動車エンジン制御ソフトウェアにおけるマルチコア上での並列処理

金羽木洋平, 梅田弾, 見神広紀, 林明宏, 沢田光男, トヨ, 木村啓二, 笠原博徳

情報処理学会第195回計算機アーキテクチャ研究発表会, Vol.2013-ARC-203 No.2 2013年01月

担当区分：最終著者
並列化アプリケーションを対象とした統計的手法によるメニーコアアーキテクチャシミュレーションの高速化

阿部洋一, 田口学豊, 木村啓二, 笠原博徳

情報処理学会第195回計算機アーキテクチャ研究発表会, Vol.2012-ARC-203 N0.13 2013年01月

担当区分：最終著者
コンパイラと協調したシミュレーション精度切り換え可能なマルチコアアーキテクチャシミュレータ

田口学豊, 阿部洋一, 木村啓二, 笠原博徳

情報処理学会第195回計算機アーキテクチャ研究発表会, Vol.2012-ARC-203 N0.14 112 ( 425(ICD2012 123-126) ) 2013年01月

担当区分：最終著者

J-GLOBAL
Automatic Design Exploration Framework for Multicores with Reconfigurable Accelerators

Cecilia Gonzalez-Alvarez, Haruku Ishikawa, Akihiro Hayashi, Daniel Jimenez-Gonzalez, Carlos Alvarez, Keiji Kimura, Hironori Kasahara

7th Workshop on Reconfigurable Computing (WRC) 2013, held in conjuction with HiPEAC conference 2013, Berlin 2013年01月 [査読有り]

担当区分：最終著者
Automatic Parallelization, Performance Predictability and Power Control for Mobile-Applications

Dominic Hillenbrand, Akihiro Hayashi, Hideo Yamamoto, Keiji Kimura, Hironori Kasahara

2013 IEEE COOL CHIPS XVI (COOL CHIPS) 1 - 3 2013年 [査読有り]

担当区分：最終著者

DOI

Scopus

1

被引用数

(Scopus)
Parallelization of Automotive Engine Control Software On Embedded Multi-core Processor Using OSCAR Compiler

Yohei Kanehagi, Dan Umeda, Akihiro Hayashi, Keiji Kimura, Hironori Kasahara

2013 IEEE COOL CHIPS XVI (COOL CHIPS) 1 - 3 2013年 [査読有り]

担当区分：最終著者

DOI

Scopus

6

被引用数

(Scopus)
Reconciling Application Power Control and Operating Systems for Optimal Power and Performance

Dominic Hillenbrand, Yuuki Furuyama, Akihiro Hayashi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

2013 8TH INTERNATIONAL WORKSHOP ON RECONFIGURABLE AND COMMUNICATION-CENTRIC SYSTEMS-ON-CHIP (RECOSOC) 1 - 8 2013年 [査読有り]

担当区分：最終著者

DOI

Scopus

4

被引用数

(Scopus)
Dynamic Profiling and Feedback Framework for Reduce-side Join

Makoto Nakayama, Kenichi Yamazaki, Satoshi Tanaka, Hironori Kasahara

2013 IEEE 16TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL SCIENCE AND ENGINEERING (CSE 2013) 1255 - 1262 2013年 [査読有り]

DOI

Scopus
Automatic parallelization with OSCAR API Analyzer: a cross-platform performance evaluation

Gonzalez-Alvarez Cecilia, 金羽木洋平, 竹本昂生, 岸本耀平, 武藤康平, 見神広紀, 林明宏, 木村啓二, 笠原博徳

情報処理学会第194回計算機アーキテクチャ・第137回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-20））, Vol.2012-ARC-202HPC137 No.10 2012 ( 10 ) 1 - 8 2012年12月

担当区分：最終著者

　概要を見る

To satisfy the demands of auto parallelizing compilers in the diverse industry of multicores, we have developed the OSCAR API Analyzer. It allows programs automatically parallelized by the OSCAR compiler with OSCAR API directives to target many different platforms using just sequential compilers. We have evaluated the execution performance of the parallelization of Fortran SPEC benchmarks (tomcatv, swim2000, mgrid2000) and media C benchmarks (AAC encoder, Optical flow, MPEG2 encoder, MPEG2 decoder, Face detect) on five HPC servers and four embedded multicores. Speedups on servers were up to 18x for 32 cores (swim2000 on Hitachi SR16000), whereas on embedded systems, AAC encoder speedup was up to 47x on TilePro64, for 64 homogeneous cores, and up to 32.65x for the optical flow on the heterogeneous multicore RP-X, using 8 cores and 4 accelerators.To satisfy the demands of auto parallelizing compilers in the diverse industry of multicores, we have developed the OSCAR API Analyzer. It allows programs automatically parallelized by the OSCAR compiler with OSCAR API directives to target many different platforms using just sequential compilers. We have evaluated the execution performance of the parallelization of Fortran SPEC benchmarks (tomcatv, swim2000, mgrid2000) and media C benchmarks (AAC encoder, Optical flow, MPEG2 encoder, MPEG2 decoder, Face detect) on five HPC servers and four embedded multicores. Speedups on servers were up to 18x for 32 cores (swim2000 on Hitachi SR16000), whereas on embedded systems, AAC encoder speedup was up to 47x on TilePro64, for 64 homogeneous cores, and up to 32.65x for the optical flow on the heterogeneous multicore RP-X, using 8 cores and 4 accelerators.

CiNii
地震動シミュレータGMSのOSCARコンパイラによる自動並列化

島岡護, 見神広紀, 林明宏, 和田康孝, 木村啓二, 森田秀和, 内山邦男, 笠原博徳

情報処理学会第194回計算機アーキテクチャ・第137回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-20））, Vol.2012-ARC-202HPC137 No.11 2012年12月

担当区分：最終著者
Opportunities and Challenges of Application-Power Control in the Age of Dark Silicon

Dominic Hillenbrand, Yuuki Furuyama, Akihiro Hayashi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

情報処理学会第194回計算機アーキテクチャ・第137回ハイパフォーマンスコンピューティング合同研究発表会（HOKKE-20））, Vol.2012-ARC-202HPC137 No.26 2012年12月

担当区分：最終著者
エンジン基本制御ソフトウェアモデルのマルチコア上での並列処理

梅田弾, 金羽木洋平, 見神広紀, 林明宏谷充, デンソー, 森裕司, デンソー, 木村啓二, 笠原博徳

情報処理学会第193回計算機アーキテクチャ研究会 (SWoPP2012) Vol.2012-ARC-201 No.22 2012 ( 3 ) 2012年08月

担当区分：最終著者

J-GLOBAL
低消費電力マルチコアRP-Xを用いた1ワットWebサービスの実現

古山祐樹, 島岡護, 見神広紀, 林明宏, 木村啓二, 笠原博徳

情報処理学会第193回計算機アーキテクチャ研究会 (SWoPP2012) Vol.2012-ARC-201 No.24 2012 ( 3 ) 2012年08月

担当区分：最終著者

J-GLOBAL
グリーンコンピューティングのための低消費電力マルチコア技術

笠原博徳

特技懇誌特許庁 265 31 - 42 2012年05月 [査読有り]
Javaの自動並列化における例外フローのインライニング解析とメソッドディスパッチの高速化

田端啓一, 木村啓二, 笠原博徳

情報処理学会第191回計算機アーキテクチャ研究会, Vol. 2012-ARC-199, No. 9 2012年03月

担当区分：最終著者
並列化メディアアプリケーションを対象としたメニーコアアーキテクチャシミュレーションの高速化の検討

阿部洋一, 石塚亮, 大胡亮太, 田口学豊, 木村啓二, 笠原博徳

情報処理学会第191回計算機アーキテクチャ研究会, Vol. 2012-ARC-199, No. 3 2011 ( 6 ) 2012年03月

担当区分：最終著者

J-GLOBAL
Heterogeneous multicore processor technologies for embedded systems

Uchiyama, K., Arakawa, F., Kasahara, H., Nojiri, T., Noda, H., Tawara, Y., Idehara, A., Iwata, K., Shikano, H.

Heterogeneous Multicore Processor Technologies for Embedded Systems 9781461402848 2012年

DOI

Scopus

5

被引用数

(Scopus)
OSCAR Parallelizing Compiler and API for Real-time Low Power Heterogeneous Multicores

Akihiro Hayashi, Mamoru Shimaoka, Hiroki Mikami, Masayoshi Mase, Yasutaka Wada, Jun Shirako, Keiji Kimura, Hironori Kasahara

16th Workshop on Compilers for Parallel Computing(CPC2012), Padova, Italy 5 ( 1 ) 68 - 79 2012年01月 [査読有り]

担当区分：最終著者

　概要を見る

汎用CPUコアに加え特定処理を高効率で実行可能なアクセラレータを搭載したヘテロジニアスマルチコアが広く普及している．しかしながら，ヘテロジニアスマルチコアでは様々な計算資源へのタスクスケジューリングやデータ転送コード挿入等多くをプログラマが記述する必要があるためプログラミングが困難である．そこで本論文では，逐次プログラムを入力とし自動並列化コンパイラを用いることで自動的に汎用コアとアクセラレータコアにタスクを配分し，高い性能および低消費電力を実現可能なソフトウェア開発フレームワークを提案する．本手法はアクセラレータコンパイラやアクセラレータライブラリ等既存のアクセラレータ開発環境を有効に利用可能である．本フレームワークを情報家電用ヘテロジニアスマルチコアプロセッサRP-Xをターゲットとして，アクセラレータライブラリを使用し，AACエンコーダおよびOptical Flow計算の自動並列化性能および消費電力を評価した．その結果，8つの汎用CPUコアおよび4つのアクセラレータコアを使用した場合，逐次実行時と比較してOptical Flow計算で最大32倍，AACエンコーダで最大80%の電力を削減可能であることを確認し，ヘテロジニアスマルチコアを対象とした汎用的なコンパイラフレームワークを実現した．There has been a growing interest in heterogeneous multicores because heterogeneous multicores achieve high performance keeping power consumption low. However, heterogeneous multicores force programmers very difficult programming. In order to overcome such a situation, this paper proposes a compilation framework which realizes high performance and low power. This paper also evaluates processing performance and the power reduction by the proposed framework on RP-X processor. The framework attains speedups up to 32x for an optical flow program with eight general purpose processor cores and four DRP (Dynamically Reconfigurable Processor) accelerator cores against sequential execution by a single processor core and 80% of power reduction for the real-time AAC encoding when we utilize an existing accelerator library.

CiNii
Enhancing the Performance of a Multiplayer Game by Using a Parallelizing Compiler

Yasir I. M. Al-Dosary, Keiji Kimura, Hironori Kasahara, Seinosuke Narita

2012 17TH INTERNATIONAL CONFERENCE ON COMPUTER GAMES (CGAMES) 67 - 75 2012年 [査読有り]

DOI

Scopus
Enhancing the Performance of a Multiplayer Game by Using a Parallelizing Compiler.

Yasir I. M. Al-Dosary, Keiji Kimura, Hironori Kasahara, Seinosuke Narita

International Journal of Intelligent Games & Simulation 7 ( 1 ) 14 - 23 2012年
SMPサーバー上での粒子線がん治療用線量計算エンジンの自動並列化

林明宏, 松本卓司, 見神広紀, 木村啓二, 山本啓二, 崎浩典, 高谷保行, 笠原博徳

情報処理学会研究報告 Vol.2011-ARC189HPC132-2 2011 ( 4 ) 2011年11月

J-GLOBAL
ヘテロジニアスマルチコア向けソフトウェア開発フレームワーク及びAPI

林明宏, 和田康孝, 渡辺岳志, 関口威, 間瀬正啓, 白子準, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム(ACS36) 5 ( 2 ) 68 - 79 2011年11月 [査読有り]

J-GLOBAL
科学技術計算プログラムの構造を利用したメニーコアアーキテクチャシミュレーション高速化手法の評価

石塚亮, 阿部洋一, 大胡亮太, 木村啓二, 笠原博徳

情報処理学会研究報告 Vol.2011-ARC-196-14 2011年07月
SPECベンチマークプログラムのCUDAによる並列化の検討

平勇樹, 木村啓二, 笠原博徳

情報処理学会研究報告 Vol.2011-HPC-130-16 2011年07月
メディアアプリケーションにおけるコンパイラによるI/Oオーバーヘッド隠蔽手法

林明宏, 関口威, 間瀬正啓, 和田康孝, 木村啓二, 笠原博徳

情報処理学会研究報告Vol.2011-ARC-195OS117-14 2011 ( 14 ) 1 - 7 2011年04月

　概要を見る

本稿では，相対的に増大するI/Oオーバーヘッドの削減を目指して，連続したファイル入出力を伴うストリーミングデータを扱うメディア処理アプリケーションを対象としたI/Oオーバーヘッド隠蔽手法を提案する．本手法ではI/O処理を並列化コンパイラが生成する通常の粗粒度タスクの1つとして扱い，粗粒度タスク間並列性解析，タスクスケジューリングを行うことでI/Oタスクと演算タスクの並列化を実現する．AACエンコードプログラムを用いて情報家電用マルチコアRP-X及びXeonサーバ上でその性能を評価した結果，提案手法は最大48%の速度向上を実現可能であることが分かった．In this paper, we propose a novel method which hides I/O overheads in multimedia applications. We propose a compilation technique which realize a I/O task definition, a data dependency analysis among coarse-grain tasks and coarse-grain task scheduling in order to hide I/O overheads for multimedia applications. This paper evaluates processing performance by the proposed methods on RP-X processor and Xeon server. As a result, the proposed method attains speedups to 1.5x for AAC encoding program with 4 SH-4A processors compared with conventional method.

CiNii
A 45-nm 37.3 GOPS/W Heterogeneous Multi-Core SOC with 16/32 Bit Instruction-Set General-Purpose Core

Hironori Kasahara

IEICE Transactions on Electronics 94-C ( 4 ) 663 - 669 2011年04月 [査読有り] [国内誌]

DOI

Scopus
低消費電力マルチコアRP2上での複数メディアアプリケーション実行時の消費電力評価

見神広紀, 北基俊平, 佐藤崇文, 間瀬正啓, 木村啓二, 石坂一久, 酒井淳嗣, 枝廣正人, 笠原博徳

情報処理学会研究報告Vol.2011-ARC-194-1 2010 ( 6 ) 2011年03月

J-GLOBAL
A parallelizing compiler cooperative heterogeneous multicore processor architecture

Wada, Y., Hayashi, A., Masuura, T., Shirako, J., Nakano, H., Shikano, H., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 6760 LNCS 215 - 233 2011年 [査読有り]

DOI

Scopus

1

被引用数

(Scopus)
Parallelizing compiler framework and API for power reduction and software productivity of real-time heterogeneous multicores

Hayashi, A., Wada, Y., Watanabe, T., Sekiguchi, T., Mase, M., Shirako, J., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 6548 LNCS 184 - 198 2011年 [査読有り]

DOI

Scopus

10

被引用数

(Scopus)
OSCAR API標準解釈系を用いたParallelizable Cプログラムの評価

佐藤卓也, 見神広紀, 林明宏, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究報告Vol.2010-ARC-191-2 2010 ( 2 ) 1 - 6 2010年10月

　概要を見る

本稿では種々の組み込みプロセッサ上で OSCAR (Optimally Scheduled AdvancedMultiprocessor) コンパイラが並列化した C あるいは Fortran プログラムを動作させることを可能とする OSCAR API を各マルチコア用のライブラリコールに変換する OSCAR API 標準解釈系を提案する．この OSCAR API 標準解釈系を用いることにより，OSCAR コンパイラが出力したプログラムは各コア用のライブラリコール入り C あるいは Fortran プログラムになり対象マルチコア内のシングルコア用コンパイラを用いて簡単にバイナリを生成し，各マルチコア上で DMA や電力制御機能を含めて実行することができる．この OSCAR API 標準解釈系を用いて OSCAR コンパイラにより並列化された Parallelizable C プログラムの評価を行った．その結果，逐次実行時と比較して，2 コア集積のマルチコアである IBM Power5+ を 4 基搭載した 8 コア SMPサーバである IBM p5 550Q において平均 5.61 倍，4 コア集積のマルチコアである Intel Xeon 5506 プロセッサを 2 基搭載した 8 コア SMP サーバにおいて平均 4.43 倍，SH-4A コアベースの情報家電用マルチコア RP2 の 4 コアを使用した SMP 実行モードにおいて平均 3.34 倍の性能向上が得られた．This paper proposes OSCAR(Optimally Scheduled Advanced Multiprocessor) API Standard Translator. OSCAR API has been developped as an interface between OSCAR compiler, which can parallelize C and Fortran programs, and various embedded multi cores. The OSCAR API Standard Translator translates a parallelized C or Fortran program by OSCAR compiler into a program having runtime library calls for DMA transfer, power control and so on for a target multicore. The parallel processing performance for Parallelizable C programs, which are automatically parallelized by OSCAR compiler, are evaluated on there multicore systems. The evaluation results show that, compared with sequential execution, 5.61 times speedup is achieved on a 8 cores server IBM p5 550Q with 4 dual-core Power5+ processors on average, 4.43 times speedup on a 4 cores server with 2 quad-core Intel Xeon processors on average, and 3.34 times speedup on Renesas/Hitachi/Waseda RP2 with SH-4A cores in SMP execution mode using 4 cores on average, respectively.

CiNii
情報家電用ヘテロジニアスマルチコアRP-Xにおけるコンパイラ低消費電力制御性能

和田康孝, 林明宏, 渡辺岳志, 関口威, 間瀬正啓, 白子準, 木村啓二, 伊藤雅之, 長谷川淳, 佐藤真琴, 野尻徹, 内山邦男, 笠原博徳

情報処理学会研究報告Vol.2010-ARC-190-8(SWoPP2010) 2010 ( 3 ) 2010年08月

J-GLOBAL
情報家電用ヘテロジニアスマルチコア用自動並列化コンパイラフレームワーク

林明宏, 和田康孝, 渡辺岳志, 関口威, 間瀬正啓, 木村啓二, 伊藤雅之, 長谷川淳, 佐藤真琴, 野尻徹, 内山邦男, 笠原博徳

情報処理学会研究報告Vol.2010-ARC-190-7(SWoPP2010) 2010 ( 3 ) 2010年08月

J-GLOBAL
プログラム構造に着目したメニーコアアーキテクチャシミュレータの高速化手法

石塚亮, 大友俊也, 大胡亮太, 木村啓二, 笠原博徳

情報処理学会研究報告Vol.2010-ARC-190-20 2010 ( 3 ) 2010年07月

J-GLOBAL
Parallelizable C and Its Performance on Low Power High Performance Multicore Processors

Masayoshi Mase, Yuto Onozaki, Keiji Kimura, Hironori Kasahara

15th Workshop on Compilers for Parallel Computing 2010 2010年07月 [査読有り]
並列化コンパイラによるソフトウェアコヒーレンシ制御

間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究報告 Vol.2010-ARC-189-7 2010 ( 7 ) 1 - 10 2010年04月

　概要を見る

近年，あらゆる情報機器において処理性能の向上および低消費電力化のため，マルチコアの採用が進んでおり，今後チップ上に集積されるコア数はさらに増え，メニーコア時代が訪れると考えられている．しかしながら，64，128 コア以上のメニーコアプロセッサにおけるコヒーレントキャッシュハードウェアは回路規模的にも消費電力的にも実装コストが大きくなりすぎるため，実用化が困難と考えられている．本稿では，キャッシュコヒーレンシ制御機構を持たない共有メモリ型のマルチプロセッサシステムにおいても，並列化コンパイラによりコヒーレントキャッシュと同等な処理を可能とする，ソフトウェアコヒーレンシ制御手法を提案する．本手法を OSCAR 自動並列化コンパイラに実装し，4 コアまではハードウェアコヒーレント機構を持つが，5 コア以上はノンコヒーレント共有メモリ動作となる，8 コア構成の情報家電用マルチコア RP2 において評価を行ったところ，4 アプリケーションプログラムにおいて 4 コアまででノンコヒーレントキャッシュモードでもコヒーレントキャッシュモードと同等以上の性能が得られ，さらに 8 コア使用時にも 1 コア使用時と比較して平均 4.88 倍の速度向上が自動で得られた．As multicore processor becomes widely used in various computer systems, the number of cores integrated in a chip is increasing for improved performance and reduced power consumption toward manycore era. However, cache coherency hardware in manycore processors which integrates over 64 or 128 cores is hard to implement both for circuit area and energy cost. This paper proposes a parallelizing compiler directed software coherence for shared memory multiprocessor systems without hardware cache coherence mechanism that enables as same parallelization as on hardware coherent cache. We implemented the proposed method in OSCAR automatic parallelizing compiler and evaluated on RP2, a multicore for consumer electronics integrating 8 cores, that can support hardware coherent cache mode under 4 cores and non-coherent shared memory multiprocessor mode over 4 cores. The evaluation results shows that automatic parallelization with the proposed software coherence mechanism achieves as much or even better performance than hardware coherence under 4 cores. Also, the software coherence gives us 4.88x speedup for 8 cores in average on 4 application programs against sequential execution.

CiNii
組込み向けマルチコア上での複数アプリケーション動作時の自動並列化されたアプリケーションの処理性能

宮本孝道, 間瀬正啓, 木村啓二, 石坂一久, 酒井淳嗣, 枝廣正人, 笠原博徳

情報処理学会研究報告 2010-ARC-188 ( 9 ) 2010年03月

CiNii
A 45nm 37.3GOPS/W heterogeneous multi-core SoC

Yoichi Yuyama, Masayuki Ito, Yoshikazu Kiyoshige, Yusuke Nitta, Shigezumi Matsui, Osamu Nishii, Atsushi Hasegawa, Makoto Ishikawa, Tetsuya Yamada, Junichi Miyakoshi, Koichi Terada, Tohru Nojiri, Makoto Satoh, Hiroyuki Mizuno, Kunio Uchiyama, Yasutaka Wada, Keiji Kimura, Hironori Kasahara, Hideo Maejima

Digest of Technical Papers - IEEE International Solid-State Circuits Conference 53 100 - 101 2010年

DOI

Scopus

33

被引用数

(Scopus)
H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理

見神広紀, 宮本孝道, 木村啓二, 笠原博徳

情報処理学会研究報告Vol.2010-ARC-187 No.22 Vol.2010-EMB-15 No.22 2010 ( 22 ) 1 - 6 2010年01月

　概要を見る

本稿ではビデオコーデックである H.264/AVC エンコーダの高速化手法としてフレームおよびマクロブロックでの階層的な並列処理を提案する．H.264/AVC エンコーダの一実装である x264 上にマクロブロックでの並列処理機能を実装し，64 コアのマルチコアシステム上での処理性能の評価を行った．その結果，2 コア集積のマルチコアである Intel Itanium2 (Montvale) を 32 基搭載した 64 コア構成の ccNUMA サーバである SGI Altix450 において，フレームでの並列処理のみの場合が 6.3 倍であったのに対しフレームおよびマクロブロックの 2 階層で行った場合は 10.6 倍の性能向上が得られた．This paper proposes hierarchical parallel processing method of H.264/AVC encoder. Data structures and data dependencies are analyzed to exploit multi-level parallelization as frame-level and macroblock-level. We implemented macroblock-level parallel processing on the x264, an open source H.264/AVC encoder. As a result, on SGI Altix450 (Intel Itanium2 (Montvale), 64 cores ccNUMA server), speed up is saturated by using 8 cores when execute encoder in only frame-level parallelization. However, scalable speedup is attained when execute encoder in frame and macroblock multi-level parallelization.

CiNii
OSCAR API for real-time low-power multicores and its performance on multicores and SMP servers

Kimura, K., Mase, M., Mikami, H., Miyamoto, T., Shirako, J., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 5898 LNCS 188 - 202 2010年 [査読有り]

DOI

Scopus

23

被引用数

(Scopus)
最先端低消費電力コンピュータ（マルチコア・メニーコア）のハードウェアとソフトウェアの研究開発

笠原博徳

早稲田電気工学会（ＥＷＥ）会報 ( 51 ) 2009年11月

担当区分：筆頭著者
自動並列化のためのElement-Sensitiveポインタ解析

間瀬正啓, 村田雄太, 木村啓二, 笠原博徳

情報処理学会第76回プログラミング研究会, 石垣島 2009年10月
Roles of Parallelizing Compilers for Low Power Manycores”, Panel: "What do compiler optimizations mean for many-cores?"

Hironori Kasahara

The 22nd International Workshop on Languages and Compilers for Parallel Computing (LCPC09) 2009年10月 [査読有り]
太陽電池で駆動できる低消費電力マルチコアプロセッサとソフトウェア

笠原博徳

Waseda University DCC Industry and Academia Cooperation Forum 2009年09月 [査読有り]
マルチコアにおけるParallelizable Cプログラムの自動並列化

間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究会報告2009-ARC-174-15(SWoPP2009) 2009 ( 3 ) 2009年08月

CiNii J-GLOBAL
Compiler Technology and API for Multi-Core

Hironori Kasahara, Jun Shirako

The IEEE Computer Society 2009 Vail Computer Elements Workshop 2009年06月 [査読有り]
Parallelizing Compiler and API for Low Power Multicores

Hironori Kasahara

LSI and Systems Workshop 2009 2009年05月 [査読有り]
低消費電力マルチコアのための並列化コンパイラ及びAPI

笠原博徳

LSIとシステムのワークショップ2009「エネルギーと環境のためのLSIとシステム」 2009年05月 [査読有り]
マルチコア上でのOSCAR APIを用いた並列化コンパイラによる低消費電力化手法

中川亮, 間瀬正啓, 白子準, 木村啓二, 笠原博徳

SACSIS2009 - 先進的計算基盤システムシンポジウム 2009年05月 [査読有り]
A Power Reduction Scheme for Parallelizing Compiler Using OSCAR API on Multicore Processors

Ryo Nakagawa, Masayoshi Mase, Jun Shirako, Keiji Kimura, Hironori Kasahara

Symposium on Advanced Computing Systems and Infrastructures (SACSIS 2009) 2009 ( 1 ) 2009年05月 [査読有り]

J-GLOBAL
組み込みマルチコアが開く新市場とそれを支える並列コンパイラ技術の最前線

笠原博徳

組み込みプロセッサ＆プラットホーム・ワークショップ2009 2009年04月 [査読有り]
New Markets Opened by Embedded Multicores and Forefront of Parallelizing Compiler Technology

Hironori Kasahara

Embedded Processor and Platform Workshop 2009 2009年04月 [査読有り]
OSCAR Parallelizing Compiler and API for Low Power High Performance Multicores

Hironori Kasahara

The 11th International Specialist Meeting on The Next generation Models on Climate Change and Sustainability for Adavanced High-performance Computing Facilities (Climate Meeting 2009) 2009年03月 [査読有り]
低消費電力マルチコアプロセッサとソフトウェア技術

笠原博徳

早稲田大学技術説明会 2009年03月 [査読有り]
Low Power Multicores Processor and Software Technologies

Hironori Kasahara

Waseda University Technical Presentation Meeting 2009年03月 [査読有り]
並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価

島岡護, 今泉和浩, 鷹野芙美代, 木村啓二, 笠原博徳

第119回ハイパフォーマンスコンピューティング研究会 2009 ( 14 ) 127 - 132 2009年02月

　概要を見る

本稿では強 NP 困難な組み合わせ最適化問題である実行時間最小マルチプロセッサスケジューリング問題のための標準タスクグラフセット STG Ver3 を提案するとともに，それを用いたアルゴリズムの性能評価について述べる． STG Ver2 はタスク実行時間生成乱数，先行制約形状生成乱数により生成されたタスクグラフセットである． STG Ver3 は STG Ver2 にタスクの並列度，タスク実行時間の偏差に考慮を加えることにより生成した "並列度セット" ， "正規化偏差セット" により構成される．評価の結果，最適化アルゴリズム DF/IHS (Depth First/ ImplicitHeuristic Search) では 87.25% ， PDF/IHS (Parallelized DF/IHS) では 92.25% の問題で 10 分以内に最適解を得られることを確認した．This paper proposes the "Standard Task Graph Set Ver3" (STG Ver3) to evaluate performance of heuristic and optimization algorithms for the minimum execution time multiprocessor scheduling problem. The minimum execution time multiprocessor scheduling problem is known as a strong NP-hard combinational optimization problem to the public. The STG Ver2 was created by random task execution times and random predecessors. In addition, the STG Ver3 considers parallelism of task graphs and deviation of task execution times to let us understand characteristics of algrithms. This paper describes evaluation results by applying the STG Ver3 to several algorithms. Performance evaluation show that DF/IHS can give us optimal solutions for 87.25%, and PDF/IHS 92.25% within 600 seconds.

CiNii
Parallel and Concurrent Search for Fast AND/OR Tree Search on Multicore Processors

Fumiyo Takano, Yoshitaka Maekawa, Hironori Kasahara

Proc. of the IASTED International Conference on Parallel and Distributed Computing and Networks (PDCN 2009) 2009年02月 [査読有り]
組込マルチコア用並列化コンパイラとAPIについて

笠原博徳

トロン協会 2009年02月 [査読有り]
Parallelizing Compiler and API for Embedded Multi-cores

Hironori Kasahara

TRON Association 2009年02月 [査読有り]
並列度・タスク実行時間の偏りを考慮した標準タスクグラフセットSTG Ver3を用いたスケジューリングアルゴリズムの評価

島岡護, 今泉和浩, 鷹野芙美代, 木村啓二, 笠原博徳

第119回ハイパフォーマンスコンピューティング研究会 2009 ( 14 ) 127 - 132 2009年02月 [査読有り]

　概要を見る

本稿では強 NP 困難な組み合わせ最適化問題である実行時間最小マルチプロセッサスケジューリング問題のための標準タスクグラフセット STG Ver3 を提案するとともに，それを用いたアルゴリズムの性能評価について述べる． STG Ver2 はタスク実行時間生成乱数，先行制約形状生成乱数により生成されたタスクグラフセットである． STG Ver3 は STG Ver2 にタスクの並列度，タスク実行時間の偏差に考慮を加えることにより生成した "並列度セット" ， "正規化偏差セット" により構成される．評価の結果，最適化アルゴリズム DF/IHS (Depth First/ ImplicitHeuristic Search) では 87.25% ， PDF/IHS (Parallelized DF/IHS) では 92.25% の問題で 10 分以内に最適解を得られることを確認した．This paper proposes the "Standard Task Graph Set Ver3" (STG Ver3) to evaluate performance of heuristic and optimization algorithms for the minimum execution time multiprocessor scheduling problem. The minimum execution time multiprocessor scheduling problem is known as a strong NP-hard combinational optimization problem to the public. The STG Ver2 was created by random task execution times and random predecessors. In addition, the STG Ver3 considers parallelism of task graphs and deviation of task execution times to let us understand characteristics of algrithms. This paper describes evaluation results by applying the STG Ver3 to several algorithms. Performance evaluation show that DF/IHS can give us optimal solutions for 87.25%, and PDF/IHS 92.25% within 600 seconds.

CiNii
Performance Evaluation of Minimum Execution Time Multiprocessor Scheduling Algorithms Using Standard Task Graph Set Ver3 Consider Parallelism of Task Graphs and Deviation of Task Execution Time

Mamoru Shimaoka, Kazuhiro Imaizumi, Fumiyo Takano, Keiji Kimura, Hironori Kasahara

Technical Report of IEICE 2009 ( 14 ) 127 - 132 2009年02月 [査読有り]

　概要を見る

本稿では強 NP 困難な組み合わせ最適化問題である実行時間最小マルチプロセッサスケジューリング問題のための標準タスクグラフセット STG Ver3 を提案するとともに，それを用いたアルゴリズムの性能評価について述べる． STG Ver2 はタスク実行時間生成乱数，先行制約形状生成乱数により生成されたタスクグラフセットである． STG Ver3 は STG Ver2 にタスクの並列度，タスク実行時間の偏差に考慮を加えることにより生成した "並列度セット" ， "正規化偏差セット" により構成される．評価の結果，最適化アルゴリズム DF/IHS (Depth First/ ImplicitHeuristic Search) では 87.25% ， PDF/IHS (Parallelized DF/IHS) では 92.25% の問題で 10 分以内に最適解を得られることを確認した．This paper proposes the "Standard Task Graph Set Ver3" (STG Ver3) to evaluate performance of heuristic and optimization algorithms for the minimum execution time multiprocessor scheduling problem. The minimum execution time multiprocessor scheduling problem is known as a strong NP-hard combinational optimization problem to the public. The STG Ver2 was created by random task execution times and random predecessors. In addition, the STG Ver3 considers parallelism of task graphs and deviation of task execution times to let us understand characteristics of algrithms. This paper describes evaluation results by applying the STG Ver3 to several algorithms. Performance evaluation show that DF/IHS can give us optimal solutions for 87.25%, and PDF/IHS 92.25% within 600 seconds.

CiNii
Green Multicore-SoC Software-Execution Framework with Timely-Power-Gating Scheme.

Masafumi Onouchi, Keisuke Toyama 0003, Tohru Nojiri, Makoto Sato, Masayoshi Mase, Jun Shirako, Mikiko Sato, Masashi Takada, Masayuki Ito, Hiroyuki Mizuno, Mitaro Namiki, Keiji Kimura, Hironori Kasahara

ICPP 2009(ICPP) 510 - 517 2009年 [査読有り]

DOI

Scopus

1

被引用数

(Scopus)
マルチコア上でのOSCAR API を用いた低消費電力化手法

中川亮, 間瀬正啓, 白子準, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-145 2009 ( 1(ARC-181 EMB-11) ) 2009年01月

J-GLOBAL
マルチコアのためのコンパイラにおけるローカルメモリ管理手法

桃園拓, 中野啓史, 間瀬正啓, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-141 2009 ( 1(ARC-181 EMB-11) ) 2009年01月

J-GLOBAL
メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価

神山輝壮, 和田康孝, 林明宏, 間瀬正啓, 中野啓史, 渡辺岳志, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-140, (第173回計算機アーキテクチャ研究会, 大阪) 2009 ( 1 ) 63 - 68 2009年01月

　概要を見る

本稿では，汎用プロセッサコアに加え複数のアクセラレータを 1 チップ上に集積したヘテロジニアスマルチコアアーキテクチャと，それに協調する自動並列化コンパイラの性能について述べる．コンパイラによる並列性の抽出を考慮して記述されたマルチメディアアプリケーションを用いて，汎用 CPU コアを 2 基， FE-GA を想定したアクセラレータコアを 2 基搭載したヘテロジニアスマルチコアアーキテクチヤ構成で評価したところ，ＭP3 エンコーダでは 1 つの汎用 CPU コアに対して 9.82 倍， JPEG 2000 エンコーダでは 14.64 倍の速度向上率が得られた．This paper describes a heterogeneous multicore architecture having accelerator cores in addition to general purpose cores, an automatic parallelizing compiler that cooperatively works with the heterogeneous multicore, a heterogeneous multicore architecture simulation environment, and performance evaluation results with the simulation environment. For the performance evaluation, multimedia applications written in C or Fortran, considered with parallelization by the compiler, are used. As a result, the evaluated heterogeneous multicore having two general purpose cores and two accelerator cores achieves 9.82 times speedup from MP3 encoder. This architecture also achieves 14.64 times speedup from JPEG2000 encoder.

CiNii J-GLOBAL
Performance of OSCAR Multigrain Parallelizing Compiler on Multicore Processors

Hiroki Mikami, Jun Shirako, Masayoshi Mase, Takamichi Miyamoto, Hirofumi Nakano, Fumiyo Takano, Akihiro Hayashi, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

Proc. of 14th Workshop on Compilers for Parallel Computing(CPC 2009) 2009年01月 [査読有り]
マルチコア上でのOSCAR API を用いた低消費電力化手法

中川亮, 間瀬正啓, 白子準, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-145 2009年01月 [査読有り]
A Power Saving Scheme on Multicore Processors Using OSCAR API

Ryo Nakagawa, Masayoshi Mase, Jun Shirako, Keiji Kimura, Hironori Kasahara

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD2008/145) 2009年01月 [査読有り]
マルチコアのためのコンパイラにおけるローカルメモリ管理手法

桃園拓, 中野啓史, 間瀬正啓, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-141 2009年01月 [査読有り]
Local Memory Management Scheme by a Compiler for Multicore Processor

Taku Momozono, Hirofumi Nakano, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD2008/141) 2009年01月 [査読有り]
メディアアプリケーションを用いた並列化コンパイラ協調型ヘテロジニアスマルチコアアーキテクチャのシミュレーション評価

神山輝壮, 和田康孝, 林明宏, 間瀬正啓, 中野啓史, 渡辺岳志, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2008-140 108 ( 375 ) 63 - 68 2009年01月 [査読有り]

　概要を見る

本稿では,汎用プロセッサコアに加え複数のアクセラレータを1チップ上に集積したヘテロジニアスマルチコアアーキテクチャと,それに協調する自動並列化コンパイラの性能について述べる.コンパイラによる並列性の抽出を考慮して記述されたマルチメディアアプリケーションを用いて,汎用CPUコアを2基,FE-GAを想定したアクセラレータコアを2基搭載したヘテロジニアスマルチコアアーキテクチャ構成で評価したところ,MP3エンコーダでは1つの汎用CPUコアに対して9.82倍,JPEG2000エンコーダでは14.64倍の速度向上率が得られた.

CiNii
Performance Evaluation of Parallelizing Compiler Cooperated Heterogeneous Multicore Architecture Using Media Applications

Teruo Kamiyama, Yasutaka Wada, Akihiro Hayashi, Masayoshi Mase, Hirofumi Nakano, Takeshi Watanabe, Keiji Kimura, Hironori Kasahara

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD2008/140) 2009 ( 1 ) 63 - 68 2009年01月 [査読有り]

　概要を見る

本稿では，汎用プロセッサコアに加え複数のアクセラレータを 1 チップ上に集積したヘテロジニアスマルチコアアーキテクチャと，それに協調する自動並列化コンパイラの性能について述べる．コンパイラによる並列性の抽出を考慮して記述されたマルチメディアアプリケーションを用いて，汎用 CPU コアを 2 基， FE-GA を想定したアクセラレータコアを 2 基搭載したヘテロジニアスマルチコアアーキテクチヤ構成で評価したところ，ＭP3 エンコーダでは 1 つの汎用 CPU コアに対して 9.82 倍， JPEG 2000 エンコーダでは 14.64 倍の速度向上率が得られた．This paper describes a heterogeneous multicore architecture having accelerator cores in addition to general purpose cores, an automatic parallelizing compiler that cooperatively works with the heterogeneous multicore, a heterogeneous multicore architecture simulation environment, and performance evaluation results with the simulation environment. For the performance evaluation, multimedia applications written in C or Fortran, considered with parallelization by the compiler, are used. As a result, the evaluated heterogeneous multicore having two general purpose cores and two accelerator cores achieves 9.82 times speedup from MP3 encoder. This architecture also achieves 14.64 times speedup from JPEG2000 encoder.

CiNii
Multiple-Paths Search with Concurrent Thread Scheduling for Fast AND/OR Tree Search.

Fumiyo Takano, Yoshitaka Maekawa, Hironori Kasahara

2009 International Conference on Complex, Intelligent and Software Intensive Systems(CISIS) 51 - 58 2009年 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
情報家電用マルチコア並列化APIを生成する自動並列化コンパイラによる並列化の評価

宮本孝道, 浅香沙織, 見神広紀, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム 1 ( 3 ) 83 - 95 2008年12月 [査読有り]

　概要を見る

マルチコアプロセッサは携帯機器，カーナビ，デジタルTV，ゲーム機等の情報家電向けの組み込み分野において低消費電力で高性能を得るために利用され始めている．一方，これらのマルチコアを有効利用可能なOSCAR自動並列化コンパイラが開発されている．このOSCARコンパイラによる最適化を複数種類のマルチコアに適用するために，OSCARコンパイラと各マルチコア用ネイティブコンパイラを接続できる並列化APIをNEDO “リアルタイム情報家電用マルチコア技術”プロジェクトで新規に開発した．本論文では各社情報家電用マルチコア向けに新規開発したAPIを用いて，並列化コンパイラが情報家電用マルチコア向けに生成したコードを，VLIWコアを4基集積の富士通FR1000マルチコア，およびルネサステクノロジ，日立製作所，早稲田大学で共同開発したSH-4Aコアを4基集積のRP1マルチコア上で並列性能評価を行った．情報家電機器上での高速化が重要となるコーデック，グラフィックス等のマルチメディア処理を対象として，FR1000マルチコアでは4プロセッサ時に1プロセッサ時に比べ平均で3.28倍，RP1マルチコアでは4プロセッサ時に1プロセッサ時に比べ平均で3.31倍という並列処理性能が得られた．さらにFR1000マルチコアでは新規開発したAPIを用いることでOpenMP API準拠の並列処理APIのみを用いたコードと比較して最大1.74倍の速度向上が得られた．Multicore processors are adopted for embedded systems like portable electronics, car navigation systems, digital TVs and games to obtain high performance and low power. Furthermore, OSCAR automatic parallelizing compiler has been developed to utilize these multicores. We newly develop consumer electronics multicore API, with support by NEDO “Multicore-processor Technology for Real-Time Consumer Electronics project”, to connect OSCAR compiler with native compilers for various kinds of multicores to apply optimization by OSCAR compiler. This paper evaluates parallel processing performances of multimedia applications using this API by OSCAR compiler on FR1000 4 VLIW cores multicore processor developed by Fujitsu Ltd, and RP1 4 SH-4A cores multicore processor jointly-developed by Renesas Technology Corp., Hitachi Ltd. and Waseda University. As the results, the developed API gives us 3.28 times speedup in average using 4 cores against using 1 core on FR1000 multicore, and 3.31 times speedup in average using 4 cores against using 1 core on RP1 multicore. Furthermore, the developed API gives us maximum of 1.74 times speedup against using only parallelization API which is compliant with OpenMP API on FR1000 multicore.

CiNii
An Evaluation of Parallelization with Automatic Parallelizing Compiler Generating Consumer Electronics Multicore API

Takamichi Miyamoto, Saori Asaka, Hiroki Mikami, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

IPSJ Transactions on Advanced Computing Systems 1 ( 3 ) 83 - 95 2008年12月 [査読有り]

　概要を見る

マルチコアプロセッサは携帯機器，カーナビ，デジタルTV，ゲーム機等の情報家電向けの組み込み分野において低消費電力で高性能を得るために利用され始めている．一方，これらのマルチコアを有効利用可能なOSCAR自動並列化コンパイラが開発されている．このOSCARコンパイラによる最適化を複数種類のマルチコアに適用するために，OSCARコンパイラと各マルチコア用ネイティブコンパイラを接続できる並列化APIをNEDO “リアルタイム情報家電用マルチコア技術”プロジェクトで新規に開発した．本論文では各社情報家電用マルチコア向けに新規開発したAPIを用いて，並列化コンパイラが情報家電用マルチコア向けに生成したコードを，VLIWコアを4基集積の富士通FR1000マルチコア，およびルネサステクノロジ，日立製作所，早稲田大学で共同開発したSH-4Aコアを4基集積のRP1マルチコア上で並列性能評価を行った．情報家電機器上での高速化が重要となるコーデック，グラフィックス等のマルチメディア処理を対象として，FR1000マルチコアでは4プロセッサ時に1プロセッサ時に比べ平均で3.28倍，RP1マルチコアでは4プロセッサ時に1プロセッサ時に比べ平均で3.31倍という並列処理性能が得られた．さらにFR1000マルチコアでは新規開発したAPIを用いることでOpenMP API準拠の並列処理APIのみを用いたコードと比較して最大1.74倍の速度向上が得られた．Multicore processors are adopted for embedded systems like portable electronics, car navigation systems, digital TVs and games to obtain high performance and low power. Furthermore, OSCAR automatic parallelizing compiler has been developed to utilize these multicores. We newly develop consumer electronics multicore API, with support by NEDO “Multicore-processor Technology for Real-Time Consumer Electronics project”, to connect OSCAR compiler with native compilers for various kinds of multicores to apply optimization by OSCAR compiler. This paper evaluates parallel processing performances of multimedia applications using this API by OSCAR compiler on FR1000 4 VLIW cores multicore processor developed by Fujitsu Ltd, and RP1 4 SH-4A cores multicore processor jointly-developed by Renesas Technology Corp., Hitachi Ltd. and Waseda University. As the results, the developed API gives us 3.28 times speedup in average using 4 cores against using 1 core on FR1000 multicore, and 3.31 times speedup in average using 4 cores against using 1 core on RP1 multicore. Furthermore, the developed API gives us maximum of 1.74 times speedup against using only parallelization API which is compliant with OpenMP API on FR1000 multicore.

CiNii
Panel Discussions: Japanese Challenges for Multicore -Low Power High Performance Multicores,Compiler and API-

Hironori Kasahara

Intel Higher Education Program 2008 Asia Academic Forum 2008年10月 [査読有り]
低炭素社会実現のためのマルチコア・テクノロジーと利用技術への挑戦

笠原博徳

IBM HPCフォーラム 2008 2008年09月 [査読有り]
Multicore Technologies for Realization of Low-carbon Society and Challenge for Utilization Technologies

Hironori Kasahara

IBM HPC Forum 2008 2008年09月 [査読有り]
An Eight Core - Eight-RAM SoC Delivers 8.6GMIPS and 33.6GFLOPS at 600MHz (1/2)

Hironori Kasahara

Microprocessor Forum Japan 2008 2008年07月 [査読有り]
8.6GMIPS/33.6GFLOPSを実現する8コア/8RAM内蔵SoC (1/2)

笠原博徳

マイクロプロセッサ・フォーラム・ジャパン2008 2008年07月 [査読有り]
Low Power High Performance Multicores Technology

Hironori Kasahara

JAPAN ASSOCIATION for HEAT PIPE Seminar 2008年07月 [査読有り]
低消費電力・高性能マルチコア技術

笠原博徳

日本ヒートパイプ協会第27回総会・講演会 2008年07月 [査読有り]
Parallelizing Compiler Cooperative Heterogeneous Multicore

Yasutaka Wada, Akihiro Hayashi, Takeshi Masuura, Jun Shirako, Hirofumi Nakano, Hiroaki Shikano, Keiji Kimura, Hironori Kasahara

Proc. of Workshop on Software and Hardware Challenges of Manycore Platforms (SHCMP 2008) 2008年06月 [査読有り]
Parallelization of MP3 Encoder using Static Scheduling on a Heterogeneous Multicore

Yasutaka Wada, Akihiro Hayashi, Takeshi Masuura, Jun Shirako, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Trans. of IPSJ on Computing Systems 1 ( 1 ) 105 - 119 2008年06月 [査読有り]

　概要を見る

情報家電の市場拡大にともない，低消費電力でありながら高い性能を実現するプロセッサが求められるようになっている．この要求に対応するため，汎用プロセッサに加え，動的再構成可能プロセッサ（DRP）や信号処理用プロセッサ（DSP）等のアクセラレータを1チップ上に複数集積したヘテロジニアスマルチコアアーキテクチャが注目を集めている．このようなヘテロジニアスマルチコアにおいては，処理の特性やコア間のデータ転送を考慮して適切に各コアに処理を割り当てることが必要となる．本論文では，このようなヘテロジニアスマルチコア用の粗粒度タスクスタティックスケジューリング手法を提案する．本論文で提案するスタティックスケジューリング手法では，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，各タスクがどのコアで実行可能か等の特性，各コア間でのデータ転送オーバヘッドを考慮して処理時間を最小とするように汎用コアあるいはアクセラレータに割り当て，さらにコア間でのデータ転送をDMAを用いてタスク処理とオーバラップして行う．これによりプログラムの階層的な並列性とチップ上のアクセラレータを有効に利用し，処理の高速化を図ることができる．本手法を用い，世界初のヘテロジニアス並列化コンパイラを開発しMP3エンコーダに適用し評価した結果，SH4A 1コアのみを用いた場合に対して，SH4A 4コアで3.99倍，SH4A 2コアとDRP 2コアで14.55倍，SH4A 4コアとDRP 4コアを用いたときに25.20倍の性能向上を得られることが確認できた．Heterogeneous multicore architectures integrating various kind of accelerators like dynamically reconfigurable processors (DRPs) or digital signal processors (DSPs) in addition to general purpose processor cores have attracted much attention to realize high performance with low power consumption. These heterogeneous multicores require scheduling schemes considering characteristics of tasks on each core and data transfers on chips. This paper proposes a static scheduling scheme for coarse grain task parallel processing on a heterogeneous multicore processor with overlapping data transfer and task execution. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics on each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using an MP3 encoder. Heterogeneous configurations give us 14.55 times speedup with two SH4As and two DRPs and 25.20 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core.

CiNii
ヘテロジニアスマルチコア上でのスタティックスケジューリングを用いたMP3エンコーダの並列化

和田康孝, 林明宏, 益浦健, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム 1 ( 1 ) 105 - 119 2008年06月 [査読有り]

　概要を見る

情報家電の市場拡大にともない，低消費電力でありながら高い性能を実現するプロセッサが求められるようになっている．この要求に対応するため，汎用プロセッサに加え，動的再構成可能プロセッサ（DRP）や信号処理用プロセッサ（DSP）等のアクセラレータを1チップ上に複数集積したヘテロジニアスマルチコアアーキテクチャが注目を集めている．このようなヘテロジニアスマルチコアにおいては，処理の特性やコア間のデータ転送を考慮して適切に各コアに処理を割り当てることが必要となる．本論文では，このようなヘテロジニアスマルチコア用の粗粒度タスクスタティックスケジューリング手法を提案する．本論文で提案するスタティックスケジューリング手法では，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，各タスクがどのコアで実行可能か等の特性，各コア間でのデータ転送オーバヘッドを考慮して処理時間を最小とするように汎用コアあるいはアクセラレータに割り当て，さらにコア間でのデータ転送をDMAを用いてタスク処理とオーバラップして行う．これによりプログラムの階層的な並列性とチップ上のアクセラレータを有効に利用し，処理の高速化を図ることができる．本手法を用い，世界初のヘテロジニアス並列化コンパイラを開発しMP3エンコーダに適用し評価した結果，SH4A 1コアのみを用いた場合に対して，SH4A 4コアで3.99倍，SH4A 2コアとDRP 2コアで14.55倍，SH4A 4コアとDRP 4コアを用いたときに25.20倍の性能向上を得られることが確認できた．Heterogeneous multicore architectures integrating various kind of accelerators like dynamically reconfigurable processors (DRPs) or digital signal processors (DSPs) in addition to general purpose processor cores have attracted much attention to realize high performance with low power consumption. These heterogeneous multicores require scheduling schemes considering characteristics of tasks on each core and data transfers on chips. This paper proposes a static scheduling scheme for coarse grain task parallel processing on a heterogeneous multicore processor with overlapping data transfer and task execution. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics on each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using an MP3 encoder. Heterogeneous configurations give us 14.55 times speedup with two SH4As and two DRPs and 25.20 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core.

CiNii
OSCAR Low Power High Performance Multicore and Parallelizing Compiler

Hironori Kasahara

Nokia, Finland 2008年06月 [査読有り]
Compiler and API for Low Power High Performance Multicores

Hironori Kasahara

8th International Forum on Application-Specific Multi-Processor SoC (MpSoc '08) 2008年06月 [査読有り]
階層グルーピング対応バリア同期機構の評価

山田海斗, 間瀬正啓, 白子準, 木村啓二, 伊藤雅之, 服部俊洋, 水野弘之, 内山邦男, 笠原博徳

第170回計算機アーキテクチャ研究会 108 ( 28 ) 19 - 24 2008年05月

　概要を見る

マルチコアプロセッサに搭載されつつある多数のコアを効率よく利用するため,ループやサブルーチンの内部の並列性を階層的に解析しタスクの定義を行い,プログラム全域の並列性を利用する階層的粗粒度タスク並列処理が提案されOSCARコンパイラに実装されている.階層的粗粒度タスク並列処理では,複数のプロセッサをソフトウェアにより階層的にグルーピングし,これらのグルーピングされたプロセッサ群に対して階層的に定義された粗粒度タスクを割り当てる.この階層的粗粒度タスク並列処理を効率よくサポートする,軽量かつスケーラブルな階層グルーピング対応バリア同期機構を開発し,NEDOリアルタイム情報家電用マルチコアプロジェクトにより開発したSH4Aプロセッサ8コア搭載の情報家電用マルチコアRP2に実装した.本稿では,この階層グルーピング対応バリア同期機構を提案すると共にRP2上で評価を行った結果について述べる.8コアを使用したAACエンコーダによる評価の結果,ソフトウェアのみによるバリア同期に対し16%の性能向上を得ることができた.

CiNii
ポインタ解析を用いた制約付きCプログラムの自動並列化

間瀬正啓, 馬場大介, 長山晴美, 村田雄太, 木村啓二, 笠原博徳

第170回計算機アーキテクチャ研究会 108 ( 28 ) 69 - 74 2008年05月

　概要を見る

本稿では,自動並列化コンパイラにより並列性抽出が可能なC言語におけるポインタ利用方法の制約について述べる.実際にこの制約を満たすようにプログラムを作成し,flow-sensitive, context-sensitiveなポインタ解析を用いた自動並列化を適用したところ,8コアSMPサーバにおいて,逐次実行と比較してSPEC2000 artで3.80倍,SPEC2006 lbmで6.17倍,MediaBench mpeg2encで5.14倍の速度向上が得られた.

CiNii
OSCAR Multigrain Parallelizing Compiler for High Performance Low Power Multicores

Hironori Kasahara

The 14th Workshop on Compiler Techniques for High-Performance Computing(CTHPC2008) 2008年05月 [査読有り]
OSCAR Multigrain Parallelizing Compiler for High Performance Low Power Multicores

Hironori Kasahara

Industrial Technology Research Institute, Hosted by Dr. Cheng 2008年05月 [査読有り]
Embedded Multi-cores Advanced Parallelizing Compiler Technologies

Hironori Kasahara

11th Embedded Systems Expo 2008年05月 [査読有り]
組込みマルチコア最先端並列化コンパイラ技術

笠原博徳

第11回組込みシステム開発技術展（ESEC) 専門セミナー 2008年05月 [査読有り]
An Evaluation of Barrier Synchronization Mechanism Considering Hierarchical Processor Grouping

Kaito Yamada, Masayoshi Mase, Jun Shirako, Keiji Kimura, Masayuki Ito, Toshihiro Hattori, Hiroyuki Mizuno, Kunio Uchiyama, Hironori Kasahara

Technical Report of IPSJ, 2008 108 ( 28 ) 19 - 24 2008年05月 [査読有り]

　概要を見る

マルチコアプロセッサに搭載されつつある多数のコアを効率よく利用するため,ループやサブルーチンの内部の並列性を階層的に解析しタスクの定義を行い,プログラム全域の並列性を利用する階層的粗粒度タスク並列処理が提案されOSCARコンパイラに実装されている.階層的粗粒度タスク並列処理では,複数のプロセッサをソフトウェアにより階層的にグルーピングし,これらのグルーピングされたプロセッサ群に対して階層的に定義された粗粒度タスクを割り当てる.この階層的粗粒度タスク並列処理を効率よくサポートする,軽量かつスケーラブルな階層グルーピング対応バリア同期機構を開発し,NEDOリアルタイム情報家電用マルチコアプロジェクトにより開発したSH4Aプロセッサ8コア搭載の情報家電用マルチコアRP2に実装した.本稿では,この階層グルーピング対応バリア同期機構を提案すると共にRP2上で評価を行った結果について述べる.8コアを使用したAACエンコーダによる評価の結果,ソフトウェアのみによるバリア同期に対し16%の性能向上を得ることができた.

CiNii
階層グルーピング対応バリア同期機構の評価

山田海斗, 間瀬正啓, 白子準, 木村啓二, 伊藤雅之, 服部俊洋, 水野弘之, 内山邦男, 笠原博徳

第170回計算機アーキテクチャ研究会 108 ( 28 ) 19 - 24 2008年05月 [査読有り]

　概要を見る

マルチコアプロセッサに搭載されつつある多数のコアを効率よく利用するため,ループやサブルーチンの内部の並列性を階層的に解析しタスクの定義を行い,プログラム全域の並列性を利用する階層的粗粒度タスク並列処理が提案されOSCARコンパイラに実装されている.階層的粗粒度タスク並列処理では,複数のプロセッサをソフトウェアにより階層的にグルーピングし,これらのグルーピングされたプロセッサ群に対して階層的に定義された粗粒度タスクを割り当てる.この階層的粗粒度タスク並列処理を効率よくサポートする,軽量かつスケーラブルな階層グルーピング対応バリア同期機構を開発し,NEDOリアルタイム情報家電用マルチコアプロジェクトにより開発したSH4Aプロセッサ8コア搭載の情報家電用マルチコアRP2に実装した.本稿では,この階層グルーピング対応バリア同期機構を提案すると共にRP2上で評価を行った結果について述べる.8コアを使用したAACエンコーダによる評価の結果,ソフトウェアのみによるバリア同期に対し16%の性能向上を得ることができた.

CiNii
Automatic Parallelization of Restricted C Programs using Pointer Analysis

Masayoshi Mase, Daisuke Baba, Harumi Nagayama, Yuta Murata, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2008 108 ( 28 ) 69 - 74 2008年05月 [査読有り]

　概要を見る

本稿では,自動並列化コンパイラにより並列性抽出が可能なC言語におけるポインタ利用方法の制約について述べる.実際にこの制約を満たすようにプログラムを作成し,flow-sensitive, context-sensitiveなポインタ解析を用いた自動並列化を適用したところ,8コアSMPサーバにおいて,逐次実行と比較してSPEC2000 artで3.80倍,SPEC2006 lbmで6.17倍,MediaBench mpeg2encで5.14倍の速度向上が得られた.

CiNii
ポインタ解析を用いた制約付きCプログラムの自動並列化

間瀬正啓, 馬場大介, 長山晴美, 村田雄太, 木村啓二, 笠原博徳

第170回計算機アーキテクチャ研究会 108 ( 28 ) 69 - 74 2008年05月 [査読有り]

　概要を見る

本稿では,自動並列化コンパイラにより並列性抽出が可能なC言語におけるポインタ利用方法の制約について述べる.実際にこの制約を満たすようにプログラムを作成し,flow-sensitive, context-sensitiveなポインタ解析を用いた自動並列化を適用したところ,8コアSMPサーバにおいて,逐次実行と比較してSPEC2000 artで3.80倍,SPEC2006 lbmで6.17倍,MediaBench mpeg2encで5.14倍の速度向上が得られた.

CiNii
Parallelization of Multimedia Applications by Compiler on Multicores for Consumer Electronics

Takamichi Miyamoto, Saori Asaka, Hiroki Mikami, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

Symposium on Advanced Computing Systems and Infrastructures (SACSIS 2008) 2008 ( 5 ) 2008年05月 [査読有り]

J-GLOBAL
情報家電用マルチコア上におけるマルチメディア処理のコンパイラによる並列化

宮本孝道, 浅香沙織, 見神広紀, 間瀬正啓, 木村啓二, 笠原博徳

SACSIS2008 - 先進的計算基盤システムシンポジウム 2008年05月 [査読有り]

CiNii
Heterogeneous Multi-Core Architecture That Enables 54x AAC-LC Stereo Encoding.

Hiroaki Shikano, Masaki Ito, Masafumi Onouchi, Takashi Todaka, Takanobu Tsunoda, Tomoyuki Kodama, Kunio Uchiyama, Toshihiko Odaka, Tatsuya Kamei, Ei Nagahama, Manabu Kusaoke, Yusuke Nitta, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

IEEE Journal of Solid-State Circuits 43 ( 4 ) 902 - 910 2008年04月 [査読有り]

DOI

Scopus

16

被引用数

(Scopus)
An 8 CPU SoC with Independent Power-off Control of CPUs and Multicore Software Debug Function

Yutaka Yoshida, Masayuki Ito, Kiyoshi Hayase, Tomoichi Hayashi, Osamu Nishii, Toshihiro Hattori, Jun Sakiyama, Masashi Takada, Kunio Uchiyama, Jun Shirako, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

Proc. of IEEE Cool Chips XI: Symposium on Low-Power and High-Speed Chips 2008 2008年04月 [査読有り]
Panel Discussions: Multi-Core and Many-Core: the 5 to 10 Year View

Hironori Kasahara

IEEE Symposium on Low-Power and High-Speed Chips COOLChips XI 2008年04月 [査読有り]
Multicore Compiler for Low Power High Performance Embedded Computing

Hironori Kasahara

IEEE Symposium on Low-Power and High-Speed Chips COOLChips XI, Yokohama, Japan 2008年04月 [査読有り]
Power-aware compiler controllable chip multiprocessor

Hiroaki Shikano, Jun Shirako, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

IEICE TRANSACTIONS ON ELECTRONICS E91C ( 4 ) 432 - 439 2008年04月 [査読有り] [国内誌]

DOI

Scopus

1

被引用数

(Scopus)
情報家電用マルチコア・プロセッサ

Hironori Kasahara

電気学会誌 128 ( 3 ) 172 - 175 2008年03月 [査読有り] [国内誌]

　概要を見る

本記事に「抄録」はありません。

DOI CiNii J-GLOBAL
Multicore Processors for Consumer Electronics

Hironori Kasahara

The Journal of IEE of Japan 128 ( 3 ) 172 - 175 2008年03月 [査読有り]
A Multigrain Parallelizing Compiler with Power Control for Multicore Processors

Hironori Kasahara

Intel Headquarter, Hosted by Dr. Peng Tu 2008年02月 [査読有り]
A Multigrain Parallelizing Compiler with Power Control for Multicore Processors

Hironori Kasahara

Google Headquarter, Hosted by Dr. Shih-wei Liao 2008年02月 [査読有り]
Advanced Parallelizing Compiler Technology for High Performance Low Power Multicores

Hironori Kasahara

VDEC Refresh Seminar 2008年01月 [査読有り]
高性能低消費電力マルチコアのための最先端並列化コンパイラ技術

笠原博徳

VDECリフレッシュ・セミナー 2008年01月 [査読有り]
Software-cooperative power-efficient heterogeneous multi-core for media processing

Hiroaki Shikano, Masaki Ito, Kunio Uchiyama, Toshihiko Odaka, Akihiro Hayashi, Takeshi Masuura, Masayoshi Mase, Jun Shirako, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

2008 ASIA AND SOUTH PACIFIC DESIGN AUTOMATION CONFERENCE, VOLS 1 AND 2 712 - + 2008年 [査読有り]

DOI

Scopus

7

被引用数

(Scopus)
Performance evaluation of compiler controlled power saving scheme

Jun Shirako, Munehiro Yoshida, Naoto Oshiyama, Yasutaka Wada, Hirofurni Nakano, Hiroaki Shikano, Keiji Kimura, Hironori Kasahara

HIGH-PERFORMANCE COMPUTING 4759 480 - 493 2008年 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
An 8640 MIPS SoC with Independent Power-Off Control of 8 CPUs and 8 RAMs by An Automatic Parallelizing Compiler.

Masayuki Ito, Toshihiro Hattori, Yutaka Yoshida, Kiyoshi Hayase, Tomoichi Hayashi, Osamu Nishii, Yoshihiko Yasu, Atsushi Hasegawa, Masashi Takada, Hiroyuki Mizuno, Kunio Uchiyama, Toshihiko Odaka, Jun Shirako, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

2008 IEEE International Solid-State Circuits Conference(ISSCC) 51 90 - 91 2008年 [査読有り]

DOI

Scopus

37

被引用数

(Scopus)
Language extensions in support of compiler parallelization

Shirako, J., Kasahara, H., Sarkar, V.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 5234 LNCS 78 - 94 2008年 [査読有り]

DOI

Scopus

7

被引用数

(Scopus)
Power Reduction Controll for Multicores in OSCAR Multigrain Parallelizing Compiler

Jun Shirako, Keiji Kimura, Hironori Kasahara

ISOCC: 2008 INTERNATIONAL SOC DESIGN CONFERENCE, VOLS 1-3 50 - 55 2008年 [査読有り]

　概要を見る

Multicore processors have become mainstream computer architecture to go beyond the performance and power efficiency limits of single-core processors. To achieve low power consumption and high performance on multicores, parallelizing compilers take on an important role. This paper describes the performance of a compiler-based power reduction scheme cooperating with OSCAR multigrain parallelizing compiler on a newly developed 8-way SH4A low power multicore chip for consumer electronics, which supports DVFS (Dynamic Voltage and Frequency Scaling) and Clock/Power Gating. Using hardware parameters and parallelized program information, OSCAR compiler determines suitable voltage and frequency of each active processor core and appropriate schedule of clock gating and power gating. Performance experiments shows the compiler reduces consumed power by 88.3%, namely from 5.68 W to 0.67 W, for real-time secure AAC Encoding and 73.5%, namely from 5.73 W to 1.52 W, for real-time MPEG2 Decoding on 8 core execution.
Parallelization with Automatic Parallelizing Compiler Generating Consumer Electronics Multicore API

Takamichi Miyamoto, Saori Asaka, Hiroki Mikami, Masayoshi Mase, Yasutaka Wada, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

PROCEEDINGS OF THE 2008 INTERNATIONAL SYMPOSIUM ON PARALLEL AND DISTRIBUTED PROCESSING WITH APPLICATIONS 600 - 607 2008年 [査読有り]

DOI

Scopus

6

被引用数

(Scopus)
マルチコアプロセッサ上でのマルチメディア処理の並列化

宮本孝道, 田村圭, 田野裕秋, 見神広紀, 浅香沙織, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-175-15(デザインガイア2007) 2007 ( 115 ) 77 - 82 2007年11月

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ動作クロック周波数向上の鈍化，ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべ<，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている．また，携帯電話，デジタル TV，ゲーム等の情報家電機器ではコーデック，グラフィックス等のマルチメディア処理の高速化が非常に重要となっている．本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる．特に動画像処理における MPEG2 エシコード，MPEG2 デコード，音声処理における MP3 エンコード，静止画処理における JPEG2000 エンコードを例として OSCAR マルチグレイン自動並列化コンパイラを用いた富土通株式会社製 FR1000 と早稲田大学，ルネサステクノロジ，株式会社日立製作所共同開発 RP1 マルチコアでの並列処理結果について述べる．Multicore processors have attracted much attention to handle the increase of power consumption, the slowdown of improvement of processor clock speed, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics devices like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler parallelizes these media applications using newly developed multicore API. This paper evaluates parallel processing performances of these multimedia applications on the FR1000 multicore processor developed by Fujitsu Ltd, and the RPl multicore processor jointly-developed by Waseda University, Renesas Technology Corp. and Hitachi Ltd.

CiNii J-GLOBAL
マルチコアプロセッサ上でのマルチメディア処理の並列化

宮本孝道, 田村圭, 田野裕秋, 見神広紀, 浅香沙織, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-175-15(デザインガイア2007) 2007 ( 115 ) 77 - 82 2007年11月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ動作クロック周波数向上の鈍化，ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべ<，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている．また，携帯電話，デジタル TV，ゲーム等の情報家電機器ではコーデック，グラフィックス等のマルチメディア処理の高速化が非常に重要となっている．本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる．特に動画像処理における MPEG2 エシコード，MPEG2 デコード，音声処理における MP3 エンコード，静止画処理における JPEG2000 エンコードを例として OSCAR マルチグレイン自動並列化コンパイラを用いた富土通株式会社製 FR1000 と早稲田大学，ルネサステクノロジ，株式会社日立製作所共同開発 RP1 マルチコアでの並列処理結果について述べる．Multicore processors have attracted much attention to handle the increase of power consumption, the slowdown of improvement of processor clock speed, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics devices like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler parallelizes these media applications using newly developed multicore API. This paper evaluates parallel processing performances of these multimedia applications on the FR1000 multicore processor developed by Fujitsu Ltd, and the RPl multicore processor jointly-developed by Waseda University, Renesas Technology Corp. and Hitachi Ltd.

CiNii
Parallelization for Multimedia Processing on Multicore Processors

Takamichi Miyamoto, Kei Tamura, Hiroaki Tano, Hiroki Mikami, Saori Asaka, Masayoshi Mase, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2007-ARC-175-05 (DesignGaia2007) 2007 ( 115 ) 77 - 82 2007年11月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ動作クロック周波数向上の鈍化，ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべ<，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている．また，携帯電話，デジタル TV，ゲーム等の情報家電機器ではコーデック，グラフィックス等のマルチメディア処理の高速化が非常に重要となっている．本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる．特に動画像処理における MPEG2 エシコード，MPEG2 デコード，音声処理における MP3 エンコード，静止画処理における JPEG2000 エンコードを例として OSCAR マルチグレイン自動並列化コンパイラを用いた富土通株式会社製 FR1000 と早稲田大学，ルネサステクノロジ，株式会社日立製作所共同開発 RP1 マルチコアでの並列処理結果について述べる．Multicore processors have attracted much attention to handle the increase of power consumption, the slowdown of improvement of processor clock speed, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics devices like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler parallelizes these media applications using newly developed multicore API. This paper evaluates parallel processing performances of these multimedia applications on the FR1000 multicore processor developed by Fujitsu Ltd, and the RPl multicore processor jointly-developed by Waseda University, Renesas Technology Corp. and Hitachi Ltd.

CiNii
Multigrain Parallelization of Restricted C Programs on SMP Servers and Low Power Multicores

M. Mase, D. Baba, H. Nagayama, H. Tano, T. Masuura, T. Miyamoto, J. Shirako, H. Nakano, K. Kimura, H. Kasahara

The 20th International Workshop on Languages and Compilers for Parallel Computing (LCPC2007) 2007年10月 [査読有り]
Low Power High Performance Multicores and Compiler Technology

Hironori Kasahara

The 5th Technology Link in W.T.L.O - For International Research Center in Collaboration of Industry and Academia 2007年10月 [査読有り]
低消費電力・高性能マルチコアとコンパイラ技術

笠原博徳

第５回Technology Link in W.T.L.O 〜産学連携における国際化拠点の構築に向けて〜 2007年10月 [査読有り]
情報家電用マルチコアSMP実行モードにおける制約付きCプログラムのマルチグレイン並列化

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 宮本孝道, 白子準, 中野啓史, 木村啓二, 笠原博徳

情報家電用マルチコアSMP実行モードにおける制約付きCプログラムのマルチグレイン並列化 2007年10月 [査読有り]
A Multi-core Parallelizing Compiler for Low-Power High-Performance Computing

Hironori Kasahara

Colloquium Electrical and Computer Engineering, Computer and Information Technology Institute, Computer Science, and Dean of Engineering, Duncan Hall, Rice University, Hosted by Prof. Vivek Sarkar 2007年10月 [査読有り]
How is specifically multicore programming different from traditional parallel computing?", Panel Discussion on "How is specifically multicore programming different from traditional parallel computing?

Hironori Kasahara

The 20th International Workshop on Languages and Compilers for Parallel Computing (LCPC2007), University of Illinois at Urbana-Champaign 2007年10月 [査読有り]
情報家電用マルチコアSMP実行モードにおける制約付きCプログラムのマルチグレイン並列化

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 宮本孝道, 白子準, 中野啓史, 木村啓二, 笠原博徳

組込みシステムシンポジウム2007 2007年10月 [査読有り]

CiNii
Multigrain Parallelization of Restricted C Programs in SMP Execution Mode of a Multicore for Consumer Electronics

Masayoshi Mase, Daisuke Baba, Harumi Nagayama, Hiroaki Tano, Takeshi Masuura, Takamichi Miyamoto, Jun Shirako, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Embedded Systems Symposium 2007 （ESS 2007) 2007 ( 8 ) 2007年10月 [査読有り]

J-GLOBAL
Multicore Innovation

Hironori Kasahara

Waseda Univ. 125 th & Faculty of Science and Engineering 100th Anniversary Symposium "Innovative Information, Electronics, and Optical technology" 2007年09月 [査読有り]
マルチコア・イノベーション

笠原博徳

早稲田大学125周年・理工学部100周年記念シンポジウム “イノベーティブ情報・電子・光技術” 2007年09月 [査読有り]
ヘテロジニアスマルチコア上でのコンパイラによる低消費電力制御

林明宏, 伊能健人, 中川亮, 松本繁, 山田海斗, 押山直人, 白子準, 和田康孝, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-174-18(SWoPP2007) 2007 ( 79 ) 103 - 108 2007年08月

　概要を見る

現在，情報家電分野からPC，サーバ，スーパーコンピュータに至るまで処理性能の向上と低消費電力化のためにマルチコアプロセッサの導入が図られている．特に情報家電では電力あたりの性能を高めるために1チップ上に複数の汎用コアとアクセラレータコアを集積するヘテロジニアスマルチコアが注目を集めている．この高処理性能/低消費電力，さらにはソフトウェア生産性向上の要求を満たすためには，実行するプログラムの適切な並列化，チップ上のリソースのきめ細かな電圧や動作周波数制御を実現する並列化コンパイラの開発が必要不可欠である．本稿では各コアがローカルメモリ，データ転送機構および電力制御機構を持つヘテロジニアスマルチコアアーキテクチャにおいて，コンパイラによる周波数及び電源制御を適用した際の性能評価結果について述べる．MP3エンコーダを用いて，CPUコアとしてSH4Aを4基，アクセラレータコアとして FE-GAを4基からなるヘテロジニアスマルチコアを想定し周波数および電源制御を行った場合，1SHコアに対し，24.32倍の速度向上が得られ，消費電力制御を行わない場合に比べて処理性能をほぼ維持したままで28.43％の消費エネルギーを削減できることが確認できた．Multicore processors are getting introduced for performance improvement and reduction of power dissipation in various IT fields, such as consumer electronics, PCs, servers and super computers. Especially, heterogeneous multicores have attracted much attention in consumer electronics to achieve higher performance per watt. In order to satisfy the demand for the high performance, low power dissipation and high software productivity, Parallelizing compilers for both parallelization and Frequency and Voltage control are required. This paper describes the evaluation results of compiler control power saving for a heterogeneous multicore processor which integrates upto 4 general purpose embedded processor Renesas SH4As and 4 accelera tor core like dynamically reconfigureable processors Hitachi FE-GAs. Performance evaluation shows the heterogeneous multicore gave us 24.32 times speed up against sequential processing and 28.43% energy savings for MP3 encoding program without performance degradation.

CiNii J-GLOBAL
ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法

和田康孝, 林明宏, 伊能健人, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-174-17(SWoPP2007) 2007 ( 79 ) 97 - 102 2007年08月

　概要を見る

本稿では，ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法について述べる．ヘテロジニアスマルチコアは．１チップ上に汎用プロセッサに加え，動的再構成可能プロセッサ (DRP) や信号処理用プロセッサ (DSP）などのアクセラレータを複数集積したプロセッサで，低消費電力で高い処理性能を得ることができるアーキテクチャとして情報家電等の分野で注目を集めている．本稿で提案するスタティックスケジューリング手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，各タスクの特性，チップ上の各コアの種類を考慮して処理時間を最小とするようにタスクを汎用コア及びアクセラレータに割り当て，コア間でのデータ転送は DMR を用いてタスク処理とオーバーラップして行うことにより，プログラムの階層的な並列性とチップ上のアクセラレータを最大限利用する手法である．本手法をMP3エンコーダに適用し評価した結果，SH4A1コアのみを用いた場合に対して，SH4A4コアで3.97倍，SH4A2コアとDRP2コアで12.64 倍，SH4A4コアとDRP4コアを用いたときに24.48倍の速度向上を得られることが確認できた．This paper proposes a static scheduling scheme for hierarchical coarse grain task parallel pro cessing on a heterogeneous multicore processor. A heterogeneous multicore processor integrates not only general purpose processors but also accelerators like dynamically reconfigurable proces sors (DRPs) or digital signal processors (DSPs). Effective usage of these accelerators allows us to get high performance and low power consumption at the same time. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics of each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using MP3 encoder. Hetero geneous configurations give us 12.64 times speedup with two SH4As and two DRPs and 24.48 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core.

CiNii J-GLOBAL
54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討

鹿野裕明, 伊藤雅樹, 戸高貴司, 津野田賢伸, 兒玉征之, 小野内雅文, 内山邦男, 小高俊彦, 亀井達也, 永濱衛, 草桶学, 新田祐介, 和田康孝, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2007-71 107 ( 195 ) 11 - 16 2007年08月

　概要を見る

汎用プロセッサ(CPU)コアとアクセラレータ(ACC)コアを複数個集積したヘテロジニアスマルチコアプロセッサ(HMCP)アーキテクチャを検討した.HMCPは,特定の演算を効率よく実行可能なACCコアの効果的な利用と複数のプロセッサコアの並列利用により,動作周波数を向上させなくとも高い演算性能を得ることが可能であり,組み込み向けSoCに求められる高性能,小面積,省電力を同時に実現する.今回HMCPアーキテクチャの有効性評価に当たり,AAC-LCエンコーディングのHMCPにおける処理方式を検討し,ホモジニアスマルチコアプロセッサにアクセラレータとして動的再構成可能プロセッサ(DRP)を付加した試作チップ上での評価を行った.その結果,600MHzで動作するCPU2個と300MHzで動作するDRP2個を集積したHMCPにおいて,CD一枚が1-2分程度でエンコード可能となる54倍速AACエンコーディングの性能が得られることを確認した。

CiNii J-GLOBAL
ヘテロジニアスマルチコア上でのコンパイラによる低消費電力制御

林明宏, 伊能健人, 中川亮, 松本繁, 山田海斗, 押山直人, 白子準, 和田康孝, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-174-18(SWoPP2007) 2007 ( 79 ) 103 - 108 2007年08月 [査読有り]

　概要を見る

現在，情報家電分野からPC，サーバ，スーパーコンピュータに至るまで処理性能の向上と低消費電力化のためにマルチコアプロセッサの導入が図られている．特に情報家電では電力あたりの性能を高めるために1チップ上に複数の汎用コアとアクセラレータコアを集積するヘテロジニアスマルチコアが注目を集めている．この高処理性能/低消費電力，さらにはソフトウェア生産性向上の要求を満たすためには，実行するプログラムの適切な並列化，チップ上のリソースのきめ細かな電圧や動作周波数制御を実現する並列化コンパイラの開発が必要不可欠である．本稿では各コアがローカルメモリ，データ転送機構および電力制御機構を持つヘテロジニアスマルチコアアーキテクチャにおいて，コンパイラによる周波数及び電源制御を適用した際の性能評価結果について述べる．MP3エンコーダを用いて，CPUコアとしてSH4Aを4基，アクセラレータコアとして FE-GAを4基からなるヘテロジニアスマルチコアを想定し周波数および電源制御を行った場合，1SHコアに対し，24.32倍の速度向上が得られ，消費電力制御を行わない場合に比べて処理性能をほぼ維持したままで28.43％の消費エネルギーを削減できることが確認できた．Multicore processors are getting introduced for performance improvement and reduction of power dissipation in various IT fields, such as consumer electronics, PCs, servers and super computers. Especially, heterogeneous multicores have attracted much attention in consumer electronics to achieve higher performance per watt. In order to satisfy the demand for the high performance, low power dissipation and high software productivity, Parallelizing compilers for both parallelization and Frequency and Voltage control are required. This paper describes the evaluation results of compiler control power saving for a heterogeneous multicore processor which integrates upto 4 general purpose embedded processor Renesas SH4As and 4 accelera tor core like dynamically reconfigureable processors Hitachi FE-GAs. Performance evaluation shows the heterogeneous multicore gave us 24.32 times speed up against sequential processing and 28.43% energy savings for MP3 encoding program without performance degradation.

CiNii
ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法

和田康孝, 林明宏, 伊能健人, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-174-17(SWoPP2007) 2007 ( 79 ) 97 - 102 2007年08月 [査読有り]

　概要を見る

本稿では，ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法について述べる．ヘテロジニアスマルチコアは．１チップ上に汎用プロセッサに加え，動的再構成可能プロセッサ (DRP) や信号処理用プロセッサ (DSP）などのアクセラレータを複数集積したプロセッサで，低消費電力で高い処理性能を得ることができるアーキテクチャとして情報家電等の分野で注目を集めている．本稿で提案するスタティックスケジューリング手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，各タスクの特性，チップ上の各コアの種類を考慮して処理時間を最小とするようにタスクを汎用コア及びアクセラレータに割り当て，コア間でのデータ転送は DMR を用いてタスク処理とオーバーラップして行うことにより，プログラムの階層的な並列性とチップ上のアクセラレータを最大限利用する手法である．本手法をMP3エンコーダに適用し評価した結果，SH4A1コアのみを用いた場合に対して，SH4A4コアで3.97倍，SH4A2コアとDRP2コアで12.64 倍，SH4A4コアとDRP4コアを用いたときに24.48倍の速度向上を得られることが確認できた．This paper proposes a static scheduling scheme for hierarchical coarse grain task parallel pro cessing on a heterogeneous multicore processor. A heterogeneous multicore processor integrates not only general purpose processors but also accelerators like dynamically reconfigurable proces sors (DRPs) or digital signal processors (DSPs). Effective usage of these accelerators allows us to get high performance and low power consumption at the same time. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics of each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using MP3 encoder. Hetero geneous configurations give us 12.64 times speedup with two SH4As and two DRPs and 24.48 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core.

CiNii
54倍速AACエンコードを実現するヘテロジニアスマルチコアアーキテクチャの検討

鹿野裕明, 伊藤雅樹, 戸高貴司, 津野田賢伸, 兒玉征之, 小野内雅文, 内山邦男, 小高俊彦, 亀井達也, 永濱衛, 草桶学, 新田祐介, 和田康孝, 木村啓二, 笠原博徳

社団法人電子情報通信学会, 信学技報, ICD2007-71 107 ( 195 ) 11 - 16 2007年08月 [査読有り]

　概要を見る

汎用プロセッサ(CPU)コアとアクセラレータ(ACC)コアを複数個集積したヘテロジニアスマルチコアプロセッサ(HMCP)アーキテクチャを検討した.HMCPは,特定の演算を効率よく実行可能なACCコアの効果的な利用と複数のプロセッサコアの並列利用により,動作周波数を向上させなくとも高い演算性能を得ることが可能であり,組み込み向けSoCに求められる高性能,小面積,省電力を同時に実現する.今回HMCPアーキテクチャの有効性評価に当たり,AAC-LCエンコーディングのHMCPにおける処理方式を検討し,ホモジニアスマルチコアプロセッサにアクセラレータとして動的再構成可能プロセッサ(DRP)を付加した試作チップ上での評価を行った.その結果,600MHzで動作するCPU2個と300MHzで動作するDRP2個を集積したHMCPにおいて,CD一枚が1-2分程度でエンコード可能となる54倍速AACエンコーディングの性能が得られることを確認した。

CiNii
A Hierarchical Coarse Grain Task Static Scheduling Scheme on a Heterogeneous Multicore

Yasutaka Wada, Akihiro Hayashi, Taketo Iyoku, Jun Shirako, Hirofumi Nakano, Hiroaki Shikano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2007-ARC-174-17(SWoPP2007) 2007 ( 79 ) 97 - 102 2007年08月 [査読有り]

　概要を見る

本稿では，ヘテロジニアスマルチコア上での階層的粗粒度タスクスタティックスケジューリング手法について述べる．ヘテロジニアスマルチコアは．１チップ上に汎用プロセッサに加え，動的再構成可能プロセッサ (DRP) や信号処理用プロセッサ (DSP）などのアクセラレータを複数集積したプロセッサで，低消費電力で高い処理性能を得ることができるアーキテクチャとして情報家電等の分野で注目を集めている．本稿で提案するスタティックスケジューリング手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，各タスクの特性，チップ上の各コアの種類を考慮して処理時間を最小とするようにタスクを汎用コア及びアクセラレータに割り当て，コア間でのデータ転送は DMR を用いてタスク処理とオーバーラップして行うことにより，プログラムの階層的な並列性とチップ上のアクセラレータを最大限利用する手法である．本手法をMP3エンコーダに適用し評価した結果，SH4A1コアのみを用いた場合に対して，SH4A4コアで3.97倍，SH4A2コアとDRP2コアで12.64 倍，SH4A4コアとDRP4コアを用いたときに24.48倍の速度向上を得られることが確認できた．This paper proposes a static scheduling scheme for hierarchical coarse grain task parallel pro cessing on a heterogeneous multicore processor. A heterogeneous multicore processor integrates not only general purpose processors but also accelerators like dynamically reconfigurable proces sors (DRPs) or digital signal processors (DSPs). Effective usage of these accelerators allows us to get high performance and low power consumption at the same time. In the proposed scheme, the compiler extracts parallelism using coarse grain parallel processing and assigns tasks considering characteristics of each core to minimize the execution time of an application. Performance of the proposed scheme is evaluated on a heterogeneous multicore processor using MP3 encoder. Hetero geneous configurations give us 12.64 times speedup with two SH4As and two DRPs and 24.48 times speedup with four SH4As and four DRPs against sequential execution with one SH4A core.

CiNii
Evaluation of Heterogeneous Multicore Architecture with AAC-LC Stereo Encoding

Hiroaki Shikano, Masaki Ito, Takashi Todaka, Takanobu Tsunoda, Tomoyuki Kodama, Masafumi Onouchi, Kunio Uchiyama, Toshihiko Odaka, Tatsuya Kamei, Ei Nagahama, Manabu Kusaoke, Yusuke Nitta, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD2007-71) 107 ( 195 ) 11 - 16 2007年08月 [査読有り]

　概要を見る

汎用プロセッサ(CPU)コアとアクセラレータ(ACC)コアを複数個集積したヘテロジニアスマルチコアプロセッサ(HMCP)アーキテクチャを検討した.HMCPは,特定の演算を効率よく実行可能なACCコアの効果的な利用と複数のプロセッサコアの並列利用により,動作周波数を向上させなくとも高い演算性能を得ることが可能であり,組み込み向けSoCに求められる高性能,小面積,省電力を同時に実現する.今回HMCPアーキテクチャの有効性評価に当たり,AAC-LCエンコーディングのHMCPにおける処理方式を検討し,ホモジニアスマルチコアプロセッサにアクセラレータとして動的再構成可能プロセッサ(DRP)を付加した試作チップ上での評価を行った.その結果,600MHzで動作するCPU2個と300MHzで動作するDRP2個を集積したHMCPにおいて,CD一枚が1-2分程度でエンコード可能となる54倍速AACエンコーディングの性能が得られることを確認した。

CiNii
最先端の組み込みマルチコア用コンパイラ技術

笠原博徳

DAシンポジウム2007 − システムLSI設計技術とDA − 2007年08月 [査読有り]
Advanced Parallelizing Compiler Technologies for Embedded Multi-cores

Hironori Kasahara

DA Symposiumu 2007 2007 ( 7 ) 2007年08月 [査読有り]

J-GLOBAL
情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 宮本孝道, 白子準, 中野啓史, 木村啓二, 亀井達也, 服部俊洋, 長谷川淳, 佐藤真琴, 伊藤雅樹, 内山邦男, 小高俊彦, 笠原博徳

情報処理学会研究会報告2007-ARC-173-05（第165回計算機アーキテクチャ研究会） 107 ( 76 ) 25 - 30 2007年05月

　概要を見る

現在,ゲーム,カーナビゲーションシステム,デジタルTV,携帯電話等の情報家電機器を始め,PCからスーパーコンピュータに至る,多くの情報機器でマルチコアプロセッサ採用の動きが進んでいる.本稿では,制約付きC言語で記述されたメディア処理等のプログラムをOSCARマルチグレイン自動並列化コンパイラにより並列化し,NEDO"リアルタイム情報家電用マルチコア技術の研究開発"プロジェクトの一環でOSCAR標準マルチコアメモリアーキテクチャに基づき株式会社ルネサルテクノロジ,株式会社日立製作所により開発されたSH-4A(SH-X3)コアを4コア集積した情報家電用マルチコアプロセッサRP1上でSMPモード実行時の性能評価を行った.評価の結果AACオーディオエンコーダで4コア使用時に1コア使用時の3.34倍の速度向上が得られた.

CiNii
MP3エンコーダを用いたOSCARヘテロジニアスチップマルチプロセッサの性能評価

鹿野裕明, 鈴木裕貴, 和田康孝, 白子準, 木村啓二, 笠原博徳

情報処理学会論文誌 48 ( SIG8(ACS18) ) 141 - 152 2007年05月 [査読有り]

J-GLOBAL
独立に周波数制御可能な 4320MIPS、SMP/AMP対応 4プロセッサLSIの開発

早瀬清, 吉田裕, 亀井達也, 芝原真一, 西井修, 服部俊洋, 長谷川淳, 高田雅士, 入江直彦, 内山邦男, 小高俊彦, 高田究, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-173-06（第165回計算機アーキテクチャ研究会） 107 ( 76 ) 31 - 35 2007年05月 [査読有り]

　概要を見る

低消費電力と高性能を備えた、4320MIPS4プロセッサSOCを90nmプロセスで設計した。それぞれのプロセッサには、32KBのデータキャッシュを内蔵しており、プロセッサ間のデータキャッシュのコヒーレンシを維持するためのモジュールを内蔵する。プロセッサ毎に処理量に応じた周波数制御と、プロセッサ間のデータキャッシュのコヒーレンシを維持するスリープモードの採用により、低電力を実現する。

CiNii
情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 深津幸二, 宮本孝道, 白子準, 中野啓史, 木村啓二, 亀井達也, 服部俊洋, 長谷川淳, 佐藤真琴, 伊藤雅樹, 内山邦男, 小高俊彦, 笠原博徳

情報処理学会研究会報告2007-ARC-173-05（第165回計算機アーキテクチャ研究会） 107 ( 76 ) 25 - 30 2007年05月 [査読有り]

　概要を見る

現在,ゲーム,カーナビゲーションシステム,デジタルTV,携帯電話等の情報家電機器を始め,PCからスーパーコンピュータに至る,多くの情報機器でマルチコアプロセッサ採用の動きが進んでいる.本稿では,制約付きC言語で記述されたメディア処理等のプログラムをOSCARマルチグレイン自動並列化コンパイラにより並列化し,NEDO"リアルタイム情報家電用マルチコア技術の研究開発"プロジェクトの一環でOSCAR標準マルチコアメモリアーキテクチャに基づき株式会社ルネサルテクノロジ,株式会社日立製作所により開発されたSH-4A(SH-X3)コアを4コア集積した情報家電用マルチコアプロセッサRP1上でSMPモード実行時の性能評価を行った.評価の結果AACオーディオエンコーダで4コア使用時に1コア使用時の3.34倍の速度向上が得られた.

CiNii
Performance Evaluation of MP3 Audio Encoder on OSCAR Heterogeneous Chip Multicore Processor

Hiroaki Shikano, Yuki Suzuki, Yasutaka Wada, Jun Shirako, Keiji Kimura, Hironori Kasahara

Trans. of IPSJ 48 ( SIG8(ACS18) ) 141 - 152 2007年05月 [査読有り]

　概要を見る

汎用プロセッサや専用プロセッサ，アクセラレータ等，様々な種類のプロセッサエレメント（PE）を複数個同一チップ上に集積し，処理を並列で行うことで，動作周波数を過度に引き上げることなく，消費電力を抑えつつ高い演算性能を得ることが可能なソフトウェア協調ヘテロジニアスチップマルチプロセッサ（HCMP）の有効性を評価した．本プロセッサは各PEにローカルメモリ，データ転送機構および電力制御機構を持ち，コンパイラと協調することで性能向上と低電力の両立を狙う．今回，MP3エンコーダプログラムを利用し，その並列処理方式と電力制御方式を検討し，HCMP上での評価を実施した．その結果，汎用プロセッサコア2個，動的再構成プロセッサコア4個を搭載したHCMPは，汎用プロセッサ1個のシングルコアプロセッサと比較して18.4倍の性能向上となることが分かった．また，同様の構成に対し電力制御を実施することにより，汎用プロセッサ1個のシングルコアプロセッサに対し，電力消費エネルギーを最大80.0\%削減できることが確認できた．This paper evaluates a heterogeneous chip multi-processor (HCMP) and its scheduling scheme. The HCMP possesses different types of processing elements (PEs) such as CPUs as general-purpose processors, as well as digital signal processors or dynamic reconfigurable processors (DRPs) as specific-purpose processors. The HCMP realizes higher performance and lower power consumption than conventional single-core processors or even homogeneous multi-core processors in some specific applications such as media processing with low operating frequency supplied. In this paper, the performance of the HCMP is analyzed by studying parallelizing scheme and power control scheme of an MP3 audio encoding program and by scheduling the program onto the HCMP using these two schemes. As a result, it is observed an HCMP, consisting of two CPUs and four DRPs, outperforms a single-core processor with one CPU by a speed-up factor of 18.4. It is also obtained that the estimated energy on the HCMP with a power control results in as much as 80.0% reduction.

CiNii
Mutligrain Parallel Processing in SMP Execution Mode on a Multicore for Consumer Electronics

Masayoshi Mase, Daisuke Baba, Harumi Nagayama, Hiroaki Tano, Takeshi Masuura, Takamichi Miyamoto, Jun Shirako, Hirofumi Nakano, Keiji Kimura, Tatsuya Kamei, Toshihiro Hattori, Atsushi Hasegawa, Makoto Sato, Masaki Ito, Toshihiko Odaka, Hironori Kasahara

Technical Report of IPSJ, 2007-ARC-173-05 107 ( 76 ) 25 - 30 2007年05月 [査読有り]

　概要を見る

現在,ゲーム,カーナビゲーションシステム,デジタルTV,携帯電話等の情報家電機器を始め,PCからスーパーコンピュータに至る,多くの情報機器でマルチコアプロセッサ採用の動きが進んでいる.本稿では,制約付きC言語で記述されたメディア処理等のプログラムをOSCARマルチグレイン自動並列化コンパイラにより並列化し,NEDO"リアルタイム情報家電用マルチコア技術の研究開発"プロジェクトの一環でOSCAR標準マルチコアメモリアーキテクチャに基づき株式会社ルネサルテクノロジ,株式会社日立製作所により開発されたSH-4A(SH-X3)コアを4コア集積した情報家電用マルチコアプロセッサRP1上でSMPモード実行時の性能評価を行った.評価の結果AACオーディオエンコーダで4コア使用時に1コア使用時の3.34倍の速度向上が得られた.

CiNii
マルチグレイン並列化コンパイラにおけるローカルメモリ管理手法

三浦剛, 田川友博, 村松裕介, 池見明紀, 中川正洋, 中野啓史, 白子準, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-172/HPC-109-11 (HOKKE2007) 2007 ( 17 ) 61 - 66 2007年03月

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上，低消費電力，価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている．消費電力を抑えつつマルチコアプロセッサの実効性能を向上させ，アプリケーションソフトウェアの開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす．この実効性能の向上のためには，マルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに起因するメモリウォール問題への対処が必要となる．具体的には，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために必須である．本稿では，OSCARマルチグレイン自動並列化コンパイラを用いた粗粒度タスク並列処理において，プログラム全域のデータローカリティを有効利用した，マルチコア上のローカルメモリ管理手法について提案する．SPEC 95fpのtomcatvを用いたOSCARマルチコアシミュレータ上の性能評価において，本手法未適用時の共有メモリを用いた逐次処理に対して，本手法適用によるローカルメモリ利用最適化により，8プロセッサで19.6倍の性能向上が得られた．Multicore systems have been attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. On multicore processor, a memory wall caused by the speed gap between processor core and memory is also serious problem. Therefore, it is important for performance improvement to use fast memolies like cache and local memory nearby a processor effectively. This paper proposes a local memory management scheme for coarse grain task parallel processing. In the evaluation using SPEC 95fp tomcatv, the proposed scheme using 8 processors achieved 19.6 times speedup against the sequantial execution without the proposed scheme on the OSCAR multicore processor by the effective use of local memories.

CiNii
マルチグレイン並列化コンパイラにおけるローカルメモリ管理手法

三浦剛, 田川友博, 村松裕介, 池見明紀, 中川正洋, 中野啓史, 白子準, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-109/HPC-109-11 (HOKKE2007) 2007 ( 17 ) 61 - 66 2007年03月 [査読有り]

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上，低消費電力，価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている．消費電力を抑えつつマルチコアプロセッサの実効性能を向上させ，アプリケーションソフトウェアの開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす．この実効性能の向上のためには，マルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに起因するメモリウォール問題への対処が必要となる．具体的には，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために必須である．本稿では，OSCARマルチグレイン自動並列化コンパイラを用いた粗粒度タスク並列処理において，プログラム全域のデータローカリティを有効利用した，マルチコア上のローカルメモリ管理手法について提案する．SPEC 95fpのtomcatvを用いたOSCARマルチコアシミュレータ上の性能評価において，本手法未適用時の共有メモリを用いた逐次処理に対して，本手法適用によるローカルメモリ利用最適化により，8プロセッサで19.6倍の性能向上が得られた．Multicore systems have been attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. On multicore processor, a memory wall caused by the speed gap between processor core and memory is also serious problem. Therefore, it is important for performance improvement to use fast memolies like cache and local memory nearby a processor effectively. This paper proposes a local memory management scheme for coarse grain task parallel processing. In the evaluation using SPEC 95fp tomcatv, the proposed scheme using 8 processors achieved 19.6 times speedup against the sequantial execution without the proposed scheme on the OSCAR multicore processor by the effective use of local memories.

CiNii
A Local Memory Management Scheme in Multigrain Parallelizing Compiler

Tsuyoshi Miura, Tomohiro Tagawa, Yusuke Muramatsu, Akinori Ikemi, Masahiro Nakagawa, Hirofumi Nakano, Jun Shirako, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2007-ARC-172/HPC-109-11 2007 ( 17 ) 61 - 66 2007年03月 [査読有り]

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上，低消費電力，価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている．消費電力を抑えつつマルチコアプロセッサの実効性能を向上させ，アプリケーションソフトウェアの開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす．この実効性能の向上のためには，マルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに起因するメモリウォール問題への対処が必要となる．具体的には，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために必須である．本稿では，OSCARマルチグレイン自動並列化コンパイラを用いた粗粒度タスク並列処理において，プログラム全域のデータローカリティを有効利用した，マルチコア上のローカルメモリ管理手法について提案する．SPEC 95fpのtomcatvを用いたOSCARマルチコアシミュレータ上の性能評価において，本手法未適用時の共有メモリを用いた逐次処理に対して，本手法適用によるローカルメモリ利用最適化により，8プロセッサで19.6倍の性能向上が得られた．Multicore systems have been attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. On multicore processor, a memory wall caused by the speed gap between processor core and memory is also serious problem. Therefore, it is important for performance improvement to use fast memolies like cache and local memory nearby a processor effectively. This paper proposes a local memory management scheme for coarse grain task parallel processing. In the evaluation using SPEC 95fp tomcatv, the proposed scheme using 8 processors achieved 19.6 times speedup against the sequantial execution without the proposed scheme on the OSCAR multicore processor by the effective use of local memories.

CiNii
Power-Aware Compiler Controllable Chip Multiprocessor.

Hiroaki Shikano, Jun Shirako, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

16th International Conference on Parallel Architectures and Compilation Techniques (PACT 2007)(PACT) 427 - 427 2007年 [査読有り]

DOI
マルチコア上でのマルチメディアアプリケーションの自動並列化

宮本孝道, 浅香沙織, 鎌倉信仁, 山内宏真, 間瀬正啓, 白子準, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-171-13 2007 ( 4 ) 69 - 74 2007年01月

　概要を見る

半導体集積度向上に伴う消費電力の増大、プロセッサ動作クロック周波数向上の鈍化、ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべく、一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている。また、携帯電話、デジタル TV、ゲーム等の情報家電上ではコーデック、グラフィックス等のマルチメディア処理の高速化が非常に重要となっている。本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる。特に動画像処理の例として MPEG2 エンコード、MPEG2 デコード、音声処理の例として MP3 エンコード、静止画処理の例として JPEG2000 エンコ－ドの OSCAR マルチグレイン自動並列化コンパイラをもちいたマルチコア上での並列処理について述べる。各マルチメディア処理の並列処理を OSCAR マルチコアプロセッサ、IBM p5 550Q Power+ 2 コア集積マルチコアプロセッサベース SMP サーバ上で評価を行った。OSCAR マルチコアプロセッサ上では、逐次処理に対して、提案するローカルメモリ最適化、データ転送最適化を伴う並列化手法により4プロセッサでの並列処理では、MPEG2 エンコードで3.81倍、MPEG2 デコードで3.04倍、MP3 エンコードで3.09倍、JPEG 2000 エンコードで3.79倍の速度向上が得られた。IBM p5 550Q 上では、逐次処理に対して OSCAR コンパイラによる8プロセッサでの並列処理では、MPEG2 エンコードで5.19倍、MPEG2 デコードで5.12倍、MP3 エンコードで3.69倍、JPEG 2000 エンコードで4.32倍の速度向上が得られた。Multicore processors have attracted much attention to handle the increase of power consumption along with the increase of integration degree of semiconductor devices, the slowdown of improvement of processor clocks, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler automatically parallelizes these media applications. This paper evaluates parallel processing performances of these multimedia applications on the OSCAR multicore processor, and the IBM p5 550Q Power5+ 8 processors SMP server. On the OSCAR multicore processor, the parallel execution with the proposed method of managing local memory and optimizing data transfer using 4 processors, gives us 3.81 times speedup for MPEG2 encoding, 3.04 times speedup for MPEG2 decoding, 3.09 times speedup for MP3 encoding, 3.79 times speedup for JPEG 2000 encoding against the sequential execution. On the IBM p5 550Q Power5+ 8 processors server, the parallel execution using 8 processors gives us 5.19 times speedup for MPEG2 encoding, 5.12 times speedup for MPEG2 decoding, 3.69 times speedup for MP3 encoding, 4.32 times speedup for JPEG 2000 encoding against the sequential execution.

CiNii J-GLOBAL
マルチコア上でのマルチメディアアプリケーションの自動並列化

宮本孝道, 浅香沙織, 鎌倉信仁, 山内宏真, 間瀬正啓, 白子準, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-171-13 2007 ( 4 ) 69 - 74 2007年01月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大、プロセッサ動作クロック周波数向上の鈍化、ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべく、一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている。また、携帯電話、デジタル TV、ゲーム等の情報家電上ではコーデック、グラフィックス等のマルチメディア処理の高速化が非常に重要となっている。本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる。特に動画像処理の例として MPEG2 エンコード、MPEG2 デコード、音声処理の例として MP3 エンコード、静止画処理の例として JPEG2000 エンコ－ドの OSCAR マルチグレイン自動並列化コンパイラをもちいたマルチコア上での並列処理について述べる。各マルチメディア処理の並列処理を OSCAR マルチコアプロセッサ、IBM p5 550Q Power+ 2 コア集積マルチコアプロセッサベース SMP サーバ上で評価を行った。OSCAR マルチコアプロセッサ上では、逐次処理に対して、提案するローカルメモリ最適化、データ転送最適化を伴う並列化手法により4プロセッサでの並列処理では、MPEG2 エンコードで3.81倍、MPEG2 デコードで3.04倍、MP3 エンコードで3.09倍、JPEG 2000 エンコードで3.79倍の速度向上が得られた。IBM p5 550Q 上では、逐次処理に対して OSCAR コンパイラによる8プロセッサでの並列処理では、MPEG2 エンコードで5.19倍、MPEG2 デコードで5.12倍、MP3 エンコードで3.69倍、JPEG 2000 エンコードで4.32倍の速度向上が得られた。Multicore processors have attracted much attention to handle the increase of power consumption along with the increase of integration degree of semiconductor devices, the slowdown of improvement of processor clocks, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler automatically parallelizes these media applications. This paper evaluates parallel processing performances of these multimedia applications on the OSCAR multicore processor, and the IBM p5 550Q Power5+ 8 processors SMP server. On the OSCAR multicore processor, the parallel execution with the proposed method of managing local memory and optimizing data transfer using 4 processors, gives us 3.81 times speedup for MPEG2 encoding, 3.04 times speedup for MPEG2 decoding, 3.09 times speedup for MP3 encoding, 3.79 times speedup for JPEG 2000 encoding against the sequential execution. On the IBM p5 550Q Power5+ 8 processors server, the parallel execution using 8 processors gives us 5.19 times speedup for MPEG2 encoding, 5.12 times speedup for MPEG2 decoding, 3.69 times speedup for MP3 encoding, 4.32 times speedup for JPEG 2000 encoding against the sequential execution.

CiNii
Automatic Parallelization for Multimedia Applications on Multicore Processors

Takamichi Miyamoto, Saori Asaka, Nobuhito Kamakura, Hiromasa Yamauchi, Masayoshi Mase, Jun Shirako, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2007-ARC-171-13 2007 ( 4 ) 69 - 74 2007年01月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大、プロセッサ動作クロック周波数向上の鈍化、ハードウェア・ソフトウェア開発期間の増大といった問題に対処すべく、一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが注目を集めている。また、携帯電話、デジタル TV、ゲーム等の情報家電上ではコーデック、グラフィックス等のマルチメディア処理の高速化が非常に重要となっている。本稿ではこのようなマルチメディアアプリケーションのマルチコアプロセッサ上での並列化について述べる。特に動画像処理の例として MPEG2 エンコード、MPEG2 デコード、音声処理の例として MP3 エンコード、静止画処理の例として JPEG2000 エンコ－ドの OSCAR マルチグレイン自動並列化コンパイラをもちいたマルチコア上での並列処理について述べる。各マルチメディア処理の並列処理を OSCAR マルチコアプロセッサ、IBM p5 550Q Power+ 2 コア集積マルチコアプロセッサベース SMP サーバ上で評価を行った。OSCAR マルチコアプロセッサ上では、逐次処理に対して、提案するローカルメモリ最適化、データ転送最適化を伴う並列化手法により4プロセッサでの並列処理では、MPEG2 エンコードで3.81倍、MPEG2 デコードで3.04倍、MP3 エンコードで3.09倍、JPEG 2000 エンコードで3.79倍の速度向上が得られた。IBM p5 550Q 上では、逐次処理に対して OSCAR コンパイラによる8プロセッサでの並列処理では、MPEG2 エンコードで5.19倍、MPEG2 デコードで5.12倍、MP3 エンコードで3.69倍、JPEG 2000 エンコードで4.32倍の速度向上が得られた。Multicore processors have attracted much attention to handle the increase of power consumption along with the increase of integration degree of semiconductor devices, the slowdown of improvement of processor clocks, and the increase of hardware/software developing period. Also, speeding up multimedia applications is required with the progress of the consumer electronics like mobile phones, digital TV and games. This paper describes parallelization methods of multimedia applications on the multicore processors. Especially in this paper, MPEG2 encoding and MPEG2 decoding are selected as examples of video sequence processing, MP3 encoding is selected as an example of audio processing, JPEG 2000 encoding is selected as an example of picture processing. OSCAR multigrain parallelizing compiler automatically parallelizes these media applications. This paper evaluates parallel processing performances of these multimedia applications on the OSCAR multicore processor, and the IBM p5 550Q Power5+ 8 processors SMP server. On the OSCAR multicore processor, the parallel execution with the proposed method of managing local memory and optimizing data transfer using 4 processors, gives us 3.81 times speedup for MPEG2 encoding, 3.04 times speedup for MPEG2 decoding, 3.09 times speedup for MP3 encoding, 3.79 times speedup for JPEG 2000 encoding against the sequential execution. On the IBM p5 550Q Power5+ 8 processors server, the parallel execution using 8 processors gives us 5.19 times speedup for MPEG2 encoding, 5.12 times speedup for MPEG2 decoding, 3.69 times speedup for MP3 encoding, 4.32 times speedup for JPEG 2000 encoding against the sequential execution.

CiNii
独立に周波数制御可能な 4320MIPS、SMP/AMP対応 4プロセッサLSIの開発

早瀬清, 吉田裕, 亀井達也, 芝原真一, 西井修, 服部俊洋, 長谷川淳, 高田雅士, 入江直彦, 内山邦男, 小高俊彦, 高田究, 木村啓二, 笠原博徳

情報処理学会研究会報告2007-ARC-173-06（第165回計算機アーキテクチャ研究会） 100 - 590 2007年

DOI

Scopus

26

被引用数

(Scopus)
A 4320MIPS four-processor core SMP/AMP with individually managed clock frequency for low power consumption

Yutaka Yoshida, Tatsuya Kamei, Kiyoshi Hayase, Shinichi Shibahara, Osamu Nishii, Toshihiro Hattori, Atsushi Hasegawa, Masashi Takada, Naohiko Irie, Kunio Uchiyama, Toshihiko Odaka, Kiwamu Takada, Keiji Kimura, Hironori Kasahara

Digest of Technical Papers - IEEE International Solid-State Circuits Conference 95 - 590 2007年 [査読有り]

　概要を見る

A 4320MIPS four-core SoC that supports both SMP and AMP for embedded applications is designed in 90nm CMOS. Each processor-core can be operated with a different frequency dynamically including clock stop, while keeping data cache coherency, to maintain maximum processing performance and to reduce average operating power. The 97.6mm2 die achieves a floating-point performance of 16.8GFLOPS. © 2007 IEEE.

DOI

Scopus

26

被引用数

(Scopus)
Heterogeneous multiprocessor on a chip which enables 54x AAC-LC stereo encoding

Masaki Ito, Takashi Todaka, Takanobu Tsunoda, Hiroshi Tanaka, Tomoyuki Kodama, Hiroaki Shikano, Masafumi Onouchi, Kunio Uchiyama, Toshihiko Odaka, Tatsuya Kamei, Ei Nagahama, Manabu Kusaoke, Yusuke Nitta, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

2007 Symposium on VLSI Circuits, Digest of Technical Papers 18 - 19 2007年 [査読有り]

DOI

Scopus

7

被引用数

(Scopus)
OSCARコンパイラにおける制約付きCプログラムの自動並列化

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 深津幸二, 宮本孝道, 白子準, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-170-01(デザインガイア2006) 2006 ( 127 ) 1 - 6 2006年11月

　概要を見る

マルチプロセッサ、マルチコアアーキテクチャの普及に伴い、ハイパフォーマンスコンピューティング分野から組み込み分野に至る様々な分野で、その特性を引出し高実効性能・低消費電力を実現する自動並列化コンパイラの重要性が高まっている。本稿ではプログラム全域の並列性およびデータローカリティの有効利用が可能なマルチグレイン並列処理を実現する、OSCARコンパイラのC言語対応について述べる。OSCARコンパイラにおけるC言語対応を迅速に行うために制約付きC言語を定めた。MPEG2エンコード、MP3エンコード、AACエンコードの各メディアアプリケーション、組込み向けベンチマークMiBenchよりsusan（smoothing）、SPEC2000よりartについてC言語対応OSCARコンパイラによる自動並列化の初期性能評価を行い、８プロセッササーバであるIBM p5 550上でIBM XL Cコンパイラversion 8.0の逐次処理と比較してsusan（smoothing）で最大7.49倍、４プロセッサワークステーションであるSun Ultra80上でSun Studio 9 Cコンパイラの逐次処理と比較してsusan(smoothing)で最大3.75倍の速度向上が得られた。Along with the popularization of multiprocessors and multicore architectures, automatic parallelizing compiler, which can realize high effective performance and low power comsumption, becomes more and more important in various areas from high performance computing to embedded computing. OSCAR compiler realizes multigrain automatic parallelization, which can exploit parallelism and data locality from the whole of the program. This paper describes C language support in OSCAR compiler. For rapid support of C language, restricted C language is proposed. In the preliminary performance evaluation of automatic parallelization using following media applications as MPEG2 encode, MP3 encode, and AAC encode, Susan (smoothing) derived from MiBench, and Art from SPEC2000, OSCAR compiler achieved 7.49 times speed up in maximum for susan (smoothing) against sequential execution on IBM p5 550 server having 8 processors, and 3.75 times speed up in maximum for susan (smoothing) too against sequential execution on Sun Ultra80 workstation having 4 processors.

CiNii J-GLOBAL
SMPサーバ及び組込み用マルチコア上でのOSCARマルチグレイン自動並列化コンパイラの性能

白子準, 田川友博, 三浦剛, 宮本孝道, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-170-02(デザインガイア2006) 2006 ( 127 ) 7 - 12 2006年11月

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上、低消費電力、価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている。このようなマルチコアプロセッサの性能を最大限に引き出し、ソフトウェア/ハードウェア開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす。本論文ではループ並列処理に加え、粗粒度タスク並列処理・近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCARマルチグレイン自動並列化コンパイラを用いた、最新SMPサーバ及び組込み組込み用マルチコアプロセッサ上での性能評価について述べる。OSCARコンパイラではプログラム中の各部分に対する適切な処理プロセッサ数と並列処理手法の決定、複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている。SPEC CFP95ベンチマーク全10本とCFP2000ベンチマーク4本を用いた性能評価において、OSCARコンパイラはIBM p5 550Q Power+8 プロセッササーバ上でIBM XL Fortran コンパイラ version 10.1の自動並列化性能に比べ平均2.74倍、IBM pSeries690 Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ version 8.1 の自動並列化性能に比べ平均4.82倍の性能向上が得られた。またNEC/ARM MPCore ARMv6 4 プロセッサ集積組込み用マルチコアにおいて、OpenMP API の一部機能をサポートすることでOSCARコンパイラによる自動並列化を実現した。組込み用途を考慮しデータセットを縮小したSPEC CFP95 を用いた評価において、逐次処理に比べtomcatv で4.08倍、swim で3.90倍、su2cor で2.21倍、hydro2d で3.53倍、mgrid で3.85倍、applu で3.62倍、turb3d で3.20倍の性能向上が得られた。Currently, multiprocessor systems, especially multicore processors, are attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. This paper describes the execution performance of OSCAR multigrain parallelizing compiler using coarse grain task parallelization and near fine grain parallelization in addition to loop parallelization, on the latest SMP servers and a SMP embedded multicore. The OSCAR compiler has realized the automatic determination of parallelizing layer, which decides the suitable number of processors and parallelizing technique for each nested part of the program, and global cache memory optimization over loops and coarse grain tasks. In the performance evaluation using 10 SPEC CFP95 benchmark programs and 4 SPEC CFP2000, OSCAR compiler gave us 2.74 times speedup compared with IBM XL Fortran compiler 10.1 on IBM p5550Q Power5+ 8 processors server, 4.82 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server. OSCAR compiler can be also applied for NEC/ARM MPCore ARMv6 4 processors low power embedded multicore, using subset of OpenMP libraries and g77 compiler. In the evaluation using SPEC CFP95 benchmarks with reduced data sets, OSCAR compiler achieved 4.08 times speedup for tomcatv, 3.90 times speedup for swim, 2.21 times speedup for su2cor, 3.53 times speedup for hydro2d, 3.85 times speedup for mgrid, 3.62 times speedup for applu and 3.20 times speedup for turb3d against the sequential execution.

CiNii J-GLOBAL
SMPサーバ及び組込み用マルチコア上でのOSCARマルチグレイン自動並列化コンパイラの性能

白子準, 田川友博, 三浦剛, 宮本孝道, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-170-02(デザインガイア2006) 2006 ( 127 ) 7 - 12 2006年11月 [査読有り]

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上、低消費電力、価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている。このようなマルチコアプロセッサの性能を最大限に引き出し、ソフトウェア/ハードウェア開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす。本論文ではループ並列処理に加え、粗粒度タスク並列処理・近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCARマルチグレイン自動並列化コンパイラを用いた、最新SMPサーバ及び組込み組込み用マルチコアプロセッサ上での性能評価について述べる。OSCARコンパイラではプログラム中の各部分に対する適切な処理プロセッサ数と並列処理手法の決定、複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている。SPEC CFP95ベンチマーク全10本とCFP2000ベンチマーク4本を用いた性能評価において、OSCARコンパイラはIBM p5 550Q Power+8 プロセッササーバ上でIBM XL Fortran コンパイラ version 10.1の自動並列化性能に比べ平均2.74倍、IBM pSeries690 Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ version 8.1 の自動並列化性能に比べ平均4.82倍の性能向上が得られた。またNEC/ARM MPCore ARMv6 4 プロセッサ集積組込み用マルチコアにおいて、OpenMP API の一部機能をサポートすることでOSCARコンパイラによる自動並列化を実現した。組込み用途を考慮しデータセットを縮小したSPEC CFP95 を用いた評価において、逐次処理に比べtomcatv で4.08倍、swim で3.90倍、su2cor で2.21倍、hydro2d で3.53倍、mgrid で3.85倍、applu で3.62倍、turb3d で3.20倍の性能向上が得られた。Currently, multiprocessor systems, especially multicore processors, are attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. This paper describes the execution performance of OSCAR multigrain parallelizing compiler using coarse grain task parallelization and near fine grain parallelization in addition to loop parallelization, on the latest SMP servers and a SMP embedded multicore. The OSCAR compiler has realized the automatic determination of parallelizing layer, which decides the suitable number of processors and parallelizing technique for each nested part of the program, and global cache memory optimization over loops and coarse grain tasks. In the performance evaluation using 10 SPEC CFP95 benchmark programs and 4 SPEC CFP2000, OSCAR compiler gave us 2.74 times speedup compared with IBM XL Fortran compiler 10.1 on IBM p5550Q Power5+ 8 processors server, 4.82 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server. OSCAR compiler can be also applied for NEC/ARM MPCore ARMv6 4 processors low power embedded multicore, using subset of OpenMP libraries and g77 compiler. In the evaluation using SPEC CFP95 benchmarks with reduced data sets, OSCAR compiler achieved 4.08 times speedup for tomcatv, 3.90 times speedup for swim, 2.21 times speedup for su2cor, 3.53 times speedup for hydro2d, 3.85 times speedup for mgrid, 3.62 times speedup for applu and 3.20 times speedup for turb3d against the sequential execution.

CiNii
OSCARコンパイラにおける制約付きCプログラムの自動並列化

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 深津幸二, 宮本孝道, 白子準, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-170-01(デザインガイア2006) 2006 ( 127 ) 1 - 6 2006年11月 [査読有り]

　概要を見る

マルチプロセッサ、マルチコアアーキテクチャの普及に伴い、ハイパフォーマンスコンピューティング分野から組み込み分野に至る様々な分野で、その特性を引出し高実効性能・低消費電力を実現する自動並列化コンパイラの重要性が高まっている。本稿ではプログラム全域の並列性およびデータローカリティの有効利用が可能なマルチグレイン並列処理を実現する、OSCARコンパイラのC言語対応について述べる。OSCARコンパイラにおけるC言語対応を迅速に行うために制約付きC言語を定めた。MPEG2エンコード、MP3エンコード、AACエンコードの各メディアアプリケーション、組込み向けベンチマークMiBenchよりsusan（smoothing）、SPEC2000よりartについてC言語対応OSCARコンパイラによる自動並列化の初期性能評価を行い、８プロセッササーバであるIBM p5 550上でIBM XL Cコンパイラversion 8.0の逐次処理と比較してsusan（smoothing）で最大7.49倍、４プロセッサワークステーションであるSun Ultra80上でSun Studio 9 Cコンパイラの逐次処理と比較してsusan(smoothing)で最大3.75倍の速度向上が得られた。Along with the popularization of multiprocessors and multicore architectures, automatic parallelizing compiler, which can realize high effective performance and low power comsumption, becomes more and more important in various areas from high performance computing to embedded computing. OSCAR compiler realizes multigrain automatic parallelization, which can exploit parallelism and data locality from the whole of the program. This paper describes C language support in OSCAR compiler. For rapid support of C language, restricted C language is proposed. In the preliminary performance evaluation of automatic parallelization using following media applications as MPEG2 encode, MP3 encode, and AAC encode, Susan (smoothing) derived from MiBench, and Art from SPEC2000, OSCAR compiler achieved 7.49 times speed up in maximum for susan (smoothing) against sequential execution on IBM p5 550 server having 8 processors, and 3.75 times speed up in maximum for susan (smoothing) too against sequential execution on Sun Ultra80 workstation having 4 processors.

CiNii
Performance of OSCAR Multigrain Parallelizing Compiler on SMP Servers and Embedded Multicore

Jun Shirako, Tomohiro Tagawa, Tsuyoshi Miura, Takamichi Miyamoto, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2006-ARC-170-02/ (DesignGaia2006) 2006 ( 127 ) 7 - 12 2006年11月 [査読有り]

　概要を見る

半導体集積度向上に伴うスケーラブルな性能向上、低消費電力、価格性能を達成するためにマルチコアプロセッサが大きな注目を集めている。このようなマルチコアプロセッサの性能を最大限に引き出し、ソフトウェア/ハードウェア開発期間を短縮するためには自動並列化コンパイラが重要な役目を果たす。本論文ではループ並列処理に加え、粗粒度タスク並列処理・近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCARマルチグレイン自動並列化コンパイラを用いた、最新SMPサーバ及び組込み組込み用マルチコアプロセッサ上での性能評価について述べる。OSCARコンパイラではプログラム中の各部分に対する適切な処理プロセッサ数と並列処理手法の決定、複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている。SPEC CFP95ベンチマーク全10本とCFP2000ベンチマーク4本を用いた性能評価において、OSCARコンパイラはIBM p5 550Q Power+8 プロセッササーバ上でIBM XL Fortran コンパイラ version 10.1の自動並列化性能に比べ平均2.74倍、IBM pSeries690 Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ version 8.1 の自動並列化性能に比べ平均4.82倍の性能向上が得られた。またNEC/ARM MPCore ARMv6 4 プロセッサ集積組込み用マルチコアにおいて、OpenMP API の一部機能をサポートすることでOSCARコンパイラによる自動並列化を実現した。組込み用途を考慮しデータセットを縮小したSPEC CFP95 を用いた評価において、逐次処理に比べtomcatv で4.08倍、swim で3.90倍、su2cor で2.21倍、hydro2d で3.53倍、mgrid で3.85倍、applu で3.62倍、turb3d で3.20倍の性能向上が得られた。Currently, multiprocessor systems, especially multicore processors, are attracting much attention for performance, low power consumption and short hardware/software development period. To take the full advantage of multiprocessor systems, parallelizing compilers serve important roles. This paper describes the execution performance of OSCAR multigrain parallelizing compiler using coarse grain task parallelization and near fine grain parallelization in addition to loop parallelization, on the latest SMP servers and a SMP embedded multicore. The OSCAR compiler has realized the automatic determination of parallelizing layer, which decides the suitable number of processors and parallelizing technique for each nested part of the program, and global cache memory optimization over loops and coarse grain tasks. In the performance evaluation using 10 SPEC CFP95 benchmark programs and 4 SPEC CFP2000, OSCAR compiler gave us 2.74 times speedup compared with IBM XL Fortran compiler 10.1 on IBM p5550Q Power5+ 8 processors server, 4.82 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server. OSCAR compiler can be also applied for NEC/ARM MPCore ARMv6 4 processors low power embedded multicore, using subset of OpenMP libraries and g77 compiler. In the evaluation using SPEC CFP95 benchmarks with reduced data sets, OSCAR compiler achieved 4.08 times speedup for tomcatv, 3.90 times speedup for swim, 2.21 times speedup for su2cor, 3.53 times speedup for hydro2d, 3.85 times speedup for mgrid, 3.62 times speedup for applu and 3.20 times speedup for turb3d against the sequential execution.

CiNii
Automatic Parallelization of Restricted C Progurams in OSCAR Compiler

Masayoshi Mase, Daisuke Baba, Harumi Nagayama, Hiroaki Tano, Takeshi Masuura, Koji Fukatsu, Takamichi Miyamoto, Jun Shirako, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2006-ARC-170-01/ (DesignGaia2006) 2006 ( 127 ) 1 - 6 2006年11月 [査読有り]

　概要を見る

マルチプロセッサ、マルチコアアーキテクチャの普及に伴い、ハイパフォーマンスコンピューティング分野から組み込み分野に至る様々な分野で、その特性を引出し高実効性能・低消費電力を実現する自動並列化コンパイラの重要性が高まっている。本稿ではプログラム全域の並列性およびデータローカリティの有効利用が可能なマルチグレイン並列処理を実現する、OSCARコンパイラのC言語対応について述べる。OSCARコンパイラにおけるC言語対応を迅速に行うために制約付きC言語を定めた。MPEG2エンコード、MP3エンコード、AACエンコードの各メディアアプリケーション、組込み向けベンチマークMiBenchよりsusan（smoothing）、SPEC2000よりartについてC言語対応OSCARコンパイラによる自動並列化の初期性能評価を行い、８プロセッササーバであるIBM p5 550上でIBM XL Cコンパイラversion 8.0の逐次処理と比較してsusan（smoothing）で最大7.49倍、４プロセッサワークステーションであるSun Ultra80上でSun Studio 9 Cコンパイラの逐次処理と比較してsusan(smoothing)で最大3.75倍の速度向上が得られた。Along with the popularization of multiprocessors and multicore architectures, automatic parallelizing compiler, which can realize high effective performance and low power comsumption, becomes more and more important in various areas from high performance computing to embedded computing. OSCAR compiler realizes multigrain automatic parallelization, which can exploit parallelism and data locality from the whole of the program. This paper describes C language support in OSCAR compiler. For rapid support of C language, restricted C language is proposed. In the preliminary performance evaluation of automatic parallelization using following media applications as MPEG2 encode, MP3 encode, and AAC encode, Susan (smoothing) derived from MiBench, and Art from SPEC2000, OSCAR compiler achieved 7.49 times speed up in maximum for susan (smoothing) against sequential execution on IBM p5 550 server having 8 processors, and 3.75 times speed up in maximum for susan (smoothing) too against sequential execution on Sun Ultra80 workstation having 4 processors.

CiNii
最先端のコンピュータアーキテクチャ −経済産業省／ＮＥＤＯリアルタイム情報家電用マルチコアプロジェクトを中心として−

笠原博徳

東京電力EWE講演会2006 2006年10月 [査読有り]
最先端マルチコアコンパイラとその並列化・低消費電力化性能

笠原博徳

アーム株式会社 ARMセミナー2006 2006年10月 [査読有り]
Multi-core Parallelizing Compiler for Low Power High Performance Computing

Hironori Kasahara

University of Illinois at Urbana-Champaign, Hosted by Prof. David Padua 2006年10月 [査読有り]
Advanced Computer Architecture: METI/NEDO Multicore-processor Technology for Real-time Consumer Electronics Project

Hironori Kasahara

Tokyo Electric Power Company EWE Seminor 2006 2006年10月 [査読有り]
Advanced Multi-core Compiler and Its Parallelization and Power Reduction Performance

Hironori Kasahara

ARM Seminar 2006 2006年10月 [査読有り]
C Language Support in OSCAR Multigrain Parallelizing Compiler using CoSy

Masayoshi Mase, Keiji Kimura, Hironori Kasahara

ACE 2nd CoSy Community Gathering 2006年10月 [査読有り]
マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法

白子準, 吉田宗弘, 押山直人, 和田康孝, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム 47 ( SIG12(ACS15) ) 147 - 158 2006年09月 [査読有り]
Software Challenges in Multi-Core Chip Era (Panel Discussion)

Guang R. Gao, Kasahara Hironori, Vivek Sarkar, Skevos Evripidou, Murphy Brian

Workshop on Software Challenges for Multicore Architectures(Tshinghua Univ. Beijing, China) 2006年09月 [査読有り]
OSCAR Multigrain Parallelizing Compiler for Multicore Architectures

Hironori Kasahara

Workshop on Software Challenges for Multicore Architectures(Tshinghua Univ. Beijing, China) 2006年09月 [査読有り]
並列化コンパイラ協調型チップマルチプロセッサ技術

笠原博徳, 木村啓二, 白子準, 和田康孝, 中野啓史, 宮本孝道

STARCシンポジウム2006 2006年09月 [査読有り]
Parallelizing Compiler Cooperative Chip Multiprocessor Technology

Hironori Kasahara, Keiji Kimura, Jun Shirako, Yasutaka Wada, Hirofumi Nakano, Takamichi Miyamoto

STARC Symposium 2006 2006年09月 [査読有り]
証明数・反証数を用いた反復深化法における複数経路並行探索の並列化

鷹野芙美代, 前川仁孝, 笠原博徳, 成田誠之助

情報処理学会研究会報告2006-HPC-103-17(SWoPP高知2006) 2006 ( 87(HPC-107) ) 2006年08月

J-GLOBAL
OSCARマルチコア上でのローカルメモリ管理手法

中野啓史, 仁藤拓実, 丸山貴紀, 中川正洋, 鈴木裕貴, 内藤陽介, 宮本孝道, 和田康孝, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-169-28(SWoPP高知2006) 2006 ( 88(ARC-169) ) 2006年08月

J-GLOBAL
並列化コンパイラの最新動向

笠原博徳

日本IBM 先駆的科学計算に関するフォーラム2006 2006年08月 [査読有り]
証明数・反証数を用いた反復深化法における複数経路並行探索の並列化

鷹野芙美代, 前川仁孝, 笠原博徳, 成田誠之助

情報処理学会研究会報告2006-HPC-103-17(SWoPP高知2006) 2006年08月 [査読有り]
OSCARマルチコア上でのローカルメモリ管理手法

中野啓史, 仁藤拓実, 丸山貴紀, 中川正洋, 鈴木裕貴, 内藤陽介, 宮本孝道, 和田康孝, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-169-28(SWoPP高知2006) 2006年08月 [査読有り]
Parallelization of Multi-Path Concurrent Search for Iterative Deepening using Proof and Disproof Numbers

Fumiyo Takano, Yoshitaka Maekawa, Hironori Kasahara, Seinosuke Narita

Technical Report of IPSJ, 2006-HPC-103-17/ (SWoPP2006) 2006年08月 [査読有り]
Local Memory Management on OSCAR Multicore

Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Masahiro Nakagawa, Yuki Suzuki, Yosuke Naito, Takamichi Miyamoto, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2006-ARC-169-28/ (SWoPP2006) 2006年08月 [査読有り]
情報家電用マルチコアと並列化コンパイラ

笠原博徳

JEITAマイクロプロセッサ専門委員会講演会「マルチコアアーキテクチャの研究開発動向及び将来展望」 2006年08月 [査読有り]
Multicores for Consumer Electronics and Parallelizing Compilers

Hironori Kasahara

JEITA SIG. on Microprocessor 2006年08月 [査読有り]
The Latest Trend of Parallelizing Compiler

Hironori Kasahara

IBM Japan Forum on Pioneering Scientific Computing 2006年08月 [査読有り]
イノベーション創出を目指した産官学連携と人材育成の試み（「イノベーションの創出に向けた産学官連携の推進と人材の育成」パネリスト）

笠原博徳

第５回産学官連携推進会議分科会 2006年06月 [査読有り]
Trial s of Collaboration among Business, Academia and Governmentand Human Resource Development for Creation of Innovations(Panel on the Promotion of Collaboration among Business, Academia and Government and Human Resource Development for Creation of Innovations)

Hironori Kasahara

5th Conference for the Promotion of Collaboration Among Business, Academia, and Government (Section Meeting) 2006年06月 [査読有り]
Compiler Controle Power Saving Scheme for Multicore Processors

Jun Shirako, Munehiro Yoshida, Naoto Oshiyama, Yasutaka Wada, Hirofumi Nakano, Hiroaki Shikano, Keiji Kimura, Hironori Kasahara

Symposium on Advanced Computing Systems and Infrastructures (SACSIS 2006) 47 ( SIG12(ACS15) ) 147 - 158 2006年05月 [査読有り]

CiNii J-GLOBAL
マルチCPUアーキテクチャと並列化コンパイラ技術の動向（コンスーマー機器への応用）

笠原博徳

ソニー株式会社技術講演会 2006年05月 [査読有り]
Latest Trends of Multi-CPU Architectures and Parallelizing Compilers: Application for Consumer Electronics

Hironori Kasahara

Sony Technology seminar 2006年05月 [査読有り]
マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法

白子準, 吉田宗広, 押山直人, 和田康孝, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

SACSIS2006 - 先進的計算基盤システムシンポジウム 2006年05月 [査読有り]
Performance Evaluation of Heterogeneous Chip Multi-Processor with MP3 Audio Encoder

Hiroaki Shikano, Yuki Suzuki, Yasutaka Wada, Jun Shirako, Keiji Kimura, Hironori Kasahara

Proc. of IEEE Symposiumu on Low-Power and High Speed Chips (COOL Chips IX) 349 - 363 2006年04月 [査読有り]

CiNii
マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ方式

宮本孝道, 中川正洋, 浅野尚一郎, 内藤陽介, 仁藤拓実, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-167/HPC-105-10 (HOKKE2006) 2006 ( 20 ) 55 - 60 2006年02月

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ実質速度向上の鈍化，ハードウェア，ソフトウェア開発期間の増大といった問題を解決すべく，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが次世代プロセッサアーキテクチャとして注目を集めている．このマルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに伴うメモリウォールは深刻な問題であり，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために重要なポイントであり，それに伴い発生するデータ転送によるオーバヘッドを減少させなければならない．このような事項を考慮して筆者等は自動マルチグレイン並列化コンパイラとの協調動作により実効性能が高く価格性能比の良いコンピュータシステムの実現を目指すOSCARマルチコアプロセッサを提案している．このOSCARマルチコアプロセッサは，全てのプロセッサコアがアクセスできる集中共有メモリ(CSM) の他に，プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM) ，そしてデータ転送オーバヘッドの隠蔽を目指し，プロセッサコアと非同期に動作可能なデータ転送ユニット(DTU)を持つ．本稿ではOSCARコンパイラを用いた粗粒度タスク並列処理において，DTUを利用したデータ転送オーバラップを考慮したタスクスケジューリングアルゴリズムとデータ転送スケジューリング手法によるデータ転送オーバラップ手法について述べる．提案手法をOSCARコンパイラに組み込み，JPEG2000エンコーディングプログラムに適用して評価を行った結果，4PEではほとんど全てデータをローカルメモリに割り当てた1PEでの処理と比べ2.86倍の速度向上率が得られた．Along with the increase of integration degree of semiconductor devices, to overcome the increase of power consumption, the slowdown of improvement of processor effective performance, and the increase of period for hardware/software developing transistors integrated on to a chip, multicore processors, have attracted much attention as a next-generation microprocessor architecture. However, the memory wall caused by the gap between memory access speed and processor core speed is still a serious problem also on the multicore processors. Therefore, the effective use of fast memories like cache and local memory nearby processor is important for reducing large memory access overhead. Futhermore, hiding data transfer overhead among local or distributed shared memories of processors and centralized shared memory is important. On the memory architechture, the data transfer is specified. Considering these problems, the authors have proposed the OSCAR multicore processor architecture which cooperates with OSCAR multigrain parallelizing compiler and aims at developing a processor with high effective performance and good cost performance computer system. The OSCAR multicore processor has local data memory (LDM) for processor private data, distributed shared memory (DSM) having two ports for synchronization and data transfer among processor cores, centralized shared memory (CSM) to support dynamic task scheduling, and data transfer unit (DTU) which transfers data asynchronously and aims at overlapping data transfer overhead. This paper proposes and evaluates a static data transfer scheduling algorithm aiming at overlapping data transfer overhead. As the results, the proposed scheme controlled by OSCAR compiler gives us 2.86 times speedup using 4 processors for JPEG2000 encoding program against the ideal sequential execution assuming that the all data can be assigned to the local memory.

CiNii J-GLOBAL
マルチコアプロセッサ上での粗粒度タスク並列処理におけるデータ転送オーバラップ方式

宮本孝道, 中川正洋, 浅野尚一郎, 内藤陽介, 仁藤拓実, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究報告2006ARC-167-10(HOKKE2006) 2006年02月 [査読有り]
Data Transfer Overlap of Coarse Grain Task Parallel Processing on a Multicore Processor

Takamichi Miyamoto, Masahiro Nakagawa, Shoichiro Asano, Yosuke Naito, Takumi Nito, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2006-ARC-167/HPC-105-10 2006 ( 20 ) 55 - 60 2006年02月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ実質速度向上の鈍化，ハードウェア，ソフトウェア開発期間の増大といった問題を解決すべく，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが次世代プロセッサアーキテクチャとして注目を集めている．このマルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに伴うメモリウォールは深刻な問題であり，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために重要なポイントであり，それに伴い発生するデータ転送によるオーバヘッドを減少させなければならない．このような事項を考慮して筆者等は自動マルチグレイン並列化コンパイラとの協調動作により実効性能が高く価格性能比の良いコンピュータシステムの実現を目指すOSCARマルチコアプロセッサを提案している．このOSCARマルチコアプロセッサは，全てのプロセッサコアがアクセスできる集中共有メモリ(CSM) の他に，プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM) ，そしてデータ転送オーバヘッドの隠蔽を目指し，プロセッサコアと非同期に動作可能なデータ転送ユニット(DTU)を持つ．本稿ではOSCARコンパイラを用いた粗粒度タスク並列処理において，DTUを利用したデータ転送オーバラップを考慮したタスクスケジューリングアルゴリズムとデータ転送スケジューリング手法によるデータ転送オーバラップ手法について述べる．提案手法をOSCARコンパイラに組み込み，JPEG2000エンコーディングプログラムに適用して評価を行った結果，4PEではほとんど全てデータをローカルメモリに割り当てた1PEでの処理と比べ2.86倍の速度向上率が得られた．Along with the increase of integration degree of semiconductor devices, to overcome the increase of power consumption, the slowdown of improvement of processor effective performance, and the increase of period for hardware/software developing transistors integrated on to a chip, multicore processors, have attracted much attention as a next-generation microprocessor architecture. However, the memory wall caused by the gap between memory access speed and processor core speed is still a serious problem also on the multicore processors. Therefore, the effective use of fast memories like cache and local memory nearby processor is important for reducing large memory access overhead. Futhermore, hiding data transfer overhead among local or distributed shared memories of processors and centralized shared memory is important. On the memory architechture, the data transfer is specified. Considering these problems, the authors have proposed the OSCAR multicore processor architecture which cooperates with OSCAR multigrain parallelizing compiler and aims at developing a processor with high effective performance and good cost performance computer system. The OSCAR multicore processor has local data memory (LDM) for processor private data, distributed shared memory (DSM) having two ports for synchronization and data transfer among processor cores, centralized shared memory (CSM) to support dynamic task scheduling, and data transfer unit (DTU) which transfers data asynchronously and aims at overlapping data transfer overhead. This paper proposes and evaluates a static data transfer scheduling algorithm aiming at overlapping data transfer overhead. As the results, the proposed scheme controlled by OSCAR compiler gives us 2.86 times speedup using 4 processors for JPEG2000 encoding program against the ideal sequential execution assuming that the all data can be assigned to the local memory.

CiNii
ヘテロジニアスチップマルチプロセッサにおける粗粒度タスクスタティックスケジューリング手法

和田康孝, 押山直人, 鈴木裕貴, 内藤陽介, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-166-3 (SHINING2006) 2006 ( 8 ) 13 - 18 2006年01月

　概要を見る

本論文では，汎用プロセッサに加え，DRP（Dynamically Recofigurable Processor）やDSP（Digital Signal Processor）などのアクセラレータを1チップ上に複数集積したヘテロジニアスチップマルチプロセッサ上で，アクセラレータの利用による高い実効性能と動作周波数・電圧の制御による低消費電力化を実現する，各コアの特性を考慮した租粒度タスクスタティックスケジューリング手法を提案する．本手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，チップ上の各コアの種類や実行可能なタスクおよびコストを考慮した処理時間最小を目指したスタティックスケジューリング手法であり，その性能をMP3エンコーダに適用し評価した．今回の評価では，汎用プロセッサ4コアとアクセラレータとしてDRP2コアを搭載したヘテロジニアスチップマルチプロセッサを対象とした評価を行った結果，本手法を適用せず汎用プロセッサ1コアのみを用いて逐次実行した場合に対して，最大8.8倍の速度向上が得られることが確認できた．This paper proposes a static scheduling scheme for coarse grain tasks on a heterogeneous chip multi processor which integrates not only general purpose processors but also accelerators like DRP or DSP. A heterogeneous chip multi processor allows us to get high performance by using the accelerators and to save energy by frequency/voltage control by the compiler. In this scheme, the compiler aim to minimize the execution time of an application in consideration of the characteristic in each core. Performance of the proposed scheme is evaluated on a heterogeneous chip multi processor which has 4 general purpose processors and 2 accelerators using MP3 encoder and gives us 8.8 times speedup against sequencial execution without the poroposed scheme.

CiNii J-GLOBAL
MP3エンコーダを用いたヘテロジニアスチップマルチプロセッサの性能評価

鹿野裕明, 鈴木裕貴, 和田康孝, 白子準, 木村啓二, 笠原博徳

情報処理学会研究会報告2006-ARC-166-1 (SHINING2006) 2006 ( 8(ARC-166) ) 2006年01月

J-GLOBAL
並列化コンパイラ協調型低消費電力・高実効性能マルチコアプロセッサの動向

笠原博徳

情報処理学会研究会報告2006-ARC-166-6 (SHINING2006) 2006 ( 8 ) 31 - 36 2006年01月

CiNii J-GLOBAL
並列化コンパイラ協調型低消費電力・高実効性能マルチコアプロセッサの動向

笠原博徳

情報処理学会2006 ARC-166-6(SHINING2006) 2006年01月 [査読有り]
ヘテロジニアスチップマルチプロセッサにおける粗粒度タスクスタティックスケジューリング手法

和田康孝, 押山直人, 鈴木裕貴, 内藤陽介, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会2006 ARC-166-3(SHINING2006) 2006 ( 8 ) 13 - 18 2006年01月 [査読有り]

　概要を見る

本論文では，汎用プロセッサに加え，DRP（Dynamically Recofigurable Processor）やDSP（Digital Signal Processor）などのアクセラレータを1チップ上に複数集積したヘテロジニアスチップマルチプロセッサ上で，アクセラレータの利用による高い実効性能と動作周波数・電圧の制御による低消費電力化を実現する，各コアの特性を考慮した租粒度タスクスタティックスケジューリング手法を提案する．本手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，チップ上の各コアの種類や実行可能なタスクおよびコストを考慮した処理時間最小を目指したスタティックスケジューリング手法であり，その性能をMP3エンコーダに適用し評価した．今回の評価では，汎用プロセッサ4コアとアクセラレータとしてDRP2コアを搭載したヘテロジニアスチップマルチプロセッサを対象とした評価を行った結果，本手法を適用せず汎用プロセッサ1コアのみを用いて逐次実行した場合に対して，最大8.8倍の速度向上が得られることが確認できた．This paper proposes a static scheduling scheme for coarse grain tasks on a heterogeneous chip multi processor which integrates not only general purpose processors but also accelerators like DRP or DSP. A heterogeneous chip multi processor allows us to get high performance by using the accelerators and to save energy by frequency/voltage control by the compiler. In this scheme, the compiler aim to minimize the execution time of an application in consideration of the characteristic in each core. Performance of the proposed scheme is evaluated on a heterogeneous chip multi processor which has 4 general purpose processors and 2 accelerators using MP3 encoder and gives us 8.8 times speedup against sequencial execution without the poroposed scheme.

CiNii
MP3エンコーダを用いたヘテロジニアスチップマルチプロセッサの性能評価

鹿野裕明, 鈴木裕貴, 和田康孝, 白子準, 木村啓二, 笠原博徳

情報処理学会2006 ARC-166-1(SHINING2006) 2006年01月 [査読有り]
2.マルチコアにおけるプログラミング（「特集マルチコアにおけるソフトウェア」）

笠原博徳, 木村啓二

情報処理 47 ( 1 ) 17 - 23 2006年01月 [査読有り]

　概要を見る

Cellプロセッサは，汎用プロセッサコア1基とメディア処理用プロセッサコア8基を混載するヘテロマルチコアプロセッサである．その性能は，複数の高精細動画像を同時処理できる能力を十分に備えており，ソフトウェアによる複数ストリーム処理を可能にする．しかし，単にハードウェア処理をソフトウェア処理に置き替えただけでは，アプリケーションの開発コストが増大してしまうため，OSから開発ツールに至るまで，総合的なソフトウェア環境による開発サポートが必要不可欠である．

CiNii J-GLOBAL
1.マルチコア化するマイクロプロセッサ（「特集マルチコアにおけるソフトウェア」）

笠原博徳, 木村啓二

情報処理 47 ( 1 ) 10 - 16 2006年01月 [査読有り]

J-GLOBAL
Parallelizing Compiler Cooperated Low Power High Effective Performance Multi-core Processors

Hironori Kasahara

Technical Report of IPSJ,2006-ARC-166-6(SHINING2006) 2006年01月 [査読有り]
A Static Scheduling Scheme for Coarse Grain Tasks on a Heterogeneous Chip Multi Processor

Yasutaka Wada, Naoto Oshiyama, Yuki Suzuki, Yosuke Naito, Jun Shirako, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ,2006-ARC-166-3(SHINING2006) 2006 ( 8 ) 13 - 18 2006年01月 [査読有り]

　概要を見る

本論文では，汎用プロセッサに加え，DRP（Dynamically Recofigurable Processor）やDSP（Digital Signal Processor）などのアクセラレータを1チップ上に複数集積したヘテロジニアスチップマルチプロセッサ上で，アクセラレータの利用による高い実効性能と動作周波数・電圧の制御による低消費電力化を実現する，各コアの特性を考慮した租粒度タスクスタティックスケジューリング手法を提案する．本手法は，ループやサブルーチン，基本ブロック間の並列性を利用する粗粒度タスク並列処理において，チップ上の各コアの種類や実行可能なタスクおよびコストを考慮した処理時間最小を目指したスタティックスケジューリング手法であり，その性能をMP3エンコーダに適用し評価した．今回の評価では，汎用プロセッサ4コアとアクセラレータとしてDRP2コアを搭載したヘテロジニアスチップマルチプロセッサを対象とした評価を行った結果，本手法を適用せず汎用プロセッサ1コアのみを用いて逐次実行した場合に対して，最大8.8倍の速度向上が得られることが確認できた．This paper proposes a static scheduling scheme for coarse grain tasks on a heterogeneous chip multi processor which integrates not only general purpose processors but also accelerators like DRP or DSP. A heterogeneous chip multi processor allows us to get high performance by using the accelerators and to save energy by frequency/voltage control by the compiler. In this scheme, the compiler aim to minimize the execution time of an application in consideration of the characteristic in each core. Performance of the proposed scheme is evaluated on a heterogeneous chip multi processor which has 4 general purpose processors and 2 accelerators using MP3 encoder and gives us 8.8 times speedup against sequencial execution without the poroposed scheme.

CiNii
Preliminary Evaluation of Heterogeneous Chip Multi-Processor with MP3 Audio Encoder

Hiroaki Shikano, Yuki Suzuki, Yasutaka Wada, Jun Shirako, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ,2006-ARC-166-1(SHINING2006) 2006 ( 8 ) 1 - 6 2006年01月 [査読有り]

　概要を見る

汎用プロセッサや専用プロセッサ，アクセラレータなど，様々な種類のプロセッサエレメント(PE)を複数個同一チップ上に集積し，処理を並列で行うことで，動作周波数を向上させなくとも高い演算性能を得ることが可能なソフトウェア協調ヘテロジニアスマルチプロセッサ (HCMP) を提案する．本プロセッサは各PEにローカルメモリ，データ転送機構及び電力制御機構を持ち，コンパイラと協調することで，性能向上と低電力の両立を狙う．今回，MP3エンコーダを評価対象とし，その並列処理方式と電力制御方式を検討し，HCMP上での机上評価を実施した．その結果，汎用プロセッサコア3個，動的再構成プロセッサコア2個を搭載したHCMPは，汎用プロセッサ1個のシングルコアプロセッサと比較して16.3倍，汎用プロセッサ5個を搭載したホモジニアスマルチコアプロセッサと比較して4.0倍の速度向上となった．また，電力制御を実施することにより，24%の電力削減効果を期待できる結果となった．This paper proposes a heterogeneous chip multi-processor (HCMP) that possesses different types of processing elements (PEs) such as CPUs as general-purpose processors, as well as digital signal processors or dynamic reconfigurable processors (DRPs) as special-purpose processors. The HCMP realizes higher performance than conventional single-core processors or even homogeneous multi-processors in some specific applications such as media processing, with low operating frequency supplied, which results in lower power consumption. In this paper, the performance of the HCMP is analyzed by studying parallelizing scheme and power control scheme of an MP3 audio encoding program and by scheduling the program onto the HCMP using these two schemes. As a result, it is confirmed that an HCMP, consisting of three CPUs and two DRPs, outperforms a single-core processor with one CPU by a speed-up factor of 16.3, and a homogeneous multi-processor with 5 CPUs by a speed-up factor of 4.0. It is also confirmed that the power control on the HCMP results in 24 % power reduction.

CiNii
Parallelizing Compilation Scheme for Reduction of Power Consumption of Chip Multiprocessors

Jun Shirako, Naoto Oshiyama, Yasutaka Wada, Hiroaki Shikano, Keiji Kimura, Hironori Kasahara

Proc. of 12th Workshop on Compilers for Parallel Computers (CPC 2006) 426 - 440 2006年01月 [査読有り]
2.Programing for Multicore Systems

Hironori Kasahara, Keiji Kimura

IPSJ MAGAZINE 47 ( 1 ) 17 - 23 2006年01月 [査読有り]
1.Multicores Emerge as Next Generation Microprocessors

Hironori Kasahara, Keiji Kimura

IPSJ MAGAZINE 47 ( 1 ) 10 - 16 2006年01月 [査読有り]

CiNii
Compiler control power saving scheme for multi core processors

Shirako, J., Oshiyama, N., Wada, Y., Shikano, H., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 4339 LNCS 362 - 376 2006年 [査読有り]

DOI

Scopus

19

被引用数

(Scopus)
Data Localization on a Multicore Processor

Hiforumi Nakano, Shoichiro Asano, Yosuke Naito, Takumi Nito, Tomohiro Tagawa, Takaumichi Miyamoto, Takeshi Kodaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2005-ARC-165-10 2005 ( 120(ARC-165) ) 51 - 56 2005年12月 [査読有り]

J-GLOBAL
マルチコアプロセッサ上でのデータローカライゼーション

中野啓文, 浅野尚一郎, 内藤陽介, 仁藤拓実, 田川友博, 宮本孝道, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究会報告2005-ARC-165-10 51 - 56 2005年11月 [査読有り]
マルチコアプロセッサ上でのデータローカライゼーション

中野啓文, 浅野尚一郎, 内藤陽介, 仁藤拓実, 田川友博, 宮本孝道, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究会報告2005-ARC-165-10 2005 ( 120 ) 51 - 56 2005年11月 [査読有り]

　概要を見る

半導体集積度向上に伴う消費電力の増大，プロセッサ実質速度向上の鈍化，ハードウェア，ソフトウェア開発期間の増大といった問題を解決すべく，一つのチップ上に複数のプロセッサコアを集積するマルチコアプロセッサが次世代プロセッサアーキテクチャとして注目を集めている．このマルチコアプロセッサにおいても，プロセッサとメモリ動作速度のギャップに伴うメモリウォールは深刻な問題であり，プロセッサに近接したキャッシュやローカルメモリ等の高速メモリの有効利用が実効性能向上のために重要なポイントとなっている．このような事項を考慮して筆者等は自動マルチグレイン並列化コンパイラとの協調動作により実効性能が高く価格性能比の良いコンピュータシステムの実現を目指すOSCARマルチコアプロセッサを提案している．このOSCARマルチコアプロセッサは，全てのプロセッサコアがアクセスできる集中共有メモリ(CSM) の他に，プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM) ，そしてデータ転送オーバヘッドの隠蔽を目指し，プロセッサコアと非同期に動作可能なデータ転送ユニット(DTU)を持つ．本稿ではOSCARコンパイラを用いた粗粒度タスク並列処理におけるデータローカライゼーション手法とLDM管理手法について述べる．提案手法をMPEG2エンコーダに適用して評価を行った結果，逐次実行に比べ，8PEで約8.01倍の速度向上率が得られた．Along with the increase of integration degree of semiconductor devices, to overcome the increase of power consumption, the slowdown of improvement of processor effective performance, and the increase of period for hardware/software developing transistors integrated on to a chip, multicore processors, which integrate multiple processor cores on a single chip, have attracted much attention as a next-generation microprocessor architecture. However, the memory wall caused by the gap between memory access speed and processor core speed is still a serious problem also on the multicore processors. Therefore the effective use of fast memories like cache and local memory nearby a processor is important. Considering these problems, the authors have proposed the OSCAR multicore processor architecture which cooperates with OSCAR multigrain parallelizing compiler and aims at developing a processor with high effective performance and good cost performance computer system. The OSCAR multicore processor has local data memory (LDM) for processor private data, distributed shared memory (DSM) having two ports for synchronization and data transfer among processor cores, centralized shared memory (CSM) to support dynamic task scheduling, and data transfer unit (DTU) which transfers data asynchronously and aims at overlapping data transfer overhead. This paper describes data localization scheme that aimed at improving the effective use of LDM using coarse grain parallel processing and compiler-controlled LDM management scheme. As the results, the proposed scheme gives us 8.01 times speedup for MPEG2 encoding program against the sequential execution on 8 processors automatically.

CiNii
ホモジニアスマルチコアにおけるコンパイラ制御低消費電力化手法

白子準, 押山直人, 和田康孝, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2005-ARC-164-10(SwoPP2005) 55 - 60 2005年09月 [査読有り]
チップマルチプロセッサ上でのMPEG2エンコードの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会論文誌 46 ( 9 ) 2311 - 2325 2005年09月 [査読有り]
Parallel Processing of MPEG2 Encoding on a Chip Multiprocessor Architecture

Takeshi Kodaka, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Trans. of IPSJ 46 ( 9 ) 2311 - 2325 2005年09月 [査読有り]

J-GLOBAL
並列化コンパイラ協調型チップマルチプロセッサ技術

笠原博徳, 木村啓二, 中野啓史, 白子準, 宮本孝道, 和田康孝

STARCシンポジウム2005 2005年09月 [査読有り]
ホモジニアスマルチコアにおけるコンパイラ制御低消費電力化手法

白子準, 押山直人, 和田康孝, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会研究会報告2005-ARC-164-10(SwoPP2005) 55 - 60 2005年08月
組み込みマルチコア用コンパイラ技術

笠原博徳

アーム株式会社 ARMセミナー2005 2005年06月 [査読有り]
Compiler technology for built-in multi-core processor

H. Kasahara

ARM Seminar 2005, Tokyo 2005年06月 [査読有り]
最先端の高性能コンピュータ

笠原博徳

文部科学省科学技術振興調整費新興分野人材養成プログラム「ナノ・IT・バイオ知財経営戦略スキルアッププログラム」特別講座「先端技術と知的財産①ナノ・IT編」 2005年05月 [査読有り]
コンピュータ分野のロードマップ

笠原博徳

NEDO 電子・情報技術ロードマップ成果報告会 2005年05月 [査読有り]
Road map of the ｃomputer area

H. Kasahara

NEDO Electronics and Information Technology Road map Accomplishment Report Symposium, Tokyo 2005年05月 [査読有り]
Advanced High-Performance Computer

H. Kasahara

Lecture on 'Advanced technology and intellectual property in Nano and IT', Program for cultivation of people in new fields of study 'Upskilling program for Nano, IT, Bio - Intellectual Property Management Strategy', Promotion Budget for Science and Techno 2005年05月 [査読有り]
Hierarchical parallelism control for multigrain parallel processing

Obata, M., Shirako, J., Kaminaga, H., Ishizaka, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2481 LNCS 31 - 44 2005年 [査読有り]

DOI

Scopus

18

被引用数

(Scopus)
並列度を考慮した標準タスクグラフセットを用いた実行時間最小マルチプロセッサスケジューリングアルゴリズムの性能評価

松澤能成, 坂井田真也, 飛田高雄, 笠原博徳

情報処理学会研究報告ARC2005-161-9 (SHINING2005) 2005 ( 7(ARC-161) ) 2005年01月

J-GLOBAL
共有メモリ型マルチプロセッササーバ上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価

白子準, 宮本孝道, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2005-161-5 (SHINING2005) 2005 ( 7 ) 21 - 26 2005年01月

　概要を見る

マルチプロセッサシステムの普及に伴い，実効性能，システム価格性能比，ソフトウェア生産性向上のため高性能な自動並列化コンパイラの重要性が高まっている．しかしながら並列処理技術において広く利用されているループ並列処理手法は既に成熟期に至り，今後の大幅な性能向上実現のためには従来とは異なる並列化手法の利用が必須である．本論文ではループ並列処理に加え，基本ブロック，ループ，サブルーチンといった粗粒度タスク間の並列性を利用する粗粒度タスク並列処理・基本ブロック内ステートメントレベルの並列性を用いる近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCAR マルチグレイン自動並列化コンパイラの性能評価について述べる．OSCAR コンパイラではプログラムの形状や並列性に応じた適切な処理プロセッサ数や各並列処理粒度の決定，複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている．SPEC95FP を用いた本性能評価においてOSCAR コンパイラは，IBM pSeries690Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ 8.1 の自動並列化性能に比べ平均4.78 倍，SGI Altix3700 Itanium2 16 プロセッササーバ上においてIntel Fortran Itanium Compiler 7.1 に比べ平均2.40 倍，Sun Fire V880 Ultra SPARC III Cu 8 プロセッササーバ上においてSun Forteコンパイラ 7.1 に比べ平均1.90 倍の性能向上が得られた．The needs for automatic parallelizing compilers are getting larger with widly use of multiprocessor systems.However, the loop parallelization techniques are almost matured and new generation of parallelization methods like multi-grain parallelization are required to achieve higher effective performance. This paper describes the performance of OSCAR multigrain parallelizing compiler that uses the coarse grain task parallelization and the near fine grain parallelization in addition to the loop parallelization. OSCAR compiler realizes the following two important techniques. The first is the automatic determination scheme of parallelizing layer, which decides the number of processors and parallelizing technique for each part of the program. The other is global cache memory optimization among loops and coarse grain tasks. In the evaluation using SPEC95FP benchmarks, OSCAR compiler gave us 4.78 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server, 2.40 times speedup compared with Intel Fortran Itanium Compiler 7.1 on SGI Altix3700 Itanium2 16 processors server, 1.90 times speedup compared with Sun Forte compiler 7.1 on Sun Fire V880 Ultra SPARC III Cu 8 processors server.

CiNii J-GLOBAL
配列間接アクセスを用いないコード生成法を用いた電子回路シミュレーション手法の性能評価

黒田亮, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2005-161-1 (SHINING2005) 2005年01月
並列度を考慮した標準タスクグラフセットを用いた実行時間最小マルチプロセッサスケジューリングアルゴリズムの性能評価

松澤能成, 坂井田真也, 飛田高雄, 笠原博徳

情報処理学会研究報告ARC2005-161-5 (SHINING2005) 2005年01月 [査読有り]
共有メモリ型マルチプロセッササーバ上におけるOSCARマルチグレイン自動並列化コンパイラの性能評価

白子準, 宮本孝道, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2005-161-5 (SHINING2005) 2005 ( 7 ) 21 - 26 2005年01月 [査読有り]

　概要を見る

マルチプロセッサシステムの普及に伴い，実効性能，システム価格性能比，ソフトウェア生産性向上のため高性能な自動並列化コンパイラの重要性が高まっている．しかしながら並列処理技術において広く利用されているループ並列処理手法は既に成熟期に至り，今後の大幅な性能向上実現のためには従来とは異なる並列化手法の利用が必須である．本論文ではループ並列処理に加え，基本ブロック，ループ，サブルーチンといった粗粒度タスク間の並列性を利用する粗粒度タスク並列処理・基本ブロック内ステートメントレベルの並列性を用いる近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCAR マルチグレイン自動並列化コンパイラの性能評価について述べる．OSCAR コンパイラではプログラムの形状や並列性に応じた適切な処理プロセッサ数や各並列処理粒度の決定，複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている．SPEC95FP を用いた本性能評価においてOSCAR コンパイラは，IBM pSeries690Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ 8.1 の自動並列化性能に比べ平均4.78 倍，SGI Altix3700 Itanium2 16 プロセッササーバ上においてIntel Fortran Itanium Compiler 7.1 に比べ平均2.40 倍，Sun Fire V880 Ultra SPARC III Cu 8 プロセッササーバ上においてSun Forteコンパイラ 7.1 に比べ平均1.90 倍の性能向上が得られた．The needs for automatic parallelizing compilers are getting larger with widly use of multiprocessor systems.However, the loop parallelization techniques are almost matured and new generation of parallelization methods like multi-grain parallelization are required to achieve higher effective performance. This paper describes the performance of OSCAR multigrain parallelizing compiler that uses the coarse grain task parallelization and the near fine grain parallelization in addition to the loop parallelization. OSCAR compiler realizes the following two important techniques. The first is the automatic determination scheme of parallelizing layer, which decides the number of processors and parallelizing technique for each part of the program. The other is global cache memory optimization among loops and coarse grain tasks. In the evaluation using SPEC95FP benchmarks, OSCAR compiler gave us 4.78 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server, 2.40 times speedup compared with Intel Fortran Itanium Compiler 7.1 on SGI Altix3700 Itanium2 16 processors server, 1.90 times speedup compared with Sun Forte compiler 7.1 on Sun Fire V880 Ultra SPARC III Cu 8 processors server.

CiNii
配列間接アクセスを用いないコード生成法を用いた電子回路シミュレーション手法の性能評価

黒田亮, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2005-161-1 (SHINING2005) 2005 ( 7 ) 1 - 6 2005年01月 [査読有り]

　概要を見る

本稿では、ランダムスパースマトリクス処理に伴う配列間接アクセスを除去したループフリーコード生成による電子回路シミュレーションの高速化手法をWS及びPC上で評価した結果について報告する。広く用いられている電子回路シミュレータSPICEでは直接法を用いたスパースマトリクス求解の高速化のために、コード生成法により非零要素のみの計算を列挙したループフリーコードを生成している。しかし、その際のスパースマトリクス処理のための配列間接アクセスが処理高速化を阻害する要因の一つになっている。そこで本論文では間接配列アクセスを用いないループフリーコードを生成する電子回路シミュレーション手法を間接法による求解が難しいBJTを含む回路に対して適用し、単一プロセッサのWS及びPC上で性能評価を行なった。その結果、過渡解析をSPICE3f5より2倍から110倍高速に行なえることが確認され、さらにこの高速化はメモリアクセスの大幅な削減によることが確認された。This paper evaluates performance of a fast sequential circuit simulation scheme using the loop free code without the array indirect accesses. This scheme allows us to get several tens of times higher processing performance than SPICE version 3f5 on a WS and a PC. The array indirect accesses for the sparse matrix solution in SPICE have been one of the factors that prevents from efficient processing. This paper describes the circuit simulation scheme using loop free code without any array indirect accesses and its performance evaluation shows the scheme gives us 2 to 110 times better performance than SPICE3f5 on a WS and a PC. The performance by reducing the memory accesses overhead significantly.

CiNii
Performance Evaluation of Electronic Circuit Simulation Using Code Generation Method without Array Indirect Access

Akira Kuroda, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2005-161-1 (SHINING2005) 2005年01月 [査読有り]
Performance Evaluation of Minimum Execution Time Multiprocessor Scheduling Algorithms using Standard Task Graph Set Which Takes into Account Parallelism of Task Graphs

Takanari Matsuzawa, Shinya Sakaida, Takao Tobita, Hironori Kasahara

Technical Report of IPSJ, ARC2004-161-9 2005 ( 7 ) 45 - 50 2005年01月 [査読有り]

　概要を見る

本論文では，実行時間最小化ノンプリエンプティブマルチプロセッサスケジューリングの公平な性能評価を可能とするために開発中のベンチマークタスクグラフを用いたヒューリスティックアルゴリズム，実用的逐次型最適化アルゴリズム及び並列最適化アルゴリズムの性能評価について述べる．本論文で用いる標準タスクグラフセット (STG) では，タスクグラフの並列度とスケジューリング対象プロセッサ台数の関係が，最適解求解率へ影響を与えることに注目し，タスク数規模は 50 100 300 500 700 1000 ，タスクグラフの並列度 para を，1.5 ≦ para < 20.5 の範囲で，3078 例のタスクグラフを生成した．この STG を用いて，2～16 台のプロセッサに割り当てる際のヒューリスティックスアルゴリズム FIFO (First In First Out) RTRS (Ready Task Random Selection) CP (Critical Path) CP/MISF (CP / Most Immediate Successor First) 実用的逐次型最適化スケジューリングアルゴリズムDF/IHS (Depth First / Implicit Heuristic Search) 及び，その並列化アルゴリズム PDF/IHS (Parallelized DF/IHS) の性能評価を行った．この結果，全 12312 例において，FIFO で 15.14 % RTRS で 14.63 % CP で 65.80 % CP/MISF で 65.85 % DF/IHS で 87.79 % PDF/IHS で 91.62 % の最適解求解率が得られた．また，探索時間上限値を 6 時間とした場合，Sun 4PE WS Ultra80 上で，PDF/IHS は DF/IHS に比べタスク割り当て対象プロセッサ台数 2 の時平均 554.6 倍，4 の時平均 461.8 倍と非常に高い加速率を得ることができた．さらに，para とプロセッサ台数が近い時，各アルゴリズムにおいて求解率が急激に低下し，プロセッサ台数 4 の時においては，CP などのヒューリスティックアルゴリズムでは``para > プロセッサ台数''の時においても求解率が低下し，最適解求解率が約 60 % であるが，DF/IHS では約 90 %，PDF/IHS では約 100 % という高い求解率が得られることが確認された．This paper evaluates performance of heuristic and optimization algorithms using benchmark task graphs named Standard TaskGraph Set (STG) for the minimum execution time nonpreemptive multiprocessor scheduling problem. In the standard task graph set used in this paper, in addition to the relationship between parallelism of task graphs and ``the number of processors'' which is the number of processors used in the scheduling problem, the scale of task graphs like 50, 100, 300, 500, 700, 1000 tasks, and parallelism ``para'' of 1.5 ≦ para<20.5 affects optimal solution rate. This paper evaluates perfomance of heuristic algorithms, practical sequential optimization algorithm DF/IHS (Depth First / Implicit Heuristic Search) and practical parallel optimization algorithm (Parallelized DF/IHS) using this STG also for 2 to 16 processors. The evaluation shows for the total 12312 tested problems, FIFO gives us optimal solutions for 15.14 % of the problems, RTRS for 14.63 %, CP for 65.80 %, CP/MISF for 65.85 %, DF/IHS for 87.79 % and PDF/IHS for 91.62 %. Also, it was confirmed that the parallel algorithm PDF/IHS gave us 554.6 times speed up against the sequential algorithm DF/IHS for 2 processors scheduling problems and 461.8 times for 4 processors scheduling problems. When para is close to the number of processors, each algorithm gives us low optimal solution rate, in addition to that, when the number of processors is 4 and ``para > the number of processors'', heuristic algorithms like CP gives us low optimal solution rate (60 %) and however, DF/IHS and PDF/IHS give us high optimal solution rate such as 90 % and 100 % respectively.

CiNii
Performance of OSCAR Multigrain Parallelizing Compiler on Shared Memory Multiprocessor Serers

Jun Shirako, Takamichi Miyamoto, Kazuhisa Ishizaka, Motoki Obata, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2004-161-5 2005 ( 7 ) 21 - 26 2005年01月 [査読有り]

　概要を見る

マルチプロセッサシステムの普及に伴い，実効性能，システム価格性能比，ソフトウェア生産性向上のため高性能な自動並列化コンパイラの重要性が高まっている．しかしながら並列処理技術において広く利用されているループ並列処理手法は既に成熟期に至り，今後の大幅な性能向上実現のためには従来とは異なる並列化手法の利用が必須である．本論文ではループ並列処理に加え，基本ブロック，ループ，サブルーチンといった粗粒度タスク間の並列性を利用する粗粒度タスク並列処理・基本ブロック内ステートメントレベルの並列性を用いる近細粒度並列処理によりプログラム全域にわたる並列化を行うOSCAR マルチグレイン自動並列化コンパイラの性能評価について述べる．OSCAR コンパイラではプログラムの形状や並列性に応じた適切な処理プロセッサ数や各並列処理粒度の決定，複数のループや粗粒度タスク間にまたがる広域的なキャッシュメモリ最適化技術が実現されている．SPEC95FP を用いた本性能評価においてOSCAR コンパイラは，IBM pSeries690Power4 24 プロセッササーバ上でIBM XL Fortran コンパイラ 8.1 の自動並列化性能に比べ平均4.78 倍，SGI Altix3700 Itanium2 16 プロセッササーバ上においてIntel Fortran Itanium Compiler 7.1 に比べ平均2.40 倍，Sun Fire V880 Ultra SPARC III Cu 8 プロセッササーバ上においてSun Forteコンパイラ 7.1 に比べ平均1.90 倍の性能向上が得られた．The needs for automatic parallelizing compilers are getting larger with widly use of multiprocessor systems.However, the loop parallelization techniques are almost matured and new generation of parallelization methods like multi-grain parallelization are required to achieve higher effective performance. This paper describes the performance of OSCAR multigrain parallelizing compiler that uses the coarse grain task parallelization and the near fine grain parallelization in addition to the loop parallelization. OSCAR compiler realizes the following two important techniques. The first is the automatic determination scheme of parallelizing layer, which decides the number of processors and parallelizing technique for each part of the program. The other is global cache memory optimization among loops and coarse grain tasks. In the evaluation using SPEC95FP benchmarks, OSCAR compiler gave us 4.78 times speedup compared with IBM XL Fortran compiler 8.1 on IBM pSeries690 Power4 24 processors server, 2.40 times speedup compared with Intel Fortran Itanium Compiler 7.1 on SGI Altix3700 Itanium2 16 processors server, 1.90 times speedup compared with Sun Forte compiler 7.1 on Sun Fire V880 Ultra SPARC III Cu 8 processors server.

CiNii
Multigrain parallel processing on compiler cooperative chip multiprocessor.

Keiji Kimura, Yasutaka Wada, Hirofumi Nakano, Takeshi Kodaka, Jun Shirako, Kazuhisa Ishizaka, Hironori Kasahara

9th Annual Workshop on Interaction between Compilers and Computer Architectures 11 - 20 2005年 [査読有り]

DOI

Scopus

14

被引用数

(Scopus)
OSCARチップマルチプロセッサ上でのMPEG2エンコードの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-160-07 2004 ( 123(ARC-160) ) 119 - 127 2004年12月

担当区分：最終著者

DOI J-GLOBAL

Scopus

2

被引用数

(Scopus)
OSCARチップマルチプロセッサ上でのMPEG2エンコードの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-160-07 2004 ( 123 ) 53 - 58 2004年12月 [査読有り]

　概要を見る

本論文では，マルチメディアアプリケーションとしてディジタルTVやDVDなどのメディアで広く利用されているMPEG2エンコードに対する，チップマルチプロセッサ上でのメモリ利用最適化およびデータ転送最適化手法を伴う粗粒度タスク並列処理手法の提案を行なうと共に，OSCARチップマルチプロセッサ上での性能評価を行なう．性能評価の結果，データローカリティの利用およびデータ転送オーバーヘッド隠蔽手法を含む提案する粗粒度タスク並列処理を適用したMPEG2エンコードは，逐次実行に対し，1プロセッサ利用時1.24倍，2プロセッサ利用時2.46倍，4プロセッサ利用時4.57倍，8プロセッサ利用時7.97倍，16プロセッサ利用時11.93倍の速度向上率が得られることが確認できた．This paper proposes a coarse grain task parallel processing scheme for MPEG2 encoding using data localization which optimizes execution efficiency assigning coarse grain tasks accessing the same array data on the same processor consecutively on a chip multiprocessor and data transfer overlapping technique which minimize the data transfer overhead by overlapping task execution and data transfer. Performance of the proposed scheme is evaluated. As the evaluation result on an OSCAR chip multiprocessor architecture, the proposed scheme gave us 1.24 times speedup for 1 processor, 2.47 times speedup for 2 processors, 4.57 times speedup for 4 processors, 7.97 times speedup for 8 processors and 11.93 times speedup for 16 processors respectively against the sequential execution on a single processor without the proposed scheme.

CiNii
HPC用自動並列化コンパイラの動向と将来課題

笠原博徳

第１９回ＮＥＣ・ＨＰＣ研究会 2004年11月 [査読有り]
Current and Future of Automatic Parallelizing Compilers

H. Kasahara

The 19th NEC HPC Forum 2004年11月 [査読有り]
Performance of OSCAR Multigrain Parallelizing Compiler on SMP Servers

Kazuhisa Ishizaka, Takamichi Miyamoto, Jun Shirako, Motoki Obata, Keiji Kimura, Hironori Kasahara

Proc. of 17th International Workshop on Languages and Compilers for Parallel Computing(LCPC2004) 2004年09月 [査読有り]

CiNii
世界一のコンパイラを作る--アドバンスト並列化コンパイラプロジェクト--

笠原博徳

IBMライフサイエンス天城セミナー 2004年09月 [査読有り]
Developing World Fastest Compiler: Advanced Parallelizing Compiler Project

H. Kasahara

IBM Life Science Amagi Seminar 2004年09月 [査読有り]
OSCARチップマルチプロセッサ上でのデータ転送ユニットを用いたデータローカライゼーション

中野啓史, 内藤陽介, 鈴木貴久, 小高剛, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-159-20 2004 ( 80(ARC-159) ) 2004年07月

J-GLOBAL
OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価

和田康孝, 白子準, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-159-11 2004 ( 80(ARC-159) ) 2004年07月

J-GLOBAL
OSCARチップマルチプロセッサ上でのデータ転送ユニットを用いたデータローカライゼーション

中野啓史, 内藤陽介, 鈴木貴久, 小高剛, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-159-20 2004年07月 [査読有り]
OSCARチップマルチプロセッサ上でのマルチグレイン並列性評価

和田康孝, 白子準, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-159-11 2004年07月 [査読有り]
Data Localization using Data Transfer Unit on OSCAR Chip Multiprocessor

Hirofumi Nakano, Yosuke Naito, Takahisa Suzuki, Takeshi Kodaka, Kazuhisa Ishizaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2004-ARC-159-20 2004年07月 [査読有り]
Evaluation of Multigrain Parallelism on OSCAR Chip Multi Processor

Yasutaka Wada, Jun Shirako, Kazuhisa Ishizaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2004-ARC-159-11 2004年07月 [査読有り]
150回研究会記念特別企画（２）パネル討論：アーキテクチャ研究の将来 “産官学連携による高付加価値チップマルチプロセッサの開発”

笠原博徳

第150回計算機アーキテクチャ研究会 2004 ( 48 ) 45 - 57 2004年05月 [査読有り]

　概要を見る

かつて日本のコンピュータアーキテクチャ研究には夢と未来があり，華やかで，活気に満ちていた．メインフレームの全盛期，計算機は，それ一つで，数億から数千万円かかる巨大システムであり，日本の産業界において重要な地位を占めていた．日本企業は，命令レベルではIBMコンパチであっても独自の技術で計算機を開発しており，ポストIBMアーキテクチャに向かって大学共々やる気は十分であり，このための資金も備えていた．80年代から90年代にかけて，第五世代計算機プロジェクト，超並列計算機プロジェクトなど歴代主査がリードした大型プロジェクトを通じて産官学は一体となって新しいアーキテクチャ研究に取り組んで来た．(1)高性能な汎用アーキテクチャはIntelに完全制覇され，日本企業は例外を除いて「計算機用」のCPUを作らなくなった．結果として，プロセッサアーキテクチャの研究は産業界のとのリンクを失った．このため，優れた研究があっても実世界にインパクトを与えることがほとんどできなくなった。 (2)マルチメディア用，組み込み用CPU，SoCアーキテクチャは日本の半導体業界の中でも大きな位置を占めており，実際に日本企業は大量にCPUを作っている．しかし，SoCにとって，組み込みCPU自体のコストおよび重要性は低く，狭い意味での「計算機アーキテクチャ」の重要性はさほど大きくない．チップ全体のアーキテクチャは実際にチップを作成するLSI設計者の研究対象領域となっている． (3)グリッドやPCクラスタの研究開発は盛んで，ユビキタスコンピューティングなど夢がある研究領域も開けている．しかし，計算機アーキテクチャ研究者の役割はさほど大きくない．情報系の大型プロジェクトには計算機アーキテクチャ分野が含まれなくなりつつある．コンピュータアーキテクチャ研究が往年の輝きを取り戻し，若手研究者に夢を与えるために，どのように研究を展開していけば良いか，その戦略を議論する．Compared with 80's and 90's when the 5th generation computer project and massively parallel architecture project were carried out,recent researches on computer architectures in Japan tend to be inactive because of various problems.This memorial panel tries to explore the strategies of future architecture researches in Japan.Seven successive chiefs of IPSJ SIG ARC join as panelists

CiNii
マルチグレイン並列性向上のための選択的インライン展開手法

白子準, 長澤耕平, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会論文誌 45 ( 4 ) 1354 - 1356 2004年05月 [査読有り]

　概要を見る

マルチプロセッサシステムの利用範囲拡大とともに実質実行性能（実効性能）・ソフトウェア生産性・価格性能比の向上のため，自動並列化コンパイラの必要性が高まっている．特にコンパイラによる実効性能を高めるため，基本ブロック，ループ，サブルーチン間の粗粒度並列処理・ループイタレーション間の中粒度並列処理・基本ブロック内ステートメント間の近細粒度並列処理を階層的に組み合わせ，プログラム全域の並列性を利用するマルチグレイン並列処理が重要となっている．マルチグレイン並列処理において階層的に並列性を抽出し，効率良い並列実行を実現するためには，各階層（ネストレベル）の並列性に応じ，適切なプロセッサ数を配分する必要がある．またこの際，階層の異なる，すなわちネストされたサブルーチンをインライン展開により同一階層になるようリストラクチャリングすることで，粗粒度並列性を高めることが可能となるため，これも考慮し適切なプロセッサ配分を行う必要がある．本稿ではプログラム中の各階層の並列度を用いマルチグレイン並列性を高めるためにインライン展開すべきサブルーチンを選択する手法と，それを考慮したプロセッサ配分法を提案する．本手法の性能をIBM RS6000 PowerPC 604e High Node 8 プロセッサミッドレンジSMPサーバ上，および1.1 GHz のPower4 を搭載した16 way ハイエンドSMP サーバIBM pSeries690regattaH 上で，SPEC95FP ベンチマークのうち，並列性の高いサブルーチンが異なる階層（ネストレベル）に分散しているプログラムである103.su2cor ，107.mgrid ，125.turb3d を用いて評価を行った．逐次処理に対してRS6000 上で2.84 ?6.04 倍，regattaH 上で3.54 ?11.19 倍，またインライン展開を併用しない従来のプロセッサ配分手法に対してRS6000 上で1.12 ?1.79 倍，regattaH上で1.03 ?1.47 倍の高速化が可能になることが確かめられた.With the increase of applications of multiprocessor systems,needs of automatic parallelizing compilers are increasing to improve effective performance, cost performance,and software productivity. Especially,for higher effective performance by compiler, a multi-grain parallel processing which exploits coarse grain parallelism among loops, subroutines and basic blocks, medium grain parallelism among loop-iterations and near fine grain parallelism among statements inside a basic block,is getting important. In multi-grain parallel processing, it is required to assign the appropriate number of processors to each nested layer, considering the parallelism of each layer. At that time,inline expansion of subroutines having large parallelism in a lower layer can increase coarse grain parallelism significantly. Therefore,considering this program restructuring,a compiler must assign processors to each layer. To this end,this paper proposes a selective inline expansion scheme for improvement of multi grain parallelism. Effectiveness of the proposed scheme is evaluated on IBM RS6000, midrange SMP server with 8 processors and IBM pSeries690 regattaH,highend SMP server with 16 processors, using 103.su2cor,107. mgrid, 125.turb3d of SPEC95FP. The multi grain parallel processing using the proposed scheme gave us 2.84 to 6.04 times speedup on RS6000, 3.54 to 11.19 times speedup on regattaH against sequential processing, 1.12 to 1.79 times speedup on RS6000, 1.03 to 1.47 times speedup on regattaH against conventional multi-grain parallelization.

CiNii
Selective Inline Expansion for Improvement of Multi Grain Parallelism

Jun shirako, Kouhei Nagasawa, Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Trans. of IPSJ 45 ( 5 ) 1354 - 1356 2004年05月 [査読有り]

J-GLOBAL
150th ARC memorial special technical meeting(2), Panel: Future of Computer Architecture Research 'Development of high-value added Chip Multiprocessors by industry-government-academia collaboration'

H. Kasahara

150th IPSJ Special Interest Group on Computer Architecture 2004年05月 [査読有り]
配列間パディングを用いた粗粒度タスク間キャッシュ最適化

石坂一久, 小幡元樹, 笠原博徳

情報処理学会論文誌 45 ( 4 ) 1063 - 1076 2004年04月 [査読有り]

　概要を見る

マルチプロセッサシステムの普及にともない自動並列化コンパイラの重要性が高まっている．従来自動並列化コンパイラの研究では，ループ並列処理を中心とした研究が行われてきたが，システムの実効性能を向上させるためには，ループ並列処理に加えループやサブルーチン間の並列性を利用する粗粒度タスク並列処理，ステートメント間の並列性を利用する近細粒度並列処理を階層的に利用するマルチグレイン並列処理が注目されている．また，プロセッサとメモリの速度差の増大によりメモリアクセスレイテンシが性能向上のボトルネックになっている．したがって，データローカリティ最適化によるキャッシュメモリの有効利用も性能向上の重要なファクタとなる．本論文では粗粒度タスク並列処理の性能の向上を目指した粗粒度タスク間キャッシュ最適化手法について述べる．本手法では，データローカライゼーション手法を用い，データおよびタスクをキャッシュサイズにフィットするように分割し，同一データにアクセスするタスクを連続的に実行できるようにプログラムの実行順序を変えたうえで，配列間パディングを用いデータレイアウトを変えることによって，連続実行される粗粒度タスク間でのコンフリクトミスを削減する．本手法の性能をキャッシュ構成の異なる2 台の4 プロセッサマルチプロセッサワークステーションSun Ultra 80 （ダイレクトマップ）とIBM RS/600044p-270 （セットアソシアティブ）上で性能評価を行った．Ultra 80 ではネイティブコンパイラSunForte 6 update 2 の自動並列化の最高性能に対してSPEC CFP95 のtomcatv で5.1 倍，swim で3.3 倍，hydro2d で2.1 倍，turb3d で1.1 倍の性能向上が得られた．またRS/6000 ではIBM XLFortran 7.1 コンパイラに対して，tomcatv で1.7 倍，swim で4.2 倍，hydro2d で2.5 倍，turb3dで1.03 倍の性能向上が得られた．Importance of automatic parallelizing compilers is getting larger with the widespread use of multiprocessor system.To improve the performance of multiprocessor system,currently multigrain parallelization is attracting much attention.In multigrain parallelization,coarse grain task parallelisms among loops and subroutines and near fine grain parallelisms among statements are used in addition to the traditional loop parallelism.The locality optimization to use cache effectively is also important for the performance improvement.This paper proposes inter-array padding for data localization to minimize cache conflict misses over loops. The proposed padding scheme was evaluated on the two commercial 4 processors workstations, namely Sun Ultra 80 and IBM RS/6000 44p-270,which have different cache configuration. Compared with the maximum performance of Sun Forte 6 update 2 compiler automatic loop parallelization on Ultra 80,the proposed padding with data localization gave us 5.1 times speedup for SPEC CFP95 tomcatv,3.3 times for swim,2.1 times for hydro2d,1.1 times for turb3d.On IBM RS/6000 44p-270,it shows 1.7 times speedup for tomcatv,4.2 times for swim,2.5 times for hydro2d,1.03 times for turb3d against automatic parallelization by IBM XL Fortran 7.1 compiler.

CiNii
Cache Optimization among Coarse Grain Tasks using Intra-Array Pading

Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Trans. of IPSJ 45 ( 4 ) 2004年04月 [査読有り]
IBM pSeries 690 上での OSCAR マルチグレイン自動並列化コンパイラの性能評価

石坂一久, 白子準, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会第66回全国大会 66th ( 5 ) 2004年03月 [査読有り]

J-GLOBAL
Software Development on Large Parallel Supercomputers in Japan -- Parallelizing Compilers and Parallel Programming Language Projects --

H. Kasahara

U.S.-Japan Forum on the Future of Supercomputing, 米国工学アカデミー、(社)日本工学アカデミー 2004年03月 [査読有り]
Research on Parallelizing Compiler for High Performance Computing in Japan

H. Kasahara

Japan-U.S.A. Supercomputing Forum, The Engineering Academy of Japan Inc.(EAJ) 2004年03月 [査読有り]
ミレニアムプロジェクトIT21アドバンスト並列化コンパイラとコンパイラ協調型チップマルチプロセッサ

笠原博徳

NECソフト㈱第四回ＶＴＣ先端領域セミナー 2004年02月 [査読有り]
データローカライゼーションを伴うMPEG2エンコーディングの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-156-3 2004 ( 12 ) 13 - 18 2004年02月

　概要を見る

PC，PDA，携帯電話などで静止画像，動画像，音声などを扱うマルチメディアアプリケーションを利用する機会が近年ますます増えている．このためマルチメディアアプリケーションを効率良く処理できる低コスト，低消費電力かつ高性能なプロセッサの必要性が増してきている．このような要求を満たすアーキテクチャとして複数のプロセッサコアを1チップ上に搭載したチップマルチプロセッサアーキテクチャが，命令レベル以外の粗粒度タスク並列性，中粒度ループ並列性など複数レベル並列性も自然に引き出すことができ，集積度向上に対しスケーラブルな性能向上が得られるプロセッサアーキテクチャとして注目されている．しかしながら，チップマルチプロセッサアーキテクチャ上で効率の良い処理を行なうには，アプリケーションの特性を解析し，その並列性とデータローカリティを考慮しながらプログラムを適切な粒度のタスクに分割し，それらのタスクをバランス良くCPUに配置する並列化技術が不可欠である．本論文では，データを共有する粗粒度タスクの連続実行によりチップ内ローカルメモリを利用したデータの授受を行ない実行効率を向上させるデータローカライゼーション手法のMPEG2エンコーディングへの適用を提案し，OSCARチップマルチプロセッサ上で性能評価を行なう．評価の結果，提案手法は8プロセッサ利用時で従来のループ並列処理に対して1.64倍の性能が得られ，逐次実行に対しても6.82倍の速度向上が得られた．Recently, many people are getting to enjoy multimedia applications with image and audio processing on PCs, mobile phones and PDAs. For this situation, development of low cost, low power consumption and high performance processors for multimedia applications has been expected. To satisfy these demands, chip multiprocessor architectures which allows us to attain scalability using coarse grain level parallelism and loop level parallelism in addition to instruction level parallelism are attracting much attention. However, in order to extract much performance from chip multiprocessor architectures efficiently, highly sophisticated technique is required such as decomposing a program into adequate grain of tasks and assigning them onto processors considering parallelism and data locality of target applications. This paper describes a parallel processing scheme for MPEG2 encoding using data localization which improve execution efficiency assigning coarse grain tasks sharing same data on a same processor consecutively for a chip multiprocessor, and evaluate its performance. As the evaluation result on OSCAR CMP using 8 processors, proposed scheme gives us 1.64 times speedup against loop parallel processing, and 6.82 times speedup against sequential execution time.

CiNii J-GLOBAL
データローカライゼーションを伴うMPEG2エンコーディングの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2004-ARC-156-3 2004 ( 12 ) 13 - 18 2004年02月 [査読有り]

　概要を見る

PC，PDA，携帯電話などで静止画像，動画像，音声などを扱うマルチメディアアプリケーションを利用する機会が近年ますます増えている．このためマルチメディアアプリケーションを効率良く処理できる低コスト，低消費電力かつ高性能なプロセッサの必要性が増してきている．このような要求を満たすアーキテクチャとして複数のプロセッサコアを1チップ上に搭載したチップマルチプロセッサアーキテクチャが，命令レベル以外の粗粒度タスク並列性，中粒度ループ並列性など複数レベル並列性も自然に引き出すことができ，集積度向上に対しスケーラブルな性能向上が得られるプロセッサアーキテクチャとして注目されている．しかしながら，チップマルチプロセッサアーキテクチャ上で効率の良い処理を行なうには，アプリケーションの特性を解析し，その並列性とデータローカリティを考慮しながらプログラムを適切な粒度のタスクに分割し，それらのタスクをバランス良くCPUに配置する並列化技術が不可欠である．本論文では，データを共有する粗粒度タスクの連続実行によりチップ内ローカルメモリを利用したデータの授受を行ない実行効率を向上させるデータローカライゼーション手法のMPEG2エンコーディングへの適用を提案し，OSCARチップマルチプロセッサ上で性能評価を行なう．評価の結果，提案手法は8プロセッサ利用時で従来のループ並列処理に対して1.64倍の性能が得られ，逐次実行に対しても6.82倍の速度向上が得られた．Recently, many people are getting to enjoy multimedia applications with image and audio processing on PCs, mobile phones and PDAs. For this situation, development of low cost, low power consumption and high performance processors for multimedia applications has been expected. To satisfy these demands, chip multiprocessor architectures which allows us to attain scalability using coarse grain level parallelism and loop level parallelism in addition to instruction level parallelism are attracting much attention. However, in order to extract much performance from chip multiprocessor architectures efficiently, highly sophisticated technique is required such as decomposing a program into adequate grain of tasks and assigning them onto processors considering parallelism and data locality of target applications. This paper describes a parallel processing scheme for MPEG2 encoding using data localization which improve execution efficiency assigning coarse grain tasks sharing same data on a same processor consecutively for a chip multiprocessor, and evaluate its performance. As the evaluation result on OSCAR CMP using 8 processors, proposed scheme gives us 1.64 times speedup against loop parallel processing, and 6.82 times speedup against sequential execution time.

CiNii
Millennium Project IT21 Advanced Parallelizing Compiler and Compiler Cooperative Chip Multiprocessor

H. Kasahara

The 4th VTC Seminar, NEC Soft 2004年02月 [査読有り]
Parallel Processing for MPEG2 Encoding using Data Localization

Takeshi Kodaka, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2004-ARC-156-3 2004 ( 12 ) 13 - 18 2004年02月 [査読有り]

　概要を見る

PC，PDA，携帯電話などで静止画像，動画像，音声などを扱うマルチメディアアプリケーションを利用する機会が近年ますます増えている．このためマルチメディアアプリケーションを効率良く処理できる低コスト，低消費電力かつ高性能なプロセッサの必要性が増してきている．このような要求を満たすアーキテクチャとして複数のプロセッサコアを1チップ上に搭載したチップマルチプロセッサアーキテクチャが，命令レベル以外の粗粒度タスク並列性，中粒度ループ並列性など複数レベル並列性も自然に引き出すことができ，集積度向上に対しスケーラブルな性能向上が得られるプロセッサアーキテクチャとして注目されている．しかしながら，チップマルチプロセッサアーキテクチャ上で効率の良い処理を行なうには，アプリケーションの特性を解析し，その並列性とデータローカリティを考慮しながらプログラムを適切な粒度のタスクに分割し，それらのタスクをバランス良くCPUに配置する並列化技術が不可欠である．本論文では，データを共有する粗粒度タスクの連続実行によりチップ内ローカルメモリを利用したデータの授受を行ない実行効率を向上させるデータローカライゼーション手法のMPEG2エンコーディングへの適用を提案し，OSCARチップマルチプロセッサ上で性能評価を行なう．評価の結果，提案手法は8プロセッサ利用時で従来のループ並列処理に対して1.64倍の性能が得られ，逐次実行に対しても6.82倍の速度向上が得られた．Recently, many people are getting to enjoy multimedia applications with image and audio processing on PCs, mobile phones and PDAs. For this situation, development of low cost, low power consumption and high performance processors for multimedia applications has been expected. To satisfy these demands, chip multiprocessor architectures which allows us to attain scalability using coarse grain level parallelism and loop level parallelism in addition to instruction level parallelism are attracting much attention. However, in order to extract much performance from chip multiprocessor architectures efficiently, highly sophisticated technique is required such as decomposing a program into adequate grain of tasks and assigning them onto processors considering parallelism and data locality of target applications. This paper describes a parallel processing scheme for MPEG2 encoding using data localization which improve execution efficiency assigning coarse grain tasks sharing same data on a same processor consecutively for a chip multiprocessor, and evaluate its performance. As the evaluation result on OSCAR CMP using 8 processors, proposed scheme gives us 1.64 times speedup against loop parallel processing, and 6.82 times speedup against sequential execution time.

CiNii
Cache optimization for coarse grain task parallel processing using inter-array padding

Ishizaka, K., Obata, M., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2958 64 - 76 2004年 [査読有り]

DOI

Scopus

8

被引用数

(Scopus)
Parallel processing using data localization for MPEG2 encoding on OSCAR chip multiprocessor

T Kodaka, H Nakano, K Kimura, H Kasahara

INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS 119 - 127 2004年 [査読有り]

　概要を見る

Currently, many people are enjoying multimedia applications with image and audio processing on PCs, PDAs, mobile phones and so on. With the popularization of the multimedia applications, needs for low cost, low power consumption and high performance processors has been increasing. To this end, chip multiprocessor architectures which allow us to attain scalable performance improvement by using multigrain parallelism are attracting much attention. However, in order to extract higher performance on a chip multiprocessor, more sophisticated software techniques are required, such as decomposing a program into adequate grain of tasks, assigning them onto processors considering parallelism, data locality optimization and so on. This paper describes a parallel processing scheme for MPEG2 encoding using data localization which improve execution efficiency assigning coarse grain tasks sharing same data on a same processor consecutively for a chip multiprocessor. The performance evaluation on OSCAR chip multiprocessor architecture shows that proposed scheme gives us 6.97 times speedup using 8 processors and 10.93 times speedup using 16 processors against sequential execution time respectively. Moreover, the proposed scheme gives us 1.61 times speedup using 8 processors and 2.08 times speedup using 16 processors against loop parallel processing which has been widely used for multiprocessor systems using the same number of processors.
Memory management for data localization on OSCAR chip multiprocessor

H Nakano, T Kodaka, K Kimura, H Kasahara

INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS 82 - 88 2004年 [査読有り]

　概要を見る

Chip Multiprocessor (CMP) architecture has attracting much attention as a next-generation microprocessor architecture and many kinds of CMP are widely being researched. However, CMP architectures several difficulties for effective use of memory, especially cache or local memory near a processor core. The authors have proposed OSCAR CMP architecture, which cooperatively works with multigrain parallelizing compiler which gives us much higher parallelism than instruction level parallelism or loop level parallelism and high productivity of application programs. To support the compiler optimization for effective use of cache or local memory, OSCAR CMP has local data memory (LDM) for processor private data and distributed shared memory (DSM) for synchronization and fine grain data transfers among processors, in addition to centralized shared memory (CSM) to support dynamic task scheduling. This paper proposes a static coarse grain task scheduling scheme for data localization using live variable analysis. Furthermore, remote memory data transfer scheduling scheme using information of live variable analysis is also described. The proposed scheme is implemented on OSCAR FORTRAN multigrain parallelizing compiler and is evaluated on OSCAR CMP using Tomcatv and Swim in SPEC CFP 95 benchmark.
Selective inline expansion for improvement of multi grain parallelism.

Jun Shirako, Kouhei Nagasawa, Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Proceedings of the IASTED International Conference on Parallel and Distributed Computing and Networks 476 - 482 2004年 [査読有り]
Performance of OSCAR Multigrain Parallelizing Compiler on SMP Servers.

Kazuhisa Ishizaka, Takamichi Miyamoto, Jun Shirako, Motoki Obata, Keiji Kimura, Hironori Kasahara

Languages and Compilers for High Performance Computing(LCPC) 3602 319 - 331 2004年 [査読有り]

DOI

Scopus

5

被引用数

(Scopus)
SMPマシン上での粗粒度タスク並列処理におけるデータプリフェッチ手法

宮本孝道, 山口高弘, 飛田高雄, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2003-ARC-155-06 2003 ( 119 ) 63 - 68 2003年11月

　概要を見る

現在多くのサーバで使用されている主記憶共有型マルチプロセッサシステム（SMP）では，プロセッサの動作速度向上と共に，メモリアクセスオーバヘッドの増大が，プロセッサ毎にスケーラブルな性能向上を得るための大きな障壁となっている．本論文では，このメモリアクセスオーバヘッドを軽減しスケーラブルな性能向上を得るために、粗粒度タスクのデータローカライゼーション（データ分割）によっても取り除けなかったデータ転送をプリフェッチによりタスク処理とオーバラップさせることにより軽減させるスタティックスケジューリングを提案し，その性能を評価する．提案するアルゴリズムは，コンパイル時のスタティックスケジューリングを前提とし，今回評価に使用したv880用のプリフェッチディレクティブを挿入したOpenMP並列化Fortranを出力するものである．性能評価の結果，Sun Forteコンパイラの逐次処理プリフェッチなしの場合と比較すると，SPEC95fpのtomcatvでは8プロセッサで最大13.9倍，swinでは8プロセッサで最大22.3倍の速度向上を得るなど，スーパーリニアスピードアップが効率良く引き出せるだけでなく，Sun Forteコンパイラによる自動プリフェッチ命令挿入を用い同一プロセッサ台数で処理する場合どうしを比較してもtomcatvでは1プロセッサで1.11倍，8プロセッサで3.86倍，swimで1プロセッサで1.44倍，8プロセッサで1.85倍の速度向上が得られ，本手法の有効性が確認された。On the shared multi processor system used in current computing servers, the increase of memory access overhead with the speedup of CPU interfere to get the scalable performance improvement with the increase of the processors. In order to get scalable performance improvement, this paper proposes and evaluates the static scheduling algorithm which reduces the memory access overhead by using cache prefetch to overlap of data transfer and task processing. The proposed algorithm is used in static scheduling stage in a compiler, moreover the compiler generates a OpenMP pararellelized Fortran program with prefetch directive for SUN Forte compiler for Sun Fire V880 server. Performance evaluation shows that the proposed algorithm gave us super liner speedup with sequential processing without prefetching by Sun Forte compiler such as 13.9 times speedup on 8processors for SPEC95fp tomcatv program and 22.3 times speedup on 8 processors for SPEC95fp swim program. Futhermore, compared with automatic prefetching by SUN Forte compiler using the same number of processors, this algorithm shows that 1.1 times speedup on 1 processor, 3.86 times speedup on 8 processors for SPEC95fp tomcatv and 1.44 times speedup on 1processor, 1.85 times speedup on 8 processors for SPEC95fp swim.

CiNii J-GLOBAL
SMPマシン上での粗粒度タスク並列処理におけるデータプリフェッチ手法

宮本孝道, 山口高弘, 飛田高雄, 石坂一久, 木村啓二, 笠原博徳

情報処理学会研究会報告2003-ARC-155-06 2003 ( 119 ) 63 - 68 2003年11月 [査読有り]

　概要を見る

現在多くのサーバで使用されている主記憶共有型マルチプロセッサシステム（SMP）では，プロセッサの動作速度向上と共に，メモリアクセスオーバヘッドの増大が，プロセッサ毎にスケーラブルな性能向上を得るための大きな障壁となっている．本論文では，このメモリアクセスオーバヘッドを軽減しスケーラブルな性能向上を得るために、粗粒度タスクのデータローカライゼーション（データ分割）によっても取り除けなかったデータ転送をプリフェッチによりタスク処理とオーバラップさせることにより軽減させるスタティックスケジューリングを提案し，その性能を評価する．提案するアルゴリズムは，コンパイル時のスタティックスケジューリングを前提とし，今回評価に使用したv880用のプリフェッチディレクティブを挿入したOpenMP並列化Fortranを出力するものである．性能評価の結果，Sun Forteコンパイラの逐次処理プリフェッチなしの場合と比較すると，SPEC95fpのtomcatvでは8プロセッサで最大13.9倍，swinでは8プロセッサで最大22.3倍の速度向上を得るなど，スーパーリニアスピードアップが効率良く引き出せるだけでなく，Sun Forteコンパイラによる自動プリフェッチ命令挿入を用い同一プロセッサ台数で処理する場合どうしを比較してもtomcatvでは1プロセッサで1.11倍，8プロセッサで3.86倍，swimで1プロセッサで1.44倍，8プロセッサで1.85倍の速度向上が得られ，本手法の有効性が確認された。On the shared multi processor system used in current computing servers, the increase of memory access overhead with the speedup of CPU interfere to get the scalable performance improvement with the increase of the processors. In order to get scalable performance improvement, this paper proposes and evaluates the static scheduling algorithm which reduces the memory access overhead by using cache prefetch to overlap of data transfer and task processing. The proposed algorithm is used in static scheduling stage in a compiler, moreover the compiler generates a OpenMP pararellelized Fortran program with prefetch directive for SUN Forte compiler for Sun Fire V880 server. Performance evaluation shows that the proposed algorithm gave us super liner speedup with sequential processing without prefetching by Sun Forte compiler such as 13.9 times speedup on 8processors for SPEC95fp tomcatv program and 22.3 times speedup on 8 processors for SPEC95fp swim program. Futhermore, compared with automatic prefetching by SUN Forte compiler using the same number of processors, this algorithm shows that 1.1 times speedup on 1 processor, 3.86 times speedup on 8 processors for SPEC95fp tomcatv and 1.44 times speedup on 1processor, 1.85 times speedup on 8 processors for SPEC95fp swim.

CiNii
The Data Prefetching of Coarse Grain Task Parallel Processing on Symmetric Multi Processor Machine

Takamichi Miyamoto, Takahiro Yamaguchi, Takao Tobita, Kazuhisa Ishizaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2003-ARC-155-06 2003 ( 119 ) 63 - 68 2003年11月 [査読有り]

　概要を見る

現在多くのサーバで使用されている主記憶共有型マルチプロセッサシステム（SMP）では，プロセッサの動作速度向上と共に，メモリアクセスオーバヘッドの増大が，プロセッサ毎にスケーラブルな性能向上を得るための大きな障壁となっている．本論文では，このメモリアクセスオーバヘッドを軽減しスケーラブルな性能向上を得るために、粗粒度タスクのデータローカライゼーション（データ分割）によっても取り除けなかったデータ転送をプリフェッチによりタスク処理とオーバラップさせることにより軽減させるスタティックスケジューリングを提案し，その性能を評価する．提案するアルゴリズムは，コンパイル時のスタティックスケジューリングを前提とし，今回評価に使用したv880用のプリフェッチディレクティブを挿入したOpenMP並列化Fortranを出力するものである．性能評価の結果，Sun Forteコンパイラの逐次処理プリフェッチなしの場合と比較すると，SPEC95fpのtomcatvでは8プロセッサで最大13.9倍，swinでは8プロセッサで最大22.3倍の速度向上を得るなど，スーパーリニアスピードアップが効率良く引き出せるだけでなく，Sun Forteコンパイラによる自動プリフェッチ命令挿入を用い同一プロセッサ台数で処理する場合どうしを比較してもtomcatvでは1プロセッサで1.11倍，8プロセッサで3.86倍，swimで1プロセッサで1.44倍，8プロセッサで1.85倍の速度向上が得られ，本手法の有効性が確認された。On the shared multi processor system used in current computing servers, the increase of memory access overhead with the speedup of CPU interfere to get the scalable performance improvement with the increase of the processors. In order to get scalable performance improvement, this paper proposes and evaluates the static scheduling algorithm which reduces the memory access overhead by using cache prefetch to overlap of data transfer and task processing. The proposed algorithm is used in static scheduling stage in a compiler, moreover the compiler generates a OpenMP pararellelized Fortran program with prefetch directive for SUN Forte compiler for Sun Fire V880 server. Performance evaluation shows that the proposed algorithm gave us super liner speedup with sequential processing without prefetching by Sun Forte compiler such as 13.9 times speedup on 8processors for SPEC95fp tomcatv program and 22.3 times speedup on 8 processors for SPEC95fp swim program. Futhermore, compared with automatic prefetching by SUN Forte compiler using the same number of processors, this algorithm shows that 1.1 times speedup on 1 processor, 3.86 times speedup on 8 processors for SPEC95fp tomcatv and 1.44 times speedup on 1processor, 1.85 times speedup on 8 processors for SPEC95fp swim.

CiNii
Millennium Project IT21 Advanced Parallelizing Compiler

H. Kasahara

Information Processing Society of Japan Kansai Branch 2003年10月 [査読有り]
ミレニアムプロジェクトIT21 アドバンスト並列化コンパイラ

笠原博徳

(社)情報処理学会関西支部大会 2003年10月 [査読有り]
OSCAR CMP上でのスタティックスケジューリングを用いたデータローカライゼーション手法

中野啓史, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究会報告2003-ARC-154-14 2003 ( 84 ) 79 - 84 2003年08月

　概要を見る

近年の集積度向上に伴い，1チップ上に複数のプロセッサを集積するチップマルチプロセッサ・アーキテクチャの実用化が進められている．筆者等はこれまで，1チップ上で複数粒度の並列性を階層的に組み合わせて利用するマルチグレイン並列処理を指向した，OSCARチップマルチプロセッサ(OSCAR CMP)を提案してきた．OSCARCMPはチップ内のプロセッサ・プライベートデータを格納するローカルデータメモリ(LDM)，プロセッサ間共有データを格納する2ポート構成の分散共有メモリ(DSM)を搭載し，コンパイラがデータ配置を適切に制御する．本稿では，データを共有するループやサブルーチン等の粗粒度タスクを同一プロセッサで連続的に実行することでデータローカリティ最適化を図るデータローカライゼーション手法の，OSCAR CMPに対する適用について述べる．さらに，OSCAR CMPにデータローカライゼーション手法を適用して評価した結果を，共有キャッシュアーキテクチャやスヌープキャッシュアーキテクチャと比較し，現在のOSCAR CMP用の単純なコード生成に対する改善点の考察も行う．Recently, chip multiprocessor architecture that contains multiple processors on a chip becomes popular approarch even in commercial area.The authors have proposed OSCAR chip multiprocessor(OSCAR CMP) that is simed at exploiting multiple grains of parallelim hierarchically from a sequeutial program on a chip. OSCAR CMP has local data memory (LDM) for processor private data and distributed shared memory having two ports for processor shared data to control data allocation by a compiler appropriatery. This paper describes data on a same processor cosecutively. In addition, OSCAR CMP using data localization scheme is compared with shared cache architecture and snooping cache architecture. Then, current naive code generation for OSCAR CMP is considered using evaluation results.

CiNii J-GLOBAL
Parallel Processing on MPEG2 Encoding for OSCAR Chip Multiprocessor

Takeshi Kodaka, Hirofumi Nakano, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2003-ARC-154-10 2003 ( 84 ) 55 - 60 2003年08月 [査読有り]

　概要を見る

最近の携帯電話，PDAなどのモバイル端末では，静止画像，動画像，音声処理など様々なマルチメディアアプリケーションの処理が必要となっている．このためマルチメディアアプリケーションを効率良く処理できる低コスト，低消費電力かつ高性能なプロセッサの開発が望まれている．これらの要求を満たしつつマルチメディアアプリケーションを効率良く処理するプロセッサとして，複数のプロセッサコアを1チップ上に搭載したチップマルチプロセッサアーキテクチャが命令レベル以外の粗粒度タスク並列性，中粒度ループ並列性など複数レベル並列性も自然に引き出すことができ，集積度向上に対しスケーラブルな性能向上が得られるアーキテクチャとして注目されている．しかしながら，チップマルチプロセッサアーキテクチャ上で効率の良い処理を行なうには，アプリケーションの特性を解析しプログラムを適切な粒度のタスクに分割し，それらをバランス良くCPUに配置する並列化技術が不可欠である．本論文では，チップマルチプロセッサ上におけるマルチメディアアプリケーションの一例として，MPEG2エンコーディングの並列性を抽出しその評価を行なう．Recently, multimedia applications with visual and sound processing are popular on mobile phones and PDAs. To satisfy the needs for efficient multimedia processing, development of low cost, low power consumption and high performance processors for multimedia applications has been expected. Chip multiprocessor architectures which allows us to attain scalability using coarse grain level parallelism and loop level parallelism in addition to instruction level parallelism are attracting much attention. However, to realize efficient processing on chip multiprocessor architectures, parallel processing techniques such as decomposing a program into adequate tasks considering characteristics of a program and assigning these tasks onto processors are essential. This paper describes a parallel processing scheme for MPEG2 encoding for a chip multiprocessor and its performance.

CiNii J-GLOBAL
OSCAR CMP上でのスタティックスケジューリングを用いたデータローカライゼーション手法

中野啓史, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究会報告2003-ARC-154-14 2003 ( 84 ) 79 - 84 2003年08月 [査読有り]

　概要を見る

近年の集積度向上に伴い，1チップ上に複数のプロセッサを集積するチップマルチプロセッサ・アーキテクチャの実用化が進められている．筆者等はこれまで，1チップ上で複数粒度の並列性を階層的に組み合わせて利用するマルチグレイン並列処理を指向した，OSCARチップマルチプロセッサ(OSCAR CMP)を提案してきた．OSCARCMPはチップ内のプロセッサ・プライベートデータを格納するローカルデータメモリ(LDM)，プロセッサ間共有データを格納する2ポート構成の分散共有メモリ(DSM)を搭載し，コンパイラがデータ配置を適切に制御する．本稿では，データを共有するループやサブルーチン等の粗粒度タスクを同一プロセッサで連続的に実行することでデータローカリティ最適化を図るデータローカライゼーション手法の，OSCAR CMPに対する適用について述べる．さらに，OSCAR CMPにデータローカライゼーション手法を適用して評価した結果を，共有キャッシュアーキテクチャやスヌープキャッシュアーキテクチャと比較し，現在のOSCAR CMP用の単純なコード生成に対する改善点の考察も行う．Recently, chip multiprocessor architecture that contains multiple processors on a chip becomes popular approarch even in commercial area.The authors have proposed OSCAR chip multiprocessor(OSCAR CMP) that is simed at exploiting multiple grains of parallelim hierarchically from a sequeutial program on a chip. OSCAR CMP has local data memory (LDM) for processor private data and distributed shared memory having two ports for processor shared data to control data allocation by a compiler appropriatery. This paper describes data on a same processor cosecutively. In addition, OSCAR CMP using data localization scheme is compared with shared cache architecture and snooping cache architecture. Then, current naive code generation for OSCAR CMP is considered using evaluation results.

CiNii
OSCARマルチプロセッサシステム上でのMPEG2エンコーディングの並列処理

小高剛, 中野啓史, 木村啓二, 笠原博徳

情報処理学会研究会報告2003-ARC-154-10 2003年08月 [査読有り]
Millennium Project IT21 'Advanced Parallelizing Compiler' and Compiler Cooperative Chip Multiprocessor

H. Kasahara

The 2nd Super H Open Forum, Renesas Technology Corp. & Hitachi Ltd. 2003年08月 [査読有り]
Data Localization Scheme using Static Scheduling on Chip Multiprocessor

Hirofumi Nakano, Takeshi Kodaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, 2003-ARC-154-14 2003年08月 [査読有り]
ミレニアムプロジェクトIT21”アドバンスト並列化コンパイラ”とコンパイラ協調型チップマルチプロセッサ

笠原博徳

㈱ルネサステクノロジ、㈱日立製作所第2回 Super H オープンフォーラム 2003年08月 [査読有り]
Static Coarse Grain Task Scheduling with Cache Optimization Using OpenMP

Nakano, H., Ishizaka, K., Obata, M., Kimura, K., Kasahara, H.

International Journal of Parallel Programming 31 ( 3 ) 211 - 223 2003年06月 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
スタティックスケジューリングを用いたデータローカライゼーションにおける配列間パディング

石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究会報告2003-ARC-153-11 2003 ( 40(ARC-153) ) 2003年05月

J-GLOBAL
スタティックスケジューリングを用いたデータローカライゼーションにおける配列間パディング

石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究会報告2003-ARC-153 2003年05月 [査読有り]
Inter-Array Padding for Data Localization with Static Scheduling

Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, 2003-ARC-153-11 2003年05月 [査読有り]
IT競争力強化に向けた産官学連携

笠原博徳

朝日新聞社企画 WASEDA.COM, オピニオン 2003年04月 [査読有り] [招待有り]
マルチグレイン並列処理のための階層的並列性制御手法

小幡元樹, 白子準, 神長浩気, 石坂一久, 笠原博徳

情報処理学会論文誌 44 ( 4 ) 1044 - 1055 2003年04月 [査読有り]

CiNii
最先端の自動並列化コンパイラ技術

笠原博徳

情報処理学会誌 44 ( 4 ) 384 - 392 2003年04月 [査読有り]

CiNii
ＩＴ競争力強化のための研究開発人材---経済産業省アドバンスト並列化コンパイラプロジェクトリーダ,JEITA及びSTARC産官学連携講座の経験を通して---

笠原博徳

経済産業省大臣官房イノベーション・システムにおける研究開発人材に関する研究会 2003年04月 [査読有り]
Hierarchical Parallelism Control Scheme for Multigrain Parallelization

Motoki Obata, Jun Shirako, Hiroki Kaminaga, Kazuhisa Ishizaka, Hironori Kasahara

Trans. of IPSJ 44 ( 4 ) 2003年04月 [査読有り]

J-GLOBAL
Multigrain parallel processing on compiler cooperative OSCAR chip multiprocessor architecture

K Kimura, T Kodaka, M Obata, H Kasahara

IEICE TRANSACTIONS ON ELECTRONICS E86C ( 4 ) 570 - 579 2003年04月 [査読有り]

　概要を見る

This paper describes multigrain parallel processing on OSCAR (Optimally SCheduled Advanced multiprocessoR) chip multiprocessor architecture. OSCAR compiler cooperative chip multiprocessor architecture aims at development of scalable, high effective performance and cost effective chip multiprocessor with ease of use by compiler supports. OSCAR chip multiprocessor architecture integrates simple single issue processors having distributed shared data memory for optimal, use of data locality over different loops and fine grain data transfer and synchronization, local data memory for private data recognized by compiler, and compiler controllable data transfer unit for overlapping data transfer to hide data transfer overhead. This OSCAR chip multiprocessor and OSCAR multigrain parallelizing compiler have been developed. simultaneously. Performance of multigrain parallel processing on OSCAR chip multiprocessor architecture is evaluated using SPEC fp 2000/95 benchmark suite. When microSPARC like single issue core is used, OSCAR chip multiprocessor architecture gives us 2.36 times speedup in fpppp, 2.64 times in su2cor, 2.88 times in turb3d, 2.98 times in hydro2d, 3.84 times in tomcatv, 3.84 times in mgrid and 3.97 times in swim respectively for four processors against single processor.
Collaboration of Industry, Government and Academia for IT Competitive Power Strengthening

Hironori Kasahara

Opinions, WASEDA.COM, Asahi Shimbunnsha 2003年04月 [査読有り]
R&D Human Resource for Strengthening IT Competitive Power---From the experience of a Project Leader of METI Advanced Parallelizing Compiler Project and JEITA & STARC Industry, Government and Academia Cooperative Lectures---

H. Kasahara

METI Minister's Secretariat Sig. on R&D Human Resource for Innovation Systems 2003年04月 [査読有り]
Advanced Automatic Parallelizing Compiler Technology

Hironori Kasahara

IPSJ MAGAZINE 44 ( 4 ) 384 - 392 2003年04月 [査読有り]

J-GLOBAL
研究開発競争力強化に向けた産官学連携寄付講座：JEITA IT最前線

笠原博徳

早稲田大学理工学部・大学院報「塔」78号 2003年03月 [査読有り] [招待有り]
Industry, Government and Academia Collaborative Donated Course for R&D Competitive Power Strengthening

Hironori Kasahara

Waseda University School of Science and Engineering, "Tower", No.78 2003年03月 [査読有り]
Coarse grain task parallel processing with cache optimization on shared memory multiprocessor

Ishizaka, K., Obata, M., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2624 352 - 365 2003年 [査読有り]

DOI

Scopus

3

被引用数

(Scopus)
チップマルチプロセッサ上での粗粒度タスク並列処理によるデータローカライゼーション

中野啓史, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2003-151-3(SHINING2003) 2003 ( 10 ) 13 - 18 2003年01月

　概要を見る

近年，次世代のマイクロプロセッサアーキテクチャとして，複数のプロセッサコアを1チップ上に集積するチップマルチプロセッサ(CMP)が大きな注目を集め，研究及び実用化されている．これらのCMPアーキテクチャは，共有キャッシュ等のメモリアーキテクチャを採用しているが，依然として従来のマルチプロセッサシステムで大きな課題となっていたキャッシュやローカルメモリ等のプロセッサコア近接メモリの有効利用に関する問題を抱えている．一方，筆者等はマルチグレイン並列処理との協調動作による実効性能が高く価格性能比の良いコンピュータシステムの実現を目指して，OSCARCMPを提案している．このOSCAR CMPは，全てのプロセッサコアがアクセスできる集中共有メモリ(CSM)の他に，プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM) を持ち，これらのメモリをコンパイラが適切に使用するデータローカライゼーションを適用することにより，前述のプロセッサコア近接メモリの有効利用に関する問題に対処する．本稿では，FORTRAN プログラムをループ・サブルーチン・基本ブロックの3種類の粗粒度タスクに分割し，粗粒度タスク間の制御依存・データ依存を解析して並列性を抽出する粗粒度タスク並列処理において，配列の生死解析情報を用いて粗粒度タスクの並び替えを行うスタティックスケジューリングアルゴリズムについて述べる．さらに，スケジューリング後のタスクに，生死解析情報を用いてCSM--LDM間のデータ転送を適切に挿入する手法についても説明する．本データローカライゼーション手法を OSCAR FORTRAN マルチグレイン並列化コンパイラ上に実装しOSCAR CMP上で評価を行った結果，SPEC 95fp のTomcatvにおいて，CSMのレイテンシを20クロックとしたときに約1.3倍，40クロックとしたときに約1.6倍の速度向上がそれぞれ得られた．Recently, Chip Multiprocessor (CMP) architecture has attracted much attention as a next-generation microprocessor architecture, and many kinds of CMP have widely developed. However, these CMP architectures still have the problem of effective use of memory system nearby processor cores such as cache and local memory. On the other hand, the authors have proposed OSCAR CMP, which cooperatively works with multigrain parallel processing, to achieve high effective performance and good cost effectiveness. To overcome the problem of effective use of cache and local memory, OSCAR CMP has local data memory (LDM) for processor private data and distributed shared memory (DSM) having two ports for synchronization and data transfer among processor cores, in addition to centralized shared memory (CSM). The multigrain parallelizing compiler uses such memory architecture of OSCAR CMP with data localization scheme that fully uses compile time information. This paper proposes a coarse grain task static scheduling scheme considering data localization using live variable analysis. Furthermore, data transfer between CSM and LDM insertion scheme using information of live variable analysis is also described. This data localization scheme is implemented on OSCAR FORTRAN multigrain parallelizing compiler and is evaluated on OSCAR CMP using Tomcatv form SPEC fp 95 benchmark suite. As the results, the proposed scheme gives us about 1.3 times speedup using 20 clocks as the access latency of CSM, and about 1.6 times using 40 clocks as the access latency of CSM respectively against without data localization scheme.

CiNii J-GLOBAL
マルチグレイン並列性向上のためのインライン展開手法

白子準, 長澤耕平, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2003-151-2(SHINING2003) 2003 ( 10(ARC-151) ) 2003年01月

J-GLOBAL
チップマルチプロセッサ上での粗粒度タスク並列処理によるデータローカライゼーション

中野啓史, 小高剛, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2003-151-3(SHINING2003) 2003 ( 10 ) 13 - 18 2003年01月 [査読有り]

　概要を見る

近年，次世代のマイクロプロセッサアーキテクチャとして，複数のプロセッサコアを1チップ上に集積するチップマルチプロセッサ(CMP)が大きな注目を集め，研究及び実用化されている．これらのCMPアーキテクチャは，共有キャッシュ等のメモリアーキテクチャを採用しているが，依然として従来のマルチプロセッサシステムで大きな課題となっていたキャッシュやローカルメモリ等のプロセッサコア近接メモリの有効利用に関する問題を抱えている．一方，筆者等はマルチグレイン並列処理との協調動作による実効性能が高く価格性能比の良いコンピュータシステムの実現を目指して，OSCARCMPを提案している．このOSCAR CMPは，全てのプロセッサコアがアクセスできる集中共有メモリ(CSM)の他に，プロセッサコアのプライベートデータを格納するローカルデータメモリ(LDM)とプロセッサコア間の同期やデータ転送に使用する2ポートメモリ構成の分散共有メモリ(DSM) を持ち，これらのメモリをコンパイラが適切に使用するデータローカライゼーションを適用することにより，前述のプロセッサコア近接メモリの有効利用に関する問題に対処する．本稿では，FORTRAN プログラムをループ・サブルーチン・基本ブロックの3種類の粗粒度タスクに分割し，粗粒度タスク間の制御依存・データ依存を解析して並列性を抽出する粗粒度タスク並列処理において，配列の生死解析情報を用いて粗粒度タスクの並び替えを行うスタティックスケジューリングアルゴリズムについて述べる．さらに，スケジューリング後のタスクに，生死解析情報を用いてCSM--LDM間のデータ転送を適切に挿入する手法についても説明する．本データローカライゼーション手法を OSCAR FORTRAN マルチグレイン並列化コンパイラ上に実装しOSCAR CMP上で評価を行った結果，SPEC 95fp のTomcatvにおいて，CSMのレイテンシを20クロックとしたときに約1.3倍，40クロックとしたときに約1.6倍の速度向上がそれぞれ得られた．Recently, Chip Multiprocessor (CMP) architecture has attracted much attention as a next-generation microprocessor architecture, and many kinds of CMP have widely developed. However, these CMP architectures still have the problem of effective use of memory system nearby processor cores such as cache and local memory. On the other hand, the authors have proposed OSCAR CMP, which cooperatively works with multigrain parallel processing, to achieve high effective performance and good cost effectiveness. To overcome the problem of effective use of cache and local memory, OSCAR CMP has local data memory (LDM) for processor private data and distributed shared memory (DSM) having two ports for synchronization and data transfer among processor cores, in addition to centralized shared memory (CSM). The multigrain parallelizing compiler uses such memory architecture of OSCAR CMP with data localization scheme that fully uses compile time information. This paper proposes a coarse grain task static scheduling scheme considering data localization using live variable analysis. Furthermore, data transfer between CSM and LDM insertion scheme using information of live variable analysis is also described. This data localization scheme is implemented on OSCAR FORTRAN multigrain parallelizing compiler and is evaluated on OSCAR CMP using Tomcatv form SPEC fp 95 benchmark suite. As the results, the proposed scheme gives us about 1.3 times speedup using 20 clocks as the access latency of CSM, and about 1.6 times using 40 clocks as the access latency of CSM respectively against without data localization scheme.

CiNii
マルチグレイン並列性向上のためのインライン展開手法

白子準, 長澤耕平, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2003-151-2(SHINING2003) 2003年01月 [査読有り]
Data Localization using Coarse Grain Task Parallelization on Chip Multiprocessor

Hirofumi Nakano, Takeshi Kodaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2003-151-3(SHINING2003) 2003年01月 [査読有り]
Multigrain parallel processing on OSCAR CMP

K Kimura, T Kodaka, M Obata, H Kasahara

INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS 56 - 65 2003年 [査読有り]

　概要を見る

It seems that Instruction Level Parallelism (ILP) approach, which has been used by various superscalar processors and VLIW processors for a long time, reaches its limitation of performance improvement. To obtain scalable performance improvement, cost effectiveness and high productivity even in the era of one billion transistors, the cooperative work between software and hardware is getting increasingly important. For this reason, the authors have developed OSCAR (Optimally SCheduled Advanced multiprocessoR) Chip Multiprocessor (OSCAR CMP) and OSCAR multigrain compiler simultaneously. To preserve the scalability in the future, OSCAR CMP has mechanisms for efficient use of parallelism and data locality, and for hiding data transfer overhead. These mechanisms can be fully controlled by the OSCAR multigrain compiler In this paper, the authors focus on multigrain parallel processing on OSCAR CMP, which enables us to exploit loop iteration level parallelism and coarse grain task parallelism in addition to ILP from the entire of a program. Performance of multigrain parallel processing on OSCAR CMP architecture is evaluated using SPEC fp 2000195 benchmark suite. When microSPARC like single issue core is used, OSCAR CMP gives us from 1.77 to 3.96 times speedup for four processors against single processor In addition, OSCAR CMP is compared with Sun UltraSPARC II like processor to evaluate cost effectiveness. As a result, OSCAR CMP gives us 1.66 times better performance on the average under the condition that OSCAR CMP and UltraSPARC II are built from almost same number of transistors.
OSCAR チップマルチプロセッサ上でのマルチグレイン並列処理

木村啓二, 小高剛, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-150-7 2002 ( 112(ARC-150) ) 2002年11月

J-GLOBAL
OSCAR 型シングルチップマルチプロセッサにおける動きベクトル探索処理

小高剛, 鈴木貴久, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2002-150-6 2002 ( 112(ARC-150) ) 2002年11月

J-GLOBAL
OSCAR チップマルチプロセッサ上でのマルチグレイン並列処理

木村啓二, 小高剛, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-150-7 2002年11月 [査読有り]
OSCAR 型シングルチップマルチプロセッサにおける動きベクトル探索処理

小高剛, 鈴木貴久, 木村啓二, 笠原博徳

情報処理学会研究報告ARC2002-150-6 2002年11月 [査読有り]
Multigrain Parallel Processing on OSCAR Chip Multiprocessor

Keiji Kimura, Takeshi Kodaka, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC2002-150-7 2002年11月 [査読有り]
Multigrain Parallel Processing on Motion Vector Estimation for Single Chip Multiprocessor

Takeshi Kodaka, Takahisa Suzuki, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2002-150-6 2002年11月 [査読有り]
Multigrain Parallelizing Compiler for Chip Multiprocessors to High Performance Severs

H. Kasahara

Intel ICRC, China 2002年11月 [査読有り]
A standard task graph set for fair evaluation of multiprocessor scheduling algorithms

Tobita, T., Kasahara, H.

Journal of Scheduling 5 ( 5 ) 379 - 394 2002年10月 [査読有り]

DOI CiNii

Scopus

152

被引用数

(Scopus)
シングルチップマルチプロセッサにおけるJPEGエンコーディングのマルチグレイン並列処理

小高剛, 内田貴之, 木村啓二, 笠原博徳

情報処理学会ハイパフォーマンスコンピューティングシステム論文誌 43 ( Sig.6(HPS5) ) 153 - 62 2002年09月 [査読有り]
NEDO-1 アドバンスト並列化コンパイラ技術

笠原博徳

情報処理学会・電子情報通信学会ＦＩＴ (Forum on Information Technology), 大型プロジェクト紹介（国家プロジェクト紹介）, 東工大百年記念館フェライト会議室 2002年09月 [査読有り]
OSCAR Multigrain Parallelizing Compiler for Chip Multiprocessors to High Performance Severs

H. Kasahara

Polish-Japanese Institute of Information Technology (PJIIT) hosted by Prof. Marek Tudruj 2002年09月 [査読有り]
NEDO-1 Advanced Parallelizing Technology, IPSJ-IEICE FIT2002 (Forum on Information Technology), National Project Introduction

H. Kasahara

2002年09月 [査読有り]
ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化

石坂一久, 中野啓史, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-149-25(SWoPP2002) 2002年08月
Performance of OSCAR Multigrain Parallelizing Compiler on SMPs

Motoki Obata, Jun Shirako, Kazuhisa Ishizaka, Hironori Kasahara

Technical Report of IPSJ, ARC2002-149-20(SWoPP2002) 2002 ( 81(ARC-149) ) 2002年08月 [査読有り]

J-GLOBAL
ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化

石坂一久, 中野啓史, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-149-25(SWoPP2002) 2002 ( 81 ) 145 - 150 2002年08月 [査読有り]

　概要を見る

プロセッサの高速化に伴うメインメモリとの速度差の増大により，キャッシュの有効利用は実効性能の向上に重要な役割を占めるようになっている．本論文では，プログラムを基本ブロック，ループ，サブルーチンといった粗粒度タスクに分割し，それらの間の並列性を利用する粗粒度タスク並列処理における，ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化手法について述べる．本手法では，キャッシュサイズを考慮して複数のループを整合分割することによって，分割後のループがアクセスするデータサイズがキャッシュに収まるようにした後，各分割ループを粗粒度タスクと定義し，同一データを使用する粗粒度タスクを同一プロセッサ上で可能なかぎり連続に実行することのより，複数ループ間でキャッシュの有効利用を図る．さらに，連続実行される粗粒度タスク集合がアクセスするデータに対して，定義された配列サイズを拡大する方式のパディングを用いたデータレイアウトの変更によりラインコンフリクトミスの削減を行う．本手法の性能評価をSun Ultra80上でspec95 のswim用いて行った．合計キャッシュサイズが16MBとなる4PEでの実行では，swimの約13MBのデータセットはパディングによるコンフリクトミスの削減により，ほとんどがキャッシュ上に収まるため，Forteのみを用いた場合の4PEでの最小処理に対して，本手法により6.02倍の性能向上が得られた．一方，データサイズがキャッシュサイズより大きい場合の1PEでの実行では，粗粒度タスク間キャッシュ最適化とパディングの併用することにより処理時間は79.1秒となり，パディングのみを用いたForteの逐次実行時間93.5秒に対して18.2%，OSCARによる粗粒度タスク間キャッシュ最適化のみの処理時間90.1秒に対しては13.9%の性能向上が得られることがわかり，両者を組み合わせて適用する本手法の有効性が確かめられた．また，RS6000 SP 604e上では，本手法での8PE の処理時間は52.0秒と，粗粒度タスク間キャッシュ最適化のみを適用した場合の8PEの処理時間59.2秒と比べ14%向上し，XLFコンパイラが8PEまでで最も良い値を出した6PEの108.0秒に対して2.08倍の性能向上が得られた．Effective use of cache is getting important with the increase of the speed gap between processors and memories. In this paper, cache optimization for coarse grain task parallel processing is described. Coarse grain task parallel processing uses the parallelism among coarse grain tasks such like basic blocks, loops and subroutines to increase effective performance of multiprocessor. In the proposed cache optimization, loops are decomposed to the small loops which access smaller data than cache size. Moreover, these loops are executed as consecutively as possible on the same processor to use cache effectively for data transfer among loops. In addition, the proposed cache optimization eliminates conflict misses among the data used in macro tasks which are consecutively executed on same processor by intra-variable padding which changes array dimension size. The proposed scheme is evaluated on Sun Ultra80 using spec95 swim. The performance of cache optimization among macro tasks (10.0s) gave us 10 times speedup against the sequential execution (99.8s) by elimination of conflict misses for 4 processors on which all data can be put on cache after padding because total cache size exceeds data size. Total speedup using padding and cache optimization among macro tasks (79.1s) is 18% against Sun Forte compiler on single processor (93.5s). Also, in the evaluation on IBM RS6000 SP 604e, the proposed scheme improve the performance of coarse grain task parallel processing by 14% (59.2s to 52.0s) for 8pe, and gave us 2.08 times speedup against XLF compiler for 6pe which gave us the best performance (108.0s).

CiNii
SMPシステム上でのOSCARマルチグレイン並列化コンパイラの性能

小幡元樹, 石坂一久, 白子準, 笠原博徳

情報処理学会研究報告ARC2002-149-20(SWoPP2002) 2002 ( 81 ) 115 - 120 2002年08月 [査読有り]

　概要を見る

本論文ではミレニアムプロジェクトIT21「アドバンスト並列化コンパイラ」の一環として開発しているOSCARマルチグレイン並列化コンパイラについて述べ、SMPマシン上での性能を評価する。OSCARマルチグレイン並列化コンパイラは、オンチップマルチプロセッサからハイエンドサーバに至る様々なシステム上において、従来から利用されてきたループ並列性に加え、ループ・サブルーチン・基本ブロック間の粗粒度並列性と基本ブロック内のステートメント間の近細粒度並列性を階層的に用いることを可能とする。また、メモリアクセスオーバヘッドを軽減するためのデータローカライゼーション手法を用いた、異なるループ間、すなわち粗粒度タスク間にわたるキャッシュ最適化も行うことができる。性能評価では、複数の異なるSMP上においてSPEC CPU95 FPベンチマークを用いてOSCARコンパイラの性能を評価した。その結果、16プロセッササーバIBM RegattaHではMGRIDで逐次処理に対して10.6倍の速度向上、8プロセッササーバIBM RS6000 604e High Node上ではHYDRO2Dで8.5倍、またSun V880サーバ上で4プロセッサを用いた場合、SWIMで6.0倍の速度向上を得ることができた。This paper describes OSCAR multigrain parallelizing compiler which has been developed in Japanese Millennium Project IT21 "Advanced Parallelizing Compiler" and its performance on SMP machines. The compiler realizes multigrain parallelization for chip-multiprocessors to high-end servers to hierarchically exploit coarse grain task parallelism among loops, subroutines and basic blocks and near fine grain parallelism among statements inside a basic block in addition to loop parallelism. Also, it globally optimizes cache use over different loops, or coarse grain tasks, based on data localization technique to reduce memory access overhead. Performance of OSCAR compiler for SPEC95fp is evaluated on different SMPs. For example, it gives us 10.6 times for MGRID on 16 processor IBM RegattaH, 8.5 times speedup for HYDRO2D on 8 processor IBM RS6000 604e High Node against sequential processing and 6.0 times speedup for TOMCATV using 4 processors on Sun Fire V880 server.

CiNii
ミレニアムプロジェクトIT21アドバンスト並列化コンパイラにおけるマルチグレイン並列処理

笠原博徳

自律分散システム研究会（名古屋大学） 2002年08月 [査読有り]
Cache Optimization among Coarse Grain Tasks considering Line Conflict Miss

Kazuhisa Ishizaka, Hirofumi Nakano, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC2002-149-25(SWoPP2002) 2002 ( 81 ) 145 - 150 2002年08月 [査読有り]

　概要を見る

プロセッサの高速化に伴うメインメモリとの速度差の増大により，キャッシュの有効利用は実効性能の向上に重要な役割を占めるようになっている．本論文では，プログラムを基本ブロック，ループ，サブルーチンといった粗粒度タスクに分割し，それらの間の並列性を利用する粗粒度タスク並列処理における，ラインコンフリクトミスを考慮した粗粒度タスク間キャッシュ最適化手法について述べる．本手法では，キャッシュサイズを考慮して複数のループを整合分割することによって，分割後のループがアクセスするデータサイズがキャッシュに収まるようにした後，各分割ループを粗粒度タスクと定義し，同一データを使用する粗粒度タスクを同一プロセッサ上で可能なかぎり連続に実行することのより，複数ループ間でキャッシュの有効利用を図る．さらに，連続実行される粗粒度タスク集合がアクセスするデータに対して，定義された配列サイズを拡大する方式のパディングを用いたデータレイアウトの変更によりラインコンフリクトミスの削減を行う．本手法の性能評価をSun Ultra80上でspec95 のswim用いて行った．合計キャッシュサイズが16MBとなる4PEでの実行では，swimの約13MBのデータセットはパディングによるコンフリクトミスの削減により，ほとんどがキャッシュ上に収まるため，Forteのみを用いた場合の4PEでの最小処理に対して，本手法により6.02倍の性能向上が得られた．一方，データサイズがキャッシュサイズより大きい場合の1PEでの実行では，粗粒度タスク間キャッシュ最適化とパディングの併用することにより処理時間は79.1秒となり，パディングのみを用いたForteの逐次実行時間93.5秒に対して18.2%，OSCARによる粗粒度タスク間キャッシュ最適化のみの処理時間90.1秒に対しては13.9%の性能向上が得られることがわかり，両者を組み合わせて適用する本手法の有効性が確かめられた．また，RS6000 SP 604e上では，本手法での8PE の処理時間は52.0秒と，粗粒度タスク間キャッシュ最適化のみを適用した場合の8PEの処理時間59.2秒と比べ14%向上し，XLFコンパイラが8PEまでで最も良い値を出した6PEの108.0秒に対して2.08倍の性能向上が得られた．Effective use of cache is getting important with the increase of the speed gap between processors and memories. In this paper, cache optimization for coarse grain task parallel processing is described. Coarse grain task parallel processing uses the parallelism among coarse grain tasks such like basic blocks, loops and subroutines to increase effective performance of multiprocessor. In the proposed cache optimization, loops are decomposed to the small loops which access smaller data than cache size. Moreover, these loops are executed as consecutively as possible on the same processor to use cache effectively for data transfer among loops. In addition, the proposed cache optimization eliminates conflict misses among the data used in macro tasks which are consecutively executed on same processor by intra-variable padding which changes array dimension size. The proposed scheme is evaluated on Sun Ultra80 using spec95 swim. The performance of cache optimization among macro tasks (10.0s) gave us 10 times speedup against the sequential execution (99.8s) by elimination of conflict misses for 4 processors on which all data can be put on cache after padding because total cache size exceeds data size. Total speedup using padding and cache optimization among macro tasks (79.1s) is 18% against Sun Forte compiler on single processor (93.5s). Also, in the evaluation on IBM RS6000 SP 604e, the proposed scheme improve the performance of coarse grain task parallel processing by 14% (59.2s to 52.0s) for 8pe, and gave us 2.08 times speedup against XLF compiler for 6pe which gave us the best performance (108.0s).

CiNii
Multigrain Parallel Processing in Millennium Project IT21 Advanced Parallelizing Compiler

H. Kasahara

Sig. on Autonomous Distributed Systems, Nagoya University hosted by Prof. Toshio Fukuda 2002年08月 [査読有り]
並列処理階層自動決定手法を用いた粗粒度タスク並列処理

白子準, 神長浩気, 近藤巧章, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-148-4 2002 ( 37 ) 19 - 24 2002年05月

　概要を見る

チップマルチプロセッサからHPC まで幅広く使われているマルチプロセッサシステムの実効性能の向上使い易さの向上のため基本ブロックループ、サブルーチン間の粗粒度並列処理・ループイタレーション間の中粒度並列処理・基本ブロック内ステートメント間の近細粒度並列処理を階層的に組合せプログラム全域の並列性を利用するマルチグレイン並列処理が重要となっている.マルチグレイン並列処理において階層的に並列性を抽出し効率よい並列実行を実現するためには各々の階層(ネストレベル) の並列性に応じて何台のプロセッサあるいはプロセッサのグループ(プロセッサクラスタ)を割り当てるかを決定する必要がある. 本稿ではプログラム中の各階層の並列性を効果的に用いるための各階層へ割り当てるべきプロセッサ数の決定手法を提案する。本手法の有効性を SMPサーバ IBM RS6000 PowerPC 604e High Node8プロセッサシステム上にて SPEC95FP ベンチマーク中8本を用いて評価を行った結果について述べる.For improvement performance and usablity of multiprocessor systems used from a chip multiprocessor to high performance computer, a multi-grain compilation scheme, which exploits coarse grain parallelism among loops, subroutines and basic blocks, conventional medium grain parallelism among loop-iterations in a Doall loop and near fine grain parallelism among statements inside a basic block, is important. In order to extract the parallelism of each layer(nest level) hierarchically and achieve a better performance in multi-grain parallel processing, it is necessary to determine how much processors or groups of processors(,or processor clusters) should be assigned to the layers, according to the parallelism of the target program layers. This paper proposes an automatic determination scheme of the number of processors to be assigned to each layer, to use the parallelism of each hierarchy in a program efficiently. Effectiveness of the proposed scheme is evaluated on IBM RS6000 SMP server with 8 processors using 8 programs of SPEC95FP.

CiNii
SMPマシン上での粗粒度タスク並列処理オーバーへッドの解析

和田康孝, 中野啓史, 木村啓二, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-148-3 2002年05月
世界トップのIT産業を担う技術と人材の育成

笠原博徳

早稲田大学広報誌月刊 Campus Now 2002/5号 2002年05月 [査読有り] [招待有り]
シングルチップマルチプロセッサにおける JPEGエンコーディングのマルチグレイン並列処理

小高剛, 内田貴之, 木村啓二, 笠原博徳

情報処理学会並列処理シンポジウム(JSPP2002) 2002年05月 [査読有り]
並列処理階層自動決定手法を用いた粗粒度タスク並列処理

白子準, 神長浩気, 近藤巧章, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-148-4 2002 ( 37 ) 19 - 24 2002年05月 [査読有り]

　概要を見る

チップマルチプロセッサからHPC まで幅広く使われているマルチプロセッサシステムの実効性能の向上使い易さの向上のため基本ブロックループ、サブルーチン間の粗粒度並列処理・ループイタレーション間の中粒度並列処理・基本ブロック内ステートメント間の近細粒度並列処理を階層的に組合せプログラム全域の並列性を利用するマルチグレイン並列処理が重要となっている.マルチグレイン並列処理において階層的に並列性を抽出し効率よい並列実行を実現するためには各々の階層(ネストレベル) の並列性に応じて何台のプロセッサあるいはプロセッサのグループ(プロセッサクラスタ)を割り当てるかを決定する必要がある. 本稿ではプログラム中の各階層の並列性を効果的に用いるための各階層へ割り当てるべきプロセッサ数の決定手法を提案する。本手法の有効性を SMPサーバ IBM RS6000 PowerPC 604e High Node8プロセッサシステム上にて SPEC95FP ベンチマーク中8本を用いて評価を行った結果について述べる.For improvement performance and usablity of multiprocessor systems used from a chip multiprocessor to high performance computer, a multi-grain compilation scheme, which exploits coarse grain parallelism among loops, subroutines and basic blocks, conventional medium grain parallelism among loop-iterations in a Doall loop and near fine grain parallelism among statements inside a basic block, is important. In order to extract the parallelism of each layer(nest level) hierarchically and achieve a better performance in multi-grain parallel processing, it is necessary to determine how much processors or groups of processors(,or processor clusters) should be assigned to the layers, according to the parallelism of the target program layers. This paper proposes an automatic determination scheme of the number of processors to be assigned to each layer, to use the parallelism of each hierarchy in a program efficiently. Effectiveness of the proposed scheme is evaluated on IBM RS6000 SMP server with 8 processors using 8 programs of SPEC95FP.

CiNii
SMPマシン上での粗粒度タスク並列処理オーバーへッドの解析

和田康孝, 中野啓史, 木村啓二, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC2002-148-3 2002 ( 37 ) 13 - 18 2002年05月 [査読有り]

　概要を見る

マルチプロセッサシステムの実効性能を今後さらに高めていくためには，ループ並列処理に加え，ループ・サブルーチン・基本ブロック間の並列性を利用する粗粒度タスク並列処理の利用が重要である．この粗粒度タスク並列処理をより効果的に実現するためには，各種オーバーヘッドを定量的に解析する必要がある．本稿では，Sun Ultra80，IBM RS/6000 7044 Model 270，SGI Origin2000の各プラットフォーム上に用意された測定機能により，L2キャッシュメモリのミスペナルティ，バリア同期およびスレッド生成のオーバーヘッドについて解析を行い，その結果をもとにOSCAR Fortran 並列化コンパイラによる性能向上の要因について述べる．Coarse grain task parallel processing, which exploits parallelism among loops, subroutines and basic blocks, is getting more important to attain performance improvement on multiprocessor architectures. To efficiently implement the coarse grain task parallel processing, it is important to analyze various processor overhead quantitatively. This paper evaluates overheads of barrier synchronization, thread fork/join and L2 cache miss penalty are using performance measurement mechanisms to analyze the performance improvements by OSCAR Fortran compiler on Sun Ultra80, IBM RS6000 and SGI Origin2000.

CiNii
Upbringing of Technology and Human Resource Aiming at World Top IT Industry

Hironori Kasahara

Waseda Univ. Monthly Report "Campus Now" Vol.5, 2002 2002年05月 [査読有り]
Coarse Grain Task Parallel Processing with Automatic Determination Scheme of Parallel Processing Layer

Jun Shirako, Hiroki Kaminaga, Noriaki Kondo, Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC2002-148-4 2002 ( 37 ) 19 - 24 2002年05月 [査読有り]

　概要を見る

チップマルチプロセッサからHPC まで幅広く使われているマルチプロセッサシステムの実効性能の向上使い易さの向上のため基本ブロックループ、サブルーチン間の粗粒度並列処理・ループイタレーション間の中粒度並列処理・基本ブロック内ステートメント間の近細粒度並列処理を階層的に組合せプログラム全域の並列性を利用するマルチグレイン並列処理が重要となっている.マルチグレイン並列処理において階層的に並列性を抽出し効率よい並列実行を実現するためには各々の階層(ネストレベル) の並列性に応じて何台のプロセッサあるいはプロセッサのグループ(プロセッサクラスタ)を割り当てるかを決定する必要がある. 本稿ではプログラム中の各階層の並列性を効果的に用いるための各階層へ割り当てるべきプロセッサ数の決定手法を提案する。本手法の有効性を SMPサーバ IBM RS6000 PowerPC 604e High Node8プロセッサシステム上にて SPEC95FP ベンチマーク中8本を用いて評価を行った結果について述べる.For improvement performance and usablity of multiprocessor systems used from a chip multiprocessor to high performance computer, a multi-grain compilation scheme, which exploits coarse grain parallelism among loops, subroutines and basic blocks, conventional medium grain parallelism among loop-iterations in a Doall loop and near fine grain parallelism among statements inside a basic block, is important. In order to extract the parallelism of each layer(nest level) hierarchically and achieve a better performance in multi-grain parallel processing, it is necessary to determine how much processors or groups of processors(,or processor clusters) should be assigned to the layers, according to the parallelism of the target program layers. This paper proposes an automatic determination scheme of the number of processors to be assigned to each layer, to use the parallelism of each hierarchy in a program efficiently. Effectiveness of the proposed scheme is evaluated on IBM RS6000 SMP server with 8 processors using 8 programs of SPEC95FP.

CiNii
Evaluation of Overhead with Coarse Grain Task Parallel Processing on SMP Machines

Yasutaka Wada, Hirofumi Nakano, Keiji Kimura, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC2002-148-3 2002年05月 [査読有り]
JPEG Encoding using Multigrain Parallel Processing on a Shingle Chip Multiprocessor

Takeshi Kodaka, Takayuki Uchida, Keiji Kimura, Hironori Kasahara

Joint Symposium on Parallel Processing 2002 (JSPP2002) 43 ( 6 ) 153 - 162 2002年05月 [査読有り]

CiNii
標準タスクグラフセットを用いた実行時間最小マルチプロセッサスケジューリングアルゴリズムの性能評価

飛田高雄, 笠原博徳

情報処理学会論文誌 43 ( 4 ) 936 - 947 2002年04月 [査読有り]

　概要を見る

本論文では，強NP困難な組合せ最適化問題である実行時間最小マルチプロセッサスケジューリング問題に対するヒューリスティックアルゴリズム，逐次および並列最適化アルゴリズムの性能評価のための``標準タスクグラフセット''と名付けたランダムタスクグラフ集を提案するとともに，それを用いたアルゴリズムの評価について述べる．従来のマルチプロセッサスケジューリングアルゴリズムの研究においては，評価に使われたランダムグラフが提案アルゴリズムに都合のよいランダムグラフである，あるいは他の研究者が検証しようとしても使われたグラフが手に入らずどのアルゴリズムが真に良いのかを比較できないという問題があった．提案する標準タスクグラフセットはこの問題を解決するため，従来の論文で使用された種々のランダムグラフ生成法を用い多種のランダムタスクグラフを生成するとともにタスクグラフとその解などの情報をWebサイトで公開しており，これを用いることで今後スケジューリングアルゴリズム研究者が各種アルゴリズムも同一条件下で公平に評価し，アルゴリズムの性能を比較することが可能となる．また本論文ではこの標準タスクグラフセットのタスク数50から5 000までのタスクグラフ2 700例を用いてアルゴリズムの評価を行い，標準タスクグラフセットの有効性の評価も行う．この評価ではヒューリスティックアルゴリズムCP，CP/MISFではそれぞれ全問題の68.22%，68.46%に，逐次最適化アルゴリズムDF/IHSでは600秒の探索上限時間内に85.79%，並列最適化アルゴリズムPDF/IHSでは4プロセッサSMP上で89.60%に最適解が得られることが確かめられ，提案する標準タスクグラフセットがヒューリスティックおよび逐次・並列最適化アルゴリズムの評価に有効であることが確認された．This paper proposes a ``Standard Task Graph Set'' (STG) to evaluate performance of heuristic and optimization algorithms for the minimum execution time multiprocessor scheduling problem, which is known as a strong NP-hard combinational optimization problem, and describes evaluation results by applying them to several algorithms. In the previous researches on multiprocessor scheduling algorithms, there exists a problem that it is not able to compare the performance to decide which algorithm is better, because the task graphs fit for the algorithm proposed in each paper or were not available to the other researchers. To cope with this problem, STG makes possible the fair evaluation and comparison of the algorithms under the same conditions for every researchers by giving many kinds of random task graphs based on various task graph generation methods used in the literature with their scheduling results, and making them available from Website.This paper evaluates several algorithms using 2,700 task graphs with 50 to 5,000 tasks from STG and evaluates its effectiveness.The performance evaluation confirms that heuristic algorithms CP and CP/MISF could obtain optimal schedules 68.22% and 68.46% of tested cases, 85.79% by a sequential optimization algorithm DF/IHS, and 89.60% by a parallel optimization algorithm PDF/IHS on a SMP with 4 processor elements within 600 seconds upper limit.It was also confirmed that the proposed STG is useful for evaluation of the heuristic and the optimization scheduling algorithms.

CiNii
共有メモリマルチプロセッサ上でのキャッシュ最適化を考慮した粗粒度タスク並列処理

石坂一久, 中野啓史, 八木哲志, 小幡元樹, 笠原博徳

情報処理学会論文誌 43 ( 4 ) 958 - 970 2002年04月 [査読有り]

　概要を見る

主記憶共有型マルチプロセッサシステムは幅広く使われているが，プロセッサ数の増加にともないその最大性能と実効性能の差が拡大してきている．このような問題を解決するためには，従来のループ並列処理に加えて，粗粒度タスク並列性，近細粒度並列性などのマルチグレイン並列性の利用が重要な技術である．また，プロセッサ技術の進歩とともに，プロセッサとメモリの速度差が顕在化し，その速度差を補うためのメモリ階層，特にキャッシュの有効利用は，マルチプロセッサシステムの性能向上に重要な要因となっている．本論文では，ループ並列化に加えプログラムを基本ブロック，ループ，サブルーチンといった粗粒度タスク（マクロタスク）に分割し，それらの間の並列性を効果的に利用するとともに，従来OSCAR型マルチプロセッサアーキテクチャにおけるローカルメモリおよび分散共有メモリ用に提案されていたデータローカライゼーション手法を主記憶共有型マルチプロセッサ上のキャッシュ最適化用に発展させたデータ分散・ダイナミックスケジューリング手法を提案する．本手法はOSCARマルチグレインコンパイラ上で実現され，逐次FORTRANプログラムを入力すると，共有メモリマシンにおける標準APIであるOpenMPを用いて複数マクロタスク間でキャッシュ上の共有データを再利用する並列化コードを自動生成する．本手法の評価を商用SMPマシンであるIBM RS/6000 604e High Node，Sun Ultra80上でspec95fpベンチマークのtomcatv，swim，mgridを用いて行った結果，IBM RS/6000上ではIBM XL FORTRAN version 6.1コンパイラの自動ループ並列化を行った場合の最小実行時間に対して本手法は最大5.8倍の性能向上を示し，Sun Ultra80上ではSun Forte 6 update 1コンパイラの最小時間に対して最大3.6倍の性能向上が得られることが確かめられた．In multiprocessor systems,the gap between peak and effective performance has getting larger.To cope with this performance gap,it is important to use multigrain parallelismin addition to ordinary loop level parallelism.Also, effective use of memory hierarchy is importantfor the performance improvement of multiprocessor systemsbecause the speed gap between processors and memories is gettinglarger.This paper describes coarse grain task parallel processingthat uses parallelism among macro-tasks like loops and subroutinesconsidering cache optimization using data localization scheme.The proposed scheme is implemented on OSCAR automatic multigrainparallelizing compiler. OSCAR compiler generates OpenMP FORTRAN programrealizing the proposed scheme from an ordinary FORTRAN77 program.Its performance is evaluated on IBM RS6000SP 604e High Node 8 processors SMP machine and Sun Ultra80 4 processors SMP machine.In the evaluation,OSCAR compiler gives us up to 5.8 times speedup againstthe minimum execution time of IBM XL FORTRAN compiler on IBM RS/6000 and up to 3.6 times speedup against Sun Forte 6 update 1 compileron Sun Ultra80.

CiNii
Coarse Grain Task Parallel Processing with Cache Optimization on Shared Memory Multiprocessor

Kazuhisa Ishizaka, Hirofumi Nakano, Satoshi Yagi, Motoki Obata, Hironori Kasahara

Trans. of IPSJ 43 ( 4 ) 958 - 970 2002年04月 [査読有り]

　概要を見る

主記憶共有型マルチプロセッサシステムは幅広く使われているが，プロセッサ数の増加にともないその最大性能と実効性能の差が拡大してきている．このような問題を解決するためには，従来のループ並列処理に加えて，粗粒度タスク並列性，近細粒度並列性などのマルチグレイン並列性の利用が重要な技術である．また，プロセッサ技術の進歩とともに，プロセッサとメモリの速度差が顕在化し，その速度差を補うためのメモリ階層，特にキャッシュの有効利用は，マルチプロセッサシステムの性能向上に重要な要因となっている．本論文では，ループ並列化に加えプログラムを基本ブロック，ループ，サブルーチンといった粗粒度タスク（マクロタスク）に分割し，それらの間の並列性を効果的に利用するとともに，従来OSCAR型マルチプロセッサアーキテクチャにおけるローカルメモリおよび分散共有メモリ用に提案されていたデータローカライゼーション手法を主記憶共有型マルチプロセッサ上のキャッシュ最適化用に発展させたデータ分散・ダイナミックスケジューリング手法を提案する．本手法はOSCARマルチグレインコンパイラ上で実現され，逐次FORTRANプログラムを入力すると，共有メモリマシンにおける標準APIであるOpenMPを用いて複数マクロタスク間でキャッシュ上の共有データを再利用する並列化コードを自動生成する．本手法の評価を商用SMPマシンであるIBM RS/6000 604e High Node，Sun Ultra80上でspec95fpベンチマークのtomcatv，swim，mgridを用いて行った結果，IBM RS/6000上ではIBM XL FORTRAN version 6.1コンパイラの自動ループ並列化を行った場合の最小実行時間に対して本手法は最大5.8倍の性能向上を示し，Sun Ultra80上ではSun Forte 6 update 1コンパイラの最小時間に対して最大3.6倍の性能向上が得られることが確かめられた．In multiprocessor systems,the gap between peak and effective performance has getting larger.To cope with this performance gap,it is important to use multigrain parallelismin addition to ordinary loop level parallelism.Also, effective use of memory hierarchy is importantfor the performance improvement of multiprocessor systemsbecause the speed gap between processors and memories is gettinglarger.This paper describes coarse grain task parallel processingthat uses parallelism among macro-tasks like loops and subroutinesconsidering cache optimization using data localization scheme.The proposed scheme is implemented on OSCAR automatic multigrainparallelizing compiler. OSCAR compiler generates OpenMP FORTRAN programrealizing the proposed scheme from an ordinary FORTRAN77 program.Its performance is evaluated on IBM RS6000SP 604e High Node 8 processors SMP machine and Sun Ultra80 4 processors SMP machine.In the evaluation,OSCAR compiler gives us up to 5.8 times speedup againstthe minimum execution time of IBM XL FORTRAN compiler on IBM RS/6000 and up to 3.6 times speedup against Sun Forte 6 update 1 compileron Sun Ultra80.

CiNii
共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法

八木哲志, 板垣裕樹, 中野啓史, 石坂一久, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会研究報告 ARC 2002 ( 22(ARC-147 HPC-89) ) 2002年03月

J-GLOBAL
粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング

熊澤慎也, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告 ARC 2002 ( 22(ARC-147 HPC-89) ) 2002年03月

J-GLOBAL
粗粒度並列性抽出のための解析時インライニングとフレキシブルクローニング

熊澤慎也, 石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告 ARC 2002 ( 22 ) 191 - 196 2002年03月 [査読有り]

　概要を見る

本論文では，粗粒度タスク並列性の更なる抽出を目的として，解析時のインライン展開，並列性解析，フレキシブルクローニングを組み合わせたプロシージャ間並列性解析手法を提案する．本手法は，解析を目的としてコンパイラ内部でインライン展開を施し並列性解析を行った後，解析された並列性を失わないように並列性のない部分を``フレキシブルクローニング''すなわちオリジナルソースあるいは別な形のサブルーチンに変換し，コード量の増加を抑える．この並列性解析手法により，生成コードの過度な増加を抑えつつグローバルな粗粒度タスク並列性を有効に引き出すことができる．SUN Ultra80 4プロセッサSMPワークステーション上でPerfect Club BenchmarkのARC2Dを用いて性能評価を行った結果，提案手法により，SUN Forteコンパイラの自動並列処理に比べて，本手法を適用しマルチグレイン並列化を行うことで4プロセッサ上で約15%のスピードアップが得られ，またコードサイズでもインライン展開のみを用いるとソースプログラムに対しオブジェクトコードで26.8%のコード量増大になるのに対し，フレキシブルクローニング手法を用いることで，コード増加量を14.8%に抑えられていることが確認された．This paper proposes an interprocedural parallelism analysis scheme which combines analysis-time inline expansion and flexible cloning for coarse-grain parallelization. The analysis-time inlining is applied to selected subroutines. After the analysis of global parallelism over procedures, compiler generates inlined code for program part having global parallelism or applies ``flexible cloning'' to program parts without global parallelism into the original shape or different shape of subroutine. With this scheme, the compiler can exploit global coarse-grain with minimum increase in the code size. Performance evaluation using benchmark program ARC2D on SUN Ultra80 shows the proposed scheme gives us maximum 15% speedup than automatic parallelization of SUN Forte compiler. And by using flexible cloning, increase of code size has reduced by 14.8% from the case which doesn't use it.

CiNii
共有メモリマルチプロセッサ上でのデータローカライゼーション対象マクロタスク決定手法

八木哲志, 板垣裕樹, 中野啓史, 石坂一久, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会研究報告 ARC 2002年03月 [査読有り]

CiNii
An Analysis-time Procedure Inlining and Flexible Cloning Scheme for Coarse-grain Automatic Parallelizing Compilation

Shin-ya Kumazawa, Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC 2002 ( 22 ) 191 - 196 2002年03月 [査読有り]

　概要を見る

本論文では，粗粒度タスク並列性の更なる抽出を目的として，解析時のインライン展開，並列性解析，フレキシブルクローニングを組み合わせたプロシージャ間並列性解析手法を提案する．本手法は，解析を目的としてコンパイラ内部でインライン展開を施し並列性解析を行った後，解析された並列性を失わないように並列性のない部分を``フレキシブルクローニング''すなわちオリジナルソースあるいは別な形のサブルーチンに変換し，コード量の増加を抑える．この並列性解析手法により，生成コードの過度な増加を抑えつつグローバルな粗粒度タスク並列性を有効に引き出すことができる．SUN Ultra80 4プロセッサSMPワークステーション上でPerfect Club BenchmarkのARC2Dを用いて性能評価を行った結果，提案手法により，SUN Forteコンパイラの自動並列処理に比べて，本手法を適用しマルチグレイン並列化を行うことで4プロセッサ上で約15%のスピードアップが得られ，またコードサイズでもインライン展開のみを用いるとソースプログラムに対しオブジェクトコードで26.8%のコード量増大になるのに対し，フレキシブルクローニング手法を用いることで，コード増加量を14.8%に抑えられていることが確認された．This paper proposes an interprocedural parallelism analysis scheme which combines analysis-time inline expansion and flexible cloning for coarse-grain parallelization. The analysis-time inlining is applied to selected subroutines. After the analysis of global parallelism over procedures, compiler generates inlined code for program part having global parallelism or applies ``flexible cloning'' to program parts without global parallelism into the original shape or different shape of subroutine. With this scheme, the compiler can exploit global coarse-grain with minimum increase in the code size. Performance evaluation using benchmark program ARC2D on SUN Ultra80 shows the proposed scheme gives us maximum 15% speedup than automatic parallelization of SUN Forte compiler. And by using flexible cloning, increase of code size has reduced by 14.8% from the case which doesn't use it.

CiNii
A Macrotask selection technique for Data-Localization Scheme on Shared-memory Multi-Processor

Satoshi Yagi, Hiroki Itagaki, Hirofumi Nakano, Kazuhisa Ishizaka, Motoki Obata, Akimasa Yoshida, Hironori Kasahara

Technical Report of IPSJ, ARC 2002年03月 [査読有り]
商用SMP上での粗粒度タスク並列処理

小幡元樹, 石坂一久, 神長浩気, 中野啓史, 吉田明正, 笠原博徳

情報処理学会研究報告ARC-2002-146-10 2002 ( 9 ) 55 - 60 2002年02月

　概要を見る

本論文では，SPEC95ベンチマークとPerfect Clubベンチマークの5本のプログラムを用い，商用SMP上におけるOSCARマルチグレイン並列化コンパイラを用いた粗粒度並列処理の評価を行う．現在，サーバアーキテクチャの主流であるSMP上での自動並列化コンパイラを用いた並列処理では，ループレベル並列処理の性能が飽和状態に達しており，その限界を越えるため粗粒度タスク並列処理が研究されている．OSCAR FORTRAN コンパイラにおける粗粒度並列処理手法では，ソースプログラム中のサブルーチン・ループ・基本ブロック間の並列性を抽出し，各種SMP上で粗粒度タスク並列化を実現するために，OpenMPを用いたワンタイムシングルレベルスレッド生成手法を用いている．さらにSMPで問題になる共有メモリアクセスオーバヘッドを軽減するため，複数タスク間での共有データの授受にキャッシュを最大限利用しようとするデータローカライゼーション手法を併用することで，さらに性能を向上させることができる．これらの技術を用いて，本論文では商用SMPサーバ IBM RS6000 SP 604e High Node，SMPワークステーションSUN Ultra80 での粗粒度並列化の性能評価を行った．その結果，粗粒度並列処理は，スレッド管理オーバヘッド，メモリアクセスオーバヘッドの軽減により既存のループ自動並列化コンパイラの性能を5つのアプリケーションにおいて60%から430%上回ることが確認された．This paper evaluates performance of coarse grain task parallel processing using OSCAR Multigrain Parallelizing Compiler for five applications from SPEC95FP and Perfect Club benchmarks on commercial SMP machines.The coarse grain task parallel processing is important to improve the effective performance of SMP machines beyond the limit of the loop parallelism. In this OSCAR compiler, One-time Single Level Thread Generation scheme using OpenMP API and a data localization scheme are used to realize coarse grain task parallelization efficiently on various SMP machines. The evaluation shows that the coarse grain parallel processing gives us 60-430% larger speed up than the automatic loop parallelizing compiler for the five applications by the reduction of overheads of thread management and shared memory access on SMP server IBM RS6000 SP 604e High Node and SMP workstation SUN Ultra80.

CiNii
OSCAR型シングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理

小高剛, 内田貴之, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2002-146-4 2002 ( 9 ) 19 - 24 2002年02月

　概要を見る

近年のJPEG MPEGなどを用いたマルチメディアコンテンツの増加に伴い，これらマルチメディアアプリケーションを効率良く処理できる低コストかつ低消費電力のプロセッサの開発が望まれている．特に，簡素なプロセッサコアを複数搭載したシングルチップマルチプロセッサアーキテクチャは最も有望なアプローチとして注目され研究・開発がなされている．本論文では，OSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理手法を提案すると共に，提案手法を適用したJPEGエンコーディングプログラムのOSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上で評価を行なった．その結果，シンプルなシングルイシュープロセッサを4基搭載したOSCAR型シングルチップマルチプロセッサでは，逐次実行に対して約3.59倍の性能向上が得られ，ほぼ同程度のトランジスタ数であると考えられるUltraSPARC-II相当の4イシュースーパースカラプロセッサをコアとしたアーキテクチャに対しても約2.87倍の性能向上が得られた．With the recent increase of multimedia contests using JPEG and MPEG, low cost, low power consumption and high performance processors for multimedia have been expected. Particularly, single chip multiprocessor architecture having simple processor cores is attracting much attention to develop such processors. This paper describes multigrain parallel processing scheme for a JPEG encoding program for OSCAR type single chip multiprocessor and its performance. The evaluation shows an OSCAR type single chip multiprocessor having four single-issue simple processor cores gave us 3.59 times speed-up than sequencial execution and 2.87 times speed-up than OSCAR type single chip multiprocessor that has a four-issue UltraSPARC-II type super-scaler processor core.

CiNii
シングルチップマルチプロセッサにおけるマルチグレイン並列処理

内田貴之, 木村啓二, 小高剛, 笠原博徳

情報処理学会研究報告ARC-2002-146-5 2002 ( 9 ) 13 - 18 2002年02月

　概要を見る

半導体集積度の向上と共にチップ上の資源の有効利用によるスケーラブルな性能向上を目指す次世代マイクロプロセッサアーキテクチャおよびそのソフトウェア技術（特にコンパイラ技術）の開発が求められている.このような次世代マイクロプロセッサアーキテクチャとしては従来のスーパースカラ VLIWのような命令レベル並列性のみでなく異なる粒度の並列性を階層的に組合せプログラム全体より並列性を抽出できるマルチグレイン並列処理を実現するシングルチップマルチプロセッサ（SCM）が実効性能を高め集積度向上に対しスケーラブルな性能向上が可能なアーキテクチャとして有望であると考えられる．本論文では SPEC2000fp及びSPEC95fpより5本のプログラムに対しマルチグレイン並列処理を適用し SCMの性能評価を行った.その結果 4プロセッサを搭載したSCMはマルチグレイン並列処理により1プロセッサの場合に対して1.4?3.8倍の速度向上が得られることが確かめられた.With the advances in semiconductor integration technology, efficient use of transisors on a chip and scalable performance improvement have been demanded. To satisfy this demand, many researches on next generation microprocessor architectures and its software, especially compilers, have been performed. In these next generation microprocessor architectures, a single chip multiprocessor(SCM) using multigrain parallel processing, which hierarchically exploits different level of parallelism from the whole program, is one of the most promising architectures. This paper evaluates performance of the SCM architectures for multigrain parallel processing, using five application programs from SPEC2000fp and SPEC95fp. The evaluation shows that a four-processor cores SCM using multigrain parallel processing gives us 1.4 to 3.8 times larger speed up against a simple processor.

CiNii
シングルチップマルチプロセッサにおけるマルチグレイン並列処理

内田貴之, 木村啓二, 小高剛, 笠原博徳

情報処理学会研究報告ARC-2002-146-5 2002 ( 9 ) 13 - 18 2002年02月 [査読有り]

　概要を見る

半導体集積度の向上と共にチップ上の資源の有効利用によるスケーラブルな性能向上を目指す次世代マイクロプロセッサアーキテクチャおよびそのソフトウェア技術（特にコンパイラ技術）の開発が求められている.このような次世代マイクロプロセッサアーキテクチャとしては従来のスーパースカラ VLIWのような命令レベル並列性のみでなく異なる粒度の並列性を階層的に組合せプログラム全体より並列性を抽出できるマルチグレイン並列処理を実現するシングルチップマルチプロセッサ（SCM）が実効性能を高め集積度向上に対しスケーラブルな性能向上が可能なアーキテクチャとして有望であると考えられる．本論文では SPEC2000fp及びSPEC95fpより5本のプログラムに対しマルチグレイン並列処理を適用し SCMの性能評価を行った.その結果 4プロセッサを搭載したSCMはマルチグレイン並列処理により1プロセッサの場合に対して1.4?3.8倍の速度向上が得られることが確かめられた.With the advances in semiconductor integration technology, efficient use of transisors on a chip and scalable performance improvement have been demanded. To satisfy this demand, many researches on next generation microprocessor architectures and its software, especially compilers, have been performed. In these next generation microprocessor architectures, a single chip multiprocessor(SCM) using multigrain parallel processing, which hierarchically exploits different level of parallelism from the whole program, is one of the most promising architectures. This paper evaluates performance of the SCM architectures for multigrain parallel processing, using five application programs from SPEC2000fp and SPEC95fp. The evaluation shows that a four-processor cores SCM using multigrain parallel processing gives us 1.4 to 3.8 times larger speed up against a simple processor.

CiNii
OSCAR型シングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理

小高剛, 内田貴之, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2002-146-4 2002 ( 9 ) 19 - 24 2002年02月 [査読有り]

　概要を見る

近年のJPEG MPEGなどを用いたマルチメディアコンテンツの増加に伴い，これらマルチメディアアプリケーションを効率良く処理できる低コストかつ低消費電力のプロセッサの開発が望まれている．特に，簡素なプロセッサコアを複数搭載したシングルチップマルチプロセッサアーキテクチャは最も有望なアプローチとして注目され研究・開発がなされている．本論文では，OSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理手法を提案すると共に，提案手法を適用したJPEGエンコーディングプログラムのOSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上で評価を行なった．その結果，シンプルなシングルイシュープロセッサを4基搭載したOSCAR型シングルチップマルチプロセッサでは，逐次実行に対して約3.59倍の性能向上が得られ，ほぼ同程度のトランジスタ数であると考えられるUltraSPARC-II相当の4イシュースーパースカラプロセッサをコアとしたアーキテクチャに対しても約2.87倍の性能向上が得られた．With the recent increase of multimedia contests using JPEG and MPEG, low cost, low power consumption and high performance processors for multimedia have been expected. Particularly, single chip multiprocessor architecture having simple processor cores is attracting much attention to develop such processors. This paper describes multigrain parallel processing scheme for a JPEG encoding program for OSCAR type single chip multiprocessor and its performance. The evaluation shows an OSCAR type single chip multiprocessor having four single-issue simple processor cores gave us 3.59 times speed-up than sequencial execution and 2.87 times speed-up than OSCAR type single chip multiprocessor that has a four-issue UltraSPARC-II type super-scaler processor core.

CiNii
商用SMP上での粗粒度タスク並列処理

小幡元樹, 石坂一久, 神長浩気, 中野啓史, 吉田明正, 笠原博徳

情報処理学会研究報告ARC-2002-146-10 2002 ( 9 ) 55 - 60 2002年02月 [査読有り]

　概要を見る

本論文では，SPEC95ベンチマークとPerfect Clubベンチマークの5本のプログラムを用い，商用SMP上におけるOSCARマルチグレイン並列化コンパイラを用いた粗粒度並列処理の評価を行う．現在，サーバアーキテクチャの主流であるSMP上での自動並列化コンパイラを用いた並列処理では，ループレベル並列処理の性能が飽和状態に達しており，その限界を越えるため粗粒度タスク並列処理が研究されている．OSCAR FORTRAN コンパイラにおける粗粒度並列処理手法では，ソースプログラム中のサブルーチン・ループ・基本ブロック間の並列性を抽出し，各種SMP上で粗粒度タスク並列化を実現するために，OpenMPを用いたワンタイムシングルレベルスレッド生成手法を用いている．さらにSMPで問題になる共有メモリアクセスオーバヘッドを軽減するため，複数タスク間での共有データの授受にキャッシュを最大限利用しようとするデータローカライゼーション手法を併用することで，さらに性能を向上させることができる．これらの技術を用いて，本論文では商用SMPサーバ IBM RS6000 SP 604e High Node，SMPワークステーションSUN Ultra80 での粗粒度並列化の性能評価を行った．その結果，粗粒度並列処理は，スレッド管理オーバヘッド，メモリアクセスオーバヘッドの軽減により既存のループ自動並列化コンパイラの性能を5つのアプリケーションにおいて60%から430%上回ることが確認された．This paper evaluates performance of coarse grain task parallel processing using OSCAR Multigrain Parallelizing Compiler for five applications from SPEC95FP and Perfect Club benchmarks on commercial SMP machines.The coarse grain task parallel processing is important to improve the effective performance of SMP machines beyond the limit of the loop parallelism. In this OSCAR compiler, One-time Single Level Thread Generation scheme using OpenMP API and a data localization scheme are used to realize coarse grain task parallelization efficiently on various SMP machines. The evaluation shows that the coarse grain parallel processing gives us 60-430% larger speed up than the automatic loop parallelizing compiler for the five applications by the reduction of overheads of thread management and shared memory access on SMP server IBM RS6000 SP 604e High Node and SMP workstation SUN Ultra80.

CiNii
Multigrain Parallel Processing for JPEG Encoding Program on an OSCAR type Single Chip Multiprocessor

Takeshi Kodaka, Takayuki Uchida, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2002-146-4 2002 ( 9 ) 19 - 24 2002年02月 [査読有り]

　概要を見る

近年のJPEG MPEGなどを用いたマルチメディアコンテンツの増加に伴い，これらマルチメディアアプリケーションを効率良く処理できる低コストかつ低消費電力のプロセッサの開発が望まれている．特に，簡素なプロセッサコアを複数搭載したシングルチップマルチプロセッサアーキテクチャは最も有望なアプローチとして注目され研究・開発がなされている．本論文では，OSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上でのJPEGエンコーディングプログラムのマルチグレイン並列処理手法を提案すると共に，提案手法を適用したJPEGエンコーディングプログラムのOSCAR型メモリアーキテクチャシングルチップマルチプロセッサ上で評価を行なった．その結果，シンプルなシングルイシュープロセッサを4基搭載したOSCAR型シングルチップマルチプロセッサでは，逐次実行に対して約3.59倍の性能向上が得られ，ほぼ同程度のトランジスタ数であると考えられるUltraSPARC-II相当の4イシュースーパースカラプロセッサをコアとしたアーキテクチャに対しても約2.87倍の性能向上が得られた．With the recent increase of multimedia contests using JPEG and MPEG, low cost, low power consumption and high performance processors for multimedia have been expected. Particularly, single chip multiprocessor architecture having simple processor cores is attracting much attention to develop such processors. This paper describes multigrain parallel processing scheme for a JPEG encoding program for OSCAR type single chip multiprocessor and its performance. The evaluation shows an OSCAR type single chip multiprocessor having four single-issue simple processor cores gave us 3.59 times speed-up than sequencial execution and 2.87 times speed-up than OSCAR type single chip multiprocessor that has a four-issue UltraSPARC-II type super-scaler processor core.

CiNii
Multigrain Parallel Processing on Single Chip Multiprocessor

Takayuki Uchida, Takeshi Kodaka, Keiji Kimura, Hironori Kasahara

Technical Report of IPSJ, ARC2002-146-3 2002 ( 9 ) 13 - 18 2002年02月 [査読有り]

　概要を見る

半導体集積度の向上と共にチップ上の資源の有効利用によるスケーラブルな性能向上を目指す次世代マイクロプロセッサアーキテクチャおよびそのソフトウェア技術（特にコンパイラ技術）の開発が求められている.このような次世代マイクロプロセッサアーキテクチャとしては従来のスーパースカラ VLIWのような命令レベル並列性のみでなく異なる粒度の並列性を階層的に組合せプログラム全体より並列性を抽出できるマルチグレイン並列処理を実現するシングルチップマルチプロセッサ（SCM）が実効性能を高め集積度向上に対しスケーラブルな性能向上が可能なアーキテクチャとして有望であると考えられる．本論文では SPEC2000fp及びSPEC95fpより5本のプログラムに対しマルチグレイン並列処理を適用し SCMの性能評価を行った.その結果 4プロセッサを搭載したSCMはマルチグレイン並列処理により1プロセッサの場合に対して1.4?3.8倍の速度向上が得られることが確かめられた.With the advances in semiconductor integration technology, efficient use of transisors on a chip and scalable performance improvement have been demanded. To satisfy this demand, many researches on next generation microprocessor architectures and its software, especially compilers, have been performed. In these next generation microprocessor architectures, a single chip multiprocessor(SCM) using multigrain parallel processing, which hierarchically exploits different level of parallelism from the whole program, is one of the most promising architectures. This paper evaluates performance of the SCM architectures for multigrain parallel processing, using five application programs from SPEC2000fp and SPEC95fp. The evaluation shows that a four-processor cores SCM using multigrain parallel processing gives us 1.4 to 3.8 times larger speed up against a simple processor.

CiNii
Coarse Grain Task Parallel Processing on Commercial SMPs

Motoki Obata, Kazuhisa Ishizaka, Hiroki Kaminaga, Hirofumi Nakano, Akimasa Yoshida, Hironori Kasahara

Technical Report of IPSJ, ARC2002-146-10 2002 ( 9 ) 55 - 60 2002年02月 [査読有り]

　概要を見る

本論文では，SPEC95ベンチマークとPerfect Clubベンチマークの5本のプログラムを用い，商用SMP上におけるOSCARマルチグレイン並列化コンパイラを用いた粗粒度並列処理の評価を行う．現在，サーバアーキテクチャの主流であるSMP上での自動並列化コンパイラを用いた並列処理では，ループレベル並列処理の性能が飽和状態に達しており，その限界を越えるため粗粒度タスク並列処理が研究されている．OSCAR FORTRAN コンパイラにおける粗粒度並列処理手法では，ソースプログラム中のサブルーチン・ループ・基本ブロック間の並列性を抽出し，各種SMP上で粗粒度タスク並列化を実現するために，OpenMPを用いたワンタイムシングルレベルスレッド生成手法を用いている．さらにSMPで問題になる共有メモリアクセスオーバヘッドを軽減するため，複数タスク間での共有データの授受にキャッシュを最大限利用しようとするデータローカライゼーション手法を併用することで，さらに性能を向上させることができる．これらの技術を用いて，本論文では商用SMPサーバ IBM RS6000 SP 604e High Node，SMPワークステーションSUN Ultra80 での粗粒度並列化の性能評価を行った．その結果，粗粒度並列処理は，スレッド管理オーバヘッド，メモリアクセスオーバヘッドの軽減により既存のループ自動並列化コンパイラの性能を5つのアプリケーションにおいて60%から430%上回ることが確認された．This paper evaluates performance of coarse grain task parallel processing using OSCAR Multigrain Parallelizing Compiler for five applications from SPEC95FP and Perfect Club benchmarks on commercial SMP machines.The coarse grain task parallel processing is important to improve the effective performance of SMP machines beyond the limit of the loop parallelism. In this OSCAR compiler, One-time Single Level Thread Generation scheme using OpenMP API and a data localization scheme are used to realize coarse grain task parallelization efficiently on various SMP machines. The evaluation shows that the coarse grain parallel processing gives us 60-430% larger speed up than the automatic loop parallelizing compiler for the five applications by the reduction of overheads of thread management and shared memory access on SMP server IBM RS6000 SP 604e High Node and SMP workstation SUN Ultra80.

CiNii
Static coarse grain task scheduling with cache optimization using openMP

Nakano, H., Ishizaka, K., Obata, M., Kimura, K., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2327 LNCS 479 - 489 2002年 [査読有り]

DOI

Scopus

2

被引用数

(Scopus)
Multigrain parallel processing for JPEG encoding on a single chip multiprocessor

T Kodaka, K Kimura, H Kasahara

INTERNATIONAL WORKSHOP ON INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS 57 - 63 2002年 [査読有り]

　概要を見る

With the recent increase of multimedia contents using JPEG and MPEG, low cost, low power consumption and high performance processors for multimedia application have been expected. Particularly, single chip multiprocessor architecture having simple processor cores that will attain good scalability and cost effectiveness is attracting much attention. To exploit full performance of single chip multiprocessor architecture, multigrain parallel processing, which exploits coarse grain task parallelism, loop parallelism and instruction level parallelism, is attractive. This paper describes a multigrain parallel processing scheme for the JPEG encoding on a single chip multiprocessor and its performance. The evaluation shows an OSCAR type single chip multiprocessor having four single-issue simple processor cores gave us 3.59 times speed-up against sequential execution time.
自動並列化コンパイラ協調型シングルチップ・マルチプロセッサの研究

笠原博徳

JEITA/EDS Fair 2002 2002年01月 [査読有り]
Automatic Parallelizing Compiler Cooperative Single Chip Multiprocessor

Hironori Kasahara

JEITA/EDS Fair 2002 2002年01月 [査読有り]
Humanoid robots in Waseda University - Hadaly-2 and WABIAN

Hashimoto, S., Narita, S., Kasahara, H., Shirai, K., Kobayashi, T., Takanishi, A., Sugano, S., Yamaguchi, J., Sawada, H., Takanobu, H., Shibuya, K., Morita, T., Kurata, T., Onoe, N., Ouchi, K., Noguchi, T., Niwa, Y., Nagayama, S., Tabayashi, H., Matsui, I., Obata, M., Matsuzaki, H., Murasugi, A., Kobaysashi, H., Haruyama, S., Okada, T., Hidaki, Y., Taguchi, Y., Hoashi, K., Morikawa, E., Iwano, Y., Araki, D., Suzuki, J., Yokoyama, M., Dawa, I., Nishino, D., Inoue, S., Hirano, T., Soga, E., Gen, S., Yanada, T., Kato, K., Sakamoto, S., Ishii, Y., Matsuo, S., Yamamoto, Y., Sato, K., Hagiwara, T., Ueda, T., Honda, N., Hashimotoo, D., Hananmoto, T., Kayaba, S., Kojima, T., Iwata, H., Kubodera, H., Matsuki, R., Nakajima, T., Nitto, K., Yamammoto, D., Kamizaki, Y., Nagaike, S., Kunitake, Y.

Autonomous Robots 12 ( 1 ) 25 - 38 2002年01月 [査読有り]

DOI

Scopus

59

被引用数

(Scopus)
Multigrain parallel processing for JPEG encoding on a single chip multiprocessor

T. Kodaka, K. Kimura, H. Kasahara

Proceedings of the Innovative Architecture for Future Generation High-Performance Processors and Systems 2002- 57 - 63 2002年 [査読有り]

　概要を見る

With the recent increase of multimedia content using JPEG and MPEG, low cost, low power consumption and high performance processors for multimedia application are desirable. In particular, single chip multiprocessor architecture having simple processor cores that will attain good scalability and cost effectiveness is attracting much attention. To exploit full performance of single chip multiprocessor architecture, multigrain parallel processing, which exploits coarse grain task parallelism, loop parallelism and instruction level parallelism, is attractive. This paper describes a multigrain parallel processing scheme for JPEG encoding on a single chip multiprocessor and its performance. The evaluation shows that an OSCAR type single chip multiprocessor having four single-issue simple processor cores gave a 3.59 times speed-up against sequential execution time.

DOI

Scopus

12

被引用数

(Scopus)
Multigrain Automatic Parallelization in Japanese Millennium Project IT21 Advanced Parallelizing Compiler.

Hironori Kasahara, Motoki Obata, Kazuhisa Ishizaka, Keiji Kimura, Hiroki Kaminaga, Hirofumi Nakano, Kouhei Nagasawa, Akiko Murai, Hiroki Itagaki, Jun Shirako

2002 International Conference on Parallel Computing in Electrical Engineering (PARELEC 2002)(PARELEC) 105 - 111 2002年 [査読有り]

DOI

Scopus

8

被引用数

(Scopus)
キャッシュ最適化を考慮したマルチプロセッサシステム上での粗粒度タスクスタティックスケジューリング手法

中野啓史, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2001-140-12 2001 ( 76(ARC-144) ) 2001年08月

J-GLOBAL
シングルチップマルチプロセッサ上でのマルチメディアアプリケーションの近細粒度並列処理

小高剛, 宮下直久, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2001-140-11 2001年08月
キャッシュ最適化を考慮したマルチプロセッサシステム上での粗粒度タスクスタティックスケジューリング手法

中野啓史, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2001-140-12 2001 ( 76 ) 67 - 72 2001年08月 [査読有り]

CiNii
シングルチップマルチプロセッサ上でのマルチメディアアプリケーションの近細粒度並列処理

小高剛, 宮下直久, 木村啓二, 笠原博徳

情報処理学会研究報告ARC-2001-140-11 2001年08月 [査読有り]
Future of Automatic Parallelizing Compiler

H. Kasahara

The 14th International Workshop on Languages and Compilers for Parallel Computing (LCPC'01) Panel: Future of Languages and Compilers, Kentucky 2001年08月 [査読有り]
A Static Scheduling Scheme for Coarse Grain Tasks considering Cache Optimization on SMP

Hirofumi Nakano, Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

IPSJ SIG Notes 2001-ARC-144-12 2001年08月 [査読有り]
Near Fine Grain Parallel Processing on Multimedia Application for Single Chip Multiprocessor

Takeshi Kodaka, Naohisa Miyashita, Keiji Kimura, Hironori Kasahara

IPSJ SIG Notes 2001-ARC-144-11 2001年08月 [査読有り]
A Data Localization Scheme for Coarse Grain Task Parallel Processing on Shared Memory Multiprocessors

Akimasa Yoshida, Satoshi Yagi, Hironori Kasahara

Proc. of IEEE International Workshop on Advanced Compiler Technology for High Performance and Embedded Systems 111 - 118 2001年07月 [査読有り]

CiNii
OSCAR Single Chip Multiprocessor and Multigrain Parallelizing Compiler

H. Kasahara

IEEE International Workshop on Advanced Compiler Technology for High Performance and Embedded Systems (IWACT 2001) Panel : New Architecture and Their Compilers, Romania 2001年07月 [査読有り]
Automatic Coarse Grain Task Parallel Processing Using OSCAR Multigrain Parallelizing Compiler

Motoki Obata, Kazuhisa Ishizaka, Hironori Kasahara

Ninth International Workshop on Compilers for Parallel Computers(CPC 2001) 173 - 182 2001年06月 [査読有り]
近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの評価

木村啓二, 加藤孝幸, 笠原博徳

情報処理学会論文誌 42 ( 4 ) 692 - 703 2001年04月 [査読有り]

CiNii
共有メモリマルチプロセッサシステム上での粗粒度タスク並列処理

笠原博徳, 小幡元樹, 石坂一久

情報処理学会論文誌 42 ( 4 ) 2001年04月 [査読有り]

CiNii J-GLOBAL
メタスケジューリング--自動並列分散処理の試み

小出洋, 笠原博徳

bit、共立出版 33 ( 4 ) 10 - 14 2001年04月 [査読有り]

J-GLOBAL
Meta-scheduling -- Trial for Automatic Distributed Computing

Hiroshi Koide, Hironori Kasahara

bit, Kyoritsu Shuppan 33 ( 4 ) 10 - 14 2001年04月 [査読有り]
Evaluation of Processor Core Architecture for Single Chip Multiprocessor with Near Fine Grain Parallel Processing

Keiji Kimura, Takayuki Kato, Hironori Kasahara

Trans. of IPSJ 42 ( 4 ) 692 - 703 2001年04月 [査読有り]
Coarse Grain Task Parallel Processing on a Shared Memory Multiprocessor System

Hironori Kasahara, Motoki Obata, Kazuhisa Ishizaka

Trans. of IPSJ 42 ( 4 ) 2001年04月 [査読有り]
資源情報サーバにおける資源情報予測の評価

小出洋, 山岸信寛, 武宮博, 笠原博徳

情報処理学会論文誌 42 ( SIG03 ) 65 - 73 2001年03月 [査読有り]

J-GLOBAL
標準タスクグラフセットを用いたデータ転送オーバーへッドを考慮したスケジューリングアルゴリズムの性能評価

山口高弘, 田中雄一, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会 2Q-01 2001年03月 [査読有り]
近細粒度並列処理に適したシングルチップマルチプロセッサのメモリアーキテクチャの評価

松元信介, 木村啓二, 笠原博徳

情報処理学会第62回全国大会 4P-01 2001年03月 [査読有り]
異機種分散計算機環境におけるOSCARマルチグレイン並列化コンパイラを用いたメタスケジューリング手法

林拓也, 茂田有己光, 小出洋, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会 3R-01 ( 1 ) 2001年03月 [査読有り]

J-GLOBAL
メモリ容量を考慮したプレロード・ポストストアスケジューリングアルゴリズムの評価

田中崇久, 舟山洋央, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会 4R-03 2001年03月 [査読有り]

CiNii
マルチメディアアプリケーションのシングルチップマルチプロセッサ上での近細粒度並列処理

小高剛, 木村啓二, 宮下直久, 笠原博徳

情報処理学会第62回全国大会 3P-08 2001年03月 [査読有り]
マルチプロセッサシステム上でのキャッシュ最適化を考慮した粗粒度タスクスタティックスケジューリング手法

中野啓史, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会第62回全国大会 4R-02 2001年03月 [査読有り]
マルチグレイン並列処理用シングルチップマルチプロセッサにおけるデータ転送ユニットの検討

宮下直久, 木村啓二, 小高剛, 笠原博徳

情報処理学会第62回全国大会 4P-02 2001年03月 [査読有り]

CiNii
データマイニングツールdataFORESTを用いた異機種分散計算機環境におけるプロセッサ負荷予測

茂田有己光, 林拓也, 小出洋, 鹿島亨, 筒井宏明, 笠原博徳

情報処理学会第62回全国大会 3R-02 ( 1 ) 2001年03月 [査読有り]

J-GLOBAL
OSCARマルチグレイン並列化コンパイラとシングルチップ・マルチプロセッサ

笠原博徳

京都大学大型計算機センター研究開発部第66回研究セミナー 65th/66th 2001年03月 [査読有り]

J-GLOBAL
OSCAR Multigrain Parallelizing Compiler and Single Chip Multiprocessor

H. Kasahara

Data Processing Center, Kyoto University 2001年03月 [査読有り]
Automatic coarse grain task parallel processing on SMP using openMP

Kasahara, H., Obata, M., Ishizaka, K.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 2017 189 - 207 2001年 [査読有り]

DOI

Scopus

17

被引用数

(Scopus)
特集：並列処理

笠原博徳

情報処理学会論文誌 42 ( 4 ) 651 - 920 2001年 [査読有り]

CiNii
SMP上でのデータ依存マクロタスクグラフのデータローカライゼーション手法

吉田明正, 八木哲志, 笠原博徳

情報処理学会研究報告ARC-141-6 2001年01月
共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価

石坂一久, 八木哲志, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会研究報告ARC-141-7 2001 ( 10(ARC-141) ) 2001年01月

J-GLOBAL
共有メモリマルチプロセッサシステム上での粗粒度タスク並列実現手法の評価

石坂一久, 八木哲志, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会研究報告ARC-141-7 2001年01月 [査読有り]
SMP上でのデータ依存マクロタスクグラフのデータローカライゼーション手法

吉田明正, 八木哲志, 笠原博徳

情報処理学会研究報告ARC-141-6 2001 2001年01月 [査読有り]

CiNii
アドバンスト並列化コンパイラ技術研究開発の概要

笠原博徳

経済産業省・NEDOミレニアムプロジェクト, 日本情報処理開発協会先端情報技術研究所 2001年01月 [査読有り]
Evaluation of coarse grain task parallel processing on the shared memory multiprocessor system

Kazuhisa Ishizaka, Satoshi Yagi, Motoki Obata, Akimasa Yoshida, Hironori Kasahara

Technical Report of IPSJ, ARC-141-7 2001年01月 [査読有り]
A Data-Localization Scheme for Macrotask-Graph with Data Dependencies on SMP

Akimasa Yoshida, Satoshi Yagi, Hironori Kasahara

Technical Report of IPSJ, ARC-141-6 2001年01月 [査読有り]
Evaluation of Single Chip Multiprocessor Core Architecture with Near Fine Grain Parallel Processing

Keiji Kimura, Hironori Kasahara

Proc. of International Workshop on Innovative Architecture for Future Generation High-Performance Processors and Systems (IWIA'01) 2001年01月 [査読有り]
Overview of METI/NEDO Millennium Project 'Advanced Parallelizing Compiler'

H. Kasahara

Japan Information Processing Development Center Research Institute for Advanced Information Technology 2001年01月 [査読有り]

CiNii
OSCAR Multigrain Parallelizing Compiler and Single Chip Multiprocessor

H. Kasahara

University of Illinois at Urbana-Champaign, Hosted by Prof. David Padua, USA 2000年11月 [査読有り]
Coarse-grain task parallel processing using the openMP backend of the OSCAR multigrain parallelizing compiler

Ishizaka, K., Obata, M., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 1940 457 - 470 2000年10月 [査読有り]

DOI

Scopus

5

被引用数

(Scopus)
Multigrain Parallel Processing Model for Future Single Chip Multiprocessor Systems

H. Kasahara

ISHPC2000, Panel "Programming Models for New Architectures" 2000年10月 [査読有り]
資源情報サーバにおける資源情報予測の評価

小出洋, 山岸信寛, 武宮博, 笠原博徳

情報処理学会研究報告ARC(SWoPP2000) 42 ( SIG3(PRO10) ) 2000年08月 [国内誌]

担当区分：最終著者

J-GLOBAL
近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの構成

木村啓二, 内田貴之, 加藤孝幸, 笠原博徳

情報処理学会研究報告ARC-139-16(SWoPP2000) 2000 ( 74(ARC-139) ) 2000年08月

J-GLOBAL
OpenMPを用いた粗粒度タスク並列処理

石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC-139-32(SWoPP2000) 2000年08月
OpenMPを用いた粗粒度タスク並列処理現

石坂一久, 小幡元樹, 笠原博徳

情報処理学会研究報告ARC-139-32(SWoPP2000) 2000年08月 [査読有り]
近細粒度並列処理用シングルチップマルチプロセッサにおけるプロセッサコアの構成

木村啓二, 内田貴之, 加藤孝幸, 笠原博徳

情報処理学会研究報告ARC-139-16(SWoPP2000) 91 - 96 2000年08月 [査読有り]

CiNii
Coarse Grain Task Parallel Processing with OpenMP API

Kazuhisa Ishizaka, Motoki Obata, Hironori Kasahara

Technical Report of IPSJ, ARC-139-32 2000年08月 [査読有り]
Processor Core Architecture of Single Chip Multiprocessor for Near Fine Grain Parallel Processing

Keiji Kimura, Takayuki Uhida, Takayuki Kato, Hironori Kasahara

Technical Report of IPSJ, ARC-139-16 2000年08月 [査読有り]
標準タスクグラフセットを用いたマルチプロセッサスケジューリングアルゴリズムの性能評価

飛田高雄, 笠原博徳

情報処理学会2000年記念並列処理シンポジウム(JSPP2000)論文集 131 - 138 2000年05月 [査読有り]
メタスケジューリングのための資源情報サーバの構築

小出洋, 山岸信寛, 武宮博, 林拓也, 引田雅之, 笠原博徳

計算工学講演会論文集 5 ( 1 ) 357 - 360 2000年05月 [査読有り]

CiNii
Performance Evaluation of Multiprocessor Scheduling Algorithms Using Standard Task Graph Set

T. Tobita, H. Kasahara

Joint Symposium on Parallel Processing 2000 (JSPP2000) 2000 ( 6 ) 131 - 138 2000年05月 [査読有り]

CiNii J-GLOBAL
マルチグレイン自動並列化のための解析時インライニング

吉井謙一郎, 松井巌徹, 小幡元樹, 熊澤慎也, 笠原博徳

情報処理学会ARC研究会/HPC研究会 2000年03月
配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化とその並列処理

間中邦之, 刑部亮, 前川仁孝, 笠原博徳

情報処理学会ARC研究会/HPC研究会 2000年03月
配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化

間中邦之, 刑部亮, 前川仁孝, 笠原博徳

情報処理学会第60回全国大会 5H-08 2000年03月 [査読有り]
解析時インライニングを用いたマルチグレイン自動並列化手法

吉井謙一郎, 松井巌徹, 小幡元樹, 熊澤慎也, 笠原博徳

情報処理学会第60回全国大会 4J-03 2000年03月 [査読有り]
メモリ容量を考慮したデータプレロード・マルチプロセッサスケジューリング

増田高史, 飛田高雄, 舟山洋央, 笠原博徳

情報処理学会第60回全国大会 4J-06 2000年03月 [査読有り]
マルチグレイン並列処理における階層的並列処理のためのプロセッサクラスタリング決定手法

山本正行, 山本晃正, 小幡元樹, 笠原博徳

情報処理学会第60回全国大会 4J-05 4J - 5 2000年03月 [査読有り]

CiNii
データ依存のみを持つ任意形状のマクロタスクグラフに対するデータローカライゼーション手法

成清暁博, 八木哲志, 松崎秀則, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会第60回全国大会 4J-02 2000年03月 [査読有り]
シングルチップマルチプロセッサの近細粒度並列処理に対する性能評価

加藤考幸, 尾形航, 木村啓二, 内田貴之, 笠原博徳

情報処理学会第60回全国大会 4J-07 2000年03月 [査読有り]
SMP上での有限要素・境界要素法併用法による電磁界解析アプリケーション並列処理

金子大作, 小幡元樹, 若尾真治, 小貫天, 笠原博徳

情報処理学会第60回全国大会 5H-07 2000年03月 [査読有り]
OpenMPを用いたマルチグレイン並列処理の実現

石坂一久, 小幡元樹, 瀧康太郎, 笠原博徳

情報処理学会第60回全国大会 4J-04 2000年03月 [査読有り]
配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化とその並列処理

間中邦之, 刑部亮, 前川仁孝, 笠原博徳

情報処理学会ARC研究会/HPC研究会 2000 ( 23(ARC-137 HPC-80) ) 2000年03月 [査読有り]

J-GLOBAL
マルチグレイン自動並列化のための解析時インライニング

吉井謙一郎, 松井巌徹, 小幡元樹, 熊澤慎也, 笠原博徳

情報処理学会ARC研究会/HPC研究会 2000年03月 [査読有り]

CiNii
Performance Evaluation and Parallelize of Electronic Circuit Simulation which generate code without array indirect access

K. Manaka, R. Osakabe, Y. Maekawa, H. Kasahara

IPSJ ARC/HPC 2000年03月 [査読有り]
An Analysis-time Procedure Inlining Scheme for Multi-grain Automatic Parallelizing Compilation

K. Yoshii, G. Matsui, M. Obata, S. Kumazawa, H. Kasahara

IPSJ ARC/HPC 2000年03月 [査読有り]
資源情報サーバにおける資源情報予測の評価

小出洋, 山岸信寛, 武宮博, 笠原博徳

情報処理学会論文誌 42 ( SIG03 ) 65 - 73 2000年03月 [査読有り] [国内誌]

担当区分：最終著者

J-GLOBAL
Near fine grain parallel processing using static scheduling on single chip multiprocessors

K Kimura, H Kasahara

INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS 23 - 31 2000年 [査読有り]

　概要を見る

With the increase of the number of transistors integrated on a chip, efficient use of transistors and scalable improvement of effective performance of a processor are getting important problems. However it has been thought that popular superscalar and VLIW would have difficulty, to obtain scalable improvement of effective performance in future because of the limitation of instruction level parallelism. To cope with this problem, a single chip multiprocessor (SCM) approach,vith multi grain parallelprocessing inside a chip, which hierarchically exploits loop parallelism and coarse grain parallelism among subroutines, loops and basic blocks in addition to instruction level parallelism, is thought one of the most promising approaches. This paper evaluates effectiveness of the single chip multiprocessor architectures with a shared cache, global registers, distributed shared memory and/or local memory for near fine grain parallel processing as the first step of research on SCM architecture to support multi grain parallel processing. The evaluation shows OSCAR (Optimally Scheduled Advanced Multiprocessor architecture having distributed shared memory and local memory in addition to centralized shared memory and attachment of global register gives us significant speed up such as 13.8% to 143.8% for four processors compared with shared cache architecture for applications which have been difficult to extract parallelism effectively.
データ依存のみを持つマクロタスクグラフに対するデータローカライゼーション手法

成清暁博, 松崎秀則, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会ARC136-8研究会 2000 ( 1 ) 43 - 48 2000年01月

　概要を見る

本論文では，階層型粗粒度タスク並列処理における，データ依存エッジのみをもつマクロタスクグラフ全体または部分グラフを対象としたデータローカライゼーション手法を提案する．本手法では，粗粒度並列処理される各階層において，ループ整合分割手法を用いて処理とデータを分割する．次に，分割されたデータ転送の多い粗粒度タスク集合をパーシャルスタティックタスク割当を用いたダイナミックスケジューリング方式により同一プロセッサに割り当て，粗粒度タスク間データ転送にローカルメモリ(LM)を利用してデータ転送オーバヘッドを軽減する．本手法は，任意形状のマクロタスクグラフ中のデータ依存のみをもつ部分グラフに適用でき，ループインデクス上下限値が変数として与えられるループをも対象とすることにより，多くの配列変数をLMに分散し，データ転送及びメモリアクセスオーバヘッドを軽減することを可能とする．マルチプロセッサシステムOSCAR上で行った性能評価の結果，本データローカライゼーション手法を用いたCG法の階層型粗粒度タスク並列処理では，データローカライゼーションを用いない場合に比べて処理時間が20％短縮されることが確認された．This paper proposes a data-localization scheme for a part with data dependence edges in any kinds of macrotask-graphs in hierarchical coarse grain parallel processing. First, multiple loops having data dependence are decomposed into data-localization-groups in each macrotask-graph layer. Next, the compiler generates a hierarchical dynamic scheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor or processor-cluster in each layer, so that shared data can be transferred via local memory. This data localization scheme can be applied to a part or the whole macrotask graph which only has data dependence edges. This data localization scheme also handles loops with the lower and upper limit given by variables. As a result, most of array data is transferred via local memory. Finally, this paper describes the performance evaluation on a multi-processor system OSCAR. The evaluation shows that hierarchical coarse grain parallel processing with data-localization can reduce execution time about 20% compared with hierarchical coarse grain parallel processing without data-localization.

CiNii
データ依存のみを持つマクロタスクグラフに対するデータローカライゼーション手法

成清暁博, 松崎秀則, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会ARC136-8研究会 43 - 48 2000年01月 [査読有り]
A Data-Localization Scheme for Macrotask-Graphs with Data Dependencies

A. Narikiyo, H. Matsuzaki, M. Obata, A. Yoshida, H. Kasahara

Technical Report of IPSJ, ARC-136-8 2000 ( 1 ) 43 - 48 2000年01月 [査読有り]

　概要を見る

本論文では，階層型粗粒度タスク並列処理における，データ依存エッジのみをもつマクロタスクグラフ全体または部分グラフを対象としたデータローカライゼーション手法を提案する．本手法では，粗粒度並列処理される各階層において，ループ整合分割手法を用いて処理とデータを分割する．次に，分割されたデータ転送の多い粗粒度タスク集合をパーシャルスタティックタスク割当を用いたダイナミックスケジューリング方式により同一プロセッサに割り当て，粗粒度タスク間データ転送にローカルメモリ(LM)を利用してデータ転送オーバヘッドを軽減する．本手法は，任意形状のマクロタスクグラフ中のデータ依存のみをもつ部分グラフに適用でき，ループインデクス上下限値が変数として与えられるループをも対象とすることにより，多くの配列変数をLMに分散し，データ転送及びメモリアクセスオーバヘッドを軽減することを可能とする．マルチプロセッサシステムOSCAR上で行った性能評価の結果，本データローカライゼーション手法を用いたCG法の階層型粗粒度タスク並列処理では，データローカライゼーションを用いない場合に比べて処理時間が20％短縮されることが確認された．This paper proposes a data-localization scheme for a part with data dependence edges in any kinds of macrotask-graphs in hierarchical coarse grain parallel processing. First, multiple loops having data dependence are decomposed into data-localization-groups in each macrotask-graph layer. Next, the compiler generates a hierarchical dynamic scheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor or processor-cluster in each layer, so that shared data can be transferred via local memory. This data localization scheme can be applied to a part or the whole macrotask graph which only has data dependence edges. This data localization scheme also handles loops with the lower and upper limit given by variables. As a result, most of array data is transferred via local memory. Finally, this paper describes the performance evaluation on a multi-processor system OSCAR. The evaluation shows that hierarchical coarse grain parallel processing with data-localization can reduce execution time about 20% compared with hierarchical coarse grain parallel processing without data-localization.

CiNii
Performance Evaluation of Minimum Execution Time Multiprocessor Scheduling Algorithms Using Standard Task Graph Set.

Takao Tobita, Masayoshi Kouda, Hironori Kasahara

Proceedings of the International Conference on Parallel and Distributed Processing Techniques and Applications(PDPTA) 745 - 751 2000年 [査読有り]
標準タスクグラフセットを用いた実行時間最小マルチプロセッサスケジューリングアルゴリズムの性能評価

飛田高雄, 笠原博徳

情報処理学会論文誌 43 ( 4 ) 745 - 751 2000年 [査読有り]

J-GLOBAL
マルチグレイン並列化FORTRANコンパイラ

岡本雅巳, 小幡元樹, 松井巌徹, 松崎秀則, 笠原博徳, 成田誠之助

情報処理学会論文誌 40 ( 12 ) 4296 - 4308 1999年12月 [査読有り]

　概要を見る

本論文では今後のシングルチップマルチプロセッサからスーパーコンピュータまでの幅広いマルチプロセッサシステムで，システムの実効性能および使いやすさの向上のために有用なFORTRANマルチグレイン並列化コンパイラについて述べる．マルチグレイン並列化は従来のマルチプロセッサ用自動並列化コンパイラで用いられていたループ並列化に加え，サブルーチン，ループ，基本ブロック間粗粒度並列化，ステートメント/命令間（近）細粒度並列化を階層的に適用することによりプログラム全域の並列処理を可能とする．This paper describes a FORTRAN multi-grain parallelizing compiler.The multi-grain parallelizing compiler improveseffective performanceand ease of useof multiprocessor systems from single-chip multiprocessors tosupercomputers.Multi-grain parallelizing scheme realizes effective parallel processingover the whole program by hierarchically appling coarse grain parallelizationamong subroutines, loops and basic blocks, and fine grain parallelizationamong statements or instructionsin addition to conventional loop parallelization.

CiNii
Multi-grain Parallelizing FORTRAN Compiler

M. Okamoto, M. Obata, G. Matsui, H. Matsuzaki, H. Kasahara, S. Narita

Trans. of IPSJ 40 ( 12 ) 4296 - 4308 1999年12月 [査読有り]

　概要を見る

本論文では今後のシングルチップマルチプロセッサからスーパーコンピュータまでの幅広いマルチプロセッサシステムで，システムの実効性能および使いやすさの向上のために有用なFORTRANマルチグレイン並列化コンパイラについて述べる．マルチグレイン並列化は従来のマルチプロセッサ用自動並列化コンパイラで用いられていたループ並列化に加え，サブルーチン，ループ，基本ブロック間粗粒度並列化，ステートメント/命令間（近）細粒度並列化を階層的に適用することによりプログラム全域の並列処理を可能とする．This paper describes a FORTRAN multi-grain parallelizing compiler.The multi-grain parallelizing compiler improveseffective performanceand ease of useof multiprocessor systems from single-chip multiprocessors tosupercomputers.Multi-grain parallelizing scheme realizes effective parallel processingover the whole program by hierarchically appling coarse grain parallelizationamong subroutines, loops and basic blocks, and fine grain parallelizationamong statements or instructionsin addition to conventional loop parallelization.

CiNii
マルチグレイン並列化コンパイラのメモリアクセスアナライザ

岩井啓輔, 小幡元樹, 木村啓二, 天野英晴, 笠原博徳

電子通信情報学会技術報告CPSY99-62 99 ( 252 ) 1 - 8 1999年08月

J-GLOBAL
シングルチップマルチプロセッサ上での近細粒度並列処理の性能評価

木村啓二, 間中邦之, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC134-4 99 ( 67(ARC-134) ) 19 - 24 1999年08月

J-GLOBAL
マルチグレイン並列化コンパイラのメモリアクセスアナライザ

岩井啓輔, 小幡元樹, 木村啓二, 天野英晴, 笠原博徳

電子通信情報学会技術報告CPSY99-62 99 ( 252 ) 1 - 8 1999年08月 [査読有り]
シングルチップマルチプロセッサ上での近細粒度並列処理の性能評価

木村啓二, 間中邦之, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC134-4 19 - 24 1999年08月 [査読有り]
Performance Evaluation of Near Fine Grain Parallel Processing on the Single Chip Multiprocessor

K. Kimura, K. Manaka, W. Ogata, M. Okamoto, H. Kasahara

Technical Report of IPSJ, ARC-134-5 19 - 24 1999年08月 [査読有り]
Memory access analyzer for a Multi-grain parallel processing

K. Iwai, M. Obata, K. Kimura, H. Amano, H. Kasahara

Technical Report of IEICE,CPSY99 99 ( 252 ) 1 - 8 1999年08月 [査読有り]
An Automatic Coarse Grain Parallel Processing Scheme Using Multiprocessor Scheduling Algorithms Considering Overlap of Task Execution and Data Transfer

H. Kasahara, M. Kogou, T. Tobita, T. Masuda, T. Tanaka

Proc. SCI99 and ISAS99 9 82 - 89 1999年08月 [査読有り]

CiNii
Meta-scheduling for a Cluster of Supercomputers

H. Koide, T. Hirayama, A. Murasugi, T. Hayashi, H. Kasahara

Proc. ICS99 Workshop 63 - 69 1999年06月 [査読有り]

CiNii
A Standard Task Graph Set for Fair Evaluation of Multiprocessor Scheduling Algorithms

T. Tobita, H. Kasahara

Proc. ICS99 Workshop 71 - 77 1999年06月 [査読有り]
階層型粗粒度並列処理における同一階層内ループ間データローカライゼーション手法

吉田明正, 越塚健一, 岡本雅巳, 笠原博徳

情報処理学会論文誌 40 ( 5 ) 2054 - 2063 1999年05月 [査読有り]

　概要を見る

本論文では階層的に粗粒度並列処理を行う階層型マクロデータフロー処理におけるデータローカライゼーション手法を提案する. 本手法では階層型ループ整合分割法を用いて各階層の処理とデータを分割しパーシャルスタティックタスク割当てを用いた階層型ダイナミックスケジューリング方式により各階層において相互間に多量のデータ転送が生じる可能性がある粗粒度タスクの集合を当該階層の同一プロセッサクラスタに割り当てさらに各プロセッサ上のローカルメモリを有効利用してデータ転送オーバヘッドを軽減する. マルチプロセッサシステムOSCAR上で行った性能評価の結果本データローカライゼーション手法を用いた階層型マクロデータフロー処理ではデータローカライゼーションを用いない場合に比べて処理時間が10?20%短縮されることが確かめられた.This paper proposes a data-localization scheme for hierarchical macro-dataflow processing, which hierachically exploits coarse-grain parallelism. The proposed data-localization scheme consists of three parts: (1) hierarchical loop aligned decomposition, which decomposes multiple loops having data dependences into data-localization-groups in each layer; (2) generation of hierarchical dynamic sheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor-cluster in each layer; (3) generation of data transfer code via local memory inside data-localization-group. Performance evaluation on a multiprocessor system OSCAR shows that hierarchical macro-dataflow processing with data-localization can reduce execution time by 10-20% compared with hierarchical macro-dataflow processing without data-localization.

CiNii
シングルチップマルチプロセッサ上での近細粒度並列処理

木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会論文誌 40 ( 5 ) 1924 - 1934 1999年05月 [査読有り]

J-GLOBAL
並列分散科学技術計算の支援環境─SSP─

武宮博, 太田浩史, 今村俊幸, 小出洋, 松田勝之, 樋口健二, 平山俊雄, 笠原博徳

計算工学講演会論文集 4 ( 1 ) 333 - 336 1999年05月 [査読有り]

CiNii
Near Fine Grain Parallel Processing on Single Chip Multiprocessors

K. Kimura, W. Ogata, M. Okamoto, H. Kasahara

Trans. of IPSJ 40 ( 5 ) 1924 - 1934 1999年05月 [査読有り]

CiNii
A Data-Localization Scheme among Loops for each Layer in Hierarchical Coarse Grain Parallel Processing

A.Yoshida, K. Koshizuka, M. Okamoto, H. Kasahara

Trans. of IPSJ 40 ( 5 ) 2054 - 2063 1999年05月 [査読有り]

　概要を見る

本論文では階層的に粗粒度並列処理を行う階層型マクロデータフロー処理におけるデータローカライゼーション手法を提案する. 本手法では階層型ループ整合分割法を用いて各階層の処理とデータを分割しパーシャルスタティックタスク割当てを用いた階層型ダイナミックスケジューリング方式により各階層において相互間に多量のデータ転送が生じる可能性がある粗粒度タスクの集合を当該階層の同一プロセッサクラスタに割り当てさらに各プロセッサ上のローカルメモリを有効利用してデータ転送オーバヘッドを軽減する. マルチプロセッサシステムOSCAR上で行った性能評価の結果本データローカライゼーション手法を用いた階層型マクロデータフロー処理ではデータローカライゼーションを用いない場合に比べて処理時間が10?20%短縮されることが確かめられた.This paper proposes a data-localization scheme for hierarchical macro-dataflow processing, which hierachically exploits coarse-grain parallelism. The proposed data-localization scheme consists of three parts: (1) hierarchical loop aligned decomposition, which decomposes multiple loops having data dependences into data-localization-groups in each layer; (2) generation of hierarchical dynamic sheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor-cluster in each layer; (3) generation of data transfer code via local memory inside data-localization-group. Performance evaluation on a multiprocessor system OSCAR shows that hierarchical macro-dataflow processing with data-localization can reduce execution time by 10-20% compared with hierarchical macro-dataflow processing without data-localization.

CiNii
処理とデータ転送のオーバーラップのための自動並列化手法

古郷誠, 田中崇久, 藤本謙作, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会 3H-06 1999年03月 [査読有り]
最早実行可能条件解析を用いたキャッシュ最適化手法

稲石大祐, 木村啓二, 藤本謙作, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会 3H-07 1999年03月 [査読有り]
マルチグレイン並列処理におけるサブルーチンを含むデータローカライゼーション手法

宇治川泰史, 成清暁博, 小幡元樹, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会 2D-05 1999年03月 [査読有り]
OSCARマルチグレイン並列化コンパイラを用いたスーパーコンピュータクラスタのためのメタ・スケジューリング手法

村杉明夫, 林拓也, 飛田高雄, 小出洋, 笠原博徳

情報処理学会第58回全国大会 2D-06 1999年03月 [査読有り]
OSCARマルチグレイン並列化コンパイラにおける階層的並列処理手法

山本晃正, 稲石大祐, 宇治川泰史, 小幡元樹, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会 2D-04 2D - 4 1999年03月 [査読有り]

CiNii
Near fine grain parallel processing using static scheduling on single chip multiprocessors

Keiji Kimura, Hironori Kasahara

Proceedings of the Innovative Architecture for Future Generation High-Performance Processors and Systems 1999- 23 - 31 1999年 [査読有り]

　概要を見る

With the increase of the number of transistors integrated on a chip, efficient use of transistors and scalable improvement of effective performance of a processor are getting im-portant problems. However, it has been thought that popular superscalar and VLIW would have difficulty to obtain scalable improvement of effective performance in future because of the limitation of instruction level parallelism. To cope with this problem, a single chip multiprocessor (SCM) approach with multi grain parallel processing inside a chip, which hierarchically exploits loop parallelism and coarse grain parallelism among subroutines, loops and basic blocks in addition to instruction level parallelism, is thought one of the most promising approaches. This paper evaluates effectiveness of the single chip multiprocessor architectures with a shared cache, global registers, distributed shared memory and/or local memory for near fine grain parallel processing as the first step of research on SCM architecture to support multi grain parallel processing. The evaluation shows OSCAR (Optimally Scheduled Advanced Multiprocessor) architecture having distributed shared memory and local memory in addition to centralized shared memory and attachment of global register gives us significant speed up such as 13.8% to 143.8% for four pro-cessors compared with shared cache architecture for applications which have been difficult to extract parallelism effectively.

DOI

Scopus

7

被引用数

(Scopus)
Job Scheduling Scheme for Pure Space Sharing among Rigid Jobs

K. Aida, H. Kasahara, S. Narita

Proc. 4th Workshop on Job Scheduling Strategies for Parallel Processing 98 - 121 1998年12月 [査読有り]
OSCAR Scalable Multigrain Parallelizing Compiler for Single Chip Multiprocessors to A Cluster of Supercomputers

H. Kasahara

Hosted by Prof. David Padua, University of Illinois at Urbana-Champaign 1998年11月 [査読有り]
最早実行可能条件解析を用いたキャッシュ利用の最適化

稲石大祐, 木村啓二, 藤本謙作, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-6 1998 ( 70 ) 31 - 36 1998年08月

　概要を見る

従来のコンパイラによる単一プロセッサ用キャッシュ最適化は個々のループを対象としているため、プログラム全体に比べると局所的な最適化が多く、プログラム全域を対象としたキャッシュ最適化は行われていない。そこで本稿では、最早実行可能条件解析を利用した単一プロセッサ上でのFORTRANプログラムのキャッシュ最適化手法を提案する。OSCAR FORTRANマルチグレイン自動並列化コンパイラは、FORTRANプログラムをループ・サブルーチン・基本ブロックの3種のマクロタスク(MT)に分割し、各MTに最早実行可能条件解析を行いマクロタスクグラフ(MTG)を生成する。MTGは制御依存及びデータ依存に基づくMT間の実行順序制約、及びMT間で授受されるデータに関する情報を表現する。本手法ではこのMTGを用いて、先行MTによってアクセスされたデータにアクセスする後続MTが先行MTの直後に実行されるよう大域的なコード移動を行い、キャッシュヒット率を向上させる。本手法は、OSCAR FORTRANマルチグレイン自動並列化コンパイラ中に、最適化された逐次型FORTRANを出力するプリプロセッサ機能として実現されている。CG法プログラムを用いた本キャッシュ最適化手法の性能評価結果を行ったところ167MHz UltraSPARC上で最高62%の速度向上が得られた。Cache optimizations by a compiler for a single processor machine have been mainly applied to a singlenested loop. On the contrary, this paper proposes a cache optimization scheme using earliest executable condition analysis for FORTRAN programs on a single processor system. OSCAR FORTRAN multi-grain automatic parallelizing compiler decomposes a FORTRAN program into three types of macrotasks (MT), such as loops, subroutines and basic blocks, and analyzes the earliest executable condition of each MT to extract coarse grain parallelism among MTs and generates a macrotask graph (MTG). The MTG represents data dependence and extended control dependence among MTs and an information of shared data among MTs. By using this MTG, a compiler realizes global code motion to use cache effectively. The code motion technique moves a MT, which accesses data accessed by a precedent MT on MTG, immediately after the precedent MT to increase a cache hit rate. This optimization is realized using OSCAR multi-grain compiler as a preprocessor to output an optimized sequential FORTRAN code. A performance evaluation shows about 62% speed up compared with original program on 167MHz UltraSPARC.

CiNii
シングルチップマルチプロセッサ上でのマルチグレイン並列処理

木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-5 98 ( 70(ARC-130) ) 1998年08月

J-GLOBAL
OSCAR FORTRAN Compilerを用いたマルチグレイン並列性の評価

小幡元樹, 松井巌徹, 松崎秀則, 木村啓二, 稲石大祐, 宇治川泰史, 山本晃正, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-3 98 ( 70(ARC-130) ) 1998年08月

J-GLOBAL
最早実行可能条件解析を用いたキャッシュ利用の最適化

稲石大祐, 木村啓二, 藤本謙作, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-6 1998 ( 70 ) 31 - 36 1998年08月 [査読有り]

　概要を見る

従来のコンパイラによる単一プロセッサ用キャッシュ最適化は個々のループを対象としているため、プログラム全体に比べると局所的な最適化が多く、プログラム全域を対象としたキャッシュ最適化は行われていない。そこで本稿では、最早実行可能条件解析を利用した単一プロセッサ上でのFORTRANプログラムのキャッシュ最適化手法を提案する。OSCAR FORTRANマルチグレイン自動並列化コンパイラは、FORTRANプログラムをループ・サブルーチン・基本ブロックの3種のマクロタスク(MT)に分割し、各MTに最早実行可能条件解析を行いマクロタスクグラフ(MTG)を生成する。MTGは制御依存及びデータ依存に基づくMT間の実行順序制約、及びMT間で授受されるデータに関する情報を表現する。本手法ではこのMTGを用いて、先行MTによってアクセスされたデータにアクセスする後続MTが先行MTの直後に実行されるよう大域的なコード移動を行い、キャッシュヒット率を向上させる。本手法は、OSCAR FORTRANマルチグレイン自動並列化コンパイラ中に、最適化された逐次型FORTRANを出力するプリプロセッサ機能として実現されている。CG法プログラムを用いた本キャッシュ最適化手法の性能評価結果を行ったところ167MHz UltraSPARC上で最高62%の速度向上が得られた。Cache optimizations by a compiler for a single processor machine have been mainly applied to a singlenested loop. On the contrary, this paper proposes a cache optimization scheme using earliest executable condition analysis for FORTRAN programs on a single processor system. OSCAR FORTRAN multi-grain automatic parallelizing compiler decomposes a FORTRAN program into three types of macrotasks (MT), such as loops, subroutines and basic blocks, and analyzes the earliest executable condition of each MT to extract coarse grain parallelism among MTs and generates a macrotask graph (MTG). The MTG represents data dependence and extended control dependence among MTs and an information of shared data among MTs. By using this MTG, a compiler realizes global code motion to use cache effectively. The code motion technique moves a MT, which accesses data accessed by a precedent MT on MTG, immediately after the precedent MT to increase a cache hit rate. This optimization is realized using OSCAR multi-grain compiler as a preprocessor to output an optimized sequential FORTRAN code. A performance evaluation shows about 62% speed up compared with original program on 167MHz UltraSPARC.

CiNii
シングルチップマルチプロセッサ上でのマルチグレイン並列処理

木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-5 1998年08月 [査読有り]
OSCAR FORTRAN Compilerを用いたマルチグレイン並列性の評価

小幡元樹, 松井巌徹, 松崎秀則, 木村啓二, 稲石大祐, 宇治川泰史, 山本晃正, 岡本雅巳, 笠原博徳

情報処理学会研究報告ARC130-3 13 - 18 1998年08月 [査読有り]

CiNii
Multigrain parallel Processing on the Single Chip Multiprocessor

K. Kimura, W. Ogata, M. Okamoto, H. Kasahara

Technical Report of IPSJ,ARC-130-5 1998年08月 [査読有り]
A Cache Optimization with Earliest Executable Condition Analysis

D. Inaishi, K. Kimura, K. Fujimoto, W. Ogata, M. Okamoto, H. Kasahara

Technical Report of IPSJ, ARC-130-6 1998 ( 70 ) 31 - 36 1998年08月 [査読有り]

　概要を見る

従来のコンパイラによる単一プロセッサ用キャッシュ最適化は個々のループを対象としているため、プログラム全体に比べると局所的な最適化が多く、プログラム全域を対象としたキャッシュ最適化は行われていない。そこで本稿では、最早実行可能条件解析を利用した単一プロセッサ上でのFORTRANプログラムのキャッシュ最適化手法を提案する。OSCAR FORTRANマルチグレイン自動並列化コンパイラは、FORTRANプログラムをループ・サブルーチン・基本ブロックの3種のマクロタスク(MT)に分割し、各MTに最早実行可能条件解析を行いマクロタスクグラフ(MTG)を生成する。MTGは制御依存及びデータ依存に基づくMT間の実行順序制約、及びMT間で授受されるデータに関する情報を表現する。本手法ではこのMTGを用いて、先行MTによってアクセスされたデータにアクセスする後続MTが先行MTの直後に実行されるよう大域的なコード移動を行い、キャッシュヒット率を向上させる。本手法は、OSCAR FORTRANマルチグレイン自動並列化コンパイラ中に、最適化された逐次型FORTRANを出力するプリプロセッサ機能として実現されている。CG法プログラムを用いた本キャッシュ最適化手法の性能評価結果を行ったところ167MHz UltraSPARC上で最高62%の速度向上が得られた。Cache optimizations by a compiler for a single processor machine have been mainly applied to a singlenested loop. On the contrary, this paper proposes a cache optimization scheme using earliest executable condition analysis for FORTRAN programs on a single processor system. OSCAR FORTRAN multi-grain automatic parallelizing compiler decomposes a FORTRAN program into three types of macrotasks (MT), such as loops, subroutines and basic blocks, and analyzes the earliest executable condition of each MT to extract coarse grain parallelism among MTs and generates a macrotask graph (MTG). The MTG represents data dependence and extended control dependence among MTs and an information of shared data among MTs. By using this MTG, a compiler realizes global code motion to use cache effectively. The code motion technique moves a MT, which accesses data accessed by a precedent MT on MTG, immediately after the precedent MT to increase a cache hit rate. This optimization is realized using OSCAR multi-grain compiler as a preprocessor to output an optimized sequential FORTRAN code. A performance evaluation shows about 62% speed up compared with original program on 167MHz UltraSPARC.

CiNii
Evaluation of Multigrain Parallelism using OSCAR FORTRAN Compiler

M. Obata, G. Matsui, H. Matsuzaki, K. Kimura, D. Inaishi, Y. Ujigawa, T. Yamamoto, M. Okamoto, H. Kasahara

Technical Report of IPSJ, ARC-130-3 1998年08月 [査読有り]
Job scheduling scheme for pure space sharing among rigid jobs

Aida, K., Kasahara, H., Narita, S.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 1459 98 - 121 1998年08月 [査読有り]

DOI CiNii

Scopus

24

被引用数

(Scopus)
実用的並列最適化マルチプロセッサスケジューリングアルゴリズム PDF/IHS の大規模問題への適用と性能評価

飛田高雄, 笠原博徳

情報処理学会並列処理シンポジウムJSPP '98論文集 31 - 37 1998年06月 [査読有り]
階層型マクロデータフロー処理における同一階層内ループ間データローカライゼーション手法

吉田明正, 越塚健一, 岡本雅巳, 小幡元樹, 笠原博徳

情報処理学会並列処理シンポジウムJSPP '98論文集 375 - 382 1998年06月 [査読有り]
Data-Localization among Doall and Sequential Loops in Coarse Grain Parallel Processing

A. YOSHIDA, Y. UJIGAWA, M. OBATA, K. KIMURA, H. KASAHARA

Seventh Workshop on Compilers for Parallel Computers, Linkoping, Sweden 266 - 277 1998年06月 [査読有り]
Application and Evaluation of a Practical Parallel Optimization Algorithm PDF/IHS (Parallelized Depth First / Implicit Heuristic Search) to Large Scale Problems

T. Tobita, H. Kasahara

Joint Symposium on Parallel Processing (JSPP'98) 31 - 37 1998年06月 [査読有り]
A Data-Localization Scheme among Loops inside the Same Layer of Hierarchical Macro-Dataflow Processing

A. Yoshida, K. Koshizuka, M. Okamoto, M. Obata, H. Kasahara

Joint Symposium on Parallel Processing (JSPP'98) 98 ( 7 ) 375 - 382 1998年06月 [査読有り]

J-GLOBAL
並列分散科学技術計算環境STA(4)─異機種並列計算機の統合利用環境の構築

今村俊幸, 太田浩史, 川崎啄治, 小出洋, 武宮博, 樋口健二, 久野章則, 笠原博徳, 相川裕史

計算工学講演会論文集 3 1998年05月 [査読有り]

CiNii
並列分散科学技術計算環境STA(3)─異機種並列計算機間通信ライブラリの構築

小出洋, 今村俊幸, 太田浩史, 川崎啄治, 武宮博, 樋口健二, 笠原博徳, 相川裕史

計算工学講演会論文集 3 1998年05月 [査読有り]
並列分散科学技術計算環境STA(2)─エディタを中心に統合された並列プログラム開発環境PPDEの構築

太田浩史, 今村俊幸, 川崎啄治, 小出洋, 武宮博, 樋口健二, 笠原博徳, 相川裕史

計算工学講演会論文集 3 1998年05月 [査読有り]
並列分散科学技術計算環境STA(1)─目的及び概要

武宮博, 今村俊幸, 太田浩史, 川崎琢治, 小出洋, 笠原博徳, 相川裕史

計算工学講演会論文集 3 1998年05月 [査読有り]

CiNii
A data-localization compilation scheme using partial-static task assignment for Fortran coarse-grain parallel processing

Kasahara, H., Yoshida, A.

Parallel Computing 24 ( 3-4 ) 579 - 596 1998年05月 [査読有り]

DOI

Scopus

10

被引用数

(Scopus)
マルチグレイン並列化コンパイラとそのアーキテクチャ支援

笠原博徳, 尾形航, 木村啓二, 小幡元樹, 飛田高雄, 稲石大祐

社団法人電子情報通信学会, 信学技報, ICD98-10, CPSY98-10, FTS98-10 98 ( 22 ) 71 - 76 1998年04月

　概要を見る

現在、スーパーコンピュータにおいては価格性能比及び使い方の困難さによる市場の伸び悩みの問題、マイクロプロセッサにおいてはスーパスカラ、VLIWなどで用いられる命令レベル並列性抽出の限界など問題が顕在化しつつある。本論文では、このような問題を克服し、並列処理の非専門家にも簡単に使え価格性能比の良いスーパーコンピュータあるいはシングルチップ・マルチプロセッサを構築する一つのアプローチとして、マルチグレイン並列化コンパイラとそれを支援するマルチプロセッサアーキテクチャについて述べる。

CiNii J-GLOBAL
電磁界解析における有限要素・境界要素併用法の並列処理手法

小幡元樹, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

電気学会論文誌 A (基礎・材料・共通部門誌) 118-A ( 4 ) 377 - 379 1998年04月 [査読有り] [国内誌]

DOI CiNii
マルチグレイン並列化コンパイラとそのアーキテクチャ支援

笠原博徳, 尾形航, 木村啓二, 小幡元樹, 飛田高雄, 稲石大祐

社団法人電子情報通信学会, 信学技報, ICD98-10, CPSY98-10, FTS98-10 98 ( 22 ) 71 - 76 1998年04月 [査読有り]

　概要を見る

現在、スーパーコンピュータにおいては価格性能比及び使い方の困難さによる市場の伸び悩みの問題、マイクロプロセッサにおいてはスーパスカラ、VLIWなどで用いられる命令レベル並列性抽出の限界など問題が顕在化しつつある。本論文では、このような問題を克服し、並列処理の非専門家にも簡単に使え価格性能比の良いスーパーコンピュータあるいはシングルチップ・マルチプロセッサを構築する一つのアプローチとして、マルチグレイン並列化コンパイラとそれを支援するマルチプロセッサアーキテクチャについて述べる。

CiNii
マルチグレイン並列化コンパイラとそのアーキテクチャ支援

笠原博徳

社団法人電子情報通信学会, 信学技報, ICD98-10, CPSY98-10, FTS98-10 98 ( 22 ) 71 - 76 1998年04月 [査読有り]

　概要を見る

現在、スーパーコンピュータにおいては価格性能比及び使い方の困難さによる市場の伸び悩みの問題、マイクロプロセッサにおいてはスーパスカラ、VLIWなどで用いられる命令レベル並列性抽出の限界など問題が顕在化しつつある。本論文では、このような問題を克服し、並列処理の非専門家にも簡単に使え価格性能比の良いスーパーコンピュータあるいはシングルチップ・マルチプロセッサを構築する一つのアプローチとして、マルチグレイン並列化コンパイラとそれを支援するマルチプロセッサアーキテクチャについて述べる。

CiNii
Parallel Processing of Hybrid Finite Element and Boundary Element Method for Electro-magnetic Field Analysis

M. Obata, Y. Maekawa, S. Wakao, T. Onuki, H. Kasahara

Trans.IEE of Japan 118-A ( 4 ) 377 - 379 1998年04月 [査読有り]

CiNii
A Multigrain Parallelizing Compiler and Its Architectural Support

H. Kasahara, W. Ogata, K. Kimura, M. Obata, T. Tobita, D. Inaishi

THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD98-10, CPSY98-10, FTS98-10) 98 ( 22 ) 71 - 76 1998年04月 [査読有り]

　概要を見る

現在、スーパーコンピュータにおいては価格性能比及び使い方の困難さによる市場の伸び悩みの問題、マイクロプロセッサにおいてはスーパスカラ、VLIWなどで用いられる命令レベル並列性抽出の限界など問題が顕在化しつつある。本論文では、このような問題を克服し、並列処理の非専門家にも簡単に使え価格性能比の良いスーパーコンピュータあるいはシングルチップ・マルチプロセッサを構築する一つのアプローチとして、マルチグレイン並列化コンパイラとそれを支援するマルチプロセッサアーキテクチャについて述べる。

CiNii
A Multigrain Parallelizing Compiler and Its Architectural Support, THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS, TECHNICAL REPORT OF IEICE. (ICD98-10, CPSY98-10, FTS98-10)

H. Kasahara

1998年04月 [査読有り]
FPGAを用いたマルチプロセッサシステムテストベッドの実装

尾形航, 山本泰平, 水尾学, 木村啓二, 笠原博徳

情報処理学会, ARC研究会,98-ARC-128-14 98 ( 18(ARC-128 HPC-70) ) 1998年03月

J-GLOBAL
科学技術計算プログラムにおけるマルチグレイン並列性の評価

小幡元樹, 松井巌徹, 松崎秀則, 木村啓二, 稲石大裕, 宇治川泰史, 山本晃正, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会 2E-07 1998年03月 [査読有り]
一般的なマクロタスクグラフに対するループ間データローカライゼーション手法

松崎秀則, 吉田明正, 岡本雅巳, 松井巌徹, 小幡元樹, 宇治川泰史, 笠原博徳

情報処理学会第56回全国大会 2E-05 1998年03月 [査読有り]
異機種並列分散コンピューティングのためのメタ・スケジューリングの構想

小出洋, 武宮博, 今村俊幸, 太田浩史, 川崎琢治, 樋口健二, 笠原博徳, 相川裕史

情報処理学会第56回全国大会 2J-10 1998年03月 [査読有り]

CiNii
マルチグレイン並列処理用シングルチップマルチプロセッサアーキテクチャ

木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会 1N-03 1998年03月 [査読有り]
マルチグレイン並列処理におけるインタープロシージャ解析

松井巌徹, 岡本雅巳, 松崎秀則, 小幡元樹, 吉井謙一郎, 笠原博徳

情報処理学会第56回全国大会 2E-04 1998年03月 [査読有り]
マクロタスク最早実行可能条件解析を用いたキャッシュ最適化手法

稲石大祐, 木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会 2E-06 303 - 304 1998年03月 [査読有り]

CiNii
FPGAを用いたマルチプロセッサシステムテストベッドの実装

尾形航, 山本泰平, 水尾学, 木村啓二, 笠原博徳

情報処理学会, ARC研究会,98-ARC-128-14 1998年03月 [査読有り]
Job Scheduling Scheme for Pure Space Sharing among Rigid Jobs

K. Aida, H. Kasahara, S. Narita

Proc. 4th Workshop on Job Scheduling Strategies for Parallel Processing 98 - 121 1998年03月 [査読有り]
Implementation of FPGA Based Architecture Test Bed For Multi Processor System

W. Ogata, T. Yamamoto, M. Mizuno, K. Kimura, H. Kasahara

IPSJ SIG Notes, 98-ARC-128-14 1998年03月 [査読有り]
OSCAR multi-grain architecture and its evaluation

H Kasahara, W Ogata, K Kimura, G Matsui, H Matsuzaki, M Okamoto, A Yoshida, H Honda

INNOVATIVE ARCHITECTURE FOR FUTURE GENERATION HIGH-PERFORMANCE PROCESSORS AND SYSTEMS, PROCEEDINGS 106 - 115 1998年 [査読有り]

　概要を見る

OSCAR (Optimally Scheduled Advanced Multiprocessor) was designed to efficiently realize multi-grain parallel processing using static and dynamic scheduling. It is a shared memory multiprocessor system having centralized and distributed shared memories in addition to local memory on each processor with data transfer controller for overlapping of data transfer and task processing. Also, its Fortran multi-grain compiler hierarchically exploits coarse grain parallelism among loops, subroutines and basic blocks, conventional medium grain parallelism among loop-iterations in a Doall loop and near fine grain parallelism among statements. At the coarse grain parallel processing, data localization (automatic data distribution) have been employed to minimize data transfer overhear. In the near fine grain processing of a basic block, explicit synchronization can be removed by use of a clock level accurate code scheduling technique with architectural supports. This paper describes OSCAR's architecture, its compiler and the performance for the multi-grain parallel processing. OSCAR's architecture and compilation technology will be more important in future High Performance Computers and single chip multiprocessors.
実用的並列最適化マルチプロセッサスケジューリングアルゴリズムPDF/IHSの性能評価

飛田高雄, 笠原博徳

情報処理学会研究報告 97 ( 113 ) 13 - 18 1997年11月

J-GLOBAL
実用的並列最適化マルチプロセッサスケジューリングアルゴリズムPDF/IHSの性能評価

飛田高雄, 笠原博徳

情報処理学会研究報告 97 ( 113 ) 13 - 18 1997年11月 [査読有り]
ヒューマンノイド−人間形高度情報処理ロボット−

橋本周司, 成田誠之助, 白井克彦, 小林哲則, 高西淳夫, 菅野重樹, 笠原博徳

情報処理 38 ( 11 ) 959 - 969 1997年11月 [査読有り]

CiNii
Performance Evaluation of a Practical Parallel Optimization Multiprocessor Scheduling Algorithm PDF/HIS

T. Tobita, H. Kasahara

IPSJ SIG Notes 97 ( 113 ) 13 - 18 1997年11月 [査読有り]
Humanoid - Intelligent Anthropomorphic Robot

S. Hashimoto, S. Narita, K. Shirai, T. Kobayashi, A. Takanishi, S. Sugano, H. Kasahara

IPSJ MAGAZINE 38 ( 11 ) 959 - 969 1997年11月 [査読有り]

CiNii
２１世紀へ向けたＨＰＣにおける日本-ＥＵ技術移転と協力

笠原博徳

教育・科学技術に関する日本・ＥＵ協力会議ラウンドテーブル論文集, United Nations University 1997年09月 [査読有り]
Technology Transfer and Cooperation in HPC Toward the 21st Century Between Japan and EU

H. Kasahara

Conference on EU-Japan Co-operation in Education, Science and Technology: Round Table on Science and Technology 1997年09月 [査読有り]
電磁界解析における有限要素・境界要素併用法の並列処理手法

小幡元樹, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

情報処理学会研究会報告,97-HPC-67-3 1997年08月
マルチグレイン並列処理用マルチプロセッサシステム

岩井啓輔, 藤原崇, 森村知弘, 天野英晴, 木村啓二, 尾形航, 笠原博徳

電子情報通信学会研究報告, CPSY97-46 1997年08月
処理とデータ転送のオーバーラッピングを考慮したダイナミックスケジューリングアルゴリズム

木村啓二, 橋本茂, 古郷誠, 尾形航, 笠原博徳

電子情報通信学会研究報告, CPSY97-40 1997年08月
実行時間最小マルチプロセッサスケジューリング問題に対する実用的並列最適化アルゴリズムの性能評価

飛田高雄, 笠原博徳

電子情報通信学会研究報告, CPSY97-39 97 ( 225(CPSY97 36-50) ) 1997年08月

J-GLOBAL
Fortran階層型マクロデータフロー処理におけるデータローカライゼーション

吉田明正, 越塚健一, 岡本雅巳, 笠原博徳

情報処理学会研究会報告,97-ARC-125-2 1997 ( 76 ) 7 - 12 1997年08月

　概要を見る

本論文では、階層的に粗粒度並列処理を行なう階層型マクロデータフロー処理におけるデータローカライゼーション手法を提案する。本手法では、粗粒度並列処理される各階層において、ループ整合分割法を用いて処理とデータを分割し、パーシャルスタティックタスク割当を用いたダイナミックスケジューリング方式により、データ転送の多い粗粒度タスク集合を同一プロセッサに割り当て、粗粒度タスク間データ転送にローカルメモリを有効利用してデータ転送オーバヘッドを軽減する。マルチプロセッサシステムOSCAR上で行った性能評価の結果、本データローカライゼーションを伴う階層型マクロデータフロー処理では、データローカライゼーションを用いない場合に比べて処理時間が10%?20%短縮されることが確かめられた。This paper proposes a data-localization scheme for Fortran hierarchical macro-dataflow processing, which hierarchically exploits coarse-grain parallelism. The proposed data-localization scheme consists of three parts: (1) loop-aligned decomposition, which decomposes multiple loops having data dependences into data-localization-groups, (2) generation of dynamic scheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor, (3) generation of data transfer code via local memory inside data-localization-group. Pceformance evaluations on a multiprocessor system OSCAR show that hierarchical macro-dataflow processing with data-localization can reduce execution time by 10%-20% compared with hierarchical macro-dataflow processing without data-localization.

CiNii
処理とデータ転送のオーバーラッピングを考慮したダイナミックスケジューリングアルゴリズム

木村啓二, 橋本茂, 古郷誠, 尾形航, 笠原博徳

電子情報通信学会研究報告、CPSY97-40 1997年08月 [査読有り]
実行時間最小マルチプロセッサスケジューリング問題に対する実用的並列最適化アルゴリズムの性能評価

飛田高雄, 笠原博徳

電子情報通信学会研究報告、CPSY97-39 1997年08月 [査読有り]
マルチグレイン並列処理用マルチプロセッサシステム

岩井啓輔, 藤原崇, 森村知弘, 天野英晴, 木村啓二, 尾形航, 笠原博徳

電子情報通信学会研究報告, CPSY97-46 1997年08月 [査読有り]

CiNii
電磁界解析における有限要素・境界要素併用法の並列処理

小幡元樹, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

電気学会電子・情報・システム部門大会講演論文集 549 - 554 1997年08月 [査読有り]
Fortran階層型マクロデータフロー処理におけるデータローカライゼーション

吉田明正, 越塚健一, 岡本雅巳, 笠原博徳

情報処理学会研究会報告、97-ARC-125-2 1997年08月 [査読有り]
電磁界解析における有限要素・境界要素併用法の並列処理手法

小幡元樹, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

情報処理学会研究会報告, 97-HPC-67-3 1997 ( 75 ) 13 - 18 1997年08月 [査読有り]

　概要を見る

現在、超電導モータ等の電気機器の開発にあたっては、発生する電磁界の解析が必須となっている。この電磁界解析手法として従来、有限要素法(E)あるいは境界要素法(E)が広く用いられている。有限要素法は、一般的に非線形性を含む不均一な領域の解析に適しており、境界要素法は均一な無限領域の解析を得意とする。しかし電磁界解析においては、磁性体のような非線形領域と周りの空気領域のように無限に広がる領域を含むため、解析時間を短縮し、さらに精度向上を目指し、著者らはFEMとBEMの長所を組み合わせた有限要素・境界要素併用法を提案している。この併用法により、FEM，BEMのみを用いた場合と比べ、計算時間は大幅に短縮されるが、本手法を用いても、大規模問題に対しては依然として長時間の解析時間を要する。そこで、本論文ではこの解析時間を短するための並列処理手法を提案し、NEC Cenju?3上で手法の性能評価を行った結果について述べる。現在、超電導モータ等の電気機器の開発にあたっては、発生する電磁界の解析が必須となっている。この電磁界解析手法として従来、有限要素法(E)あるいは境界要素法(E)が広く用いられている。有限要素法は、一般的に非線形性を含む不均一な領域の解析に適しており、境界要素法は均一な無限領域の解析を得意とする。しかし電磁界解析においては、磁性体のような非線形領域と周りの空気領域のように無限に広がる領域を含むため、解析時間を短縮し、さらに精度向上を目指し、著者らはFEMとBEMの長所を組み合わせた有限要素・境界要素併用法を提案している。この併用法により、FEM，BEMのみを用いた場合と比べ、計算時間は大幅に短縮されるが、本手法を用いても、大規模問題に対しては依然として長時間の解析時間を要する。そこで、本論文ではこの解析時間を短するための並列処理手法を提案し、NEC Cenju?3上で手法の性能評価を行った結果について述べる。Recently, for development of electrical appliances like super conductive motors, analysis of a generated electro-magnetic field is required. As a method of the electro-magnetic field analysis, the Finite Element Method (FEM) and the Boundary Element Method (BEM) have been widely used. The FEM is suitable for analysis of infinitely extending fields. The electro-magnetic field to be analyzed for electrical appliances, however, includes non-linear and infinite subfields. Taking into consideration these factors, the authors have been proposing a hybrid FE and BE method to take full advantages of these two method. Though analysis time by the hybrid FE and BE method compared with the FEM or BEM is significantly reduced, high precision analysis for large scale needs a large analysis time. To reduce analysis time, this paper proposes parallel processing scheme for a distributed many multiprocessor and evaluate its performance on NEC Cenju-3.

CiNii
Multi-processor system for Multi-grain Parallel Processing

K. Iwai, T. Fujiwara, T. Morimura, H. Amano, K. Kimura, W. Ogata, H. Kasahara

Technical Report of IEICE, CPSY97-46 1997年08月 [査読有り]
A Macro Task Dynamic Scheduling Algorithm with Overlapping of Task Processing and Data Transfer

K. Kimura, S. Hashimoto, M. Kogou, W. Ogata, H. Kasahara

Technical Report of IEICE, CPSY97-40 1997年08月 [査読有り]
Evaluation of a Practical Parallel Optimization Algorithm for the Minimum Execution-Time Multiprocessor Scheduling Problem

T. Tobita, H. Kasahara

Technical Report of IEICE, CPSY97-39 1997年08月 [査読有り]
Parallel Processing of Hybrid Finite Element and Boundary Element Method for Electro-magnetic field analysis

M. Obata, Y. Maekawa, S. Wakao, T. Onuki, H. Kasahara

Proc. of the Electronics, Information and Systems Conference 549 - 554 1997年08月 [査読有り]
Data-Localization for Fortran Hierarchical Macro-Dataflow Processing

Yoshida, K. Koshizuka, M. Okamoto, H. Kasahara

IPSJ SIG Notes,97-ARC-125-2 1997 ( 76 ) 7 - 12 1997年08月 [査読有り]

　概要を見る

本論文では、階層的に粗粒度並列処理を行なう階層型マクロデータフロー処理におけるデータローカライゼーション手法を提案する。本手法では、粗粒度並列処理される各階層において、ループ整合分割法を用いて処理とデータを分割し、パーシャルスタティックタスク割当を用いたダイナミックスケジューリング方式により、データ転送の多い粗粒度タスク集合を同一プロセッサに割り当て、粗粒度タスク間データ転送にローカルメモリを有効利用してデータ転送オーバヘッドを軽減する。マルチプロセッサシステムOSCAR上で行った性能評価の結果、本データローカライゼーションを伴う階層型マクロデータフロー処理では、データローカライゼーションを用いない場合に比べて処理時間が10%?20%短縮されることが確かめられた。This paper proposes a data-localization scheme for Fortran hierarchical macro-dataflow processing, which hierarchically exploits coarse-grain parallelism. The proposed data-localization scheme consists of three parts: (1) loop-aligned decomposition, which decomposes multiple loops having data dependences into data-localization-groups, (2) generation of dynamic scheduling routine with partial static task assignment, which assigns macrotasks inside data-localization-group to the same processor, (3) generation of data transfer code via local memory inside data-localization-group. Pceformance evaluations on a multiprocessor system OSCAR show that hierarchical macro-dataflow processing with data-localization can reduce execution time by 10%-20% compared with hierarchical macro-dataflow processing without data-localization.

CiNii
Parallel Processing of Hybrid Finite Element and Boundary Element Method for Electro-magnetic field analysis

M. Obata, Y. Maekawa, S. Wakao, T. Onuki, H. Kasahara

IPSJ SIG Notes, 97-HPC-67-3 1997年08月 [査読有り]
マルチプロセッサシステム上でのプロセッサグループへの並列ジョブのスケジューリング手法

合田憲人, 笠原博徳, 成田誠之助

電子情報通信学会論文誌 J-80-D-I ( 6 ) 463 - 473 1997年06月 [査読有り]

　概要を見る

本論文では, マルチプロセッサシステム上で, 動的に到着する並列ジョブをプロセッサグループに割り当てるジョブスケジューリング手法について述べる. 各ジョブにジョブが要求する数のプロセッサを割り当てる手法では, 従来より, 到着順でジョブにプロセッサグループを割り当てる手法が提案されているが, これらの手法では, プロセッサフラグメンテーションが大きいという問題点がある. 本論文では, プロセッサフラグメンテーションを小さく抑え, プロセッサ利用率を向上させる手法であるFit Processors First Served (FPFS) およびFit Processors Most Processors First Served (FPMPFS) を提案する. また本論文では, 待ち行列モデルおよび1次元Bin-packing問題を用いた性能解析, シミュレーションによる性能評価, 実マルチプロセッサシステムNEC Cenju-3上での性能評価により, 提案手法の有効性, 実用性を検証する. これらの検証の結果, 提案手法が従来手法よりも, 実システム上でのプロセッサ利用率を9〜19[%]向上させる等, プロセッサ利用率および平衡条件を向上させ, 有効性, 実用性の高いことが確認された.

CiNii
A Scheduling Scheme of Parallel Jobs to Processor Groups on a Multiprocessor System

K. Aida, H. Kasahara, S. Narita

Trans. of IEICE J-80-D-I ( 6 ) 463 - 473 1997年06月 [査読有り]

J-GLOBAL
並列処理の電力系統解析への応用

笠原博徳, 成田誠之助

電気学会論文誌 117-B ( 5 ) 621 - 624 1997年05月 [査読有り] [国内誌]

DOI
Application of Parallel Processing to Power Systems Analysis

H. Kasahara, S. Narita

Trans. IEEJ 117-B ( 5 ) 621 - 624 1997年05月 [査読有り]

J-GLOBAL
Data-localization scheduling inside processor-cluster for multigrain parallel processing

Yoshida, A., Koshizuka, K., Ogata, W., Kasahara, H.

IEICE Transactions on Information and Systems E80-D ( 4 ) 473 - 479 1997年04月 [査読有り]
電磁界解析のための有限要素・境界要素併用法の並列処理

小幡元樹, 前川仁孝, 坂本哲也, 若尾真治, 小貫天, 笠原博徳

情報処理学会第54回全国大会 5F-7 69 - 70 1997年03月 [査読有り]

　概要を見る

本稿では、電磁界解析のための有限要素・境界要素併用法のデータ転送の最適化、及び生成される係数行列の格納法について述べる。電磁界解析では、磁性体領域などの非線形問題を扱い、また周辺磁場解析では無限に近い領域を扱う必要がある。そこで電磁界解析において効率良い計算をするために、磁性体領域などの非線形領域には有限要素法を、空気領域には境界要素法を利用する有限要素・境界要素併用法を提案した。従来より、有限要素法に関しては領域分割を用いた並列化の研究が多く行われてきた。しかし有限要素・境界要素併用法では、境界要素法を併用したことによる係数行列が特殊な形になるため、従来の並列化手法では効率よい並列処埋が困難であった。そこで、筆者らはサブストラクチャ法による分割を境界要素部分にも適用して並列処理する手法を提案した。本稿では、さらに効率よい並列処理を図るために、データ転送などを最適化し高速化する手法の提案を行う。また、提案する手法の有効性を評価するために Cenju-3上で実装し、評価した結果について述べる。

CiNii
実行時間最小・実用的並列最適化マルチプロセッサ・スケジューリング・アルゴリズムの大規模問題への適用

飛田高雄, 笠原博徳

情報処理学会第54回全国大会 3J-5 275 - 276 1997年03月 [査読有り]

　概要を見る

一般に強NP困難となることが知られている実行時間最小マルチプロセッサスケジューリング問題に対し、筆者等は、ヒューリスティックを用いた分枝限定法である応用した実用的な最適化アルゴリズムDF/IHS (Depth First / Implicit Heuristic Search) を開発し、実問題に適用してその効果を確かめている。さらに、DF/IHSの探索部分を並列化したPDF/IHS (Paralldized DF/IHS) を提案し、8プロセッサマルチプロセッサシステム (ALLIANT社 FXシリーズ)上でインプリメントし、その効果を確認している。本稿ではこのPDF/IHSを Kendall Square Research社の KSR1上でインプリメントし、タスク数数百から1000の大規模スケジューリング問題に適用した結果について述べる。

CiNii
階層型マクロデータフロー処理におけるデータローカライゼーション手法

越塚健一, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会 1L-5 1997年03月 [査読有り]
階層型マクロデータフローのためのダイナミック/スタティック併用スケジューリング手法

桐原正樹, 岡本雅巳, 赤鹿秀樹, 笠原博徳

情報処理学会第54回全国大会 1L-1 333 - 334 1997年03月 [査読有り]

　概要を見る

マルチプロセッサシステム用 Fortlan 自動並列化コンパイラにおいて従来自動並列化が不可能であったループ並列性以外の並列性を抽出するために、筆者等は粗粒度の並列性を利用した並列処理 (マクロデータフロー処理)手法、および基本ブロック内部の近細粒度並列処理手法を提案している。また、筆者等は粗粒度・中粒度・近細粒度並列処理を階層的に適用する並列処埋手法であるマルチグレイン並列処理手法、さらにループやサブルーチン等の粗粒度タスク内で階層的にマクロデータフロー処埋を行なう階層型マクロデータフロー処理も提案している。この階層型マクロデータフロー処埋では、粗粒度タスク間のスケジューリング方法として、実行時不確定性に対応するためにダイナミックスケジューリング手法を用いてきた。しかし、ダイナミックスケジューリング手法は実行時にスケジューリングを行なうためにスケジューリングオーバーヘッドが大きくなってしまうという問題が生じる。そこで、スケジューリングオーバーヘッドを軽減し、さらにマクロタスク間のデータ転送オーバーヘッドを最小化するために、本稿では、ダイナミックスケジューリング手法とスタテイックスケジューリング手法との併用法を提案する。

CiNii
マルチプロセッサシステム上でのCFDの並列処理に関する研究

柳川慎, 橋本茂, 前川仁孝, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会 5F-8 1997年03月 [査読有り]
マクロデータフロー処理における処理とデータ転送のオーバーラップ

橋本茂, 藤本謙作, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会 5F-6 1997年03月 [査読有り]
Humanoid robot - Development of an information assistant robot Hadaly

S Hashimoto, S Narita, H Kasahara, A Takanishi, S Sugano, K Shirai, T Kobayashi, H Takanobu, T Kurata, K Fujiwara, T Matsuno, T Kawasaki, K Hoashi

RO-MAN '97 SENDAI: 6TH IEEE INTERNATIONAL WORKSHOP ON ROBOT AND HUMAN COMMUNICATION, PROCEEDINGS 106 - 111 1997年 [査読有り]

　概要を見る

This paper describes a humanoid robot "Hadaly," that was developed as a basic model for the final version of Humanoid. In this study, the authors feature an attempt to find the configurations and functions that are reguired for a humanoid. Hadaly consists of four systems; an audio-visual system, a head system, a speech system and an arm system. The configurations and functions reguired for a humanoid robot are clarified based on the results of the information assistance experiment with Hadaly.
Data localization using loop aligned decomposition for macro-dataflow processing

Yoshida, A., Kasahara, H.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 1239 56 - 74 1997年 [査読有り]

DOI CiNii

Scopus
データ転送と処理のオーバーラップを用いたマクロタスクスケジューリング手法

橋本茂, 藤本謙作, 岡本雅巳, 笠原博徳

電子情報通信学会,CPSY96-107 96 ( 503 ) 65 - 72 1997年01月

　概要を見る

最近, ローカルメモリに加え分散共有メモリ, データ転送ユニットを持ったマルチプロセッサシステムが開発されている. これらのシステムにおいて, ローカルメモリを有効に使用するためにはプロセッサエレメント間のデータ転送のオーバーヘッドを最小化するデータと処理の分割配置が重要である. しかしながら, ユーザやコンパイラがデータ転送オーバーヘッドを最小化するようにスケジューリングを行ってもいくつかのデータ転送は残ってしまう. 本稿では, データ転送オーバーヘッドを削減し, タスクと処理のオーバーラップを考慮し, 残りのオーバーヘッドを隠蔽するための, データプレロード/ポストストアをを用いたヒューリスティックスケジューリングアルゴリズムを用いてプロトタイプコンパイラ(プリプロセッサ)をインプリメントし, 富士通のVPP500上で予備評価を行なった結果について述べる.

CiNii J-GLOBAL
データ転送と処理のオーバーラップを用いたマクロタスクスケジューリング手法

橋本茂, 藤本謙作, 岡本雅巳, 笠原博徳

電子情報通信学会、CPSY96-107 96 ( 503 ) 65 - 72 1997年01月 [査読有り]

　概要を見る

最近, ローカルメモリに加え分散共有メモリ, データ転送ユニットを持ったマルチプロセッサシステムが開発されている. これらのシステムにおいて, ローカルメモリを有効に使用するためにはプロセッサエレメント間のデータ転送のオーバーヘッドを最小化するデータと処理の分割配置が重要である. しかしながら, ユーザやコンパイラがデータ転送オーバーヘッドを最小化するようにスケジューリングを行ってもいくつかのデータ転送は残ってしまう. 本稿では, データ転送オーバーヘッドを削減し, タスクと処理のオーバーラップを考慮し, 残りのオーバーヘッドを隠蔽するための, データプレロード/ポストストアをを用いたヒューリスティックスケジューリングアルゴリズムを用いてプロトタイプコンパイラ(プリプロセッサ)をインプリメントし, 富士通のVPP500上で予備評価を行なった結果について述べる.

CiNii
A Macro Task Scheduling Method of Overlapping of Data Transfer and Task Processing

S. Hashimoto, K. Fujimoto, M. Okamoto, H. Kasahara

Technical Report of IEICE, CPSY96-107 96 ( 503 ) 65 - 72 1997年01月 [査読有り]

　概要を見る

最近, ローカルメモリに加え分散共有メモリ, データ転送ユニットを持ったマルチプロセッサシステムが開発されている. これらのシステムにおいて, ローカルメモリを有効に使用するためにはプロセッサエレメント間のデータ転送のオーバーヘッドを最小化するデータと処理の分割配置が重要である. しかしながら, ユーザやコンパイラがデータ転送オーバーヘッドを最小化するようにスケジューリングを行ってもいくつかのデータ転送は残ってしまう. 本稿では, データ転送オーバーヘッドを削減し, タスクと処理のオーバーラップを考慮し, 残りのオーバーヘッドを隠蔽するための, データプレロード/ポストストアをを用いたヒューリスティックスケジューリングアルゴリズムを用いてプロトタイプコンパイラ(プリプロセッサ)をインプリメントし, 富士通のVPP500上で予備評価を行なった結果について述べる.

CiNii
Near Fine Grain Parallel Processing without Explicit Synchronization on a Multiprocessor System

W. Ogata, A. Yoshida, M. Okamoto, K. Kimura, H. Kasahara

Proc. of Sixth Workshop on Compilers for Parallel Computers 1996年12月 [査読有り]

CiNii
実用レベルのマルチグレインFORTRANコンパイラの開発

岡本雅巳, 合田憲人, 吉田明正, 笠原博徳, 成田誠之助

情報処理学会研究報告, 96ARC 1996年10月
スタティックスケジューリングを用いた電子回路シミュレーションの粗粒度/近細粒度階層型並列処理手法

前川仁孝, 高井峰生, 伊藤泰樹, 西川健, 笠原博徳

情報処理学会論文誌 37 ( 10 ) 1859 - 1868 1996年10月 [査読有り]

　概要を見る

本論文では回路分割を用いた分割回路間粗粒度並列処理手法と分割回路内のステートメント間近細粒度並列処理手法を階層的に適用する直接法を用いた電子回路シミュレーションの並列処理手法を提案する. 従来よりマルチプロセッサ上での電子回路シミュレーションではタスク粒度を比較的粗くできる回路分割手法を用いた並列化がよく行われてきた. しかしこの回路分割法では効率良い並列処理が可能な回路の分割数は必ずしもプロセッサ数と同一でないという問題点がある. そこで本論文で提案する粗粒度/近細粒度階層型並列処理手法では回路分割により生成された各分割回路をマクロタスクとしてプロセッサクラスダに割り当て各プロセッサクラスタ内では割り当てられた分割回路内の解析計算をステートメントレベルの近細粒度タスクに分割しデータ転送を考慮したスタティックスケジューリングアルゴリズムを用いて並列処理することにより従来の回路分割法のみでは効率良い並列処理が行えなかったような回路の処理を高速化することが可能となる. 本手法をマルチプロセッサシステムOSCAR上で性能評価した結果従来の回路分割による粗粒度並列処理のみの場合と比べプロセッサを16台用いた場合平均して約40%程度の速度向上が得られることが確かめられた.This paper proposes a hierarchical parallel processing scheme of circuit simulation using direct method, which hierarchially combines coarse train parallel processing with circuit tearing and near fine grain parallel processing. Parallel processing schemes of a circuit simulation using the circuit tearing have been often employed for distributed memory multiprocessor systems. However, in the circuit fearing, it is difficult to tear a circuit t6 a optimal number of processors by which parallel processing time can bb minimum. Taking this fact into consideration this paper proposes a hierarchical parallel processing scheme, which combines coarse grain parallel processing using circuit tearing and near fine grain parallel processing. Torn circuits scheduled to processor clusters. Next, analysis of a torn circuit is performed by processors inside a processor clustor by near fine grain parallel processing technique. In the near fine grain parallel processing, statement level tasks are generated from loop free code for the solution of unstructured sparse matrix using Crout method inside a torn circuit. Then the generated tasks are scheduled to processors inside the processor cluster by static scheduling algolithm. Also, performance of the proposed scheme is evaluated on a multiprocessor system OSCAR. It has been confirmed that a hierarchical scheme allows us to obtain about 40% speedup compared with ordinary circuit tearing parallel processing method.

CiNii
実用レベルのマルチグレインFORTRANコンパイラの開発

岡本雅巳, 合田憲人, 吉田明正, 笠原博徳, 成田誠之助

情報処理学会研究報告、96ARC 43 - 48 1996年10月 [査読有り]

CiNii
A Coarse Grain/Near Fine Grain Hierarchical Parallel Processing Scheme of Circuit Simulation Using Static Scheduling

Y. Maekawa, M. Takai, T. Ito, T. Nishikawa, H. Kasahara

Trans. of IPSJ 37 ( 10 ) 1859 - 1868 1996年10月 [査読有り]

　概要を見る

本論文では回路分割を用いた分割回路間粗粒度並列処理手法と分割回路内のステートメント間近細粒度並列処理手法を階層的に適用する直接法を用いた電子回路シミュレーションの並列処理手法を提案する. 従来よりマルチプロセッサ上での電子回路シミュレーションではタスク粒度を比較的粗くできる回路分割手法を用いた並列化がよく行われてきた. しかしこの回路分割法では効率良い並列処理が可能な回路の分割数は必ずしもプロセッサ数と同一でないという問題点がある. そこで本論文で提案する粗粒度/近細粒度階層型並列処理手法では回路分割により生成された各分割回路をマクロタスクとしてプロセッサクラスダに割り当て各プロセッサクラスタ内では割り当てられた分割回路内の解析計算をステートメントレベルの近細粒度タスクに分割しデータ転送を考慮したスタティックスケジューリングアルゴリズムを用いて並列処理することにより従来の回路分割法のみでは効率良い並列処理が行えなかったような回路の処理を高速化することが可能となる. 本手法をマルチプロセッサシステムOSCAR上で性能評価した結果従来の回路分割による粗粒度並列処理のみの場合と比べプロセッサを16台用いた場合平均して約40%程度の速度向上が得られることが確かめられた.This paper proposes a hierarchical parallel processing scheme of circuit simulation using direct method, which hierarchially combines coarse train parallel processing with circuit tearing and near fine grain parallel processing. Parallel processing schemes of a circuit simulation using the circuit tearing have been often employed for distributed memory multiprocessor systems. However, in the circuit fearing, it is difficult to tear a circuit t6 a optimal number of processors by which parallel processing time can bb minimum. Taking this fact into consideration this paper proposes a hierarchical parallel processing scheme, which combines coarse grain parallel processing using circuit tearing and near fine grain parallel processing. Torn circuits scheduled to processor clusters. Next, analysis of a torn circuit is performed by processors inside a processor clustor by near fine grain parallel processing technique. In the near fine grain parallel processing, statement level tasks are generated from loop free code for the solution of unstructured sparse matrix using Crout method inside a torn circuit. Then the generated tasks are scheduled to processors inside the processor cluster by static scheduling algolithm. Also, performance of the proposed scheme is evaluated on a multiprocessor system OSCAR. It has been confirmed that a hierarchical scheme allows us to obtain about 40% speedup compared with ordinary circuit tearing parallel processing method.

CiNii
Development of a Practical Level Multi-Grain FORTRAN Compiler

M. Okamoto, K. Aida, A. Yoshida, H. Kasahara, S. Narita

SIG Notes of IPSJ 1996年10月 [査読有り]
有限要素・境界要素併用法の並列処理手法

前川仁孝, 坂本哲也, 小幡元樹, 若尾真治, 笠原博徳, 小貫天

電気学会情報処理研究会資料, IP-96-27 1996年09月
無同期近細粒度並列処理におけるデータ転送順序最適化

尾形航, 吉田明正, 岡本雅巳, 笠原博徳

電気学会情報処理研究会資料, IP-96-29 IP-96 ( 23-30 ) 1996年09月

J-GLOBAL
無同期近細粒度並列処理におけるデータ転送順序最適化

尾形航, 吉田明正, 岡本雅巳, 笠原博徳

電気学会情報処理研究会資料、IP-96-29 1996年09月 [査読有り]
有限要素・境界要素併用法の並列処理手法

前川仁孝, 坂本哲也, 小幡元樹, 若尾真治, 笠原博徳, 小貫天

電気学会情報処理研究会資料、IP-96-27 1996年09月 [査読有り]
データ転送と処理のオーバーラップを用いたデータ転送最小化自動並列化コンパイラ

藤本謙作, 橋本茂, 笠原博徳

電気学会情報処理研究会資料、IP-96-24, 1996年09月 [査読有り]
Optimization of Data Transfer Order for Near Fine Grain Parallel Processing without Explicit Synchronization Code

W. Ogata, A. Yoshida, M. Okamoto, H. Kasahara

Technical Report of IEE Japan, IP-96-29 1996年09月 [査読有り]
Parallel Processing Scheme of the Hybrid Finite Element and Boundary Element Method

Y. Maekawa, T. Sakamoto, M. Obata, S. Wakao, H. Kasahara, T. Onuki

Technical Report of IEE Japan, IP-96-27 1996年09月 [査読有り]
データ転送と処理のオーバーラップを用いたデータ転送最小化自動並列化コンパイラ

藤本謙作, 橋本茂, 笠原博徳

電気学会情報処理研究会資料, IP-96-24 IP-96 ( 23-30 ) 1996年09月

J-GLOBAL
マルチプロセッサシステム上での並列ジョブのスケジューリング手法の評価

合田憲人, 笠原博徳, 成田誠之助

情報処理学会研究報告 OS-73-13 96 ( 79(OS-73) ) 1996年08月

J-GLOBAL
マルチグレインデータローカライゼーションのための近細粒度タスクスケジューリング

吉田明正, 越塚健一, 尾形航, 笠原博徳

電子情報通信学会技術研究報告, CPSY96-66 96 ( 231(CPSY96 57-68) ) 1996年08月

J-GLOBAL
マルチグレインデータローカライゼーションのための近細粒度タスクスケジューリング

吉田明正, 越塚健一, 尾形航, 笠原博徳

電子情報通信学会技術研究報告、CPSY96-66 1996年08月 [査読有り]
マルチプロセッサシステム上での並列ジョブのスケジューリング手法の評価

合田憲人, 笠原博徳, 成田誠之助

情報処理学会研究報告 OS-73-13 1996年08月 [査読有り]
A Near-Fine-Grain Task Scheduling Scheme for Multi-Grain Data-Localization

Yoshida, K. Koshizuka, W. Ogata, H. Kasahara

Technical Report of IEICE, CPSY96-66 1996年08月 [査読有り]
Evaluation of a Scheduling Scheme of Parallel Jobs on a Multiprocessor System

K. Aida, H. Kasahara, S. Narita

IPSJ SIG Notes OS-73-13 1996年08月 [査読有り]
ソーテッドコードブックベクトル量子化の並列処理

中野恵一, 笠原博徳

情報処理学会論文誌 37 ( 7 ) 1996年07月 [査読有り]
マルチプロセッサ上での近細粒度並列処理

笠原博徳

情報処理学会学会誌 37 ( 7 ) 1996年07月 [査読有り]
Parallel Processing for Fast Vector Quantization with Sorted Codebook

K. Nakano, H. Kasahara

Trans. of IPSJ 37 ( 7 ) 1996年07月 [査読有り]
Near Fine Grain Parallel Processing on Multiprocessor Systems

H. Kasahara

Journal of IPSJ 37 ( 7 ) 1996年07月 [査読有り]

J-GLOBAL
Data-Localization for Fortran Macro-Dataflow Computation Using Partial Static Task Assignment.

Akimasa Yoshida, Kenichi Koshizuka, Hironori Kasahara

Proceedings of the 10th international conference on Supercomputing 61 - 68 1996年05月 [査読有り]

DOI

Scopus

13

被引用数

(Scopus)
共有メモリ型マルチプロセッサシステム上でのFortran粗粒度タスク並列処理の性能評価

合田憲人, 岩崎清, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会論文誌 37 ( 3 ) 418 - 429 1996年03月 [査読有り]

　概要を見る

本論文は共有メモリ型マルチプロセッサシステム上での粗粒度並列処理手法であるFortranマクロデータフロー処理の実現方法と性能評価について述べる. マクロデータフロー処理手法ではコンパイラがプログラムの粗粒度タスク(マクロタスク)への分割マクロタスク間の並列性抽出マクロタスクをプロセッサヘ割り当てるダイナミックスケジューリングコード生成を自動的に行う. 従来よりマルチプロセッサシステム上で用いられているマルチタスキング等の粗粒度並列処理ではユーザによる粗粒度タスク間の並列性抽出が困難である OS等によるダイナミックスケジューリングオーバーヘッドが大きいという問題があるが本マクロデータフロー処理ではコンパイラが自動的にマクロタスク間の並列性を抽出するとともに各ソースプログラム用に最適化したダイナミックスケジューリングコードを生成するためオーバーヘッドを低く抑えることが可能である. 本手法の性能評価をAlliant FX/4およびKendall Square Research KSR1上で行った結果マクロデータフロー処理がプログラムの実行時間をループ並列化マルチタスキング等の従来手法を適用した場合の1/1.92から1/8.10に短縮することが確認された.This paper presents an implementation and performance evaluation of the macrodataflow computation scheme that is a coarse grain parallel processing scheme on shared memory multi-processor systems. In macrodataflow computation, the compiler automatically generates coarse grain tasks called macrotasks, exploits parallelism among macrotasks and generates a dynamic scheduling routine to assign macrotasks to processors. A conventional coarse grain parallel processing scheme such as multi-tasking has drawbacks such as difficulty in the extraction of parallelism among coarse grain tasks by users and large dynamic scheduling overhead caused by OS calls. However, in macrodataflow computation, the compiler exploits parallelism among macrotasks automatically and dynamic scheduling overhead is small because the compiler optimizes a dynamic scheduling routine for each source program. Performance evaluation of the macrodataflow computation scheme on an Alliant FX/4 and a Kendall Square Research KSR1 shows that macrodataflow computation reduces execution time of programs to 1/1.92 - 1/8.10 of execution time by conventional schemes such as loop parallelization and multi-tasking.

CiNii
有限要素法と境界要素法を利用した電磁界解析の並列処理

坂本哲也, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

情報処理学会第52回全国大会 4L-8 1996年03月 [査読有り]

CiNii
電力系統過渡安定度計算の階層的並列処理手法

西川健, 前川仁孝, 中野恵一, 笠原博徳

情報処理学会第52回全国大会 4L-9 1996年03月 [査読有り]
階層型マクロデータフロー処理のためのマクロタスクスケジューリング手法

赤鹿秀樹, 岡本雅巳, 宮沢稔, 安田泰勲, 笠原博徳

情報処理学会第52回全国大会 1L-1 1996年03月 [査読有り]
マルチプラットフォーム・マクロデータフローコンパイラの開発

安田泰勲, 合田憲人, 岩井啓輔, 岡本雅巳, 笠原博徳

情報処理学会第52回全国大会 1L-3 1996年03月 [査読有り]
データ転送と処理のオーバーラップを用いたデータ転送最小化自動並列化コンパイラ

藤本謙作, 橋本茂, 笠原博徳

情報処理学会第52回全国大会 1L-2 1996年03月 [査読有り]

CiNii
Performance Evaluation of Fortran Coarse Grain Parallel Processing on Shared Memory Multi-processor Systems

K. Aida, K. Iwasaki, M. Okamoto, H. Kasahara, S. Narita

Trans. of IPSJ 37 ( 3 ) 418 - 429 1996年03月 [査読有り]

　概要を見る

本論文は共有メモリ型マルチプロセッサシステム上での粗粒度並列処理手法であるFortranマクロデータフロー処理の実現方法と性能評価について述べる. マクロデータフロー処理手法ではコンパイラがプログラムの粗粒度タスク(マクロタスク)への分割マクロタスク間の並列性抽出マクロタスクをプロセッサヘ割り当てるダイナミックスケジューリングコード生成を自動的に行う. 従来よりマルチプロセッサシステム上で用いられているマルチタスキング等の粗粒度並列処理ではユーザによる粗粒度タスク間の並列性抽出が困難である OS等によるダイナミックスケジューリングオーバーヘッドが大きいという問題があるが本マクロデータフロー処理ではコンパイラが自動的にマクロタスク間の並列性を抽出するとともに各ソースプログラム用に最適化したダイナミックスケジューリングコードを生成するためオーバーヘッドを低く抑えることが可能である. 本手法の性能評価をAlliant FX/4およびKendall Square Research KSR1上で行った結果マクロデータフロー処理がプログラムの実行時間をループ並列化マルチタスキング等の従来手法を適用した場合の1/1.92から1/8.10に短縮することが確認された.This paper presents an implementation and performance evaluation of the macrodataflow computation scheme that is a coarse grain parallel processing scheme on shared memory multi-processor systems. In macrodataflow computation, the compiler automatically generates coarse grain tasks called macrotasks, exploits parallelism among macrotasks and generates a dynamic scheduling routine to assign macrotasks to processors. A conventional coarse grain parallel processing scheme such as multi-tasking has drawbacks such as difficulty in the extraction of parallelism among coarse grain tasks by users and large dynamic scheduling overhead caused by OS calls. However, in macrodataflow computation, the compiler exploits parallelism among macrotasks automatically and dynamic scheduling overhead is small because the compiler optimizes a dynamic scheduling routine for each source program. Performance evaluation of the macrodataflow computation scheme on an Alliant FX/4 and a Kendall Square Research KSR1 shows that macrodataflow computation reduces execution time of programs to 1/1.92 - 1/8.10 of execution time by conventional schemes such as loop parallelization and multi-tasking.

CiNii
データ転送と処理のオーバーラップを考慮したヒューリスティックマルチプロセッサスケジューリングアルゴリズムの最適化アルゴリズムを用いた性能評価

角谷清司, 橋本茂, 笠原博徳

1996年電子情報通信学会春季大会講演論文集 D-82 ( Sogo Pt 6 ) 1996年03月 [査読有り]

J-GLOBAL
並列処理の導入による有限要素・境界要素併用解析法の高速化

若尾真治, 堀充利, 前川仁孝, 坂本哲也, 笠原博徳, 小貫天

電気学会研究会資料, SA-96-10, RM-96-60 1996年
並列処理の導入による有限要素・境界要素併用解析法の高速化

若尾真治, 堀充利, 前川仁孝, 坂本哲也, 笠原博徳, 小貫天

電気学会研究会資料、SA-96-10、RM-96-60 1996年 [査読有り]
The Application of Parallel Processing to The Hybrid FE-BE Analysis

S. Wakao, M. Hori, Y. Maekawa, T. Sakamoto, H. Kasahara, T. Onuki

Technical Report of IEE Japan, SA-96-10, RM-96-60 1996年 [査読有り]
Fortranマルチグレイン並列処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

情報処理学会論文誌 36 ( 7 ) 1551 - 1559 1995年07月 [査読有り]

CiNii
A Data-Localization Scheme for Fortran Multi-Grain Parallel Processing

A. Yoshida, S. Maeda, W. Ogata, H. Kasahara

Trans. of IPSJ 36 ( 7 ) 1551 - 1559 1995年07月 [査読有り]

J-GLOBAL
Data-Localization for Macro-Dataflow Computation Using Static Macrotask Fusion

A.Yoshida, S. Maeda, K. Fujimoto, H. Kasahara

Proc. Fifth Workshop on Compilers for Parallel Computers 440 - 453 1995年07月 [査読有り]

CiNii
Parallel Processing Schemes for Fast Vector Quantization with Sorted Codebook

K. Nakano, H. Kasahara

Proc. JSPP'95 337 - 344 1995年05月 [査読有り]
ソーテッドコードブックベクトル量子化の並列処理

中野恵一, 笠原博徳

JSPP'95 論文集 337 - 344 1995年05月 [査読有り]
OSCAR Fortran Multigrain Compiler

H. Kasahara

Stanford University, Hosted by Professor John L. Hennessy and Professor Monica Lam 1995年05月 [査読有り]
階層並列実行ジョブ間スケジューリング手法

合田憲人, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究報告 ARC-111-1 1995 ( 29 ) 1 - 8 1995年03月

　概要を見る

本稿では，複数ジョブの階層並列実行におけるジョブスケジューリング手法について述べる．本稿における複数ジョブの階層並列実行では，各ジョブのコンパイル時の情報をもとにして，OSジョブスケジューラが，各ジョブに複数プロセッサ（すなわちプロセッサグループ）を割り当て，割り当てられたプロセッサグループ上では，単一ジョブ内タスクをスタティックスケジューリングあるいはコンパイラが生成したダイナミックスケジューリングルーチン用いて並列処理する．本稿では，複数ジョブにプロセッサグループを割り当てる場合のスケジューリング手法として，Bin?packingアルゴリズムを用いたFit Processors First Served()を提案する．This paper presents a job scheduling scheme for hierarchical parallel execution of multiple jobs. In the hierarchical parallel execution of multiple jobs, an OS job scheduler allocates processors(or a processor group) to each job referring the information obtained at compile time. On the processor group allocated to a job, tasks in a job are executed by processors using static scheduling or dynamic scheduling with a dynamic scheduling routine generated by the compiler. This paper proposes a job scheduling scheme to allocate processor groups to multiple jobs using Bin-packing algorithm named Fit Processors first Served(FPFS).

CiNii
リカレントニューラルネットワークにおける学習の並列処理

芹沢一, 前川仁孝, 中野恵一, 笠原博徳

電子情報通信学会1995年総合大会 D-149 ( Sogo Pt 6 ) 1995年03月 [査読有り]

J-GLOBAL
マルチグレイン並列処理用アーキテクチャシミュレータの概要

太田昌人, 尾形航, 笠原博徳

電子情報通信学会1995年総合大会 D-133 ( Sogo Pt 6 ) 1995年03月 [査読有り]

J-GLOBAL
無同期近細粒度並列処理における並列コードスケジューリング

尾形航, 太田昌人, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第50回全国大会 1J-3 15 - 16 1995年03月 [査読有り]

　概要を見る

マルチプロセッサ上での科学技術計算の並列処理においては従来中粒度並列処理(ループ並列化)が主に用いられてきた。しかし、粗粒度並列性(ループ,サブルーチン,基本ブロック間の並列性)を利用できない、また、基本ブロックや逐次ループを複数のPEで並列処理できないという問題があった。このため、より高い並列処理性能を実現するには、中粒度並列処理に加え、ループ,サブルーチン,基本ブロックをタスクとして定義しこれらの間の並列牲を抽出するマクロデーターフロー処理や、逐次ループ、基本ブロックを複数のPEで並列処理する近細粒度並列処理を組み合わせ、プログラムが持つ並列性を最大限に引き出すマルチグレイン並列化コンパイラが必要となる。筆者等は従来より、このようなマルチグレイン並列処理を行なうOSCAR Fortran自動並列コンパイラを開発している。マルチグレイン並列処理において、近細粒度並列処理は、基本ブロックに含まれるステートメントを近細粒度タスクとして定義し、これらの間の並列性を抽出しながら複数のPEにタスクを割り当て、並列処理するものだが、従来の主記憶共有型マルチプロセッサや分散メモリ型マルチプロセッサでは近細粒度タスクに比べて相対的に大きなデータ転送オーバーヘッドや同期オーバーヘッドのため効率的な並列処理が困難であった。しかし、マルチプロセッサシステムOSCARはFortranマルチグレイン自動並列化コンパイラのデータ転送や同期オーバーヘッドを最小化するスタティックスケジューリング手法や、スタティックスケジューリングの結果を参照して冗長な同期を除く手法、クロックレベルの厳密なコードスケジューリングにより同期を除去する手法と、それらの最適化を可能とするアーキテクチャサポートで近細粒度並列処理を実現している。本稿では、コードスケジューリングをさらに改良してデータ転送順序最適化を行なう手法について述べる。

CiNii
電子回路シミュレーションの粗粒度/近細粒度並列処理手法

伊藤泰樹, 前川仁孝, 高井峰生, 西川健, 笠原博徳

情報処理学会第50回全国大会 2J-9 1995年03月 [査読有り]
商用共有メモリ型マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

岩崎清, 合田憲人, 笠原博徳, 成田誠之助

情報処理学会第50回全国大会 1B-8 1995年03月 [査読有り]
自動並列化コンパイラにおけるデータプレロード・ポストストアを用いたデータ転送オーバヘッドの隠蔽

藤本謙作, 笠原博徳

情報処理学会第50回全国大会 1J-7 1995年03月 [査読有り]
マルチグレイン並列処理におけるデータローカライゼーションのための近細粒度タスクスケジューリング

吉田明正, 尾形航, 岡本雅巳, 合田憲人, 笠原博徳

情報処理学会第50回全国大会 1J-5 1995年03月 [査読有り]
Array Subscript Bit Vector 表示によるデータ依存解析手法

山下浩一郎, 安田泰勲, 宮沢稔, 笠原博徳

情報処理学会第50回全国大会 1J-2 1995年03月 [査読有り]
階層並列実行ジョブ間スケジューリング手法

合田憲人, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究報告、ARC-111-1 1995 ( 29 ) 1 - 8 1995年03月 [査読有り]

　概要を見る

本稿では，複数ジョブの階層並列実行におけるジョブスケジューリング手法について述べる．本稿における複数ジョブの階層並列実行では，各ジョブのコンパイル時の情報をもとにして，OSジョブスケジューラが，各ジョブに複数プロセッサ（すなわちプロセッサグループ）を割り当て，割り当てられたプロセッサグループ上では，単一ジョブ内タスクをスタティックスケジューリングあるいはコンパイラが生成したダイナミックスケジューリングルーチン用いて並列処理する．本稿では，複数ジョブにプロセッサグループを割り当てる場合のスケジューリング手法として，Bin?packingアルゴリズムを用いたFit Processors First Served()を提案する．This paper presents a job scheduling scheme for hierarchical parallel execution of multiple jobs. In the hierarchical parallel execution of multiple jobs, an OS job scheduler allocates processors(or a processor group) to each job referring the information obtained at compile time. On the processor group allocated to a job, tasks in a job are executed by processors using static scheduling or dynamic scheduling with a dynamic scheduling routine generated by the compiler. This paper proposes a job scheduling scheme to allocate processor groups to multiple jobs using Bin-packing algorithm named Fit Processors first Served(FPFS).

CiNii
Scheduling Scheme among Hierarchically Parallel Executed Jobs

K. Aida, M. Okamoto, H. Kasahara, S. Narita

SIG Notes of IPSJ, ARC-111-1 1995 ( 29 ) 1 - 8 1995年03月 [査読有り]

　概要を見る

本稿では，複数ジョブの階層並列実行におけるジョブスケジューリング手法について述べる．本稿における複数ジョブの階層並列実行では，各ジョブのコンパイル時の情報をもとにして，OSジョブスケジューラが，各ジョブに複数プロセッサ（すなわちプロセッサグループ）を割り当て，割り当てられたプロセッサグループ上では，単一ジョブ内タスクをスタティックスケジューリングあるいはコンパイラが生成したダイナミックスケジューリングルーチン用いて並列処理する．本稿では，複数ジョブにプロセッサグループを割り当てる場合のスケジューリング手法として，Bin?packingアルゴリズムを用いたFit Processors First Served()を提案する．This paper presents a job scheduling scheme for hierarchical parallel execution of multiple jobs. In the hierarchical parallel execution of multiple jobs, an OS job scheduler allocates processors(or a processor group) to each job referring the information obtained at compile time. On the processor group allocated to a job, tasks in a job are executed by processors using static scheduling or dynamic scheduling with a dynamic scheduling routine generated by the compiler. This paper proposes a job scheduling scheme to allocate processor groups to multiple jobs using Bin-packing algorithm named Fit Processors first Served(FPFS).

CiNii
Fortran粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

電子情報通信学会論文誌 J78-D-I ( 2 ) 1995年02月 [査読有り]
A Data-Localization Scheme among Doall/Sequential Loops for Fortran Coarse-Grain Parallel Processing

A. Yoshida, S. Maeda, W. Ogata, H. Kasahara

Trans. of IEICE J78-D-I ( 2 ) 162 - 169 1995年02月 [査読有り]

　概要を見る

マルチプロセッサシステム上での粗粒度並列処理手法としてマクロデータフロー処理が提案されている.従来のマクロデータフロー処理では,粗粒度タスクが実行時にプロセッサにスケジューリングされるため,粗粒度タスク間で共有されるデータを集中型共有メモリに配置し,粗粒度タスク間のデータ授受は集中型共有メモリを介して行われていた.本論文では,共有メモリを介したデータ転送オーバヘッドを軽減するため,Doallループとシーケンシャルループの間で,ローカルメモリを介したデータ授受を行うデータローカライゼーション手法を提案する.本手法では,コンパイラが,Doallループとシーケンシャルループを配列データの使用範囲が等しくなるように整合して部分ループに分割し,データ転送量の多い(データの結び付きの強い)部分ループ集合を実行時に同一プロセッサにスケジューリングしてローカルメモリを介したデータ授受を行えるような並列マシンコードを生成する.提案手法を用いたコンパイラは,マルチプロセッサシステムOSCAR上でインプリメントされており,OSCARシミュレータ上での性能評価から処理時間が20%程度短縮されることが確認された.

CiNii J-GLOBAL
電子回路シミュレーションの階層的並列処理手法

前川仁孝, 高井峰生, 伊藤泰樹, 西川健, 笠原博徳

電子情報通信学会技術研究報告,CPSY95-22 95 ( 25(ICD95 11-22) ) 87 - 94 1995年

J-GLOBAL
電子回路シミュレーションの階層的並列処理手法

前川仁孝, 高井峰生, 伊藤泰樹, 西川健, 笠原博徳

電子情報通信学会技術研究報告,CPSY95-22 95 ( 21 ) 87 - 94 1995年 [査読有り]

　概要を見る

本論文では、回路分割と近細粒度並列処理手法を用いる電子回路シミュレーションの階層的並列処理手法について述べる。従来よりマルチプロセッサ上での電子回路シミュレーションでは回路分割手法を用いた並列化がよく行われてきた。しかし、この回路分割法では効率よい並列処理が可能な回路の分割数には限度があり、プロセッサ台数が多い場合にはプロセッサ台数に見合った並列化ができないという問題がある。そこで本論文では、回路分割による粗粒度並列処理と分割回路内を更にステートメントレベルの並列処理を行う近細粒度並列処理を階層的に組み合わせる並列処理手法を提案する。また、本手法の有効性をマルチプロセッサシステムOSCAR上で評価を行った結果について述べる。

CiNii
ACM International Conference on Supercomputing(ICS'95)参加報告

笠原博徳, 吉田明正

電気学会論文誌 115-C ( 10 ) 1221 1995年 [査読有り]
ICS'95参加報告

吉田明正, 笠原博徳

情報処理学会学会誌 36 ( 8 ) 777 - 778 1995年 [査読有り]

CiNii
Participation Report of ICS'95

A. Yoshida, H. Kasahara

Trans. of IPSJ 36 ( 8 ) 777 - 778 1995年 [査読有り]
Participation Report of ACM International Conference on Supercomputing (ICS'95)

H. Kasahara, A. Yoshida

Trans. of IEEE 115-C ( 10 ) 1221 1995年 [査読有り]
A Hierarchical Parallel Processing Scheme of Circuit Simulation

Y. Maekawa, M. Takai, T. Ito, K. Nishikawa, H. Kasahara

SIG Notes of IEE, CPSY95-22 87 - 94 1995年 [査読有り]
Performance evaluation of macrodataflow computation on shared memory multiprocessors

K AIDA, K IWASAKI, H KASAHARA, S NARITA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS, AND SIGNAL PROCESSING - PROCEEDINGS 50 - 54 1995年 [査読有り]
Hierarchical macro-dataflow computation scheme

M OKAMOTO, K YAMASHITA, H KASAHARA, S NARITA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS, AND SIGNAL PROCESSING - PROCEEDINGS 44 - 49 1995年 [査読有り]
Near fine grain parallel processing of circuit simulation using direct method

Y MAEKAWA, K NAKANO, M TAKAI, H KASAHARA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS, AND SIGNAL PROCESSING - PROCEEDINGS 272 - 276 1995年 [査読有り]
Compilation scheme for near fine grain parallel processing on a multiprocessor system without explicit synchronization

W OGATA, K FUJIMOTO, M OOTA, H KASAHARA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS, AND SIGNAL PROCESSING - PROCEEDINGS 327 - 332 1995年 [査読有り]
A data-localization scheme using task-fusion for macro-dataflow computation

A YOSHIDA, S MAEDA, K FUJIMOTO, H KASAHARA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS, AND SIGNAL PROCESSING - PROCEEDINGS 135 - 140 1995年 [査読有り]
回路分割を用いた電子回路シミュレーションの並列化手法

前川仁孝, 高井峰生, 伊藤泰樹, 西川健, 笠原博徳

電気学会情報処理研究会報告 IP-94-44 IP-94 ( 37-47 ) 1994年12月

J-GLOBAL
マルチプロセッサシステムOSCAR上での無同期近細粒度並列処理のためのコンパイル手法

尾形航, 太田昌人, 吉田明正, 岡本雅巳, 笠原博徳

電気学会情報処理研究会報告, IP-94-41 1994年12月
マクロデータフロー処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

電気学会情報処理研究会資料, IP-94-40 1994年12月
回路分割を用いた電子回路シミュレーションの並列化手法

前川仁孝, 高井峰生, 伊藤泰樹, 西川健, 笠原博徳

電気学会情報処理研究会報告、IP-94-44 1994年12月 [査読有り]
マルチプロセッサシステムOSCAR上での無同期近細粒度並列処理のためのコンパイル手法

尾形航, 太田昌人, 吉田明正, 岡本雅巳, 笠原博徳

電気学会情報処理研究会報告、IP-94-41 1994年12月 [査読有り]
マクロデータフロー処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

電気学会情報処理研究会資料、IP-94-40 1994年12月 [査読有り]
A Data-Localization Scheme among Doall/Sequential Loops for Macro-Dataflow Computation

A. Yoshida, S. Maeda, W. Ogata, H. Kasahara

Technical Report of IEE Japan, IP-94-40 1994年12月 [査読有り]
Parallel Processing Scheme of Electronic Circuit Simulation Using Circuit Tearing

Y. Maekawa, M. Takai, T. Itoh, T. Nishikawa, H. Kasahara

SIG Notes of IEE, IP-94-44 1994年12月 [査読有り]
Compilation Scheme for Near Fine Grain Parallel Processing without Synchronization on Multiprocessor System OSCAR

W. Ogata, M. Oota, A. Yoshida, M. Okamoto, H. Kasahara

SIG Notes of IEE, IP-94-41 1994年12月 [査読有り]
ソートされたコードブックを用いた高速ベクトル量子化

中野恵一, 笠原博徳

電子情報通信学会論文誌 J77-D-II ( 10 ) 1984 - 1992 1994年10月 [査読有り]

　概要を見る

ベクトル量子化は能率の良いデータ圧縮法の一つとして音声や画像の量子化に利用されている.このベクトル量子化を,すべてのコードブックベクトルのすべての次元に関するひずみを計算する全探索法で実現すると膨大な計算量が必要になる.そこで量子化ひずみを増大させることなくひずみ計算を削減し,ベクトル量子化の高速化を可能とする,ソートされたコードブックを利用した手法を提案する.この手法は,探索が終了した範囲での最小ひずみである「ひずみの上限値」と,入力ベクトルとそれに対する最適出力ベクトルのひずみがその値よりも小さくならないと保証された「ひずみの下限値」とを比較し,これらが一致した時点で探索を終了することにより探索領域を限定し,ひずみ計算回数を減少させるものである.ここで「ひずみの下限値」はソートされたコードブックを用いて,次元ごとの,入力ベクトル要素とその要素に(探索過程の各時点で)最も近いコードブックベクトル要素とのひずみの線形和として求められる.すなわち一部のコードブックベクトルとのひずみ計算だけで,最適出力ベクトルが求められる.本手法の有効性は,画像のベクトル量子化に要するひずみ計算量の従来手法との比較により確認された.

CiNii
Fast Vector Quantization Using Sorted Codebook

K. Nakano, H. Kasahara

Trans. of IEICE J77-D-II ( 11 ) 1984 - 1992 1994年10月 [査読有り]

　概要を見る

ベクトル量子化は能率の良いデータ圧縮法の一つとして音声や画像の量子化に利用されている.このベクトル量子化を,すべてのコードブックベクトルのすべての次元に関するひずみを計算する全探索法で実現すると膨大な計算量が必要になる.そこで量子化ひずみを増大させることなくひずみ計算を削減し,ベクトル量子化の高速化を可能とする,ソートされたコードブックを利用した手法を提案する.この手法は,探索が終了した範囲での最小ひずみである「ひずみの上限値」と,入力ベクトルとそれに対する最適出力ベクトルのひずみがその値よりも小さくならないと保証された「ひずみの下限値」とを比較し,これらが一致した時点で探索を終了することにより探索領域を限定し,ひずみ計算回数を減少させるものである.ここで「ひずみの下限値」はソートされたコードブックを用いて,次元ごとの,入力ベクトル要素とその要素に(探索過程の各時点で)最も近いコードブックベクトル要素とのひずみの線形和として求められる.すなわち一部のコードブックベクトルとのひずみ計算だけで,最適出力ベクトルが求められる.本手法の有効性は,画像のベクトル量子化に要するひずみ計算量の従来手法との比較により確認された.

CiNii
Fortranマクロデータフロー処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

情報処理学会論文誌 35 ( 9 ) 1848 - 1860 1994年09月 [査読有り]

CiNii
粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 山下浩一郎, 笠原博徳

情報処理学会第49回全国大会 4T-7 1994年09月 [査読有り]
A Data-Localization Scheme for Fortran Macro-Dataflow Computation

A. Yoshida, S. Maeda, W. Ogata, H. Kasahara

Trans. of IPSJ 35 ( 9 ) 1848 - 1860 1994年09月 [査読有り]

　概要を見る

本論文では、ループ、サブルーチン、基本ブロック等の粗粒度タスク間並列処理をダイナミックスケジューリングを用いて行うマクロデータフロー処理における、データローカライゼーション手法を提案する。ここで、データローカライゼーションとは、実行時に同一プロセッサに割り当てられるタスク間では、ローカルメモリを介してデータ授受を行なうことにより、共有メモリアクセスに伴うデータ転送オーバヘッドを軽減する方式である。本手法では、このデータローカライズを複数ループに渡って行なうために新たに提案するループ整合分割手法を用いる。提案するデータローカライゼーションを用いたコンパイラは、マルチプロセッサシステムOSCAR上でインプリメントされており、その性能評価についても述べる。

CiNii J-GLOBAL
ソーテッドコードブックベクトル量子化の並列探索による高速化手法

中野恵一, 笠原博徳

電子情報通信学会技術研究報告 CPSY94-42 1994年07月
マクロデータフロー処理のマルチジョブ実行手法

合田憲人, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究報告 OS-65-4 94 ( 64(OS-65) ) 1994年07月

J-GLOBAL
ソーテッドコードブックベクトル量子化の並列探索による高速化手法

中野恵一, 笠原博徳

電子情報通信学会技術研究報告 CPSY94-42 1994年07月 [査読有り]
マクロデータフロー処理のマルチジョブ実行手法

合田憲人, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究報告、OS-65-4 1994年07月 [査読有り]
Parallel Search Scheme for Fast Vector Quantization with Sorted Codebook

K. Nakano, H. Kasahara

Technical Report of IEICE, CPSY94-42 94 ( 164 ) 9 - 16 1994年07月 [査読有り]

　概要を見る

ベクトル量子化は能率は良いデータ圧縮法の1つといて音声や画像の量子化に利用されている.このベクトル量子化の高速処理のために、筆者らは、量子化歪みを増大させることなく歪み計算を削減する,ソーテッドコードブックベクトル量子化(VQ-SC)を既に提案している.本論文では、より規模が大きいベクトル量子化をさらに高速に処理するために、VQ-SCにおける探索を並列化する手法を提案する。本手法は、コードブックを分割して複数プロセッサに割り当て、VQ-SCに基づいて並列探索するものである。本手法の有効性は,実並列計算機上における画像のベクトル量子化に要する処理時間により評価する.

CiNii
A Multi-job Execution Scheme for Macro-dataflow Computation

K. Aida, M. Okamoto, H. Kasahara, S. Narita

SIG Notes of IPSJ, OS-65-4 1994年07月 [査読有り]
直接法を用いた電子回路シミュレーションの近細粒度並列処理

前川仁孝, 田村光雄, 中山功, 吉成泰彦, 笠原博徳

電気学会論文誌C 114-C ( 5 ) 579 - 587 1994年05月 [査読有り] [国内誌]

DOI CiNii
マルチグレイン並列処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

情報処理学会並列処理シンポジウム, JSPP'94論文集 1994 1994年05月 [査読有り]

J-GLOBAL
Near Fine Grain Parallel Processing of Circuit Simulation Using Direct Method

Y. Maekawa, M. Tamura, I. Nakayama, Y. Yoshinari, H. Kasahara

Trans. IEE of Japan 114-C ( 5 ) 579 - 587 1994年05月 [査読有り]

J-GLOBAL
A Data-Localization Scheme for Multi-Grain Parallel Processing

A. Yoshida, S. Maeda, W. Ogata, H. Kasahara

Joint Symposium on Parallel Processing 1994 1994年05月 [査読有り]
スタティックスケジューリングを用いたマルチプロセッサシステム上の無同期近細粒度並列処理

尾形航, 吉田明正, 合田憲人, 岡本雅巳, 笠原博徳

情報処理学会論文誌 35 ( 4 ) 522 - 531 1994年04月 [査読有り]

　概要を見る

マルチプロセッサシステム上でFortranプログラム中の基本ブロックを並列処理する手法として、従来よりコンパイル時のスタティックスケジューリングを用いた近細粒度並列処理手法が提案されている。しかし、従来の方式ではタスク間のデータ依存に基づく先行制約を保証するため並列プログラム中に同期コードを埋め込まねばならず、実行時の同期オーバヘッドが比較的大きいという問題があった。本論文ではマシンコードスケジューリングの精度を引巻上げ、マシンクロックレベルで命令実行タイミングを最適化し、すべての同期コードを除去することで同期オーバヘッドを低減する手法について提案する。また本手法を、ハードウェアアーキテクチャ面からサポートするよう設計された実マルチプロセッサシステムOSCAR上でインプリメントし、無同期実行の効果を検証した結果についても報告する。

CiNii
OSCARマルチグレインコンパイラにおける階層型マクロデータフロー処理手法

岡本雅巳, 合田憲人, 宮沢稔, 本多弘樹, 笠原博徳

情報処理学会論文誌 35 ( 4 ) 513 - 521 1994年04月 [査読有り]
Near Fine Grain Parallel Processing without Synchronization using Static Scheduling

W. Ogata, A. Yoshida, K. Aida, M. Okamoto, H. Kasahara

Trans. of IPSJ 35 ( 4 ) 522 - 531 1994年04月 [査読有り]

　概要を見る

マルチプロセッサシステム上でFortranプログラム中の基本ブロックを並列処理する手法として、従来よりコンパイル時のスタティックスケジューリングを用いた近細粒度並列処理手法が提案されている。しかし、従来の方式ではタスク間のデータ依存に基づく先行制約を保証するため並列プログラム中に同期コードを埋め込まねばならず、実行時の同期オーバヘッドが比較的大きいという問題があった。本論文ではマシンコードスケジューリングの精度を引巻上げ、マシンクロックレベルで命令実行タイミングを最適化し、すべての同期コードを除去することで同期オーバヘッドを低減する手法について提案する。また本手法を、ハードウェアアーキテクチャ面からサポートするよう設計された実マルチプロセッサシステムOSCAR上でインプリメントし、無同期実行の効果を検証した結果についても報告する。

CiNii
A Hierarchical Macro-dataflow Computation Scheme of OSCAR Multi-grain Compiler

M. Okamoto, K. Aida, M. Miyazawa, H. Honda, H. Kasahara

Trans. of IPSJ 35 ( 4 ) 513 - 521 1994年04月 [査読有り]

　概要を見る

本論文ではFortranプログラムにおける、基本ブロック・ループ・サブルーチン間の粗粒度並列性を階層的に利用する階層型マクロデータフロー処理手法について述べる。筆者らは既に粗粒度タスク間の並列性をマクロタスクの最早実行可能条件解析を用いて自動抽出する単階層のマクロデータフロー処理手法を実現している。階層型マクロデータフロー処理は、従来の単階層マクロデータフロー処理では利用していなかったループやサブルーチン等のマクロタスク内部の粗粒度並列性も抽出することを可能にする。特に、本論文では階層型マクロデータフロー処理手法におけるマクロタスクの階層的定義手法、マクロタスク間の階層的並列性抽出手法、および階層的に定義されたマクロタスクの階層的なプロセッサクラスタヘのスケジューリング方式について述べる。また、本手法のOSCAR上での性能評価の結果についても述べる。

CiNii
主記憶共有マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

合田憲人, 岩崎清, 松本健, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究会報告, ARC-105-9, HPC-50-9 94 ( 22(ARC-105 HPC-50) ) 1994年03月

J-GLOBAL
主記憶共有型マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

松本健, 合田憲人, 岩崎清, 笠原博徳

情報処理学会第48回全国大会 2B-5 ( 22 ) 65 - 72 1994年03月 [査読有り]

　概要を見る

主記憶共有マルチプロセッサシステム上でのFortranプログラムの並列処理では、従来よりマルチタスキング、マイクロタスキングが用いられていた。しかし、マルチタスキングでは、ユーザによる粗粒度タスク間の並列性指定が困難である、スケジューリングオーバーヘッドが大きいという問題がある。また、イタレーション間の複雑なデータ依存や条件分岐によって、マイクロタスキングでは並列化できないループも依然存在する。本稿では、主記憶共有マルチプロセッサシステム上でのマクロデータフロー処理の性能評価について述べる。本手法では、コンパイラがプログラムの粗粒度タスク（マクロタスク）への分割、マクロタスク間の並列性抽出、スケジューリングコード生成を自動的に行なうことにより、効率良い粗粒度並列処理を行なうことが可能である。Parallel processing of Fortran programs on a shared memory multi-processor system has been implemented using multi-tasking and micro-tasking. However, multi-tasking has drawbacks such as difficulty in the extraction of parallelism among coarse grain tasks by users and large scheduling overhead. And, there still exist sequential loop that cannot be concurrentized by micro-tasking because of complicated loop carried dependencies among iterations and conditional branch. This paper discusses performance evaluation of macro-dataflow computation on a shared memory multi-processor system. The macro-dataflow computation allows us to get efficient parallel processing among coarse grain tasks, because the compiler automatically generates coarse grain tasks (macro-tasks), exploits parallelism among macro-tasks and generates a scheduling routine.

CiNii
階層型マクロデータフロー処理におけるサブルーチン並列処理手法

宮沢稔, 岡本雅巳, 笠原博徳

情報処理学会第48回全国大会 2B-4 1994年03月 [査読有り]
マルチグレイン並列処理におけるタスク融合を用いたデータローカライゼション手法

前田誠司, 吉田明正, 笠原博徳

情報処理学会第48回全国大会 2B-3 1994年03月 [査読有り]
マクロデータフロー処理のためのジョブスケジューリング

合田憲人, 笠原博徳, 成田誠之助

情報処理学会第48回全国大会 2H-5 1994年03月 [査読有り]
OSCARアプリケーション専用目的コンパイラにおける超階層マクロデータフロー処理

黒田泰, 田村光雄, 前川仁孝, 笠原博徳

情報処理学会第48回全国大会 5G-7 1994年03月 [査読有り]
主記憶共有マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

合田憲人, 岩崎清, 松本健, 岡本雅巳, 笠原博徳, 成田誠之助

情報処理学会研究会報告, ARC-105-9, HPC-50-9 1994 ( 22 ) 65 - 72 1994年03月 [査読有り]

　概要を見る

主記憶共有マルチプロセッサシステム上でのFortranプログラムの並列処理では、従来よりマルチタスキング、マイクロタスキングが用いられていた。しかし、マルチタスキングでは、ユーザによる粗粒度タスク間の並列性指定が困難である、スケジューリングオーバーヘッドが大きいという問題がある。また、イタレーション間の複雑なデータ依存や条件分岐によって、マイクロタスキングでは並列化できないループも依然存在する。本稿では、主記憶共有マルチプロセッサシステム上でのマクロデータフロー処理の性能評価について述べる。本手法では、コンパイラがプログラムの粗粒度タスク（マクロタスク）への分割、マクロタスク間の並列性抽出、スケジューリングコード生成を自動的に行なうことにより、効率良い粗粒度並列処理を行なうことが可能である。Parallel processing of Fortran programs on a shared memory multi-processor system has been implemented using multi-tasking and micro-tasking. However, multi-tasking has drawbacks such as difficulty in the extraction of parallelism among coarse grain tasks by users and large scheduling overhead. And, there still exist sequential loop that cannot be concurrentized by micro-tasking because of complicated loop carried dependencies among iterations and conditional branch. This paper discusses performance evaluation of macro-dataflow computation on a shared memory multi-processor system. The macro-dataflow computation allows us to get efficient parallel processing among coarse grain tasks, because the compiler automatically generates coarse grain tasks (macro-tasks), exploits parallelism among macro-tasks and generates a scheduling routine.

CiNii
Performance Evaluation of Macro-dataflow Computation on Shared Memory Multi-processor System

K. AIDA, K. IWASAKI, K. MATSUMOTO, M. OKAMOTO, H. KASAHARA, S. NARITA

Technical Report of IPSJ, ARC-105-9, HPC-50-9 1994年03月 [査読有り]
分散共有メモリ型マルチプロセッサシステムにおけるデータ転送と処理のオーバーラップスケジューリング手法

平山直紀, 藤原和典, 笠原博徳

1994年電子情報通信学会春季全国大会 D-134 ( Shunki Pt 6 ) 1994年03月 [査読有り]

J-GLOBAL
プロセッサ間通信を考慮した実行時間最小マルチプロセッサスケジューリングアルゴリズム

野沢幸輝, 笠原博徳

1994年電子情報通信学会春季全国大会 D-133 ( Shunki Pt 6 ) 1994年03月 [査読有り]

J-GLOBAL
自動並列化コンパイラ

笠原博徳

情報処理学会超並列計算機の現状と将来シンポジウム 1994年02月 [査読有り]
Automatic Parallelizing Compilers

H. Kasahara

Symposium on current status and Future of Massively Parallel Machines 1994年02月 [査読有り]
Fortran Macro-Dataflow Compiler

H. Honda, K. Aida, M. Okamoto, A. Yoshida, W. Ogata, H. Kasahara

Proceedings of Fourth Workshop on Compilers for Parallel Computers 1993年12月 [査読有り]

CiNii
マルチプロセッサシステム上における非線形方程式求解の並列処理：電力潮流計算を例として

中野恵一, 笠原博徳

電子情報通信学会技術研究報告 93 ( 302 (CPSY93-36) ) 9 - 15 1993年11月

J-GLOBAL
マルチプロセッサシステム上における非線形方程式求解の並列処理：電力潮流計算を例として

中野恵一, 笠原博徳

電子情報通信学会技術研究報告 93 ( 302(CPSY93-36) ) 9 - 15 1993年11月 [査読有り]

　概要を見る

本稿では,マルチプロセッサシステム上でのNewton-Raphson法を用いた非線型方程式求解の並列処理手法を提案する.ここでは非線形方程式の一例として電力潮流計算を例に取りながら議論を進める.本手法では,Newton-Raphson法を用いた連立非線形方程式求解に必要なスパース線形方程式求解には,収束性に問題のある間接法ではなく直接法を用いる.すなわち本手法では,LU分解を伴う直接法を用いた非線形方程式求解の並列化を目的とする.本手法では,データ転送を考慮したスタティック・スケジューリングを用い,データ転送および同期のオーバーヘッドを最小化し,マルチプロセッサシステム上で,効率良い並列処理を実現する.本手法の有効性は実マルチプロセッサシステムOSCAR上で検証される.

CiNii
連続・離散時間制御システムシミュレーションの並列処理

山本裕治, 鳥居宏行, 前川仁孝, 田村光雄, 笠原博徳, 成田誠之助

電気学会論文誌C 113-C ( 11 ) p939 - 946 1993年11月 [査読有り] [国内誌]

DOI CiNii
並列処理ソフトウェア

笠原博徳

電気学会論文誌C 113-C ( 11 ) p919 - 927 1993年11月 [査読有り] [国内誌]

DOI CiNii
マルチプロセッサシステム上での非線形方程式求解の並列処理

中野恵一, 笠原博徳

電気学会論文誌 113-C ( 11 ) p947 - 954 1993年11月 [査読有り] [国内誌]

DOI CiNii
Software for Parallel Processing

H. Kasahara

Trans.IEE of Japan 113-C ( 11 ) 1993年11月 [査読有り]

J-GLOBAL
Parallel Processing of Non-Linear Equations Solution on Multiprocessor Systems

K. Nakano, H. Kasahara

Trans.IEE of Japan 113-C ( 11 ) 1993年11月 [査読有り]

J-GLOBAL
Parallel Processing of Continuous/Discrete-Time Control Systems Simulation

Y. Yamamoto, H. Torii, Y. Maekawa, M. Tamura, H. Kasahara, S. Narita

Trans.IEE of Japan 113-C ( 11 ) 1993年11月 [査読有り]

J-GLOBAL
Parallel Processing of Non-linear Equations Solution on Multiprocessor Systems -Load Flow Calculation as an Example-

K. Nakano, H. Kasahara

Technical Report of IEICE 93 ( 302 (CPSY93-36) ) 9 - 15 1993年11月 [査読有り]

　概要を見る

本稿では,マルチプロセッサシステム上でのNewton-Raphson法を用いた非線型方程式求解の並列処理手法を提案する.ここでは非線形方程式の一例として電力潮流計算を例に取りながら議論を進める.本手法では,Newton-Raphson法を用いた連立非線形方程式求解に必要なスパース線形方程式求解には,収束性に問題のある間接法ではなく直接法を用いる.すなわち本手法では,LU分解を伴う直接法を用いた非線形方程式求解の並列化を目的とする.本手法では,データ転送を考慮したスタティック・スケジューリングを用い,データ転送および同期のオーバーヘッドを最小化し,マルチプロセッサシステム上で,効率良い並列処理を実現する.本手法の有効性は実マルチプロセッサシステムOSCAR上で検証される.

CiNii
並列処理のためのシステムソフトウェア

笠原博徳

情報処理 34 ( 9 ) p1133 - 1186 1993年09月 [査読有り]

CiNii
System Software for Parallel Processing

H. Kasahara

IPSJ MAGAZINE 34 ( 9 ) 1993年09月 [査読有り]

J-GLOBAL
マクロデータフロー処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 岡本雅巳, 笠原博徳, 本多弘樹

電子情報通信学会技術研究報告 93 ( 180 (CPSY93-23) ) 81 - 88 1993年08月

　概要を見る

本論文では、ループ、サブルーチン、基本ブロック等の粗粒度タスク間並列処理をダイナミックスケジューリングを用いて行うマクロデータフロー処理における、データローカライゼーション手法を提案する。ここで、データローカライゼーションとは、実行時に同一プロセッサに割り当てられるタスク間では、ローカルメモリを介してデータ授受を行なうことにより、共有メモリアクセスに伴うデータ転送オーバヘッドを軽減する方式である。本手法では、このデータローカライズを複数ループに渡って行なうために新たに提案するループ整合分割手法を用いる。提案するデータローカライゼーションを用いたコンパイラは、マルチプロセッサシステムOSCAR上でインプリメントされており、その性能評価についても述べる。

CiNii J-GLOBAL
マクロデータフロー処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 岡本雅巳, 笠原博徳, 本多弘樹

電子情報通信学会技術研究報告 93 ( 180 (CPSY93-23) ) 81 - 88 1993年08月 [査読有り]
A Data-Localization Scheme for Macro-Dataflow Computation

A. Yoshida, S. Maeda, W. Ogata, M. Okamoto, H. Honda, H. Kasahara

Technical Report of IEICE 93 ( 180 (CPSY93-23) ) 81 - 88 1993年08月 [査読有り]

　概要を見る

本論文では、ループ、サブルーチン、基本ブロック等の粗粒度タスク間並列処理をダイナミックスケジューリングを用いて行うマクロデータフロー処理における、データローカライゼーション手法を提案する。ここで、データローカライゼーションとは、実行時に同一プロセッサに割り当てられるタスク間では、ローカルメモリを介してデータ授受を行なうことにより、共有メモリアクセスに伴うデータ転送オーバヘッドを軽減する方式である。本手法では、このデータローカライズを複数ループに渡って行なうために新たに提案するループ整合分割手法を用いる。提案するデータローカライゼーションを用いたコンパイラは、マルチプロセッサシステムOSCAR上でインプリメントされており、その性能評価についても述べる。

CiNii
実行開始条件による並列性検出手法ループへの拡張

本多弘樹, 合田憲人, 岡本雅巳, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'93論文集 1993年05月 [査読有り]
スタティックスケジューリングを用いたマルチプロセッサシステム上の無同期細粒度並列処理

尾形航, 吉田明正, 合田憲人, 岡本雅巳, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'93論文集 111 - 118 1993年05月 [査読有り]

CiNii
OSCARマルチグレインコンパイラにおける階層型マクロデータフロー処理手法

岡本雅巳, 合田憲人, 宮沢稔, 笠原博徳, 本多弘樹

情報処理学会並列処理シンポジウムJSPP'93論文集 1993年05月 [査読有り]
Parallelism Detection Scheme with Execution Conditions for Loops

H. Honda, K. Aida, M. Okamoto, H. Kasahara

Joint Symposium on Parallel Processing 1993 1993年05月 [査読有り]
Near Fine Grain Parallel Processing without Synchronization using Static Scheduling

W. Ogata, A. Yoshida, K. Aida, M. Okamoto, H. Kasahara

Joint Symposium on Parallel Processing 1993 1993 1993年05月 [査読有り]

J-GLOBAL
A Hierarchical Macro-Dataflow Computation Scheme of OSCAR Multi-grain Compiler

M. Okamoto, K. Aida, M. Miyazawa, H. Honda, H. Kasahara

Joint Symposium on Parallel Processing 1993 1993 1993年05月 [査読有り]

J-GLOBAL
並列コンピュータの動向

笠原博徳

日本機械学会第70期総会先端技術フォーラム 1993年04月 [査読有り]
学会誌パネル討論会「並列計算機の実用化・商用化を逡巡させる諸要因とはその徹底分析と克服」

稲上泰弘, 小柳義夫, 笠原博徳, 島崎真昭, 高橋延匡, 瀧和男(ICOT, 山田実(日本T, 吉岡顕(東大, 富田真治

情報処理 34/4, ( 4 ) 1993年04月 [査読有り]

CiNii
What are reasons to prevent parallel computer practical products?

Y. Inagami, H. Shimazaki, M. Yamada, Y. Koyanagi, N. Takahashi, A. Yoshioka, H. Kasahara, K. Taki

IPSJ 34 ( 4 ) 1993年04月 [査読有り]
Perspective on Parallel Computers

H. Kasahara

Advanced Technology Forum of the 70th Congress of The Japan Society of Mechanical Engineers 1993年04月 [査読有り]
無同期細粒度並列処理のためのデータ転送順序最適化

尾形航, 吉田明正, 合田憲人, 岡本雅巳, 笠原博徳

報処理学会第46回全国大会 6L-3 5 - 6 1993年03月 [査読有り]

　概要を見る

マルチプロセッサ用Fortran自動並列化コンパイラでは従来Do-allやDo-acrossなどループ並列化が行なわれていた。しかし、単にループ並列のみでは実効性能の向上が因難であることが認識されており、最近では逐次ループ、あるいはループ外部の基本ブロックの並列化を可能とする近細粒度並列処理、ループ,サブルーチン,基本ブロック間の並列処理を可能にする粗粒度並列処理に関する研究が行なわれている。マルチプロセッサ上の(近)細粒度並列処理では、相対的に大きいプロセッサ間データ転送及び同期オーバーヘッドの最小化が重要となる。これらのオーバーヘッドを最小化するためにデータ転送をなるべく生じさせず全体の処理時間を最小化するスタティックスケジューリングアルゴリズムと、スケジューリング結果を利用して冗長な同期コードを除去する並列マシンコード生成法を用いた並列処理手法が提案されている。また最近ではコード生成時のコードスケジューリング精度を上げ、コンパイラがプロセッサ間データ転送タイミング(パスアクセス、メモリアクセスタイミング)及びタスク実行をクロックレベルで制御し全ての同期コードの除去を可能にする無同期細粒度並列処理手法も提案されている。本稿では、この無同期細粒度並列処理のためのコード生成部をさらに高度化し、プロセッサ間でのデータ転送順序を最適化し実行時間を短縮する手法を提案する。また手法の有効性は実マシンOSCAR上で検証される。

CiNii
通信時間を含む実行時間最小マルチプロセッサスケジューリングアルゴリズム

宮川尚, 野沢幸輝, 笠原博徳

電子情報通信学会春期全国大会 D-150 ( Shunki Pt 6 ) 1993年03月 [査読有り]

J-GLOBAL
直接解法による電子回路シミュレーションの並列処理

吉成泰彦, 中山功, 田村光雄, 前川仁孝, 笠原博徳, 成田誠之助

電子情報通信学会春期全国大会 D-159 ( Shunki Pt 6 ) 1993年03月 [査読有り]

J-GLOBAL
ローカルメモリを有するマルチプロセッサシステムにおけるデータプレロード・ポストストアスケジューリングアルゴリズム

林田宏一, 藤原和典, 笠原博徳

電子情報通信学会春期全国大会 D-152 ( Shunki Pt 6 ) 1993年03月 [査読有り]

J-GLOBAL
マルチプロセッサシステム上の回路シミュレーションのための回路分割手法

中山功, 吉成泰彦, 田村光雄, 前川仁孝, 笠原博徳, 成田誠之助

電子情報通信学会春期全国大会 D-158 ( Shunki Pt 6 ) 1993年03月 [査読有り]

J-GLOBAL
マルチプロセッサシステムのためのタスク融合手法

中谷徳夫, 宮本宏行, 野沢幸輝, 笠原博徳

電子情報通信学会春期全国大会 D-151 ( Shunki Pt 6 ) 1993年03月 [査読有り]

J-GLOBAL
実行開始条件による並列性検出手法ループへの拡張

本田弘樹, 笠原博徳

情報処理学会第46回全国大会 6E-4 69 - 70 1993年03月 [査読有り]

　概要を見る

本稿では、Fortranプログラムのマクロタスク(粗粒度タスク)レベルでの並列処理を自動的に行うシステムで必要となる、プログラム全域にわたるマクロタスク間並列性の自動検出手法について議論する。

CiNii
ソートされたコードブックを用いた高速ベクトル量子化

中野恵一, 笠原博徳

情報処理学会第46回全国大会 5K-1 381 - 382 1993年03月 [査読有り]

　概要を見る

ベクトル量子化は能率の良いデータ圧縮法として、音声や画像の量子化に利用されている。このベクトル量子化は、コードブック{Y1、Y2、…、YN}から入力ベクトルX=(X1、X2、…、XK)との歪みが最も小さい出力ベクトルYi=(Yi,1、Yi,2、…、YiK)を探索し、XをYiに写像することと考えられる。ここでKはベクトルの次元数、Nはコードブックのサイズである。このベクトル量子化を実現する基本的な手法として全探索法が知られている。これは、入力されたベクトルに対する最適な出力ベクトルを発見するために、すべてのコードブックベクトルとの歪みを計算するもので、量子化時間が大きい。そこで、1)木探索ベクトル量子化のように構造的なコードブックを用いる手法や、2)全探索法と同じコードブックを用いながら歪みの計算回数を減らすことで高速化する手法などの、様々な高速化手法が提案されいる。構造的なコードブックを用いれば計算量は大幅に削減されるが、量子化歪みは全探索に比ベて一般に増大する。そこで本稿では、量子化歪みを増大させることなく、高速にベクトル量子化を実現する、ソートされたコードブックを用いた探索手法を提案する。この手法は、探索が終了した範囲での最小歪みである「歪みの上限値」と、最適出力ベクトルとの歪みがその値より小さくなることはないと保証された「歪みの下限値」との比較により、探索領域を限定することで、歪み計算回数を減少させるものである。ここで「歪みの下限値」はソートされたコードブックを用いて求められる。なお以下では、歪みとしては一般に用いられることの多い2乗歪みを対象とする。ただし提案する手法では、入力ベクトルとコードブックベクトルとの歪みを、ベクトルの次元ごとにそれぞれ計算しそれらすべての次元にわたる和を量子化歪みとするものであれば、他の歪み測度を用いることも可能である。

CiNii
Fortran マクロデータフロー処理におけるデータローカライゼーション

吉田明正, 前田誠司, 岡本雅巳, 合田憲人, 本多弘樹, 笠原博徳

情報処理学会第46回全国大会 8L-3 1993年03月 [査読有り]
「並列処理技術」特集の編集によせて

Hironori Kasahara

電気学会論文誌Ｃ（電子・情報・システム部門誌） 1993年 [国内誌]

DOI
OSCAR Fortranマルチグレインコンパイラ

吉田明正, 岡本雅巳, 合田憲人, 尾形航, 本多弘樹, 笠原博徳

情報処理学会研究報告 92 ( 85 (PRG-9) ) 71 - 78 1992年10月
マルチプロセッサシステム上の無同期細粒度並列処理

尾形航, 岡本雅巳, 本多弘樹, 笠原博徳, 成田誠之助

電子情報通信学会技術報告 92 ( 82 ) 59 - 66 1992年10月

　概要を見る

マルチプロセッサシステム上でFortranプログラム中の基本ブロックを並列処理する手法として、従来よりコンパイル時のスタティックスケジューリングを用いた細粒度並列処理手法が提案されている。しかし、従来の方式ではタスク間のデータ依存に基づく先行制約を保証するため並列プログラム中に同期コードを埋めこまねばならず、その実行によるオーバーヘッドが比較的大きいという問題があった。本論文ではスケジューリングの精度を引き上げマシンクロックレベルでの命令実行の最適化を可能とすることにより、すべての同期コードを除去する事でオーバーヘッドを低減する手法について提案する。又、本手法を実マルチプロセッサシステムOSCAR上でインプリメントし、無同期実行の効果を検証した結果についても報告する。The near fine grain parallel processing scheme using static scheduling algorithms has been proposed to process a Fortran basic block in parallel on a multiprocessor system. However, the scheme suffers from relatively large synchronization overhead since synchronization codes must be inserted into a parallel machine code to satisfy precedence constraints caused by data dependences among tasks. To cope with this problem, this paper proposes a parallel code generation scheme which removes all synchronizations by optimizing, or scheduling, execution timing of every instrucrion in a machine clock level, Furthermore, it reports performance of the parallel processing without synchronization evaluated on an actual multiprocessor system OSCAR.

CiNii
マルチプロセッサシステム上の無同期細粒度並列処理

尾形航, 岡本雅巳, 本多弘樹, 笠原博徳, 成田誠之助

電子情報通信学会技術報告 92 59 - 66 1992年10月 [査読有り]
OSCAR Fortranマルチグレインコンパイラ

吉田明正, 岡本雅巳, 合田憲人, 尾形航, 本多弘樹, 笠原博徳

情報処理学会研究報告 92 ( 85 (PRG-9) ) 71 - 78 1992年10月 [査読有り]

CiNii
Near Fine Grain Parallel Processing on a Multiprocessor System Without Synchronization

W. Ogata, M. Okamoto, H. Honda, H. Kasahara, S. Narita

Technical Report of IEICE 92 59 - 66 1992年10月 [査読有り]
OSCAR Fortran Multi Grain Parallelizing Compiler

Yoshida, M. Okamoto, K. Aida, W. Ogata, H. Honda, H. Kasahara

SIG Notes of IPSJ 92 ( 85 (PRG-9) ) 71 - 78 1992年10月 [査読有り]
Fortran マクロデータフロー処理のマルチプロセッサスーパーコンピュータ上での評価

合田憲人, 松本健, 岡本雅巳, 吉田明正, 本田弘樹, 笠原博徳, 成田誠之助

電子情報通信学会技術報告 92 ( 172 (CPSY92-13) ) 33 - 40 1992年08月
Fortranプログラムの階層的マクロデータフロー処理手法

岡本雅巳, 合田憲人, 尾形航, 吉田明正, 本多弘樹, 笠原博徳

情報処理学会研究報告 92 ( 64 (ARC-95) ) 105 - 112 1992年08月

　概要を見る

本論文ではFortranプログラムにおける，ループ間・サブルーチン間の粗粒度並列性を階層的に利用する階層的マクロデータフロー処理手法について述べる．筆者らはすでに粗粒度タスク間の並列性を最早実行可能条件解析を用いて抽出する単階層マクロデータフロー処理手法を実現している．階層的マクロデータフロー処理は，従来の単階層マクロデータフロー処理では利用されていなかったループやサブルーチン等のマクロタスク内部の粗粒度並列性も抽出することを可能にする．特に，本論文ではこの階層的マクロデータプロー処理手法における粗粒度タスク（マクロタスク）の階層的定義手法，マクロタスク間の階層的並列性抽出手法，および階層的に定義されたマクロタスクの階層的なプロセッサクラスクへのスケジューリング方式について述べる．また，本手法のOSCAR上での性能評価についても述べる．This paper proposes a hierarchical macro-dataflow computation scheme which hierarchically exploits the coarse grain parallelism among loops and subroutines in a Fortran program. The authors have already implemented a single layer macro-dataflow processing compiler using the earliest executable condition analysis among the highest level macrotasks. The hierarchical macro-dataflow computation allows us to exploit the coarse grain parallelism inside a macrotask like a subroutine or a loop hierarchically. This paper especially describes a hierarchical definition of macrotasks, a parallelism extaction scheme among macrotasks defined inside an upper layer macrotask and a scheduling scheme which assigns hierarchical macrotasks on hierarchical processor clusters. Also, a performance of the hierarchical macro-dataflow computation is ecaluated on a multiprocessor system OSCAR.

CiNii
密結合型マルチプロセッサシステム上でのProlog OR並列処理の実現

甲斐宗徳, 加茂正充, 佐藤弘幸, 笠原博徳

電子情報通信学会論文誌 J75-D-I ( 8 ) 675 - 684 1992年08月 [査読有り]

CiNii
データプレロードおよびポストストアを考慮したマルチプロセッサスケジューリングアルゴリズム

藤原和典, 白鳥健介, 鈴木真, 笠原博徳

電子情報通信学会論文誌 J75-D-I ( 8 ) 495 - 503 1992年08月 [査読有り]

CiNii
Fortranマクロデータフロー処理のマクロタスク生成手法

笠原博徳, 合田憲人, 吉田明正, 岡本雅巳, 本多弘樹

電子情報通信学会論文誌 J75-D-I ( 8 ) 511 - 525 1992年08月 [査読有り]

CiNii
Fortranプログラム粗粒度タスクのOSCARにおける並列実行方式

本多弘樹, 合田憲人, 岡本雅巳, 笠原博徳

電子情報通信学会論文誌 J75-D-I ( 8 ) 526 - 535 1992年08月 [査読有り]

CiNii
Fortran マクロデータフロー処理のマルチプロセッサスーパーコンピュータ上での評価

合田憲人, 松本健, 岡本雅巳, 吉田明正, 本田弘樹, 笠原博徳, 成田誠之助

電子情報通信学会技術報告 92 ( 172 (CPSY92-13) ) 33 - 40 1992年08月 [査読有り]
Fortranプログラムの階層的マクロデータフロー処理手法

岡本雅巳, 合田憲人, 尾形航, 吉田明正, 本多弘樹, 笠原博徳

情報処理学会研究報告 92 ( 64 (ARC-95) ) 105 - 112 1992年08月 [査読有り]

　概要を見る

本論文ではFortranプログラムにおける，ループ間・サブルーチン間の粗粒度並列性を階層的に利用する階層的マクロデータフロー処理手法について述べる．筆者らはすでに粗粒度タスク間の並列性を最早実行可能条件解析を用いて抽出する単階層マクロデータフロー処理手法を実現している．階層的マクロデータフロー処理は，従来の単階層マクロデータフロー処理では利用されていなかったループやサブルーチン等のマクロタスク内部の粗粒度並列性も抽出することを可能にする．特に，本論文ではこの階層的マクロデータプロー処理手法における粗粒度タスク（マクロタスク）の階層的定義手法，マクロタスク間の階層的並列性抽出手法，および階層的に定義されたマクロタスクの階層的なプロセッサクラスクへのスケジューリング方式について述べる．また，本手法のOSCAR上での性能評価についても述べる．This paper proposes a hierarchical macro-dataflow computation scheme which hierarchically exploits the coarse grain parallelism among loops and subroutines in a Fortran program. The authors have already implemented a single layer macro-dataflow processing compiler using the earliest executable condition analysis among the highest level macrotasks. The hierarchical macro-dataflow computation allows us to exploit the coarse grain parallelism inside a macrotask like a subroutine or a loop hierarchically. This paper especially describes a hierarchical definition of macrotasks, a parallelism extaction scheme among macrotasks defined inside an upper layer macrotask and a scheduling scheme which assigns hierarchical macrotasks on hierarchical processor clusters. Also, a performance of the hierarchical macro-dataflow computation is ecaluated on a multiprocessor system OSCAR.

CiNii
Multiprocessor Scheduling Algorithms Considering Data-Preloading and Poststoring

K. Fujiwara, K. Shiratori, M. Suzuki, H. Kasahara

Trans. of IEICE J75-D-I ( 8 ) 495 - 503 1992年08月 [査読有り]

CiNii
Implementation of an OR-Parallel Processing Scheme of Prolog on Tightly-Coupled Multiprocessor System

M. Kai, M. Kamo, H. Sato, H. Kasahara

Trans. of IEICE J75-D-I ( 8 ) 675 - 684 1992年08月 [査読有り]

CiNii
Coarse Grain Parallel Execution Scheme of a Fortran Program on OSCAR

H. Honda, K. Aida, M. Okamoto, H. Kasahara

Trans. of IEICE J75-D-I ( 8 ) 526 - 535 1992年08月 [査読有り]

CiNii
A Macro-Task Generation Scheme for Fortran Macro-Dataflow Computation

H. Kasahara, K. Aida, A. Yoshida, M. Okamoto, H. Honda

Trans. of IEICE J75-D-I ( 8 ) 511 - 525 1992年08月 [査読有り]

CiNii
Evaluation of Fortran Macro-dataflow Computation on a Multi-processor Supercomputer

K. Aida, K. Matsumoto, M. Okamoto, A. Yoshida, H. Honda, H. Kasahara, S. Narita

Technical Report of IEICE 92 ( 172 (CPSY92-13) ) 33 - 40 1992年08月 [査読有り]
A HIERARCHICAL MACRO-DATAFLOW COMPUTATION SCHEME OF FORTRAN PROGRAMS

M. Okamoto, K. Aida, W. Ogata, A. Yoshida, H. Honda, H. Kasahara

SIG Notes of IPSJ 92 ( 64 (ARC-95) ) 105 - 112 1992年08月 [査読有り]

　概要を見る

本論文ではFortranプログラムにおける，ループ間・サブルーチン間の粗粒度並列性を階層的に利用する階層的マクロデータフロー処理手法について述べる．筆者らはすでに粗粒度タスク間の並列性を最早実行可能条件解析を用いて抽出する単階層マクロデータフロー処理手法を実現している．階層的マクロデータフロー処理は，従来の単階層マクロデータフロー処理では利用されていなかったループやサブルーチン等のマクロタスク内部の粗粒度並列性も抽出することを可能にする．特に，本論文ではこの階層的マクロデータプロー処理手法における粗粒度タスク（マクロタスク）の階層的定義手法，マクロタスク間の階層的並列性抽出手法，および階層的に定義されたマクロタスクの階層的なプロセッサクラスクへのスケジューリング方式について述べる．また，本手法のOSCAR上での性能評価についても述べる．This paper proposes a hierarchical macro-dataflow computation scheme which hierarchically exploits the coarse grain parallelism among loops and subroutines in a Fortran program. The authors have already implemented a single layer macro-dataflow processing compiler using the earliest executable condition analysis among the highest level macrotasks. The hierarchical macro-dataflow computation allows us to exploit the coarse grain parallelism inside a macrotask like a subroutine or a loop hierarchically. This paper especially describes a hierarchical definition of macrotasks, a parallelism extaction scheme among macrotasks defined inside an upper layer macrotask and a scheduling scheme which assigns hierarchical macrotasks on hierarchical processor clusters. Also, a performance of the hierarchical macro-dataflow computation is ecaluated on a multiprocessor system OSCAR.

CiNii
OSCAR Multigrain Parallelizing compiler and Its Performance

H. Kasahara

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor Rudolf Eigenmann 1992年08月 [査読有り]
リアルタイムシステムにおける並列処理

笠原博徳

計測と制御 31 ( 7 ) p768 - 774 1992年07月 [査読有り]

CiNii
Multi-grain Parallelizing Compiler and Its Performance

H. Kasahara

Third Workshop on Compilers for Parallel Computers, Panel: How good are parallelizing compilers in practice? ,Vienna, Austria 1992年07月 [査読有り]
Near Fine Grain Parallelizing Compiler for OSCAR

H. Kasahara, H. Honda, K. Aida, M. Okamoto, A. Yoshida, W. Ogata, S. Narita

Proceedings of Third Workshop on Compilers for Parallel Computers 1992年07月 [査読有り]
Special Issue on Real-Time Distributed Systems. Parallel Processing in Real-Time Systems.

Hironori Kasahara

計測と制御 31 ( 7 ) 768 - 774 1992年07月 [査読有り] [国内誌]

DOI CiNii
A PARALLEL PROCESSING SCHEME OF CIRCUIT SIMULATION ON A MULTIPROCESSOR SYSTEM

W. Premchaiswadi, Y. Maekawa, M. Tamura, H. Kasahara, S. Narita

日本シミュレーション学会論文誌 11 ( 2 ) 1992年06月 [査読有り]
並列計算機の実用化・商用化を逡巡させる諸要因とは？並列化コンパイラの現状と将来 (パネルディスカッション)

笠原博徳

情報処理学会並列処理シンポジウムJSPP'92 1992年06月 [査読有り]
近細粒度タスクを用いた電子回路シミュレーションの並列処理

前川仁孝, 田村光雄, W. Premchaiswadi, 笠原博徳, 成田誠之助

情報処理学会並列処理シンポジウムJSPP'92 1992年06月 [査読有り]
Parallel Processing of Circuit Simulation Using the Near Fine Grain Tasks

Y. Maekawa, M. Tamura, W. Premchaiswadi, H. Kasahara, S. Narita

Joint Symposium on Parallel Processing 1992 1992年06月 [査読有り]
Present and Future of Parallelizing Compilers

H. Kasahara

Joint Symposium on Parallel Processing 1992 1992年06月 [査読有り]
A PARALLEL PROCESSING SCHEME OF CIRCUIT SIMULATION ON A MULTIPROCESSOR SYSTEM

W. Premchaiswadi, Y. Maekawa, M. Tamura, H. Kasahara, S. Narita

Trans. of the Japan Society for Simulation Technology 11 ( 2 ) 129 - 136 1992年06月 [査読有り]

　概要を見る

In circuit simulation, parallel processing is usually performed by dividing a circuit to be simulated into a set of subcircuits, which are solved in parallel, but each subcircuit is solved sequentially. This solution employs only part of parallelism that can be exploited. There is substantial parallelism inside the subcircuit computation which is more difficult to exploit because it is harder to decompose the computation into independent pieces and assign them onto each processor element. To resolve the mentioned problem, an efficient parallel processing is required. This paper proposes a parallel processing scheme for circuit simulation using the direct method on a multiprocessor system. To accomplish the objective, the code generation method which is known as the fastest solution method for the solution of sparse linear equations on a sequential machine is employed to generated loop-free code. Then, a heuristic scheduling algorithm considering data transfer is employed to allocate these generated tasks to processors. Finally, a simulator based on a multiprocessor system OSCAR is used for the performance evaluation of the proposed scheme.

CiNii
「マルチプロセッサスーパコンピュータPHIの研究開発」の編集にあたって

鈴木滋, 笠原博徳

情報処理 33 ( 5 ) p512 - 565 1992年05月

CiNii
OSCAR上でのスパース行列直接解法の並列処理

笠原博徳, ウィチェンプレムチャイサワディ, 田村光雄, 前川仁孝, 成田誠之助

情報処理学会論文誌 33 ( 4 ) 438 - 447 1992年04月 [査読有り]

　概要を見る

本論文では従来並列処理が困難であった構造化されていないスパース線形方程式求解に対する細粒度タスクを用いた並列処理手法を提案すると共にその性能評価をマルチプロセッサシステムOSCAR(Optimally SCheduled Advmced MultiprocessoR)上で行った結果について述べる直接解法を用いたスパース線形方程式求解では電子回路シミュレータで使用されるループフリーコードが最も高速であることが知られている提案する手法では専用目的コンパイラがこのループフリーコードを自動生成した後細粒度タスクへ分割しそれらのタスクをプロセッサ間のデータ転送オーバヘッドを考慮してプロセッサにスケジューリングする次にコンパイラはデータ転送オーバへツドや同期オーバヘッドが最小となるように並列化マシンコードを生成するこの並列化マシンコードは OSCARの各プロセッサ上のローカルメモリにロードされ実行されるこのようなループフリーコードの細粒度レベルでの並列処理が実マルチプロセッサ上で実現されたのは世界初である

CiNii
Parallel Processing of Direct Solution Method for Unstructured Sparse Matrices on OSCAR

H. Kasahara, W. Premchaiswadi, M. Tamura, Y. Maekawa, S. Narita

Trans. of IPSJ 33 ( 4 ) 438 - 447 1992年04月 [査読有り]

　概要を見る

本論文では従来並列処理が困難であった構造化されていないスパース線形方程式求解に対する細粒度タスクを用いた並列処理手法を提案すると共にその性能評価をマルチプロセッサシステムOSCAR(Optimally SCheduled Advmced MultiprocessoR)上で行った結果について述べる直接解法を用いたスパース線形方程式求解では電子回路シミュレータで使用されるループフリーコードが最も高速であることが知られている提案する手法では専用目的コンパイラがこのループフリーコードを自動生成した後細粒度タスクへ分割しそれらのタスクをプロセッサ間のデータ転送オーバヘッドを考慮してプロセッサにスケジューリングする次にコンパイラはデータ転送オーバへツドや同期オーバヘッドが最小となるように並列化マシンコードを生成するこの並列化マシンコードは OSCARの各プロセッサ上のローカルメモリにロードされ実行されるこのようなループフリーコードの細粒度レベルでの並列処理が実マルチプロセッサ上で実現されたのは世界初である

CiNii
連続・離散時間制御システム・リアルタイムシミュレーションの並列処理手法

鳥居宏行, 田村光雄, 前川仁孝, 山本裕治, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 92 ( 28 (CPSY91-80) ) 67 - 74 1992年03月

CiNii
連続・離散時間制御システム・リアルタイムシミュレーションの並列処理手法

鳥居宏行, 田村光雄, 前川仁孝, 山本裕治, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 92 ( 28 (CPSY91-80) ) 67 - 74 1992年03月 [査読有り]

CiNii
専用目的コンパイラ開発用並列化中間言語とその処理系

田村光雄, 前川仁孝, 笠原博徳, 成田誠之助

情報処理学会第44回全国大会 3D-1 1992年03月 [査読有り]
階層的マクロデータフロー処理のインプリメント手法

岡本雅巳, 合田憲人, 尾形航, 吉田明正, 本多弘樹, 笠原博徳

情報処理学会第44回全国大会 2D-9 1992年03月 [査読有り]
階層メモリマルチプロセッサシステム上でのデータ分割・配置及びデータ転送と処理のオーバーラッピング手法

藤原和典, 林田宏一, 笠原博徳

情報処理学会第44回全国大会 2D-10 1992年03月 [査読有り]
マルチプロセッサスーパーコンピュータ上でのFORTRANマクロデータフロー処理

合田憲人, 岡本雅巳, 尾形航, 本多弘樹, 笠原博徳, 成田誠之助

情報処理学会第44回全国大会 2D-6 1992年03月 [査読有り]
OSCAR上での直接法を用いた回路シミュレーションの並列処理

前川仁孝, 田村光雄, Wichian Premchaiswadi, 笠原博徳, 成田誠之助

情報処理学会第44回全国大会 3D-2 1992年03月 [査読有り]
A PARALLEL PROCESSING SCHEME FOR REAL TIME SIMULATION OF CONTINUOUS-AND DISCRETE-TIME CONTROL SYSTEM

H. Torii, M. Tamura, Y. Maekawa, Y. Yamamoto, H. Kasahara, S. Narita

Technical Report of IEICE 92 ( 28 (CPSY91-80) ) 67 - 74 1992年03月 [査読有り]

CiNii
Prolog OR並列処理における副作用対処法

佐藤弘幸, 加茂正充, 甲斐宗徳, 笠原博徳

1992年電子情報通信学会全国大会 D-127 1992年03月 [査読有り]
OSCAR 上での連続・離散時間制御システムシミュレーションの並列処理

鳥居弘行, 山本裕治, 川田雄司, 笠原博徳, 成田誠之助

1992年電子情報通信学会全国大会 D-128 1992年03月 [査読有り]
A multi-grain parallelizing compilation scheme for OSCAR (Optimally scheduled advanced multiprocessor)

Kasahara, H., Honda, H., Mogi, A., Ogura, A., Fujiwara, K., Narita, S.

Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics) 589 LNCS 283 - 297 1992年 [査読有り]

DOI

Scopus

9

被引用数

(Scopus)
Parallel Processing of robot control and simulation.

Hironori Kasahara

Parallel Computation Systems for Robotics 77 - 93 1992年 [査読有り]

DOI
A MULTI-GRAIN PARALLELIZING COMPILATION SCHEME FOR OSCAR (OPTIMALLY SCHEDULED ADVANCED MULTIPROCESSOR)

H KASAHARA, H HONDA, A MOGI, A OGURA, K FUJIWARA, S NARITA

LANGUAGES AND COMPILERS FOR PARALLEL COMPUTING 589 281 - 297 1992年 [査読有り]
A parallel optimization algorithm for minimum execution‐time multiprocessor scheduling problem

Kasahara, H., Itoh, A., Tanaka, H., Itoh, K.

Systems and Computers in Japan 23 ( 13 ) 54 - 65 1992年 [査読有り]

DOI

Scopus

5

被引用数

(Scopus)
OSCAR 上での Fortran マクロデータフロー処理

吉田明正, 合田憲人, 岡本雅巳, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 463 (CPSY91-69) ) 55 - 62 1992年01月
OSCAR 上での Fortran マクロデータフロー処理

吉田明正, 合田憲人, 岡本雅巳, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 463 (CPSY91-69) ) 55 - 62 1992年01月 [査読有り]
Fortran Macro-dataflow Computation on OSCAR

A. Yoshida, K. Aida, M. Okamoto, H. Honda, H. Kasahara

Technical Report of IEICE 91 ( 463 (CPSY91-69) ) 55 - 62 1992年01月 [査読有り]
Fortran マルチグレイン並列処理

岡本雅巳, 合田憲人, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 365 (CPSY91-55) ) 23 - 30 1991年12月
Fortran マルチグレイン並列処理

岡本雅巳, 合田憲人, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 365 (CPSY91-55) ) 23 - 30 1991年12月 [査読有り]
海外の並列処理研究動向イリノイ大学CSRDにおける並列処理研究

笠原博徳

情報処理 32 ( 12 ) 1991年12月 [査読有り]
Parallel Processing Researches in CSRD of University of Illinois at Urbana-Champaign

H. Kasahara

Trans. of IPSJ 32 ( 12 ) 1991年12月 [査読有り]
A multi-grain parallel processing of Fortran programs

M. Okamoto, K. Aida, H. Honda, H. Kasahara

Technical Report of IEICE 91 ( 365 (CPSY91-55) ) 23 - 30 1991年12月 [査読有り]
OSCAR/Fortran コンパイラのインプリメンテーション

本多弘樹, 岡本雅巳, 合田憲人, 笠原博徳

情報処理学会研究報告 91 ( 100 (ARC-91) ) 13 - 20 1991年11月
実行時間最小マルチプロセッサスケジューリング問題に対する並列最適化アルゴリズム

笠原博徳, 伊藤敦, 田中久充, 伊藤敬介

電子情報通信学会論文誌 D-I J74-D-I ( 11 ) 755 - 764 1991年11月 [査読有り]

　概要を見る

記事分類: データ処理・計算機器

CiNii
OSCAR/Fortran コンパイラのインプリメンテーション

本多弘樹, 岡本雅巳, 合田憲人, 笠原博徳

情報処理学会研究報告 91 ( 100 (ARC-91) ) 13 - 20 1991年11月 [査読有り]
A Parallel Optimization Algorithm for Minimum Execution-Time Multiprocessor Scheduling Problem

H. Kasahara, A. Itoh, H. Tanaka, K. Itoh

Trans. of IEICE D-I J74-D-I ( 11 ) 755 - 764 1991年11月 [査読有り]
Implementation of OSCAR/Fortran Compiler

H. Honda, M. Okamoto, K. Aida, H. Kasahara

SIG Notes of IPSJ 91 ( 100 (ARC-91) ) 13 - 20 1991年11月 [査読有り]
Fortran Multigrain Compiler for a Multiprocessor OSCAR

H. Kasahara

Rice University, Hosted by Professor Ken Kennedy 1991年11月 [査読有り]
OSCAR FORTRAN Compiler

H. Kasahara, H. Honda, K. Aida, M. Okamoto, S. Narita

International Logic Programming Symposium, Workshop on Compilation of (Symbolic) Languages for Parallel Computers 30 - 37 1991年11月 [査読有り]

CiNii
Perspective on Simulation

H. Ishitani, H. Tsukui, Y. Ono, Y. Iida, S. Umeda, H. Ezure, H. Kasahara, M. Tago, K. Miki

Technical Report of IEE(Part II) 374 1991年10月 [査読有り]
分担解説シミュレーション最近の動向

石谷久, 都井裕, 小野祐一, 飯田善久, 梅田茂樹, エム, 江連久, 笠原博徳, 田子精男, 三木一克

電気学会技術報告2部 374 8 - 10 1991年10月 [査読有り]

CiNii
A FORTRAN PARALLELIZING COMPILATION SCHEME FOR OSCAR USING DEPENDENCE GRAPH ANALYSIS

H KASAHARA, H HONDA, S NARITA

IEICE TRANSACTIONS ON COMMUNICATIONS ELECTRONICS INFORMATION AND SYSTEMS 74 ( 10 ) 3105 - 3114 1991年10月 [査読有り]

　概要を見る

This paper proposes a Fortran parallelizing compilation scheme for a multiprocessor system named OSCAR. The scheme hierarchically exploits parallelism among coarse grain tasks, such as, loops, subroutines or basic blocks. among medium grain tasks like loop iterations and among near fine grain tasks like statements. Parallelism among the coarse grain tasks called the macrotasks is detected by analyzing a macro-flow graph which explicitly represents control flow and data dependences. The detected parallelism among the macrotasks is represented by a directed acyclic graph called a macrotask graph. Macrotasks in a macrotask graph are dynamically assigned to processor clusters to cope with run-time uncertainties. A macrotask composed of a Do-all loop or a Do-across loop, which is assigned onto a processor cluster, is processed in the medium grain in parallel by processors inside the processor cluster. A macrotask composed of a basic block is processed on a processor cluster in the near fine grain by using static scheduling. A macrotask composed of subroutine or a large sequential loop is processed by hierarchically applying macro-dataflow computation inside a processor cluster. Performance of the proposed scheme is evaluated on OSCAR. The evaluation shows that the hierarchical parallel processing scheme using dynamic and static scheduling effectively exploits parallelism from Fortran programs.
マクロデータフロー処理におけるマクロタスク分割・融合手法

合田憲人, 岡本雅巳, 吉田明正, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-30) ) 205 - 212 1991年07月
ランダムスパースマトリクス直接解法の並列処理

前川仁孝, 田村光雄, W.Premchaiswadi, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-17) ) 107 - 114 1991年07月
階層記憶マルチプロセッサシステムにおけるプレロード, ポストストアを考慮したスケジューリングアルゴリズム

藤原和典, 白鳥健介, 鈴木真, 笠原博徳

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-14) ) 83 - 90 1991年07月
階層記憶マルチプロセッサシステムにおけるプレロード, ポストストアを考慮したスケジューリングアルゴリズム

藤原和典, 白鳥健介, 鈴木真, 笠原博徳

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-14) ) 83 - 90 1991年07月 [査読有り]
ランダムスパースマトリクス直接解法の並列処理

前川仁孝, 田村光雄, W.Premchaiswadi, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-17) ) 107 - 114 1991年07月 [査読有り]
マクロデータフロー処理におけるマクロタスク分割・融合手法

合田憲人, 岡本雅巳, 吉田明正, 本多弘樹, 笠原博徳

電子情報通信学会技術研究報告 91 ( 130 (CPSY91-30) ) 205 - 212 1991年07月 [査読有り]

CiNii
Schemes for decomposition and fusion of macrotasks in the macro-dataflow computation

K. Aida, M. Okamoto, A. Yoshida, H. Honda, H. Kasahara

Technical Report of IEICE 91 ( 130 (CPSY91-30) ) 205 - 212 1991年07月 [査読有り]
Scheduling Algorithms Considering Data-preloading and Data-poststoring for Hierarchical Memory Multiprocessor Systems

K. Fujiwara, K. Shiratori, M. Suzuki, H. Kasahara

Technical Report of IEICE 91 ( 130 (CPSY91-14) ) 83 - 90 1991年07月 [査読有り]
Parallel Processing of Direct Solution Method for Random Sparse Matrix

Y. Maekawa, M. Tamura, W. Premchaiswadi, H. Kasahara, S. Narita

Technical Report of IEICE 91 ( 130 (CPSY91-17) ) 107 - 114 1991年07月 [査読有り]
マルチプロセッサシステム上での非線形微分方程式の並列処理

W.Pemchaiswadi, H. Kasahara, S. Narita

シミュレーション 10 ( 2 ) 140 - 150 1991年06月 [査読有り]
Parallel processing of nonlinear differential algebraic equations on a multiprocessor system

W. Premchaiswadi, H. Kasahara, S. Narita

Simulation 10 ( 2 ) 140 - 150 1991年06月 [査読有り]
将来の並列処理のあるべき姿いま何をすべきか(パネルディスカッション)

笠原博徳

情報処理学会並列処理シンポジウムJSPP'91 1991年05月 [査読有り]
Future Parallel Processing Systems

H. Kasahara

Symposium of IPSJ JSPP'91 1991年05月 [査読有り]
並列コンパイラの諸技術

笠原博徳

電子情報通信学会第4回回路とシステム軽井沢ワークショップ論文集 227 - 232 1991年04月 [査読有り]
マルチプロセッサシステムの動向

笠原博徳

電子情報通信学会第4回回路とシステム軽井沢ワークショップ論文集 127 - 132 1991年04月 [査読有り]
並列処理技術マルチプロセッサシステムのハードウェア

笠原博徳

コンピュータ・シミュレーション 2 ( 2 ) 32 - 41 1991年04月 [査読有り]
Parallel Processor Technology: Hardware of Multiprocessor Systems

H. Kasahara

COMPUTER SIMULATION 2 ( 2 ) 32 - 41 1991年04月 [査読有り]
Perspective on Multiprocessor Systems

H. Kasahara

Proc. of The Fourth KARUIZAWA Workshop on Circuits and Systems 1991年04月 [査読有り]
Parallelizing Compilation Techniques

H. Kasahara

Proc. of The Fourth KARUIZAWA Workshop on Circuits and Systems 1991年04月 [査読有り]
階層メモリマルチプロセッサシステムのためのデータプレローディング及びポストストアアルゴリズム

藤原和典, 白鳥健介, 鈴木真, 笠原博徳

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.66 - 6.67 1991年03月 [査読有り]
データ転送を考慮した最適化マルチプロセッサスケジューリング・アルゴリズム

伊藤敬介, 宮川尚, 笠原博徳

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.64 - 6.65 1991年03月 [査読有り]
OSCAR用デバッグシステム

滝沢和史, 笠原博徳, 成田誠之助

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.82 - 6.83 1991年03月 [査読有り]
OSCAR上での階層型ニューラル・ネットワークの学習計算の並列処理

飯田晴彦, 若田秀夫, 中野恵一, 笠原博徳

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.80 - 6.81 1991年03月 [査読有り]
OSCAR上でのセルラ・ニューラル・ネットワーク・シミュレーションの並列処理手法

吉岡明広, 林俊成, 笠原博徳, 成田誠之助, L. Chua

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.78 - 6.79 1991年03月 [査読有り]
OSCAR上でのFortranサブルーチンの並列処理

茂木章善, 本多弘樹, 笠原博徳

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.74 - 6.75 1991年03月 [査読有り]
OSCAR上でのFORTRANプログラムの階層的マクロデータフロー処理手法

小椋章央, 合田憲人, 本多弘樹, 笠原博徳, 成田誠之助

情報処理学会第42回全国大会講演論文集 ( 6 ) 6.76 - 6.77 1991年03月 [査読有り]
Parallel processing scheme of a basic block in a fortran program on oscar

Honda, H., Kasahara, H., Kasahara, H., Narita, S.

Systems and Computers in Japan 22 ( 11 ) 1 - 13 1991年 [査読有り]

DOI

Scopus
Coarse grain parallelism detection scheme of a fortran program

Honda, H., Kasahara, H.

Systems and Computers in Japan 22 ( 12 ) 24 - 36 1991年 [査読有り]

DOI

Scopus

4

被引用数

(Scopus)
報告並列コンピュータの動向

笠原博徳

電波新聞社 1991年01月 [査読有り]
Perspective on Parallel Computers

H. Kasahara

Denpa-Shinbun 1991年01月 [査読有り]
PARALLEL PROCESSING SCHEME FOR A FORTRAN PROGRAM ON A MULTIPROCESSOR SYSTEM OSCAR

H HONDA, A MOGI, A OGURA, H KASAHARA, S NARITA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS AND SIGNAL PROCESSING : CONFERENCE PROCEEDINGS, VOLS 1 AND 2 1 9 - 12 1991年 [査読有り]
AN EFFICIENT OR PARALLEL PROCESSING SCHEME OF PROLOG - HIERARCHICAL PINCERS ATTACK SEARCH

M KAI, H KASAHARA

IEEE PACIFIC RIM CONFERENCE ON COMMUNICATIONS, COMPUTERS AND SIGNAL PROCESSING : CONFERENCE PROCEEDINGS, VOLS 1 AND 2 2 677 - 680 1991年 [査読有り]
Parallel Processing of Sparse Matrix Solution Using Fine Grain Tasks on OSCAR.

Hironori Kasahara, Wichian Premchaiswadi, Mikio Tamura, Yoshinori Maekawa, Seinosuke Narita

Proceedings of the International Conference on Parallel Processing, ICPP '91, Austin, Texas, USA, August 1991. Volume III: Algorithms and Applications. 322 - 323 1991年 [査読有り]
Fortranプログラム粗粒度タスク間の並列性検出手法

本多弘樹, 岩田雅彦, 笠原博徳

電子情報通信学会論文誌 J73-D-I ( 12 ) 951 - 960 1990年12月 [査読有り]

CiNii
原子プラント状態予測シミュレータへの並列処理の適用

佐々木和則, 神余浩夫, 笠原博徳, 成田誠之助

日本原子力学会誌 32 ( 10 ) 1099 - 1022 1990年10月 [査読有り]
OSCAR上でのFortranプログラム基本ブロックの並列処理手法

本多弘樹, 水野聡, 笠原博徳, 成田誠之助

電子情報通信学会論文誌 J73-D-I ( 9 ) 756 - 766 1990年09月 [査読有り]

CiNii
米国イリノイ大学滞在記

笠原博徳

電気学会論文誌B 1990年09月 [査読有り]
Researching in University of Illinois at Urbana-Champaign

H. Kasahara

Trans. of IEE Japan B 1990年09月 [査読有り]
並列コンピュータの最新動向

笠原博徳

ソニーコンピューターフェア'90 1990年06月 [査読有り]
Perspective on Parallel Computers

H. Kasahara

Sony Computer Fair '90 1990年06月 [査読有り]
最適化並列コンパイラ技術の現状

笠原博徳

電子情報通信学会学会誌 73 ( 3 ) 258 - 266 1990年03月 [査読有り]

　概要を見る

資料形態 : テキストデータプレーンテキスト
コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌
記事分類: データ処理・計算機器--ソフトウェア

CiNii
OSCAR上での音声認識の並列処理手法

飯田晴彦, 笠原博徳, 成田誠之助

情報処理学会第41回全国大会講演論文集 ( 6 ) 1990年03月 [査読有り]
Current State of Optimal Parallelizing Compilers

H. Kasahara

Journal of ICICE 73 ( 3 ) 1990年03月 [査読有り]
並列化マルチプロセッサ・スケジューリングアルゴリズムの性能評価

守友祥史, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
汎用目的マルチプロセッサシステムOSCARの実行環境

入江豊, 本多弘樹, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
階層型メモリマルチプロセッサシステムにおけるデータ転送とタスク分割の最適化

白鳥健介, 鈴木真, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
ロールバックモデルに基づくOSCAR上での離散系シミュレーションの並列処理手法

橋本高男, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
データ転送を考慮した最適化マルチプロセッサスケジューリング・アルゴリズム

RATNA A. A. P, 伊藤敬介, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
データプレローディングを考慮したマルチプロセッサスタティックスケジューリングアルゴリズム

鈴木真, 藤原和典, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
Prolog OR並列処理「階層型挟み打ち探索法」の拡張

新名孝至, 甲斐宗徳, 湯浅理之, 笠原博徳

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
OSCAR上での常微分方程式求解並列処理の性能評価

久永裕嗣, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
OSCAR上でのスパース線形方程式求解並列処理の性能評価

佐藤東哉, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
OSCARコンパイラにおけるループ並列化手法

市川伸治, 本多弘樹, 笠原博徳, 成田誠之助

1990年電子情報通信学会全国大会講演論文集 Pt.6 1990年03月 [査読有り]
OSCAR上での細粒度タスクの並列処理

笠原博徳, 本多弘樹, W. Premchaiswadi, 小椋章央, 茂木章善, 成田誠之助

情報処理学会研究報告 90 ( 60(ARC-83) ) 97 - 102 1990年

　概要を見る

本論文ではマルチプロセッサシステムOSCAR （__?ptimally <Sc>___?heduled A__?dvanced Multiprocessor__?．）上での、細粒度タスクの並列処理手法について述べる。ここでOSCAR上での細粒度タスクとは各々が単一あるいは複数浮動小数点命令命令からなるタスクを意味する。本手法ではデータ転送を考慮したスタティックスケジューリングを用いることにより、同期及びデータ転送の最小化及び、各プロセッサのレジスタの最適使用が可能となる。本手法を用いたコンパイラはすでにOSCAR上にインプリメントされており、本論文では、OSCAR上での性能評価についても述べる。This paper proposes a compilation scheme for parallel processing of near fine grain tasks, each of which consists of several operations or a statment. on a multiprocessor system called OSCAR(O__-ptimally <Sc>___-heduled A__-dvanced Multiprocessor__-). The scheme generates optimized parallel machine codes which minimize synchronization overhead and data transfer overhead and optimally use registers of each processor by using static multiprocessor scheduling algorithms considering data transfer among processors. This scheme can effectively be combined with compilation scheme for macro-dataflow computation which uses parallelism among coarse grain tasks like loops, basic blocks and subroutines and for the traditional loop concurrentization which use palallelism among medium grain tasks like iterations. A compiler using the proposed scheme has been implemented on OSCAR which has been designed to take full advantage of the static scheduling. In this paper the performance evaluation of the scheme on OSCAR is also described.

CiNii
並列化マルチプロセッサ・スケジューリング・アルゴリズム

笠原博徳, 田中久充, 伊藤敬介

情報処理学会研究報告 90 ( 60 (ARC-83) ) 91 - 96 1990年
OSCAR上でのスティッフ微分方程式求解の並列処理

W. Premchaiswadi, H. Honda, H. Kasahara, S. Narita

情報処理学会研究報告 90 ( 60(ARC-83) ) 85 - 90 1990年
並列化マルチプロセッサ・スケジューリング・アルゴリズム

笠原博徳, 田中久充, 伊藤敬介

情報処理学会研究報告 90 ( 60 (ARC-83) ) 91 - 96 1990年 [査読有り]
OSCAR上での細粒度タスクの並列処理

笠原博徳, 本多弘樹, W. Premchaiswadi, 小椋章央, 茂木章善, 成田誠之助

情報処理学会研究報告 90 ( 60(ARC-83) ) 97 - 102 1990年 [査読有り]

　概要を見る

本論文ではマルチプロセッサシステムOSCAR （__?ptimally <Sc>___?heduled A__?dvanced Multiprocessor__?．）上での、細粒度タスクの並列処理手法について述べる。ここでOSCAR上での細粒度タスクとは各々が単一あるいは複数浮動小数点命令命令からなるタスクを意味する。本手法ではデータ転送を考慮したスタティックスケジューリングを用いることにより、同期及びデータ転送の最小化及び、各プロセッサのレジスタの最適使用が可能となる。本手法を用いたコンパイラはすでにOSCAR上にインプリメントされており、本論文では、OSCAR上での性能評価についても述べる。This paper proposes a compilation scheme for parallel processing of near fine grain tasks, each of which consists of several operations or a statment. on a multiprocessor system called OSCAR(O__-ptimally <Sc>___-heduled A__-dvanced Multiprocessor__-). The scheme generates optimized parallel machine codes which minimize synchronization overhead and data transfer overhead and optimally use registers of each processor by using static multiprocessor scheduling algorithms considering data transfer among processors. This scheme can effectively be combined with compilation scheme for macro-dataflow computation which uses parallelism among coarse grain tasks like loops, basic blocks and subroutines and for the traditional loop concurrentization which use palallelism among medium grain tasks like iterations. A compiler using the proposed scheme has been implemented on OSCAR which has been designed to take full advantage of the static scheduling. In this paper the performance evaluation of the scheme on OSCAR is also described.

CiNii
OSCAR上でのスティッフ微分方程式求解の並列処理

W. Premchaiswadi, H. Honda, H. Kasahara, S. Narita

情報処理学会研究報告 90 ( 60(ARC-83) ) 85 - 90 1990年 [査読有り]

　概要を見る

この論文では可変ステップ・可変オーダのインプリシットな積分法であるBDF法を用いた、スティッフな非線形常微分方程式求解の並列処理手法を提案する。このBDF法は非線形微分方程式から非線形方程式への変換、Newton?Raphson法を用いた非線形方程式の求解、次積分ステップオーダの決定、という部分からなる。本手法の有効性と実用性はマルチプロセッサシステムOSCAR上で検証される。this paper proposes a parallel processing scheme of variable-step and variable-order implicit integration algorithm. Backward differentiation formula (BDF), for solving systems of stiff nonlinear differential-algebraic equations. the BDF method composes of processes, namely, transformation of nonlinear ODE to nonlinear algebraic equations, solution of nonlinear algebraic equations by Newton-Raphson method and computation of the next step size and order. The effectiveness and practicality of the proposed scheme were successfully tested on an actual multiprocessor system OSCAR.

CiNii
Improvement in Hierarchical Pincers Attack Search for Or Parallel Processing of Prolog

M. Kai, T. Shimmei, K. Kobayashi, H. Kasahara, H. Iizuka

Technical Report of IEICE 89 ( 168 (CPSY89 45-58) ) 1990年 [査読有り]
Implementation and Performance Evaluation of Fortran Parallel Processing System on Oscar

H. Honda, M. Hirota, Y. Irie, M. Suzuki, H. Kasahara, S. Narita

Technical Report of IEICE 89 ( 168 (CPSY89 89-57) ) 1990年 [査読有り]
Parallelized Optimizing Multiprocessor Scheduling Algorithm

H. Kasahara, H. Tanaka, K. Itoh

SIG Notes of IPSJ 90 ( 60 (ARC-83) ) 91 - 96 1990年 [査読有り]
PARALLEL PROCESSING SCHEME OF THE SOLUTION OF STIFF NONLINEAR ORDINARY DIFFERENTIAL ALGEBRAIC EQUATIONS ON OSCAR

W. Premchaiswadi, H. Honda, H. Kasahara, S. Narita

SIG Notes of IPSJ 90 ( 60(ARC-83) ) 85 - 90 1990年 [査読有り]

　概要を見る

この論文では可変ステップ・可変オーダのインプリシットな積分法であるBDF法を用いた、スティッフな非線形常微分方程式求解の並列処理手法を提案する。このBDF法は非線形微分方程式から非線形方程式への変換、Newton?Raphson法を用いた非線形方程式の求解、次積分ステップオーダの決定、という部分からなる。本手法の有効性と実用性はマルチプロセッサシステムOSCAR上で検証される。this paper proposes a parallel processing scheme of variable-step and variable-order implicit integration algorithm. Backward differentiation formula (BDF), for solving systems of stiff nonlinear differential-algebraic equations. the BDF method composes of processes, namely, transformation of nonlinear ODE to nonlinear algebraic equations, solution of nonlinear algebraic equations by Newton-Raphson method and computation of the next step size and order. The effectiveness and practicality of the proposed scheme were successfully tested on an actual multiprocessor system OSCAR.

CiNii
PARALLEL PROCESSING OF NEAR FINE GRAIN TASKS ON OSCAR (Optimally Scheduled Advanced Multiprocessor)

H. Kasahara, H. Honda, W. PREMCHAISWADI, A. Ogura, A. Mogi, S. Narita

SIG Notes of IPSJ 90 ( 60(ARC-83) ) 97 - 102 1990年 [査読有り]

　概要を見る

本論文ではマルチプロセッサシステムOSCAR （__?ptimally <Sc>___?heduled A__?dvanced Multiprocessor__?．）上での、細粒度タスクの並列処理手法について述べる。ここでOSCAR上での細粒度タスクとは各々が単一あるいは複数浮動小数点命令命令からなるタスクを意味する。本手法ではデータ転送を考慮したスタティックスケジューリングを用いることにより、同期及びデータ転送の最小化及び、各プロセッサのレジスタの最適使用が可能となる。本手法を用いたコンパイラはすでにOSCAR上にインプリメントされており、本論文では、OSCAR上での性能評価についても述べる。This paper proposes a compilation scheme for parallel processing of near fine grain tasks, each of which consists of several operations or a statment. on a multiprocessor system called OSCAR(O__-ptimally <Sc>___-heduled A__-dvanced Multiprocessor__-). The scheme generates optimized parallel machine codes which minimize synchronization overhead and data transfer overhead and optimally use registers of each processor by using static multiprocessor scheduling algorithms considering data transfer among processors. This scheme can effectively be combined with compilation scheme for macro-dataflow computation which uses parallelism among coarse grain tasks like loops, basic blocks and subroutines and for the traditional loop concurrentization which use palallelism among medium grain tasks like iterations. A compiler using the proposed scheme has been implemented on OSCAR which has been designed to take full advantage of the static scheduling. In this paper the performance evaluation of the scheme on OSCAR is also described.

CiNii
A Compilation Scheme for Macro-Dataflow Computation on Hierarchical Multiprocessor Systems.

Hironori Kasahara, Hiroki Honda, Masahiko Iwata, M. Hirota

Proceedings of the 1990 International Conference on Parallel Processing 294 - 295 1990年 [査読有り]

CiNii
Parallel processing of robot arm dynamic control computation on multimicroprocessors

Kasahara, H.

Microprocessors and Microsystems 14 ( 1 ) 3 - 9 1990年01月 [査読有り]

DOI

Scopus

3

被引用数

(Scopus)
Application of parallel processing to PWR plant predictive simulator.

Hironori Kasahara

日本原子力学会誌 32 ( 10 ) 1009 - 1022 1990年 [査読有り] [国内誌]

DOI

Scopus
Parallel processing of near fine grain tasks using static scheduling OSCAR (optimally scheduled advanced multiprocessor).

Hironori Kasahara, Hiroki Honda, Seinosuke Narita

Proceedings Supercomputing '90(SC) 856 - 864 1990年 [査読有り]

DOI
並列処理技術−マルチプロセッサシステム上での並列シュミレーションの実例

笠原博徳

日本シミュレーション学会誌 8 ( 4 ) 1989年12月 [査読有り]
Parallel Processing Technology-Practical Parallel Simulation on Multiprocessor Systems

H. Kasahara

Research Papers of the JSTT 8 ( 4 ) 1989年12月 [査読有り]
並列処理技術−並列処理におけるソフトウェア

笠原博徳

日本シミュレーション学会誌 8 ( 3 ) 1989年09月 [査読有り]
Parallel Processing Technology-Software for Parallel Processing Systems

H. Kasahara

Research Papers of the JSTT 8 ( 3 ) 1989年09月 [査読有り]
Parallel Processing of Real-time Dynamic Systems Simulation on OSCAR (Optimally SCheduled Advanced multiprocessoR)

H. Kasahara, H. Honda, S. Narita

Proc. 3rd NASA NSF DOD Conf. on Aerospace Computational Control 1989年08月 [査読有り]
ロボット制御・シミュレーションの並列処理

笠原博徳

計測自動制御学会SICE'88 1989年07月 [査読有り]
OSCAR Fortran Compiler

H. Kasahara

IBM T. J. Watson Research Center, Hosted by Dr. Vivek Sarker 1989年07月 [査読有り]
Parallel processing of robot control and simulation

H. Kasahara

The Society of Instrument and Control Engineers(SICE'88) 1989年07月 [査読有り]
並列処理技術−マルチプロセッサシステムのハードウェア

笠原博徳

日本シミュレーション学会誌 8 ( 2 ) 95 - 103 1989年06月 [査読有り]

　概要を見る

Multiprocessor systems has been used in wide range of computers from multiprocessor supercomputers to multimicroprocessor systems. Need for the multiprocessor systems will be increased for developing faster supercomputing systems with throughput of several tens of billion floating point operations per second and also more cost effective computer systems. This paper surveys basic hardware technology of multiprocessor systems such as processors, interconnection networks and synchronization mechanism.

CiNii
Parallel Processing Technology-Hardware of Multiprocessor Systems

H. Kasahara

Research Papers of the JSTT 8 ( 2 ) 1989年06月 [査読有り]
Fortran Macro-dataflow processing

H. Kasahara

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor David Padua 1989年04月 [査読有り]
並列処理技術−並列処理の概要−

笠原博徳

日本シミュレーション学会誌 1989年03月 [査読有り]
並列化マルチプロセッサ・スケジューリング・アルゴリズムの実マルチプロセッサ上でのインプリメント

田中久充, 笠原博徳

情報処理学会第38回全国大会講演論文集 ( 3 ) 1452 - 1453 1989年03月 [査読有り]
階層型挟み打ち法によるPROLOG OR並列処理

小林和男, 甲斐宗徳, 笠原博徳

情報処理学会第38回全国大会講演論文集 ( 3 ) 1454 - 1455 1989年03月 [査読有り]
OSCAR上での並列化FORTRAN コンパイラのインプリメント

広田雅一, 本多弘樹, 笠原博徳

情報処理学会第38回全国大会講演論文集 ( 3 ) 1447 - 1448 1989年03月 [査読有り]
OSCAR上での電力潮流計算の並列処理

中野恵一, 佐藤東哉, 笠原博徳, 成田誠之助

情報処理学会第38回全国大会講演論文集 ( 3 ) 1451 1989年03月 [査読有り]
OSCAR上での階層型ニューラル・ネットワーク・シミュレーションの並列処理手法

中野恵一, 奥田恒久, 笠原博徳

情報処理学会第38回全国大会講演論文集 ( 3 ) 1445 - 1446 1989年03月 [査読有り]
OSCAR上でのインプリシット常微分方程式求解の並列処理手法のインプリメント

PREMCHAISWADI W, 奥田恒久, 佐藤東哉, 笠原博徳, 成田誠之助

情報処理学会全国大会講講演論文集 ( 3 ) 1449 - 1450 1989年03月 [査読有り]
A Parallel Processing Scheme for the Solution of Ordinary Differential Equations Using Static Optimal Multiprocessor Scheduling Algorithms

H. Kasahara, H. Honda, E. Takane, S. Narita

PROCEEDINGS OF THE THIRD ANNUAL PARALLEL PROCESSING SYMPOSIUM 1989年03月 [査読有り]
Parallel Processing Technology -Overview of Parallel Processing-

H. Kasahara

Journal of the Japan Society for Simulation Technology 1989年03月 [査読有り]
階層型挟み打ち探索法を用いたProlog OR並列処理

小林和男, 笠原博徳, 甲斐宗徳

情報処理学会並列処理シンポジウムJSPP'89論文集 1989年02月 [査読有り]
階層型マルチプロセッサシステムOSCAR上でのFortran並列処理手法

本多弘樹, 広田雅一, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'89論文集 2 251 - 258 1989年02月 [査読有り]

CiNii
Architecture of a General Purpose Multiprocessor System OSCAR

H. Kasahara, H. Honda, S. Narita, S. Hashimoto

Trans. of IPSJ 88 ( 3 ) 1989年02月 [査読有り]
Prolog OR Parallel Processing Using Hierarchical Pincers Attack Search

K. Kobayashi, H. Kasahara, M. Kai

Joint Symposium on Parallel Processing 1989 1989年02月 [査読有り]
Parallel Processing Scheme of Fortran on Hierarchical Multiprocessor System Oscar

H. Honda, M. Hirota, H. Kasahara

Joint Symposium on Parallel Processing 1989 1989年02月 [査読有り]
Prolog並列処理「階層型挟み打ち探索法」の拡張

甲斐宗徳, 新名孝至, 小林和男, 笠原博徳, 飯塚肇

電子情報通信学会技術研究報告 89 ( 168 (CPSY89 45-58) ) 1989年
OSCAR上でのFortran並列処理系のインプリメントと性能評価

本多弘樹, 広田雅一, 入江豊, 鈴木真, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 89 ( 168 (CPSY89 89-57) ) 1989年
Prolog並列処理「階層型挟み打ち探索法」の拡張

甲斐宗徳, 新名孝至, 小林和男, 笠原博徳, 飯塚肇

電子情報通信学会技術研究報告 89 ( 168(CPSY89 45-58) ) 1989年 [査読有り]
OSCAR上でのFortran並列処理系のインプリメントと性能評価

本多弘樹, 広田雅一, 入江豊, 鈴木真, 笠原博徳, 成田誠之助

電子情報通信学会技術研究報告 89 ( 168 (CPSY89 89-57) ) 1989年 [査読有り]
汎用目的マルチプロセッサ・システムOSCAR上での常微分方程式求解の並列処理

笠原博徳, 高根栄二, 佐藤東哉, 久永裕嗣, 成田誠之助

早稲田大学情報科学研究教育センタ紀要 8.Autumn 1988年09月 [査読有り]
PROLOG 階層型挟み打ち並列探索法のALLIANT FX/4上での性能評価

小林和男, 甲斐宗徳, 笠原博徳

情報処理学会第37回全国大会講演論文集 37 ( 1 ) 188 - 189 1988年09月 [査読有り]

　概要を見る

本稿では、従来筆者等が提案している階層型挟み打ち探索法と呼ぶPROLOGの並列処理手法をマルチプロセッサ・ミニ・スーパーコンピュータALLIANT FX/4(DSP9040上で実現したのでその結果について報告する。この並列処理手法はOR並列を扱うものであり、PROLOGの処理過程をAND逐次実行の条件下でOR木を用いて表現し、そのOR木を複数のプロセッサが左右から階層的に挟み打ちをする形で並列かつ独立に深さ優先探索を行うというものである。この手法ではプロセッサへの負荷割り当て単位(タスクグラニュラリティ)を大きくとることができ、負荷の割り当て制御(スケジューリング)の頻度を低減させ、スケジューリングによるオーバーヘッドを低く抑えることができる。また、プロセッサ台数以上の速度向上すなわち加速異常が得られることがシミュレータ上で確認されている。本手法は、汎用目的マルチプロセッサシステムOSCAR上でのPROLOGの並列処理手法として開発されたものであるが、それに先立って本手法の実システム上での有効性を実証するために今回FX/4上で実現したものである。

CiNii
Parallel Processing for the Solution of Sparse Linear Equations on OSCAR (Optimally Scheduled Advanced Multiprocessor)

H. Kasahara, H. Nakayama, E. Takane, S. Narita

Proc. IEE BISL CONPAR 88(Cambridge Univ Press) 1988年09月 [査読有り]
Perspective on advanced parallel processing system for robotics.

Hironori Kasahara

日本ロボット学会誌 6 ( 4 ) 318 - 325 1988年08月 [査読有り] [国内誌]

DOI CiNii
OSCAR(Optimally Scheduled Advanced Multiprocessor)のアーキテクチャ

笠原博徳, 成田誠之助, 橋本親

電子情報通信学会論文誌 J71-D ( 8 ) p1440 - 1445 1988年08月 [査読有り]

CiNii
OSCAR(Optimally Scheduled Advanced Multiprocessor)上での連続システムシミュレーションの並列処理

笠原博徳

計測自動制御学会システムシンポジウム講演論文集 14 1988年08月 [査読有り]
Architecture of OSCAR(Optimally Scheduled Advanced Multiprocessor)

H. Kasahara, S. Narita, S. Hashimoto

Trans. of IEICE J71-D ( 8 ) 1988年08月 [査読有り]

CiNii
Parallel processing of continuous systems simulation on OSCAR(Optimally Scheduled Advanced Multiprocessor)

H. Kasahara

Symposium of SICE'88 14 1988年08月 [査読有り]
Perspective on Advanced Parallel Processing System for Robotics

H. Kasahara, S. Narita

Journal of the Robotics Society of Japan 6 ( 4 ) 1988年08月 [査読有り]
階層型挟み打ち探索によるPROLOG OR並列処理手法

甲斐宗徳, 小林和男, 笠原博徳

情報処理学会論文誌 29 ( 7 ) 647 - 655 1988年07月 [査読有り]

　概要を見る

本論文では階層型挟み打ち探索法と呼ぶPROLCのOR並列処理手法を提案する.本手法では PROLOGの処理過程をAND逐次実行の条件下でOR木を用いて表現しそのOR木を複数のプロセッサが左右から階層的に挟み打ちをする形で並列かつ独立に深さ優先探索を行う.これによりプロセッサヘの負荷割当て単位(グラニュラリティ)を大きくとることができ負荷の割当て制御(スケジューリン力の頻度を低減させスケジューリングによるオーバヘッドおよび実行時のプロセッサ間データ転送のオー(へッドを低く抑えることが可能となるまたスケジューりングの効率化のために各プロセッサの探索状況を示す特殊なポインタ(セレクションポインタ)を導入する.これにより負荷の割当て後探索に必要な環境を各プロセッサがデータ転送を行わずに自己生成できスケジューリング時のデータ転送オーバヘッドをさらに軽減することができる本手法ではOR木の左右から深さ優先探索を行うため m台のプロセッサを用いて1台の時の1/m以下の処理時間を得るという加速異常現象を有効に引き出すことができる.本手法の性能および有効性はソフトウェアシミュレーションにより確かめられる.

CiNii
An OR Parallel Processing Scheme of PROLOG Using Hierarchical Pincers Attack Search

M. Kai, K. Kobayashi, H. Kasahara

Trans. of IPSJ 29 ( 7 ) 647 - 655 1988年07月 [査読有り]

　概要を見る

本論文では階層型挟み打ち探索法と呼ぶPROLCのOR並列処理手法を提案する.本手法では PROLOGの処理過程をAND逐次実行の条件下でOR木を用いて表現しそのOR木を複数のプロセッサが左右から階層的に挟み打ちをする形で並列かつ独立に深さ優先探索を行う.これによりプロセッサヘの負荷割当て単位(グラニュラリティ)を大きくとることができ負荷の割当て制御(スケジューリン力の頻度を低減させスケジューリングによるオーバヘッドおよび実行時のプロセッサ間データ転送のオー(へッドを低く抑えることが可能となるまたスケジューりングの効率化のために各プロセッサの探索状況を示す特殊なポインタ(セレクションポインタ)を導入する.これにより負荷の割当て後探索に必要な環境を各プロセッサがデータ転送を行わずに自己生成できスケジューリング時のデータ転送オーバヘッドをさらに軽減することができる本手法ではOR木の左右から深さ優先探索を行うため m台のプロセッサを用いて1台の時の1/m以下の処理時間を得るという加速異常現象を有効に引き出すことができる.本手法の性能および有効性はソフトウェアシミュレーションにより確かめられる.

CiNii
Parallel Processing for The Solution of Sparse Linear Equations on OSCAR(Optimally SCheduled Advanced MultiprocessoR

H. Kasahara, H. Nakayama, E. Takane, S. Hashimoto

SIG Notes of IPSJ 88 ( 19(CA-70) ) 1988年06月 [査読有り]
OSCAR単一プロセッサ・クラスタ上でのFortranの並列処理手法

本多弘樹, 水野聡, 広田雅一, 笠原博徳

電子情報通信学会技術研究報告 88 ( 155 ) 1988年04月
OSCAR単一プロセッサ・クラスタ上でのFortranの並列処理手法

本多弘樹, 水野聡, 広田雅一, 笠原博徳

電子情報通信学会技術研究報告 88 ( 155 ) 1988年04月 [査読有り]
A parallel processing scheme of Fortran programs on OSCAR's processor cluster

H. Honda, S. Mizuno, M. Hirota, H. Kasahara

Technical Report of IEICE 88 ( 155 ) 1988年04月 [査読有り]
OSCAR上での非線形方程式求解の並列処理手法-電力潮流計算として-

中野恵一, 中山晴之, 高根栄二, 引池正則, 笠原博徳, 成田誠之助

情報処理学会第36回全国大会講演論文集集 ( 1 ) 175 - 176 1988年03月 [査読有り]
階層型マルチプロセッサシステムOSCAR上でのFortran 並列処理手法

笠原博徳, 本多弘樹

情報処理学会第36回全国大会講演論文集 ( 1 ) 743 - 744 1988年03月 [査読有り]
データ転送を考慮したヒューリスティック・マルチプロセッサ・スケジューリング・アルゴリズム

田中久充, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 179 - 180 1988年03月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムを用いたインプリシットな常微分方程式の並列処理手法

中山晴之, 奥田恒久, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 177 - 178 1988年03月 [査読有り]
Prolog OR並列処理手法「階層型挟み打ち探索法」の性能評価

甲斐宗徳, 小林和男, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 805 - 806 1988年03月 [査読有り]
OSCAR上でのスパース線形方程式求解の並列処理

中山晴之, 高根栄二, 笠原博徳, 成田誠之助, 富沢敬一

情報処理学会第36回全国大会講演論文集 ( 1 ) 171 - 172 1988年03月 [査読有り]
OSCAR上でのエクスプリシット常微分方程式求解の並列処理

高根栄二, 橋本親, 大東尚司, 笠原博徳, 成田誠之助

情報処理学会第36回全国大会講演論文集 ( 1 ) 173 - 174 1988年03月 [査読有り]
OSCAR上でのFortran DOループの並列処理手法

広田雅一, 本多弘樹, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 751 - 752 1988年03月 [査読有り]
OSCARプロセッサ・クラスタ内でのFortranの並列処理

水野聡, 本多弘樹, 吉田昌弘, 笠原博徳, 成田誠之助

情報処理学会第36回全国大会講演論文集 ( 1 ) 749 - 750 1988年03月 [査読有り]
Fortranマクロタスクグラフのダイナミックマルチプロセッサスケジューリング手法

岩田雅彦, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 747 - 748 1988年03月 [査読有り]
Fortran マクロフローグラフからの並列性抽出手法

本多弘樹, 岩田雅彦, 笠原博徳

情報処理学会第36回全国大会講演論文集 ( 1 ) 745 - 746 1988年03月 [査読有り]
Performance Evaluation of Hierarchical Pincers Attack Search for Parallel Processing of PROLOG

M. Kai, K. Kobayashi, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 805 - 806 1988年03月 [査読有り]
Parallel Processing of the Solution of Explicit Ordinary Differential Equations on OSCAR

E. Takane, S. Hashimoto, N. Ohigashi, H. Kasahara, S. Narita

Proc. 36th Annual Convention IPSJ ( 1 ) 173 - 174 1988年03月 [査読有り]
Parallel Processing of The Solution of Sparse Linear Equations on OSCAR

H. Nakayama, E. Takane, H. Kasahara, S. Narita, K. Tomizawa

Proc. 36th Annual Convention IPSJ ( 1 ) 171 - 172 1988年03月 [査読有り]
Parallel Processing of Fortran Programs on OSCAR's Processor Cluster

S. Mizuno, H. Honda, M. Yoshida, H. Kasahara, S. Narita

Proc. 36th Annual Convention IPSJ ( 1 ) 749 - 750 1988年03月 [査読有り]
Heuristic Multiprocessor Scheduling Algorithms Considering Inter-Processor Data Transfer

H. Tanaka, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 179 - 180 1988年03月 [査読有り]
A Scheme for Extracting Parallelism from Fortran Macro Flow Graph

H. Honda, M. Iwata, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 745 - 746 1988年03月 [査読有り]
A Parallel Processing Scheme of Fortran Program on OSCAR

H. Kasahara, H. Honda

Proc. 36th Annual Convention IPSJ ( 1 ) 743 - 744 1988年03月 [査読有り]
A Parallel Processing Scheme of Fortran DO Loop on OSCAR

M. Hirota, H. Honda, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 751 - 752 1988年03月 [査読有り]
A Parallel Processing Scheme for the Solution of Non-linear Equations on OSCAR

K. Nakano, H. Nakayama, E. Takane, M. Hikichi, H. Kasahara, S. Narita

Proc. 36th Annual Convention IPSJ ( 1 ) 175 - 176 1988年03月 [査読有り]
A Parallel Processing Scheme for the Solution of Implicit Ordinary Differential Equations Using Static Multiprocessor Scheduling Algorithm

H. Nakayama, T. Okuda, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 177 - 178 1988年03月 [査読有り]
A Dynamic Multiprocessor Scheduling Scheme for Fortran Macro Task Graph

M. Iwata, H. Kasahara

Proc. 36th Annual Convention IPSJ ( 1 ) 747 - 748 1988年03月 [査読有り]
マルチプロセッサ・システムの研究動向

笠原博徳

電気学会論文誌C分冊 108-C ( 2 ) p96 - 103 1988年02月 [査読有り] [国内誌]

DOI CiNii
汎用マルチプロセッサシステムOSCARのアーキテクチャ

笠原博徳, 本多弘樹, 成田誠之助, 橋本親

情報処理学会コンピュータシンポジウム論文集 88 ( 3 ) 1988年02月 [査読有り]
Research Prospect of Multiprocessor Systems

H. Kasahara

Trans. of IEE Japan 108-C ( 2 ) 1988年02月 [査読有り]
汎用目的マルチプロセッサ・システムOSCAR上でのスパース線形方程式求解の並列処理

笠原博徳, 中山晴之, 高根栄二, 橋本親

情報処理学会研究報告 88 ( 19(CA-70) ) 1 - 8 1988年

　概要を見る

本論文では、任意個のプロセッサ・エレメントから成るマルチプロセッサ・システム上で、スパース連立一次方程式を、最小時間で効率良く解く並列処理手法について述べる。本手法は、LU分解に基づくガウスの消去法やクラウト法などの、直接法の並列処理を目的とし、各プロセッサ・エレメントで実行されるマシン・コードの自動生成を行うところに特徴がある。すなわち、コンパイル時に筆者等が開発したスタティック・スケジューリング・アルゴリズムCP/MISFおよびDF/IHSを用いて、最適スタティック・スケジュールを得ることにより全体の処理時間を最小にし、同時に諸々のオーバーヘッドを最小化するマシン・コードを生成する。本手法の有効性は、8086と8087とを用いた実験用マルチプロセッサ・システム上で、さらに、筆者等が現在開発中であるマルチプロセッサ・システムOSCAR (O__-ptimally <SC>___-eduled A__-dvanced MultiprocessoR__-)上で検証される。This paper describes an efficient parallel processing scheme for the solution of sparse linear equations on multiprocessor supercomputing systemcomposed of arbitrary number of processor elements. The parallel processing scheme is aimed at the parallel processing for direct solution methods such as Gaussian elimination algorithm and Crout algorithm hased on LU factorization. In this scheme, a variety of overheads are also minimized by using the static scheduling algorithms CP/MISF and DF/IHS developed by the authors to obtain the optimal schedule at the stage of computation. The effectiveness of the proposed scheme is demonstrated on an experimental multiprocessor system using lntel 8086 and 8087. and on OSCAR(O__-ptimally <SC>___-heduled A__-dvanced MultiprocessoR__-) a prototype multiprocessor supercomputing system being developed by the authors to extract advantageous features of static scheduling to the maximum extent.

CiNii
汎用目的マルチプロセッサ・システムOSCAR上でのスパース線形方程式求解の並列処理

笠原博徳, 中山晴之, 高根栄二, 橋本親

情報処理学会研究報告 88 ( 19(CA-70) ) 1 - 8 1988年 [査読有り]

　概要を見る

本論文では、任意個のプロセッサ・エレメントから成るマルチプロセッサ・システム上で、スパース連立一次方程式を、最小時間で効率良く解く並列処理手法について述べる。本手法は、LU分解に基づくガウスの消去法やクラウト法などの、直接法の並列処理を目的とし、各プロセッサ・エレメントで実行されるマシン・コードの自動生成を行うところに特徴がある。すなわち、コンパイル時に筆者等が開発したスタティック・スケジューリング・アルゴリズムCP/MISFおよびDF/IHSを用いて、最適スタティック・スケジュールを得ることにより全体の処理時間を最小にし、同時に諸々のオーバーヘッドを最小化するマシン・コードを生成する。本手法の有効性は、8086と8087とを用いた実験用マルチプロセッサ・システム上で、さらに、筆者等が現在開発中であるマルチプロセッサ・システムOSCAR (O__-ptimally <SC>___-eduled A__-dvanced MultiprocessoR__-)上で検証される。This paper describes an efficient parallel processing scheme for the solution of sparse linear equations on multiprocessor supercomputing systemcomposed of arbitrary number of processor elements. The parallel processing scheme is aimed at the parallel processing for direct solution methods such as Gaussian elimination algorithm and Crout algorithm hased on LU factorization. In this scheme, a variety of overheads are also minimized by using the static scheduling algorithms CP/MISF and DF/IHS developed by the authors to obtain the optimal schedule at the stage of computation. The effectiveness of the proposed scheme is demonstrated on an experimental multiprocessor system using lntel 8086 and 8087. and on OSCAR(O__-ptimally <SC>___-heduled A__-dvanced MultiprocessoR__-) a prototype multiprocessor supercomputing system being developed by the authors to extract advantageous features of static scheduling to the maximum extent.

CiNii
汎用目的マルチプロセッサ・システムOSCAR上での常微分方程式求解の並列処理

笠原博徳, 高根栄二, 成田誠之助, 富沢敬一, 大東尚司

電子情報通信学会技術研究報告 87 ( 349 ) 1988年01月
Prolog OR並列処理手法 - 階層型挟み打ち探索法 -

甲斐宗徳, 小林和男, 笠原博徳

情報処理学会研究報告 88 ( 4(CA-69/MC-48) ) 1988年01月
マルチプロセッサスケジューリング問題に対する分枝限定法の適用

笠原博徳

日本オペレーションリサーチ学会誌 33 ( 1 ) 14 - 18 1988年01月 [査読有り]

CiNii
汎用目的マルチプロセッサ・システムOSCAR上での常微分方程式求解の並列処理

笠原博徳, 高根栄二, 成田誠之助, 富沢敬一, 大東尚司

電子情報通信学会技術研究報告 87 ( 349 ) 1988年01月 [査読有り]
Prolog OR並列処理手法-階層型挟み打ち探索法-

甲斐宗徳, 小林和男, 笠原博徳

情報処理学会研究報告 88 ( 4(CA-69/MC-48) ) 1 - 7 1988年01月 [査読有り]

　概要を見る

本稿では階層型狭み打ち探索法を呼ぶPROLOGのOR並列処理手法を提案する。本手法では、PROLOGの処理過程をAND逐次実行の条件下でOR木を用いて表現し、そのOR木を複数のプロセッサが左右から階層的に挟み打ちをする形で並列かつ独立に深さ優先探索を行なう。これによりプロセッサへの負荷割当て単位（グラニュラリティ）を大きくとることができ、負荷の割当て制御（スケジューリング）の頻度を低減させ、スケジューリングによるオーバヘッドおよび実行時のプロセッサ間データ転送のオーバヘッドを低く抑えることが可能となる。また、スケジューリングの効率化のために各プロセッサの探索状況を示す特殊なポインタ（セレクションポインタ）を導入する。これにより、負荷の割当て後、探索に必要な環境を各プロセッサがデータ転送を行なわずに自己生成でき、スケジューリング時のデータ転送オーバヘッドをさらに軽減することができる。本手法ではOR木の左右から深さ優先探索を行なうため、m台のプロセッサを用いて1台の時の1/m以下の処理時間を得るという加速異常現象を有効に引き出すことができる。本手法の性能及び有効性はソフトウェアシミュレーションにより確かめられる。We proposes an OR parallel processing scheme of Prolog named "Hierarchical Pincers Attack Search". In the scheme, an OR-tree, which represents an execution process of a Prolog program, is searched from right and left by a plurality of processors. Each processor does the depth first search independently. The pincers attack search allows us to get a coarse task granularity. That reduces the frequency of the task assignment or the task scheduling, and also the amount of the data transfers among the processors. Furthermore, the introduction of a special pointer which indicates the status of the processors, minimizes the data transfers caused by the task scheduling. In addition, the depth first searches from the both sides extract the acceleration anormaly efficiently. The effectiveness of the proposed scheme is confirmed by simulations of the parallel processing process.

CiNii
Parallel processing of the solution of ordinary differential equations on a general purpose multiprocessor system OSCAR

Kasahara, Hironori, Takane, Eiji, Sato, Haruya, Hisanaga, Yuji, Narita, Seinosuke

Bulletin of Centre for Informatics (Waseda University) 8 ( 349 ) 1988年01月 [査読有り]
AN OR PARALLEL PROCESSING SCHEME OF PROLOG - HIERARCHICAL PINCERS ATTACK SEARCH -

M. Kai, K. Kobayashi, H. Kasahara

SIG Notes of IPSJ 88 ( 4(CA-69/MC-48) ) 1988年01月 [査読有り]
Application of Branch and Bound Method to a Multiprocessor Scheduling Problem

H. Kasahara

Communications of the Operations Research Society of Japan 33 ( 1 ) 1988年01月 [査読有り]
Application of df/ihs to minimum total weighted flow time multiprocessor scheduling problems

Kasahara, H., Kai, M., Narita, S., Wada, H.

Systems and Computers in Japan 19 ( 6 ) 25 - 34 1988年 [査読有り]

DOI

Scopus

1

被引用数

(Scopus)
Parallel Processing of Robot Dynamics Simulation Using Optimal Multiprocessor Scheduling Algorithms

Kasahara, H., Iwata, M., Narita, S., Fujii, H.

Systems and Computers in Japan 19 ( 10 ) 45 - 54 1988年 [査読有り]

DOI

Scopus
スケジューリング・アルゴリズムを用いた電力潮流計算の並列処理手法

笠原博徳, 中野恵一, 中山晴之, 高根栄二, 成田誠之助

電気学会情報処理研究会資料 IP-87 ( 1-12 ) 111 - 120 1987年11月
スケジューリング・アルゴリズムを用いた電力潮流計算の並列処理手法

笠原博徳, 中野恵一, 中山晴之, 高根栄二, 成田誠之助

電気学会情報処理研究会資料 IP-87 ( 1-12 ) 111 - 120 1987年11月 [査読有り]
A Parallel Processing Scheme for the Calculation of Load Flow Using Scheduling Algorithms

H. Kasahara, K. Nakano, H. Nakayama, E. Takane, S. Narita

Technical Report of IEE Japan IP-87 ( 1月12日 ) 111 - 120 1987年11月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムを用いた常微分方程式求解の並列処理

笠原博徳, 藤井稔久, 本多弘樹, 成田誠之助

情報処理学会論文誌 28 ( 10 ) 1060 - 1070 1987年10月 [査読有り]

　概要を見る

本論文ではエクスプリシットな常微分方程式求解のための効率良い並列処理手法を提案する.数値積分法を用いた常微分方程式の求解で要求される計算は互いに複雑なデータ依存性を持つ多くの算術代入文(スカラアサイメント文)から構成されており従来効率良い並列処理が難しかった種類の計算である.本並列処理手法はこのような計算を筆者らが開発したスタティックなマルチプロセッサ・スケジューリング・アルゴリズムを用いることにより任意数のプロセッサを用いてほほ最小の処理時間で処理することを可能とする.この手法はタスク生成タスクのプロセッサ上への最適スケジューリングスケジューリング結果を用いた実行効率の良いマシンコード生成などの部分から成り立っており種々のタスクグラニュラリティに対応できる.また本手法の有効性および実用性は 7ペアの8086と8087をパス結合した実験用マルチプロセッサ上で検証される.さらに本論文では従来アノレゴリズム開発の難しさ等から実並列処理システムヘの適用が諦められていた最適スケジューリングが実マルチプロセッサ・システム上で実際に並列処理を可能とする実用的なものであることを初めて示す.

CiNii
Parallel Processing of Solution of Ordinary Differential Equations Using Static Multiprocessor Scheduling Algorithms

H. Kasahara, T. Fujii, H. Honda, S. Narita

Trans. of IPSJ 28 ( 10 ) 1060 - 1070 1987年10月 [査読有り]

　概要を見る

本論文ではエクスプリシットな常微分方程式求解のための効率良い並列処理手法を提案する.数値積分法を用いた常微分方程式の求解で要求される計算は互いに複雑なデータ依存性を持つ多くの算術代入文(スカラアサイメント文)から構成されており従来効率良い並列処理が難しかった種類の計算である.本並列処理手法はこのような計算を筆者らが開発したスタティックなマルチプロセッサ・スケジューリング・アルゴリズムを用いることにより任意数のプロセッサを用いてほほ最小の処理時間で処理することを可能とする.この手法はタスク生成タスクのプロセッサ上への最適スケジューリングスケジューリング結果を用いた実行効率の良いマシンコード生成などの部分から成り立っており種々のタスクグラニュラリティに対応できる.また本手法の有効性および実用性は 7ペアの8086と8087をパス結合した実験用マルチプロセッサ上で検証される.さらに本論文では従来アノレゴリズム開発の難しさ等から実並列処理システムヘの適用が諦められていた最適スケジューリングが実マルチプロセッサ・システム上で実際に並列処理を可能とする実用的なものであることを初めて示す.

CiNii
最適マルチプロセッサスケジューリングアルゴリズムを用いたロボットダイナミックスシミュレーションの並列処理

笠原博徳, 藤井博文, 岩田雅彦, 成田誠之助

電子情報通信学会論文誌 J70-D ( 9 ) 1783 - 1790 1987年09月 [査読有り]

　概要を見る

資料形態 : テキストデータプレーンテキスト
コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌
記事分類: 制御工学

CiNii
OSCAR上での常微分方程式求解並列処理の性能予測

笠原博徳, 高根栄二, 本多弘樹, 成田誠之助, 富沢敬一

情報処理学会第35回全国大会講演論文集 ( 1 ) 101 - 102 1987年09月 [査読有り]
OSCAR上でのPROLOG並列処理手法

甲斐宗徳, 笠原博徳

情報処理学会第35回全国大会講演論文集 ( 1 ) 1595 - 1596 1987年09月 [査読有り]
Parallel Processing of Robot Dynamics Simulation Using Optimal Multiprocessor Scheduling Algorithms

H. Kasahara, H. Fujii, M. Iwata, S. Narita

Trans. of IEICE D J70-D ( 9 ) 1783 - 1790 1987年09月 [査読有り]
Performance Estimation of Parallel Processing of the Solution of Ordinary Differential Equations on OSCAR

H. Kasahara, E. Takane, H. Honda, S. Narita, K. Tomizawa

Proc. 35th Annual Convention IPSJ ( 1 ) 101 - 102 1987年09月 [査読有り]
Parallel Processing Scheme of PROLOG on OSCAR

M. Kai, H. Kasahara

Proc. 35th Annual Convention IPSJ ( 1 ) 1595 - 1596 1987年09月 [査読有り]
並列処理技術

笠原博徳, 成田誠之助

コンピュートロール(コロナ社) 19 6 - 13 1987年07月 [査読有り]
ロボット制御における並列処理

笠原博徳

コンピュートロール(コロナ社) 19 97 - 103 1987年07月 [査読有り]

CiNii
Parallel Processing of Robot Motion Simulation

H. Kasahara, H. Fujii, M. Iwata

Proc. IFAC 10th World Congress 329 - 336 1987年07月 [査読有り]

CiNii
Multiprocessor Scheduling Algorithms and Parallel Processing

H. Kasahara

Erlangen-Nurnberg University, Hosted by Prof. Wolfgang Handler 1987年07月 [査読有り]
Parallel Processing of Robot Control

H. Kasahara

Computrol (CORONA PUBLISHING CO., LTD.) 19 97 - 103 1987年07月 [査読有り]
Parallel Processing Technology

H. Kasahara, S. Narita

Computrol (CORONA PUBLISHING CO., LTD.) 19 6 - 13 1987年07月 [査読有り]
トータル加重フロー時間最小マルチプロセッサスケジューリング問題に対するDF/IHSの応用

笠原博徳, 和田英彦, 甲斐宗徳, 成田誠之助

電子情報通信学会論文誌 J70-D ( 6 ) 1083 - 1091 1987年06月 [査読有り]

　概要を見る

資料形態 : テキストデータプレーンテキスト
コレクション : 国立国会図書館デジタルコレクション > デジタル化資料 > 雑誌
記事分類: データ処理・計算機器

CiNii
An Application of DF/IHS to Minimum Total Weighted Flow Time Multiprocessor Scheduling Problem

H. Kasahara, H. Wada, M. Kai, S. Narita

Trans. of IEICE D J70-D ( 6 ) 1083 - 1091 1987年06月 [査読有り]
オプティカル・フロー計算およびカメラの運動パラメータ決定のための並列処理手法

伊東俊哉, 中野恵一, 笠原博徳, 成田誠之助

早稲田大学情報科学研究教育センタ紀要 BCIW'87-A-5 47 - 59 1987年05月 [査読有り]
A Parallel Processing Scheme for the Solution of Sparse Linear Equations Using Static Optimal Multiprocessor Scheduling Algorithms

H. Kasahara, T. Fujii, H. Nakayama, S. Narita, Leon O.Chua

Proc. 2nd Int. Conf. on Supercomputing 1987年05月 [査読有り]

CiNii
PARALLEL PROCESSING SCHEME FOR THE CALCULATION OF OPTICAL FLOW AND THE DETERMINATION OF CAMERA MOTION PARAMETERS.

Ito, Toshiya, Nakano, Keiichi, Kasahara, Hironori, Narita, Seinosuke

Bulletin of Centre for Informatics (Waseda University) 5 47 - 59 1987年05月 [査読有り]
並列深さ優先インプリシットヒューリスティック探索法

伊藤敦, 笠原博徳

電子情報通信学会創立70周年記念総合全国大会講演論文集 6 105 1987年03月 [査読有り]
オプティカル・フロー計算およびカメラの運動パラメータ決定のための並列処理手法

伊東俊哉, 中野恵一, 笠原博徳, 成田誠之助

電子情報通信学会創立70周年記念総合全国大会講演論文集 6 226 1987年03月 [査読有り]
OSCAR上でのスパース・リニア方程式求解並列処理の性能予測

笠原博徳, 高根栄二, 中山晴之, 成田誠之助

電子情報通信学会創立70周年記念総合全国大会講演論文集 7 24 1987年03月 [査読有り]
汎用目的マルチプロセッサ・システムOSCAR(Optimally Scheduled Advanced Multiprocessor)

笠原博徳, 成田誠之助, 吉田昌弘, 富沢敬一

情報処理学会第34回全国大会講演論文集 ( 1 ) 267 - 268 1987年03月 [査読有り]
最適化マルチプロセッサスケジューリングアルゴリズムの並列処理手法

伊藤敦, 笠原博徳

情報処理学会第34回全国大会講演論文集 ( 1 ) 275 - 276 1987年03月 [査読有り]
最適マルチプロセッサ・スケジューリングアルゴリズムを利用したFortran並列化コンパイラ

本多弘樹, 水野聡, 笠原博徳, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 277 - 278 1987年03月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたMENDELの並列処理手法

甲斐宗徳, 笠原博徳, 成田誠之助, 本位田真一, 内平直志, 田村信介

情報処理学会第34回全国大会講演論文集 ( 1 ) 285 - 286 1987年03月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムを用いた線形方程式の並列処理の手法

笠原博徳, 藤井稔久, 中山晴之, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 283 - 284 1987年03月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムを用いた常微分方程式求解の並列処理手法 -スカラアサイメント文の並列処理-

笠原博徳, 藤井稔久, 中山晴之, 本多弘樹, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 279 - 280 1987年03月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット・シミュレーションの並列処理 -小マトリクス・ベクトル演算の並列処理-

笠原博徳, 岩田雅彦, 藤井博文, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 281 - 282 1987年03月 [査読有り]
スタティック・マルチプロセッサ・スケジューリング・アルゴリズムの強度とダイナミック・スケジューリングアルゴリズムへの拡張

甲斐宗徳, 岩田雅彦, 伊藤敦, 笠原博徳

情報処理学会第34回全国大会講演論文集 ( 1 ) 273 - 274 1987年03月 [査読有り]

CiNii
OSCARにおける複数バス制御方式

大東尚司, 引地正則, 橋本親, 笠原博徳, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 271 - 272 1987年03月 [査読有り]
OSCARにおけるプロセッサエレメントのハードウエア構成

橋本親, 引地正則, 富沢敬一, 笠原博徳, 成田誠之助

情報処理学会第34回全国大会講演論文集 ( 1 ) 269 - 270 1987年03月 [査読有り]
Parallelized Optimal Multiprocessor Scheduling Algorithms

A. Ito, H. Kasahara

Technical Committee on Computation of IEICE 1987年03月 [査読有り]
Robustness of Static Multiprocessor Scheduling Algorithm and Its Extension to Dynamic Scheduling

M. Kai, M. Iwata, A. Ito, H. Kasahara

Proc. 34th Annual Convention IPSJ ( 1 ) 273 - 274 1987年03月 [査読有り]
Parallel Processing of Robot Motion Simulation Using Static Scheduling Algorithms - Parallel Processing of Small-matrix/vector Operations -

H. Kasahara, T. Iwata, H. Fujii, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 281 - 282 1987年03月 [査読有り]
Parallel Processing of Optimal Multiprocessor Scheduling Algorithm

A. Ito, H. Kasahara

Proc. 34th Annual Convention IPSJ ( 1 ) 275 - 276 1987年03月 [査読有り]
OSCAR (Optimally Scheduled Advanced Multiprocessor)

H. Kasahara, S. Narita, M. Yoshida, K. Tomizawa

Proc. 34th Annual Convention IPSJ ( 1 ) 267 - 268 1987年03月 [査読有り]
Multiple bus control method of OSCAR

N. Ohigashi, M. Hikichi, S. Hashimoto, H. Kasahara, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 271 - 272 1987年03月 [査読有り]
Methods for Parallel Processing of MENDEL with Multiprocessor Scheduling Algorithms

M. Kai, H. Kasahara, S. Narita, S. Honiden, N. Uchihira, S. Tamura

Proc. 34th Annual Convention IPSJ ( 1 ) 285 - 286 1987年03月 [査読有り]
Hardware Architecture of Processor Element on OSCAR

S. Hashimoto, M. Hikichi, K. Tomizawa, H. Kasahara, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 269 - 270 1987年03月 [査読有り]
Fortran Parallelizer Using Optimal Multiprocessor Scheduling Algorithms

H. Honda, S. Mizuno, H. Kasahara, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 277 - 278 1987年03月 [査読有り]
A Parallel Processing Scheme for The Solution of Sparse Linear Equations Using Static Multiprocessor Scheduling Algorithm

H. Kasahara, T. Fujii, H. Nakayama, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 283 - 284 1987年03月 [査読有り]
A Parallel Processing Scheme for The Solution of Ordinary Differential Equations Using Static Multiprocessor Algorithms - Parallel Processing of Scalar Assignments -

H. Kasahara, T. Fujii, H. Nakayama, H. Honda, S. Narita

Proc. 34th Annual Convention IPSJ ( 1 ) 279 - 280 1987年03月 [査読有り]
A PARALLEL PROCESSING SCHEME FOR THE CALCULATION OF OPTICAL FLOW AND THE DETERMINATION OF MOTION PARAMETERS

T. Ito, K. Nakano, H. Kasahara, S. Narita

NATIONAL CONVENTION RECORD,1987 THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS ( 6 ) 226 1987年03月 [査読有り]
Parallelized Depth First Implicit Heuristic Search

Ito, H. Kasahara

NATIONAL CONVENTION RECORD,1987 THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS ( 6 ) 105 1987年03月 [査読有り]
Performance Estimation of Parallel Processing of Sparse Linear Equations on OSCAR

H. Kasahara, E. Takane, H. Nakayama, S. Narita

NATIONAL CONVENTION RECORD, 1987 THE INSTITUTE OF ELECTRONICS, INFORMATION AND COMMUNICATION ENGINEERS ( 7 ) 24 1987年03月 [査読有り]
マルチプロセッサスケジューリング・アルゴリズムを用いた論理型オブジェクト指向言語MENDELの並列処理

甲斐宗徳, 笠原博徳, 成田誠之助, 本位田真一, 田村信介

電気学会論文誌C分冊 107-C ( 2 ) 1987年02月 [査読有り] [国内誌]

DOI
Task scheduling algorithms for multiprocessor real‐time control systems

Kai, M., Kasahara, H., Narita, S., Ukaji, H.

Electrical Engineering in Japan 107 ( 2 ) 120 - 130 1987年 [査読有り]

DOI

Scopus
常微分方程式求解の並列処理

笠原博徳, 藤井稔久, 本多弘樹, 成田誠之助

情報処理学会研究報告 ARC-64-1 1987 ( 7 ) 1 - 8 1987年01月

　概要を見る

本論文では、エクスプリシットな常微分方程式求解のための効率良い並列処理手法を提案する。数値積分法を用いた常微分方程式の求解で要求される計算は、主に、従来効率良い並列処理が難しかったスカラ・アサインメント文の処理から構成されている。本並列処理手法は、このような計算を、筆者等が開発した最適マルチプロセッサ・スケジューリング・アルゴリズムを用いることにより、任意数のプロセッサを用いて最小の処理時間で効率良く処理することを可能とする。この手法の有効性及び実用性は、実験用マルチプロセッサ上で検証される。さらに本論文では、従来アルゴリズム開発の難しさから並列処理への適用が諦められていた最適スケジューリングが、実マルチプロセッサ・システム上で効率良い並列処理を可能とする実用的なものである事も示す。This paper describes an efficient parallel processing scheme for the solution of explicit ordinary differential equations. The solution of ordinary differential equations involves the computation of scalar assignment statements, which has so far been difficult to process in parallel efficiently. The proposed scheme using optimal multiprocessor scheduling algorithms, however, allows us to process the computation in the minimum execution time on a multiprocessor system composed of an arbitary number of processor elements. Its usefullness and practicality are demonstrated on an experimental multiprocessor system.

CiNii
常微分方程式求解の並列処理

笠原博徳, 藤井稔久, 本多弘樹, 成田誠之助

情報処理学会研究報告ARC-64-1 1987 ( 7 ) 1 - 8 1987年01月 [査読有り]

　概要を見る

本論文では、エクスプリシットな常微分方程式求解のための効率良い並列処理手法を提案する。数値積分法を用いた常微分方程式の求解で要求される計算は、主に、従来効率良い並列処理が難しかったスカラ・アサインメント文の処理から構成されている。本並列処理手法は、このような計算を、筆者等が開発した最適マルチプロセッサ・スケジューリング・アルゴリズムを用いることにより、任意数のプロセッサを用いて最小の処理時間で効率良く処理することを可能とする。この手法の有効性及び実用性は、実験用マルチプロセッサ上で検証される。さらに本論文では、従来アルゴリズム開発の難しさから並列処理への適用が諦められていた最適スケジューリングが、実マルチプロセッサ・システム上で効率良い並列処理を可能とする実用的なものである事も示す。This paper describes an efficient parallel processing scheme for the solution of explicit ordinary differential equations. The solution of ordinary differential equations involves the computation of scalar assignment statements, which has so far been difficult to process in parallel efficiently. The proposed scheme using optimal multiprocessor scheduling algorithms, however, allows us to process the computation in the minimum execution time on a multiprocessor system composed of an arbitary number of processor elements. Its usefullness and practicality are demonstrated on an experimental multiprocessor system.

CiNii
Parallel Processing of Ordinary Differential Equations

H. Kasahara, T. Fujii, H. Honda, S. Narita

SIG Notes of IPSJ 1987 ( 7 ) 1 - 8 1987年01月 [査読有り]

　概要を見る

本論文では、エクスプリシットな常微分方程式求解のための効率良い並列処理手法を提案する。数値積分法を用いた常微分方程式の求解で要求される計算は、主に、従来効率良い並列処理が難しかったスカラ・アサインメント文の処理から構成されている。本並列処理手法は、このような計算を、筆者等が開発した最適マルチプロセッサ・スケジューリング・アルゴリズムを用いることにより、任意数のプロセッサを用いて最小の処理時間で効率良く処理することを可能とする。この手法の有効性及び実用性は、実験用マルチプロセッサ上で検証される。さらに本論文では、従来アルゴリズム開発の難しさから並列処理への適用が諦められていた最適スケジューリングが、実マルチプロセッサ・システム上で効率良い並列処理を可能とする実用的なものである事も示す。This paper describes an efficient parallel processing scheme for the solution of explicit ordinary differential equations. The solution of ordinary differential equations involves the computation of scalar assignment statements, which has so far been difficult to process in parallel efficiently. The proposed scheme using optimal multiprocessor scheduling algorithms, however, allows us to process the computation in the minimum execution time on a multiprocessor system composed of an arbitary number of processor elements. Its usefullness and practicality are demonstrated on an experimental multiprocessor system.

CiNii
マルチプロセッサ・リアルタイム制御システムにおけるタスクスケジューリング手法

甲斐宗徳, 笠原博徳, 成田誠之助, 宇梶仁志

電気学会論文誌C分冊 106-C ( 12 ) 1986年12月 [査読有り]
Real-time simulation of robot motion dynamics on a multiprocessor system

H. Kasahara, H. Fujii, M. Iwata, H. Honda, S. Narita

Proceedings of the Seventh IFAC Workshop on Distributed Computer Control Systems 1986 1986年10月 [査読有り]
A Multiprocessor Robot Motion Simulator

H. Kasahara, H. Fujii, M. Iwata, H. Honda, S. Narita

Proc. JSST International Conference 1986年07月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いた論理型オブジェクト指向言語の並列処理手法

甲斐宗徳, 笠原博徳, 成田誠之助, 本位田真一, 内平直志, 田村信介

電子通信学会技術研究報告 86 ( 10 ) 1986年04月
マルチプロセッサ・スケジューリング・アルゴリズムを用いた論理型オブジェクト指向言語の並列処理手法

甲斐宗徳, 笠原博徳, 成田誠之助, 本位田真一, 内平直志, 田村信介

電子通信学会技術研究報告 86 ( 10 ) 1986年04月 [査読有り]
Parallel Processing of Prolog Based Concurrent Object Oriented Language Using Multiprocessor Scheduling Algorithms

M. Kai, H. Kasahara, S. Narita, S. Honiden, N. Utihira, S. Tamura

Technical Report of IECE 86 ( 10 ) 1986年04月 [査読有り]
加重フロー時間最小マルチプロセッサ・スケジューリング問題に対するDF/IHSの応用

和田英彦, 甲斐宗徳, 笠原博徳, 成田誠之助

電子通信学会技術研究報告 85 ( 320 ) 1986年03月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット・ダイナミクス計算の並列処理

藤井博文, 安井卓也, 幸村和久, 笠原博徳, 成田誠之助

電子通信学会技術研究報告 85 ( 311 ) 1986年03月
平均加重滞留時間最小マルチプロセッサ・スケジューリング問題に対するDF/HISの応用

和田英彦, 三宅貴, 甲斐宗徳, 笠原博徳, 成田誠之助

電子通信学会総合全国大会 1986年03月 [査読有り]
二次元情報を利用した物体認識手法

宮下七郎, 長谷川博昭, 伊東俊哉, 笠原博徳, 成田誠之助

電子通信学会総合全国大会 1986年03月 [査読有り]
スケジューリング・アルゴリズムを用いたロボット・ダイナミクス計算の並列処理

藤井博文, 岩田雅彦, 水野正敏, 笠原博徳, 成田誠之助

電子通信学会総合全国大会 1986年03月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット・ダイナミクス計算の並列処理

藤井博文, 安井卓也, 幸村和久, 笠原博徳, 成田誠之助

電子通信学会技術研究報告 85 ( 311 ) 1986年03月 [査読有り]
Parallel Processing of Robot Dynamics Computation Using Multiprocessor Scheduling Algorithms

H. Fujii, T. Yasui, K. Koumura, H. Kasahara, S. Narita

Technical Report of IECE 85 ( 311 ) 1986年03月 [査読有り]
加重フロー時間最小マルチプロセッサ・スケジューリング問題に対するDF/IHSの応用

和田英彦, 甲斐宗徳, 笠原博徳, 成田誠之助

電子通信学会技術研究報告 85 ( 320 ) 1986年03月
Parallel Processing of Robot Dynamics Computation Using Scheduling Algorithms

H. Fujii, M. Iwata, M. Mizuno, H. Kasahara, S. Narita

Proc. 1985 Spring Annual Convention of IEICE 1986年03月 [査読有り]
An Application of DF/IHS to Minimum Average Weighted Residence Time Multiprocessor Scheduling Problem

H. Wada, T. Miyake, M. Kai, H. Kasahara, S. Narita

Proc. 1985 Spring Annual Convention of IEICE 1986年03月 [査読有り]
Object Recognition methods Using Two-dimensional Information

S. Miyashita, H. Hasegawa, T. Itoh, H. Kasahara, S. Narita

Proc. 1985 Spring Annual Convention IEICE 1986年03月 [査読有り]
並列化最適マルチプロセッサスケジューリングアルゴリズム

伊藤敦, 笠原博徳

電子情報通信学会コンピューテーション研究会 COMP86-89 1986年03月 [査読有り]
Task scheduling algorithms for multiprocessor realtime control systems.

Hironori Kasahara

電気学会論文誌Ｃ（電子・情報・システム部門誌） 106 ( 12 ) 257 - 264 1986年 [査読有り] [国内誌]

DOI
An Approach to Supercomputing Using Multiprocessor Scheduling Algorithms

H. Kasahara, S. Narita

Proc. of IEEE 1st International Conf. on Supercomputing 139 - 148 1985年12月 [査読有り]

CiNii
Multiprocessor Scheduling Algorithms and Their application to Supercomputing

H. Kasahara

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor David Kuck 1985年12月 [査読有り]
Parallel Processing for Simulation of Dynamical Systems

H. Kasahara, H. Honda, M. Kai, T. Seki, S. Narita

Proc. of IFAC 7th Conf. on Digital Computer Application to Process Control System 527 - 533 1985年09月 [査読有り]

CiNii
スケジューリング・アルゴリズムを用いたマルチプロセッサ連続システム・シミュレータ WAMUX

笠原博徳, 本多弘樹, 藤井稔久, 成田誠之助, 富沢敬一

日本シミュレーション学会、第5回シミュレーション・テクノロジー・コンファレンス 1985年06月 [査読有り]
Multiprocessor Continuous System Simulator WAMUX Using Scheduling Algorithms

H. Kasahara, H. Honda, T. Fujii, S. Narita, K. Tomizawa

The 5th Conference on Simulation Technology, Japan Society for Simulation Technology 1985年06月 [査読有り]
Load Distribution Among Real time Control Computers: Multiprocessor Control of Tandem Rolling Mills

M. Kai, H. Wada, H. Kasahara, S. Narita, H. Ukaji

Proc. of 6th IFAC Workshop on DCCS 1985年05月 [査読有り]
マルチプロセッサ・システム上で起動周期が変動するタスク集合を処理するためのスケジューリング手法

甲斐宗徳, 笠原博徳, 成田誠之助, 永井英夫

電気学会全国大会 1985年04月 [査読有り]
A Scheduling Scheme for Processing of Task Set Fluctuating it's Start-up Cycle on Multiprocessor Systems.

M. Kai, H. Kasahara, S. Narita, H. Nagai

Proc. Annual Convention of IEE 1985年04月 [査読有り]
マルチプロセッサ・スケジューリング問題に対するヒューリスティック・アルゴリズムの性能評価

和田英彦, 笠原博徳, 成田誠之助

電子通信学会, 1985年総合全国大会 1985年03月 [査読有り]
ビジュアル・フィードバック機能を持つロボット制御系の並列処理

関俊文, 藤沢栄蔵, 笠原博徳, 成田誠之助

電子通信学会, 1985年総合全国大会 1985年03月 [査読有り]
PARALLEL PROCESSING FOR ROBOT CONTROL WITH VISUAL FEEDBACK

T. Seki, E. Fujisawa, H. Kasahara, S. Narita

Proc. 1985 Spring Annual Convention IEICE 1985年03月 [査読有り]
Performance Evaluation of Heuristic Algorithms for Multiprocessor Scheduling Problem

H. Kasahara, H. Wada, S. Narita

Proc. 1985 Spring Annual Convention IEICE 1985年03月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット制御・シミュレーションの並列処理

笠原博徳, 安井卓也, 幸村和久, 甲斐宗徳, 成田誠之助

電子通信学会、回路とシステム研究会 1985年02月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット制御・シミュレーションの並列処理

笠原博徳, 安井卓也, 幸村和久, 甲斐宗徳, 成田誠之助

電子通信学会, 回路とシステム研究会 1985年02月
Dynamic Task Scheduling for Control of Hot Strip Mill Lines

M. Kai, A. Ito, H. Wada, H. Kasahara, S. Narita, H. Ukaji

Bulletin of Centre for Informatics, Waseda University 2, Autumn 1985年 [査読有り]
Practical multiprocessor scheduling algorithms for efficient parallel processing

Kasahara, H., Narita, S.

Systems and Computers in Japan 16 ( 2 ) 11 - 19 1985年 [査読有り]

DOI

Scopus

6

被引用数

(Scopus)
Parallel Processing of Robot-Arm Control Computation on a Multimicroprocessor System

Kasahara, H., Narita, S.

IEEE Journal on Robotics and Automation 1 ( 2 ) 104 - 113 1985年 [査読有り]

DOI

Scopus

114

被引用数

(Scopus)
ロボット・モーション・シミュレーションの並列処理手法

笠原博徳, 安井卓也, 谷口浩一, 成田誠之助

日本ロボット学会、学術講演会 1984年11月 [査読有り]
ロボット・アーム制御計算の並列処理

笠原博徳, 幸村和久, 谷口浩一, 成田誠之助

日本ロボット学会、学術講演会 1984年11月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムとその実システムの応用

笠原博徳, 甲斐宗徳, 成田誠之助

第7回情報処理論とその応用研究会 1984年11月 [査読有り]
MULTI-PROCESSOR SCHEDULING ALGORITHMS AND THEIR PRACTICAL APPLICATIONS

H. Kasahara, M. Kai, S. Narita

The 7th Symposium on Information Theory and Its Applications 1984年11月 [査読有り]
Parallel Processing of Robot Arm Control Computation

H. Kasahara, H. Koumura, K. Taniguchi, S. Narita

Proc. Annual Convention of The Robotics Society of Japan 1984年11月 [査読有り]
A Parallel Processing Scheme for Robot Motion Simulation

H. Kasahara, T. Yasui, K. Taniguchi, S. Narita

Proc. Annual Convention of The Robotics Society of Japan 1984年11月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット・アーム制御計算の並列処理

笠原博徳, 幸村和久, 安井卓也, 成田誠之助

電子通信学会技術研究報告(電子計算機研究会) 84 ( 175 ) 1984年10月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット制御計算の並列処理手法

笠原博徳, 成田誠之助

日本ロボット学会誌 2 ( 5 ) 387 - 401 1984年10月 [査読有り] [国内誌]

　概要を見る

本論文では, ロボット制御計算のための実用的かつ汎用的な並列処理手法を提案する.提案する並列処理手法は, 高価なミニあるいはスーパーミニコンピュータの代わりに, 複数の安価なマイクロプロセッサを用いることにより, 冗長自由度を有する, あるいは有しないロボット・アームのカイネマティック制御/ダイナミック制御のための複雑な計算をリアルタイムで処理することを可能とする.また, これは同時にロボットコントローラの価格性能比・応答性・可搬性の向上等種々のメリットをもたらす.<BR>このようなメリットを十分に生かすためには, 効果的な並列処理手法の開発が非常に重要となる.ただしここで並列処理手法とは, 制御計算をどのように小さな単位 (タスク) に分割し, それらのタスクをどのようにプロセッサ上にスケージュルすべきかという方法を定義するものである.<BR>しかし, ロボット制御並列計算で要求されるスケジューリングは, 強NPハードと呼ばれるきわめて難しい最適化問題のひとつである, このため従来提案されている並列処理手法では, このスケジューリング問題を非常に簡略化しなければ解くことができず, 最小の並列処理時間を得ることができなかった.<BR>これに対して本並列処理手法は, 我々が新しく開発したマルチプロセッサ・スケジューリング・アルゴリズムDFIIHS (Depth First/Implicit Heuristicsearch) を用いることにより, 上記の非常に難しいスケジューリング問題を克服した.すなわちそれは, 任意のハードウエア構成 (プロセッサ数, プロセッサ結合方式等) のMIMDマルチプロセッサ上で, 種々のロボットに対する任意の制御アルゴリズムを, 最小時間で並列処理することを可能とする優れた手法である.

DOI CiNii
マルチプロセッサ・スケジューリングアルゴリズムを用いた連続システム・シミュレーションの並列処理

笠原博徳, 甲斐宗徳, 関俊文, 本多弘樹, 成田誠之助

電子通信学会技術研究報告(電子計算機研究会) 84 ( 175 ) 1984年10月 [査読有り]
ロボット制御計算の並列処理

笠原博徳, 成田誠之助

第9回ロボット及び応用システム・シンポジウム 1984年10月 [査読有り]
マルチプロセッサ・スケジューリング・アルゴリズムを用いたロボット・アーム制御計算の並列処理

笠原博徳, 幸村和久, 安井卓也, 成田誠之助

電子通信学会技術研究報告 (電子計算機研究会) 84 ( 175 ) 1984年10月
マルチプロセッサ・スケジューリングアルゴリズムを用いた連続システム・シミュレーションの並列処理

笠原博徳, 甲斐宗徳, 関俊文, 本多弘樹, 成田誠之助

電子通信学会技術研究報告 (電子計算機研究会) 84 ( 175 ) 1984年10月
Parallel Processing Scheme for Robot Control Computation Using Multi-Processor Scheduling Algorithm

H. Kasahara, S. Narita

Journal of Robotics Society of Japan 2 ( 5 ) 1984年10月 [査読有り]
Parallel processing of robot control calculation

S. Narita, H. Kasahara

9th Symposium on Robotics and Applied Systems 1984年10月 [査読有り]
マルチプロセッサ・スケジューリング問題に対する実用的な最適及び近似アルゴリズム

笠原博徳, 成田誠之助

電子通信学会論文誌D 67-D ( 7 ) p792 - 799 1984年07月 [査読有り]

CiNii
A Practical Optimal / Approximate Algorithm for Multi-Processor Scheduling Problem

H. Kasahara, S. Narita

Trans. of IEICE D 67-D ( 7 ) 778 - 785 1984年07月 [査読有り]

CiNii
Load Distribution among Real-time Control Computers Connected via Communication Media

H. Kasahara, S. Narita

Proc. of 9th IFAC World Congress 1984年07月 [査読有り]
Integrated Simulation System for Design and Evaluation of Distributed Computer Control Systems

H. Kasahara, S. Narita

Proc. of 9th IFAC World Congress 1984年07月 [査読有り]
並列処理時間最小マルチプロセッサ・スケジューリング・アルゴリズム

笠原博徳, 有吉一雄, 成田誠之助

電子通信学会 1984年総合全国大会 1984年03月 [査読有り]
マイクロプロセッサを用いたローカルエリアネットワーク・テストベッド

井村和久, 宮下訓, 笠原博徳, 成田誠之助

電子通信学会 1984年総合全国大会 1984年03月 [査読有り]
プロセッサ間データ転送を考慮したマルチプロセッサ・スケジューリング・アルゴリズム

笠原博徳, 有吉一雄, 甲斐宗徳, 成田誠之助

電子通信学会 1984年総合全国大会 1984年03月 [査読有り]
スケジューリング理論を用いたロボット制御計算の汎用的並列処理手法

笠原博徳, 横田友孝, 安井卓也, 成田誠之助

電子通信学会 1984年総合全国大会 1984年03月 [査読有り]
マルチプロセッサ・スケジューリング問題に対する最適及び近似アルゴリズム(2) - 最適アルゴリズム

笠原博徳, 有吉一雄, 成田誠之助

情報処理学会第28回全国大会講演論文集 ( 1 ) 13 - 14 1984年03月 [査読有り]
マルチプロセッサ・スケジューリング問題に対する最適及び近似アルゴリズム(1) - ヒューリスティックアルゴリズムとその応用

笠原博徳, 有吉一雄, 成田誠之助

情報処理学会第28回全国大会講演論文集 ( 1 ) 11 - 12 1984年03月 [査読有り]
Optimal / Approximate Algorithm for Multi-Processor Scheduling Problem(2) - Optimal Algorithms

H. Kasahara, K. Ariyoshi, S. Narita

Proc. 28th Annual Convention of IPSJ ( 1 ) 13 - 14 1984年03月 [査読有り]
Optimal / Approximate Algorithm for Multi-Processor Scheduling Problem(1) - Heuristic Algorithms and Their Applications

H. Kasahara, K. Ariyoshi, S. Narita

Proc. 28th Annual Convention of IPSJ ( 1 ) 11 - 12 1984年03月 [査読有り]
Multiprocessor Scheduling Algorithm minimizing parallel processing time

H. Kasahara, K. Ariyoshi, S. Narita

Proc. 1984 Spring Annual Convention IEICE 1984年03月 [査読有り]
Multi-Processor Scheduling Algorithm Considering Inter-Processor Data Transfer

H. Kasahara, K. Ariyoshi, M. Kai, S. Narita

Proc. 1984 Spring Annual Convention IEICE 1984年03月 [査読有り]
Local Area Network Testbed Using Microprocessor

K. Imura, S. Miyashita, H. Kasahara, S. Narita

Proc. 1984 Spring Annual Convention IEICE 1984年03月 [査読有り]
General-Purpose Parallel Processing Scheme for Robot Control Computation using Scheduling Theory

H. Kasahara, T. Yokota, T. Yasui, S. Narita

Proc. 1984 Spring Annual Convention IEICE 1984年03月 [査読有り]
Practical Multiprocessor Scheduling Algorithms for Efficient Parallel Processing.

Hironori Kasahara, Seinosuke Narita

IEEE Transactions on Computers 33 ( 11 ) 1023 - 1029 1984年 [査読有り]

DOI

Scopus

322

被引用数

(Scopus)
マルチプロセッサ連続システムシミュレーションのための並列処理手法

笠原博徳, 成田誠之助

日本シミュレーション学会誌 2 ( 3 ) 1983年11月 [査読有り]
Parallel Processing Scheme for Multi-processor Continuous System Simulator

H. Kasahara, S. Narita

JOURNAL OF THE JAPAN SOCIETY FOR SIMULATION TECHNOLOGY 2 ( 3 ) 1983年11月 [査読有り]
マルチプロセッサ・スケジューリング問題に対する最適及び保証された解精度を持つ近似アルゴリズム

笠原博徳, 成田誠之助

電子通信学会技術研究報告(オートマトンと言語研究会) 83 ( 163 ) 1983年10月
マルチプロセッサ・スケジューリング問題に対する最適及び保証された解精度を持つ近似アルゴリズム

笠原博徳, 成田誠之助

電子通信学会技術研究報告(オートマトンと言語研究会) 83 ( 163 ) 1983年10月 [査読有り]
A PRACTICAL OPTIMIZATION / APPROXIMATION ALGORITHM FOR MULTI-PROCESSOR SCHEDULING PROBLEM

H. Kasahara, S. Narita

Technical Report of IEICE 83 ( 163 ) 1983年10月 [査読有り]
ディジタル制御系の解析に向くシミュレーション言語DOSP

犬伏裕之, 笠原博徳, 佐藤博, 成田誠之助

日本シミュレーション大会, 第3回シミュレーション・テクノロジー・コンファレンス 1983年07月 [査読有り]
Simulation Language DOSP Appropriate for Analysis for Digital Control

H. Inubushi, H. Kasahara, H. Sato, S. Narita

The 3rd Conference on Simulation Technology, Japan Society for Simulation Technology 1983年07月 [査読有り]
分散制御システムのアベイラビリティ評価モデル

若槻直, 有吉一雄, 笠原博徳, 成田誠之助

電気学会全国大会 1983年04月 [査読有り]
所望の規範モデルを用いたPID調整則とその応用例

上田俊一, 犬伏裕之, 笠原博徳, 成田誠之助

電気学会全国大会 1983年04月 [査読有り]
産業用ローカルエリアネットワークの通信制御方式の評価

中後明, 井村和久, 笠原博徳, 成田誠之助

電気学会全国大会 1983年04月 [査読有り]
マルチプロセッサ・ダイナミクス・シミュレータのための並列処理手法

笠原博徳, 有吉一雄, 成田誠之助

電気学会全国大会 1983年04月 [査読有り]
PID Tuning Using Desired Reference Model and Their Applications

S. Ueda, H. Inubushi, H. Kasahara, S. Narita

Proc. Annual Convention of IEE 1983年04月 [査読有り]
Evaluation of Communication Control Method on Industrial Local Area Network

A. Chugo, K. Imura, H. Kasahara, S. Narita

Proc. Annual Convention of IEE 1983年04月 [査読有り]
Availability Evaluation Model for Distributed Control System

N. Wakatsuki, K. Ariyoshi, H. Kasahara, S. Narita

Proc. Annual Convention of IEE 1983年04月 [査読有り]
A Processing Scheme for Multiprocessor Dynamics Simulator

H. Kasahara, K. Ariyoshi, S. Narita

Proc. Annual Convention IEE 1983年04月 [査読有り]
分散制御システムにおける負荷分割、資源割り当て、及びスケジューリング手法

笠原博徳, 成田誠之助

電気四学会連合大会 1982年11月 [査読有り]
Load distribution and resource allocation in distributed control systems

H. Kasahara, S. Narita

Unified convention of 4 electrical societies 1982年11月 [査読有り]
Parallel Processing for Real Time Control and Simulation of Distributed Computer Control Systems

H. Kasahara, S. Narita

Proc. of 4th IFAC Workshop on DCCS 1982年05月 [査読有り]
分散制御システムの実時間シミュレーションのための並列処理

笠原博徳, 若槻直, 斉藤浩, 成田誠之助

電気学会全国大会 1982年04月 [査読有り]
マルチマイクロプロセッサを用いたダイナミック・シミュレータ

斉藤浩, 中後明, 笠原博徳, 成田誠之助

電気学会全国大会 1982年04月 [査読有り]
Parallel Processing for Real Time Simulation of Distributed Control Systems

H. Kasahara, N. Wakatsuki, H. Saito, S. Narita

Proc. Annual Convention of IEE 1982年04月 [査読有り]
Dynamic Simulator Using Multi-microprocessor

H. Saito, A. Chugo, H. Kasahara, S. Narita

Proc. Annual Convention of IEE 1982年04月 [査読有り]
分散制御システムの実時間制御・シミュレーションのための並列処理アルゴリズム

笠原博徳, 若槻直, 成田誠之助

電気学会情報処理研究会 1982年02月
分散制御システムの実時間制御・シミュレーションのための並列処理アルゴリズム

笠原博徳, 若槻直, 成田誠之助

電気学会情報処理研究会 1982年02月 [査読有り]
Parallel Processing Algorithm for Real Time Control and Simulation of Distributed Control System

H. Kasahara, N. Wakatsuki, S. Narita

Technical Report of IEE SIG on Information Processing 1982年02月 [査読有り]
モデル規範形サンプル値PIDコントローラとその応用例

佐藤博, 新井弘志, 笠原博徳, 成田誠之助

電気学会東京支部大会 1981年12月 [査読有り]
Model Reference Sampling Value PID Controller and Their Applications

H. Sato, H. Arai, H. Kasahara, S. Narita

Proc. Annual Convention of Tokyo-based Affiliate of IEEE 1981年12月 [査読有り]
A Parallel Processing Algorithm for Fast Load-Flow and Stability Calculations

S. Narita, H. Tachiyeda, K. Omata, T. Mimura, H. Kasahara

Proc. of the Seventh Power Systems Computation Conference 1981年07月 [査読有り]

CiNii

▼全件表示

書籍等出版物

Technology Megatrends 2030

Alejandro Acero, Tülay Adali, Iqbal Ahamed, Ziauddin Ahmed, Metin Akay, Anwer Aldulaimi, Priscilla Amalraj, Mohamed Amin, Cherif Amira, Ravikiran Annaswamy, Mary Baker, Cullen Bash, Marc Beebe, Elisa Bertino, Kirk Bresniker, Solimar Cardenas, Nuno Carvalho, Jenifer Castillo, Jose, Ignacio Castillo, Sri Chandra, Carl Chang, Rong Chang, Kyle Chard, Hong Chen, Giri Chukkapalli, Ernestina Cianca, Tom Coughlin, Ravinder Dahiya, Ernesto Damiani, Sanja Damjanovic, Cinzia DaVia, Marko Delimar, Celia Desmond, Steve Diamond, Zoran Dimitrijevic, Julieta Dominguez, Soberanes, Steve Dukes, Ashutosh Dutta, Christof Eber, Izzat Elhaji, Ayman EL-Refaie, Johan Enslin, Mohamed Essaaidi, Tiago Falk, Paolo, Faraboschi, Rafael Ferreira Da Silva, Eitan Frachtenberg, Jean-Luc Gaudio, Shashank Gaur, Glenn Ge, Gustavo Giannattasio, Alfredo Goldman, Christopher Gorog, Kathy Grise, Ada Gavrilovska Habl, Sin Kuen Hawkins, Sumi Helal, Sandra Hidalgo, Mike Ignatowski, Lizy John, Steve Jordan, Rajiv Joshi, Muhammed Luqman Jukaku, Vincent Kaabunga, Mrinal Karvir, Hironori Kasahara, Dan Katz, Jim Keller, Brad Kloza, David Koehler, Anu Korhonen, Bruce Kraemer, Philip Krein, Amit Kumar, Rakesh Kumar, Luis Kun, Loi Lei Lai, Danny Lange, Tim Lee, Wei-Jen Lee, Grace Lewis, Keqiu Li, Sheng Li, Tian Hong Loh, Daniel Lottis, Avery Lu, Meng Lu, Daniel Vicente, Lühr Sierra, Maike Luiken, Antonio Luque, Albert Lysko, Dave, Magnoni, Milos Manic, Katherine Mansfield, Terence Martinez, John McDonald, Cecilia Metra, Bruno Meyer, Dejan Milojicic (Chair, Christine Miyachi, Jamie Moesch, Khaled Mokhtar, Mostafa Mortezaie, Juliane Mueller, Ajay Mungara, Chengappa Munjandira, Bert Munoz, John Munoz, Thamir F., Tom) Murad, Roberto Murphy, Nirmal Nair, Alon Newton, Luu Nguyen, Paul Nikolich, Louis Nisiotis, Damir Novosel, Maciej Ogorzalek, Bojana Miloradovic Parman, Sudeep Pasricha, Chadrakant Patel, Nita Patel, Liliane Peters, Thomas Phelan, Piero Pianetta, Petar Popovski, Alexandra Posoldova, Ipsita Praharaj, Nury Ramirez, Jeewika Ranaweera, Won Woo Ro, Hugo Rodrigue, Anil Roy, Marina Ruggieri, Jason Rupe, YunWei Ryan Li, Martin Sadler, Dominique Schreurs, Tomy Sebastian, Puneet Sharma, Luis Miguel Silveira, Saurabh Sinha, David Snyder, Vesna, Sossi, Leonel Sousa, Luka Strezoski, Allison Leigh Taylor, George Thiruvathukal, Barry Tilton, Bill Tonti, Julio Toro, Isabel Trancoso, Michelle Tubb, Mehmet Ulema, Gordana Velikic, John Verboncoeur, Irene Pazos Viana, May Wang, Rabab Ward, Hironori Washizaki, Rod Waterhouse, Joseph, Wei, Linda Wilson, Andrew Wolfe, Gerd Zellweger, Ying Zhang, Georges Zissis, Doug Zuckerman( 担当範囲: Co-author)

IEEE Future Directions, IEEE Santa Clara Valley Section, IEEE Computer Society, and IEEE Industry Engagement 2026年03月
TECHNOLOGY PREDICTIONS 2026

Antonio Luque, Albert A. Lysko, John McDonald, Avi Mendelson, Cecilia Metra, Dejan Milojicic (chair, Puneet Kumar Mishra, Oleg Missikoff, Christine Miyachi, Jamie Moesch, Khaled Mokhtar, Juliane Muller, Ajay Mungara, Chengappa Munjandira, John Munoz, Alon Newton, Louis Nisiotis, Maciej Ogorzalek, Bojana Miloradovic Parman, Bob Parro, Sudeep Pasricha, Nita Patel, Chandrakant Patel, Tom Phelan, Alexandra Posoldova, Benjamin Riggan, Won Woo Ro, Marina Ruggieri, Melissa Russell, Martin Sadler, Roxanna Saint-Nom, Tomy Sebastian, Puneet Sharma, Sohaib Sheikh, Saurabh Sinha, David Snyder, Vesna Sossi, Leonel Sousa, Luka Strezoski, Vladimir Terzija, George K. Thiruvathukal, Julio Toro, Isabel Trancoso, Michelle Tubb, Moshe Vardi, Gordana Velikic, John Verboncoeur, Irene Pazos Viana, Jeffrey Voas, May Dongmei Wang, Rod Waterhouse, Kathy Weeks, Linda Wilson, Stefano Zanero, Gerd Zellweger, Ying Zhang( 担当：共著)

https://www.computer.org/resources/2026-tech-predictions, IEEE Computer Society 2026年01月
Message from ISCA 2025 General Co-Chairs

Jean-Luc Gaudio, University of California Irvine, Hironori Kasahara, Waseda University( 担当：共著, 担当範囲: General Co-Chiairs)

ACM/IEEE ISCA (International Symposiun on Computer Architecture) 2025 Proceedings and Home Page, https://www.iscaconf.org/isca2025/message_from_GCs.php 2025年06月
2025 Technology Predictions

Ali Abedi, Mohamed Amin, Cherif Amira, Jyotika Athavale, Mary Baker, Greg Byrd, Kyle Chard, Tom Coughlin, Izzat El Hajj, Paolo Faraboschi, Rafael Ferreira da Silva, Nicola Ferrier, Eitan Frachtenberg, Jean-Luc Gaudio, Ada Gavrilovska Habl, Alfredo Goldman, Mike Ignatowski, Lizy K. John, Vincent Kaabunga, Mrinal Karvir, Hironori Kasahara, Witold Kinsner, Danny Lange, Phillip A Laplante, Keqiu Li, Avi Mendelson, Cecilia Metra, Dejan Milojicic (chair, Puneet Mishra, Christine Miyachi, Khaled Mokhtar, Chengappa Munjandira, Bob Parro, Sudeep Pasricha, Nita Patel, Alexandra Posoldova, Marina Ruggieri, Tomy Sebastian, Farzin Shadpour, Sohaib Sheikh, Saurabh Sinha, Vesna Sossi, Luka Strezoski, Vladimir Terzija, George Thiruvathukal, Michelle Tubb, Gordana Velikic, John Verboncoeur, Irene Pazos Viana, Jeffrey Voas, Rod Waterhouse, Stefano Zanero, Gerd Zellweger, Ying Zhang( 担当：分担執筆)

IEEE Computer Society 2025年01月
Success in the Rear View: IEEE CS Leaders Reveal 2024 Technology Predictions Scorecard

Ali Abedi, Mohamed Amin, Cherif Amira, IEEE CS Presiden, Jyotika Athavale, Rosa M Badia, Mary Baker, Greg Byrd, Mercy Chelanga, IEEE President Tom Coughlin, Izzat El Hajj, Paolo Faraboschi, Nicola Ferrier, Eitan Frachtenberg, IEEE CS President Jean Luc Gaudio, Ada Gavrilovska, Alfredo Goldman, Vincent Kaabunga, IEEE CS Presiden, Hironori Kasahara, Witold Kinsner, Danny Lange, Phil Laplante, Avi Mendelson, IEEE CS President Cecilia Metra, IEEE CS Presiden, Dejan Milojicic (chair, Puneet Mishra, Chris Miyachi, Khaled Mokhtar, Chengappa Munjandira, Bob Parro, IEEE CS Presiden, Nita Patel, Alexandra Posoldova, Farzin Shadpour, Marina Ruggieri, Sohaib Qamar Sheikh, Tomy Sebastian, Saurabh Sinha, Vesna Sossi, Luka Strezoski, Vladimir Terzija, Michelle Tubb, Gordana Velikic, John Verboncoeur, Irene Pazos Viana, Jeff Voas, Rod Waterhouse, Gerd Zellweger( 担当：分担執筆)

IEEE Computer Society 2024年10月
2024 Technology Predictions

Ali Abedi, Mohamed Amin, Cherif Amira, Jyotika Athavale, Rosa M Badia, Mary Baker, Greg Byrd, Mercy Chelanga, Tom Coughlin, Izzat El Hajj, Paolo Faraboschi, Nicola Ferrier, Eitan Frachtenberg, Jean Luc Gaudio, Ada Gavrilovska, Alfredo Goldman, Vincent Kaabunga, Hironori Kasahara, Witold Kinsner, Danny Lange, Phil Laplante, Avi Mendelson, Cecilia Metra, Dejan Milojicic (chair, Puneet Mishra, Chris Miyachi, Khaled Mokhtar, Chengappa Munjandira,Bob Parro, Nita Patel, Alexandra Posoldova, Farzin Shadpour, Marina Ruggieri, Sohaib Qamar Sheikh, Tomy Sebastian, Saurabh Sinha, Vesna Sossi, Luka Strezoski, Vladimir Terzija, Michelle Tubb, Gordana Velikic, John Verboncoeur, Irene Pazos Viana, Jeff Voas, Rod Waterhouse, Gerd Zellweger( 担当：共著)

IEEE Computer Society 2024年01月
Technology Predictions

Rosa M. Badia, Mary Baker, Tom Coughlin, Paolo Faraboschi, Eitan Frachtenberg, Vincent Kaabunga, Hironori Kasahara, Kim Keeton, Danny Lange, Phil Laplante, Andrea Matwyshyn, Avi Mendelson, Cecilia Metra, Dejan Milojicic, Nita Patel, Roberto Saracco, Michelle Tubb, Irene Pazos Viana( 担当：分担執筆)

2022年01月
並列処理技術

笠原博徳

情報処理学会５０年のあゆみ,pp.195-198 2021年10月 ISBN: 4339022969
組込みマルチコアハンドブック基礎編

笠原博徳( 担当：監修)

JEITA 2021年09月
(論文誌特集編集)特集:並列処理

笠原博徳

情報処理学会論文誌 Vol.42, No.4 pp.651-920 2021年04月
組込みマルチコアハンドブック技術・応用編

笠原博徳( 担当：監修)

JEITA 2021年02月
Guest Editorial: Special Issue on Network and Parallel Computing for Emerging Architectures and Applications

( 担当：共著)

2019年03月
NPC: 15th IFIP International Conference Network and Parallel Computing

Feng Zhang, Jidong Zhai, Marc Snir, Hai Jin, Hironori Kasahara, Mateo Valero( 担当：編集)

Lecture Notes in Computer Science, Vol.11276 LNCS 2018年11月
Message from the CAP 2017 Organizing Committee

Cristina Seceleanu, Hironori Kasahara, Tiberiu Seceleanu

IEEE COMPSAC 2017 (The 41th IEEE Computer Society International Conference on Computers, Software & Applications) 2017年07月
IEEE CS 2022 Report

Hasan Alkhatib, Paolo Faraboschi, Eitan Frachtenberg, Hironori Kasahara, Danny Lange, Phil Laplante, Arif Merchant, Dejan Milojicic, Karsten Schwan

IEEE Computer Society 2014年09月
Languages and compilers for parallel computing : 25th International Workshop, LCPC 2012, Tokyo, Japan, September 11-13, 2012 : revised selected papers

Workshop on Languages and Compilers for Parallel Computing, 笠原, 博徳, Kimura, Keiji

Springer 2013年 ISBN: 9783642376573
Languages and Compilers for Parallel Computing: 25th International Workshop, LCPC 2012, Tokyo, Japan, September 11-13, 2012, Revised Selected Papers

Hironori Kasahara, Keiji Kimura( 担当：編集)

Lecture Notes in Computer Science, Vol.7760 2013年
Heterogeneous multicore processor technologies for embedded systems

Kunio Uchiyama, Fumio Arakawa, Hironori Kasahara, Tohru Nojiri, Hideyuki Noda, Yasuhiro Tawara, Akio Idehara, Kenichi Iwata, Hiroaki Shikano( 担当：共著)

Springer New York 2012年10月
フィニッシュ電験三種3機械

前川仁孝, 笠原博徳

オーム社 1995年
情報処理ハンドブック

笠原博徳

オーム社 1995年
(会誌特集編集)マルチプロセッサスーパコンピュータPHIの研究開発：特集「マルチプロセッサスーパコンピュータPHIの研究開発」の編集にあたって Outline of the Research

鈴木滋, 笠原博徳

情報処理, Vol.33, No.5 1992年05月
並列処理技術

笠原博徳

コロナ社 1991年06月
Microprocessors in Robotic and Manufacturing Systems. Microprocessor-Based Systems Engineering, vol 6

Hironori Kasahara, Tzafestas, S.G.( 担当：分担執筆, 担当範囲: Microprocessors in Robotic and Manufacturing Systems)

Springer 1991年 ISBN: 9789401138123
Parallel Computation System for Robotics

H. Kasahara

World Scientific 1991年
Microprocessors in Robotic and Manufacturing Systems

H. Kasahara

Kluwer Academic Pub. 1991年
ロボット工学ハンドブック

笠原博徳

ロボット学会 1990年
Tutorial:Hard Real-Time Systems

H. Kasahara

IEEE Computer Society Press 1988年

▼全件表示

講演・口頭発表等

Multicore and Compiler Co-design for Performance and Power

Hironori Kasahara [招待有り]

University of Toronto & Fujitsu Co-Creation Lab. Seminar hosted by Prof. Ali Sheikholeslam

発表年月： 2026年02月
パネル討論：半導体と九州の未来に答える

笠原博徳, 今村徹, 黒田忠広 [招待有り]

九州各県議会議員交流セミナー

発表年月： 2026年02月

開催年月：
2026年02月

　

　
マルチコアコンピューティングとグリーン半導体エコシステム

笠原博徳 [招待有り]

九州各県議会議員交流セミナー (熊本) 九州各県議会

発表年月： 2026年02月

開催年月：
2026年02月

　

　
ISCA’25 Organizing Committee Report by General Co-Chairs

Prof.Jean-Luc Gaudio, iversity of California, Irvine, a, d, Prof.Hironori Kasahara, Waseda University [招待有り]

ACM/IEEE ISCA 2025 (International Symposium on Computer Architecture)

発表年月： 2025年06月
Sustainable Green Muticore Codesigned with Compiler @ Super-Panel: Sustainable Computer Architecture,

Hironori Kasahara [招待有り]

ACM/IEEE ISCA'25 (International Symposium on Computer Architecture)

発表年月： 2025年06月
Green Multicore by Co-desig of Compiler and Architecture

Hironori Kasahara [招待有り]

Panel: Transformational improvements in data center power efficiency and sustainability, International Workshop on Data Center Energy Efficiency (DCEE-2025) at ACM/IEEE ISCA 2025

発表年月： 2025年06月
環境に優しいグリーンコンピューティング

笠原博徳 [招待有り]

早稲田大学オープンキャンパス情報理工学科模擬講義, Waseda Univ., Tokyo, Japan

発表年月： 2024年08月
Green Multicore Computing

Hironori Kasahara [招待有り]

keynote, The 48th IEEE COMPSAC (International Conference on Computers, Software, and Applications) 2024, Osaka, Japan

発表年月： 2024年07月
アドバンストマルチコアプロセッサ研究所

笠原博徳 [招待有り]

早稲田大学量子技術社会実装拠点設立シンポジウム, 早稲田大学リサーチイノベーションセンター

発表年月： 2024年03月
技術者の役割・未来：イノベーションエコシステムの構築

笠原博徳 [招待有り]

日本工学会第5回世界エンジニアリングデー記念シンポジウムパネルディスカッション：技術者の役割・未来

発表年月： 2024年03月
Evolution of Compiler and Multiprocessors with Accelerators

Hironori Kasahara [招待有り]

Panel: Evolution of Parallel Architecture Targets, The 36th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2023), Lexington, Kentucky, USA

発表年月： 2023年10月

開催年月：
2023年10月

　

　
OSCAR Codesigned Compiler and Multicore Architecture

Hironori Kasahara [招待有り]

Keynote Speech, The 36th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2023), Lexington, Kentucky, USA

発表年月： 2023年10月

開催年月：
2023年10月

　

　
パネルディスカッション:コンピュータ科学を核とした異分野融合とは～分野の壁を越えられるか～

笠原博徳 [招待有り]

室蘭工業大学コンピュータ科学センター創立記念シンポジウム, Muroran Institute of Technology, Hokkaido, Japan

発表年月： 2023年08月
グリーン・マルチコア・コンピューティングシステムとオープン・イノベーション・エコシステム

笠原博徳 [招待有り]

室蘭工業大学コンピュータ科学センター創立記念シンポジウム, Muroran Institute of Technology, Hokkaido, Japan

発表年月： 2023年08月
アクセラレータ付きマルチコア上でのリアルタイム制御計算の自動並列化・低消費電力化コンパイラ技術

笠原博徳 [招待有り]

TIER IV Workshop 2023 自動運転におけるAIコンピューティング

発表年月： 2023年07月
Recognition of Innovative Ideas and Efforts Made before Correctly for Sustainable Technical Progress

Hironori Kasahara [招待有り]

IEEE World Congress on Services, JVA (Prof. John Vincent Atanasoff: The father of the First Electronic Digital Computer) Symposium Plenary Panel (Hybrid): The Invention of Electronic Digital Computing

発表年月： 2023年07月
高性能・低消費電力マルチコアプロセッサのためのコンパイラ・アーキテクチャ協調設計

笠原博徳 [招待有り]

第46回AIチップ設計拠点フォーラム, 産業技術総合研究所・東京大学 AIチップ設計拠点

発表年月： 2023年04月
Open Innovation at Waseda University

Hironori Kasahara [招待有り]

BELGIAN ECONOMIC MISSION TO JAPAN, Waseda University IBUKA International Conference Center

発表年月： 2022年12月
Memory Optimization in OSCAR Parallelizing Compiler

Hironori Kasahara [招待有り]

Oxford-Waseda Symposium on New Memory Programming Language Support for Emerging Memory Technologies, Organizers: Peter Braam, Jeremy Gibbons, Oleg Kiselyov, and Hironori Kasahara with the Support by MEXT TGU Program "Waseda University ICT Robot Project" and Advanced Multicore Processor Research Institute, Green Computing Center at Waseda University

発表年月： 2022年12月
グリーン・マルチコアプロセッサ・アーキテクチャと自動並列化コンパイラに関する研究

笠原博徳 [招待有り]

IEEE東京支部講演会, Tokyo, Japan, Online

発表年月： 2022年10月
環境に優しいグリーンコンピューティングの研究

笠原博徳 [招待有り]

早稲田大学グリーン・コンピューティング機構アーリーキャリア研究者発表会

発表年月： 2022年09月
早稲田オープン・イノベーション・エコシステム挑戦的研究プログラム(W-SPRING)プログラム概要

笠原博徳

W-SPRINGシンポジウム, Waseda Univ., Tokyo, Japan

発表年月： 2022年08月
新宿・早稲田サテライト

笠原博徳 [招待有り]

GTB協議会第3回総会, Tokyo, Japan

発表年月： 2022年08月
早稲田大学オープンイノベーションバレー構想: Connected Collaborative Universityに向けた取組み

笠原博徳 [招待有り]

Cisco Connect

発表年月： 2022年06月
RU11 special programme: Challenges and prospects for The World University Rankings -Japanese universities perspectives-

Hironori Kasahara [招待有り]

Panel Discussion, THE ASIA UNIVERSITIES SUMMIT, Fujita Health University, Aichi, Japan

発表年月： 2022年05月
Green Multicore Computing for Scientific, Image and Deep Learning Computation

Hironori Kasahara [招待有り]

Keynote Speech at IEEE International Conference on Image Processing and Robotics (ICIPRoB2022), Sri Lanka, Online

発表年月： 2022年03月
W-SPRING

笠原博徳 [招待有り]

早稲田大学 WOI'22 W-SPRINGプログラムシンポジウム, Waseda Univ., Tokyo, Japan, Online

発表年月： 2022年03月
早稲田大学オープンイノベーションフォーラム2022（WOI'22)

笠原博徳 [招待有り]

早稲田大学 WOI'22 オープニング・リマーク, Waseda Univ., Tokyo, Japan, Online

発表年月： 2022年03月
早稲田オープン・イノベーション・エコシステム挑戦的研究プログラム(W-SPRING)

笠原博徳 [招待有り]

W-SPRINGプログラム 2021年度キックオフシンポジウム, Waseda Univ., Tokyo, Japan, Online

発表年月： 2022年01月
早稲田大学におけるコアファシリティ化への取組み, パネルディスカッション:各機関における研究設備・機器のコアファシリティ化に向けた段階的なプロセス（苦労）と現状の課題、今後の展開方策

笠原博徳 [招待有り]

文部科学省研究基盤EXPO2022 令和3年度先端研究基盤共用促進事業シンポジウム, Tokyo, Japan, Online

発表年月： 2022年01月
早稲田オープン・イノベーション・フォーラムWOI'22のご紹介

笠原博徳 [招待有り]

稲門経済人の集い, Waseda Univ., Tokyo, Japan, Online

発表年月： 2022年01月
早稲田オープンイノベーションエコシステム・カーボンニュートラル・WOI

笠原博徳 [招待有り]

東芝-早稲田大学技術交流会, Tokyo, Japan, Online

発表年月： 2022年01月
Designing New Generation based University Key Management

Hironori Kasahara [招待有り]

Roundtable on University Management Innovation x Resilient, in UGSS2021 (The 15th Universities‘ Global Strategy Symposium), Tokyo, Japan, Online

発表年月： 2021年12月
IEEE COMPSAC2021 IEEE-HKN Panel Working in the IT world: a 20+ years overview in Japan

Hironori Kasahara [招待有り]

COMPSAC 2021 IEEE-HKN Panel - Working in the IT world: a 20+ years overview, IEEE COMPSAC 2021: IEEE Computer Society Signature Conference on Intelligent and Resilient Computing for a Collaborative World, Madrid, Spain, Online (Madrid)

発表年月： 2021年07月
IEEE COMPSAC2021 Panel: Career Pointers from Computer Society Leadership: What is the Most Important Advice that Your Carrier Pointers have Taugh You?

Hironori Kasahara [招待有り]

Plenary Past President's Panel on Career Pointers from Computer Society Leadership, IEEE COMPSAC 2021: IEEE Computer Society Signature Conference on Intelligent and Resilient Computing for a Collaborative World, Madrid, Spain, Online (Madrid)

発表年月： 2021年07月
IEEE COMPSAC2021 CS Presidents Panel

Hironori Kasahara [招待有り]

President's Panel, IEEE COMPSAC 2021: IEEE Computer Society Signature Conference on Intelligent and Resilient Computing for a Collaborative World, Madrid, Spain, Online (Madrid)

発表年月： 2021年07月
一般財団法人テレコム先端技術研究支援センター（SCAT）会長大賞受賞記念講演：グリーンコンピューティングに貢献する並列化コンパイラとコンパイラ協調型マルチコアアーキテクチャに関する先駆的研究への貢献

笠原博徳 [招待有り]

第110回テレコム技術情報セミナー, 一般財団法人テレコム先端技術研究支援センター, Tokyo, Japan (Tokyo)

発表年月： 2021年07月
最先端コンピューティング技術と早稲田オープン・イノベーション・バレー構想

笠原博徳 [招待有り]

早稲田大学自主挑戦科目「理工文化論」, Tokyo, Japan, Online (Tokyo)

発表年月： 2021年05月
早稲田オープン・イノベーション・エコシステム

笠原博徳 [招待有り]

Waseda Open Innovation Forum 2021：早稲田大学発ベンチャーを起点とした知の共創の場としてのオープン・イノベーション・エコシステム (Tokyo)

発表年月： 2021年03月
早稲田大学グリーン・コンピューティング・研究開発拠点とアドバンストマルチコアプロセッサ研究所における研究開発

笠原博徳 [招待有り]

Waseda Open Innovation Forum 2021：早稲田大学グリーン・コンピューティング・システム研究機構10周年記念講演会 (Tokyo)

発表年月： 2021年03月
Waseda Open Innovation Forum 2021

Hironori Kasahara [招待有り]

Waseda Open Innovation Forum 2021 (Tokyo)

発表年月： 2021年03月
Oxford-Waseda Computer Science Symposium

Hironori Kasahara [招待有り]

Waseda Open Innovation Forum 2021 : Oxford-Waseda Computer Science Symposium (Tokyo)

発表年月： 2021年03月
Green Multicore Computing

Hironori Kasahara [招待有り]

Waseda Open Innovation Forum 2021: Oxford-Waseda Computer Science Symposium (Tokyo)

発表年月： 2021年03月
OSCAR自動並列化コンパイラ --プログラムの自動高速化及び自動省電力化--

川角冬馬, 大森侑, 山本一貴, 藤田一輝, 木村啓二, 笠原博徳

Waseda Open Innovation Forum 2021

発表年月： 2021年03月
Transitioning Humanoid Robots from Laboratory to Home : From 3D Printing to AI-driven Computation

Hironori Kasahara [招待有り]

Science/AAAS

発表年月： 2021年03月
コアファシリティ構築支援プログラム実施概要・成果報告

笠原博徳 [招待有り]

研究基盤イノベーション分科会＆文科省共催シンポジウム (Tokyo)

発表年月： 2021年01月
Waseda Open Innovation Forum 2021--「早稲田オープン・イノベーション・エコシステム」の実現に向けて

笠原博徳 [招待有り]

WASEDA稲門経済人の集い2021 (Tokyo)

発表年月： 2021年01月
COVID-19対応早稲田オンライン講義とWOI’21:2021年3月9日（火）10日（水）

笠原博徳 [招待有り]

東芝・早稲田大学技術交流会 (Tokyo)

発表年月： 2021年01月
Welcome to Sozo Capital Formation Training

Hironori Kasahara [招待有り]

Sozo Ventures提供ビジネス力強化プログラム (Tokyo)

発表年月： 2020年12月
IEEE InTech Forum Keynote Speeches Concluding Remarks by General Chair

Hironori Kasahara [招待有り]

IEEE InTech Forum--Forum on the Response and Resiliency to Covid-19 (Washington)

発表年月： 2020年12月
Welcome to University of Oxford and Waseda University International Workshop on Multiphase Flows:Analysis, Modelling and Numerics

Hironori Kasahara [招待有り]

Oxford-Waseda International Workshop on Multiphase Flows: Analysis, Modelling and Numerics (Tokyo)

発表年月： 2020年12月
OSCAR Parallelizing and Power Reducing Compiler

Tohma Kawasumi, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2020 Exhibition, Online: Atlanta

発表年月： 2020年11月
Multigrain Parallelization for MATLAB/SimulinkUsing the OSCAR Compiler

Ryo Koyama, Yuta Tsumura, Dan Umeda, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2020 Exhibition, Online: Atlanta

発表年月： 2020年11月
OSCAR Vector Multicore SystemPlatinum Vector Accelerator on FPGA

Kazuki Fujita, Kazuki Yamamoto, Honoka Koike, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2020 Exhibition, Online: Atlanta

発表年月： 2020年11月
Plenary Panel

Hironori Kasahara [招待有り]

Silicon Valley Japan Forum US Japan Relationship (Tokyo)

発表年月： 2020年11月
一般社団法人情報処理学会創立60周年記念パネル討論～これからの学会のデザイン～

笠原博徳 [招待有り]

一般社団法人情報処理学会創立60周年記念式典パネル討論会 (Tokyo)

発表年月： 2020年10月
Panel : Startup Ecosystems and Initiatives That Emerge from Universities Will Be Discussed

Hironori Kasahara [招待有り]

Y Combinater & Silicon Valley Japan Platform (SVJP)"Road to Silicon Valley - The Role of the University in the Innovation Ecosystem" (Tokyo)

発表年月： 2020年10月
Waseda Open Innovation Ecosystem

Hironori Kasahara [招待有り]

Y Combinater & Silicon Valley Japan Platform (SVJP)"Road to Silicon Valley - The Role of the University in the Innovation Ecosystem" (Tokyo)

発表年月： 2020年10月
コンピューターの今後の可能性と課題～高性能化・低消費電力化・ソフトウェア生産性～

笠原博徳 [招待有り]

ＪＸ金属株式会社セミナー (Tokyo)

発表年月： 2020年10月
早稲田オープンイノベーションバレー構想

笠原博徳 [招待有り]

早稲田大学「次世代ヒートポンプ技術戦略研究コンソーシアム」オープニングセレモニー (Tokyo)

発表年月： 2020年10月
早稲田大学におけるCOVID-19対応オンライン教育

Hironori Kasahara [招待有り]

2020年度早稲田大学GITI:国際情報通信研究センターフォーラム (Tokyo)

発表年月： 2020年09月
早稲田大学におけるオンライン/ハイブリッド教育：https://www.youtube.com/watch?v=tZW3uxBhLlM

笠原博徳 [招待有り]

国立情報学研究所【第16回】4月からの大学等遠隔授業に関する取組状況共有サイバーシンポジウム遠隔・対面ハイブリッド講義に向けての取り組み (Tokyo)

発表年月： 2020年09月
Plenary Panel: To Patent or Not to Patent?

Hironori Kasahara [招待有り]

IEEE COMPSAC 2020: IEEE Computer Society Signature Conference on Computers, Software and Applications (Madrid)

発表年月： 2020年07月
世界で輝くWASEDAを目指して：高性能・低消費電力コンピューティング技術と早稲田オープンイノベーションバレー構想

笠原博徳 [招待有り]

早稲田大学高等学院理工学特論 (Tokyo)

発表年月： 2020年07月
早稲田大学の目指すオープン・イノベーション

笠原博徳 [招待有り]

早稲田大学経営管理研究科准教授牧兼充先生”Lab to Market” (Tokyo)

発表年月： 2020年07月
早稲田大学でのCOVID-19対応オンライン教育

笠原博徳 [招待有り]

Blackboard/米国大使館商務部主催・日本の高等教育における教育と学習継続のための戦略 (Tokyo)

発表年月： 2020年06月
Green Multicore Computing

Hironori Kasahara [招待有り]

Hosted by Prof. Jean-Luc Gaudiot, Distinguished Professor, University of California, Irvine, California, USA,

発表年月： 2020年02月
IEEE Computer Society 2018会長としての活動と早稲田オープンイノベーションバレー構想について

笠原博徳 [招待有り]

東芝研究開発センター講演会

発表年月： 2020年01月
早稲田大学における研究力強化

笠原博徳 [招待有り]

文部科学省研究費部会

発表年月： 2020年01月
早稲田大学の研究力強化に向けた取り組み～早稲田オープンイノベーションバレー構想～

笠原博徳 [招待有り]

早稲田大学商議員フォーラム

発表年月： 2019年12月
IEEE Computer Society 2018会長としての活動と早稲田オープンイノベーションバレー構想について

笠原博徳 [招待有り]

早稲田大学DCC(デジタルキャンパスコンソーシアム)20周年記念講演会

発表年月： 2019年11月
Automatic Parallelization by OSCAR Compiler for NEC SX-Aurora TSUBASA

Hironori Kasahara [招待有り]

NEC Aurora Community Meeting at SC19( IEEE ACM Super Computing2019)

発表年月： 2019年11月
OSCAR Vector Multicore System - Platinum Vector Accelerator on FPGA -

Kazuki Yamamoto, Kazuki Fujita, Yuta Tadokoro, Tomoya Kashimata, Tomoya Kashimata, Boma A. Adhi, Yoshitake Ooki, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2019 Exhibition, Denver (デンバー)

発表年月： 2019年11月
OSCAR Parallelizing & Power Reducing Compiler - Power is Reduced to 1/7 on ARM -

Kazuki Yamamoto, Kazuki Fujita, Yuta Tadokoro, Tomoya Kashimata, Tomoya Kashimata, Boma A. Adhi, Yoshitake Ooki, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2019 Exhibition, Denver (デンバー)

発表年月： 2019年11月
OSCAR Automatic Parallelizing Compiler - Automatic Speedup and Power Reduction -

Kazuki Yamamoto, Kazuki Fujita, Yuta Tadokoro, Tomoya Kashimata, Tomoya Kashimata, Boma A. Adhi, Yoshitake Ooki, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2019 Exhibition, Denver (デンバー)

発表年月： 2019年11月
Parallelising Compiler for Green Multicore Computing

Hironori Kasahara [招待有り]

Hosted by Prof. Jeremy Gibbons, Department of Computer Science, Oxford University

発表年月： 2019年11月
グリーン・マルチコア・コンピューティングの将来

笠原博徳 [招待有り]

Hitachiアカデミックシステム研究会（ＨＡＳ研）第43回研究会

発表年月： 2019年09月
Plenary Panel: Meeting of the Alliances

Hironori Kasahara [招待有り]

The(Times Higher Education)World Academic Summit 2019 in Zurich

発表年月： 2019年09月
Parallel Processing of MATLAB and Simulink Simulation and Control on Multicore Processors

Hironori Kasahara [招待有り]

MathWorks Asia Research Summit

発表年月： 2019年09月
ハイ・パフォーマンス・コンピューティングと医療

笠原博徳 [招待有り]

日本医師会第3回学術推進会議

発表年月： 2019年07月
Green Multicore Compiler

Hironori Kasahara [招待有り]

MPSoC Forum 2019

発表年月： 2019年07月
Opening Remarks --Simon WRIGHT, Director - Programming, Japan House London --

Hironori Kasahara [招待有り]

SYMPOSIUM : Classical Arts x Digital Technologies

発表年月： 2019年06月
Collaboration as IEEE Computer Society President 2018 and Open Innovation Eco-system in Waseda University

Hironori Kasahara [招待有り]

Next Generation Industry Navigators Forum

発表年月： 2019年03月
早稲田大学の目指すオープン・イノベーション・エコシステム

笠原博徳 [招待有り]

Waseda Open Innovation Forum 2019

発表年月： 2019年03月
Green Multicore Computing: Low Power High Performance

Hironori Kasahara [招待有り]

Tencent-Waseda University Technical Tour

発表年月： 2018年12月
Collaborative Initiatives Promoting Institutional Joint Research between University of Birmingham and Waseda University

Hironori Kasahara [招待有り]

早稲田大学におけるバーミンガム大学デー

発表年月： 2018年11月
IEEE Computer Society

HironoriKasahara [招待有り]

Ivannikov ISP RAS Open Conference

発表年月： 2018年11月
Green Multicore Computing: Low Power High Performance

HironoriKasahara [招待有り]

Ivannikov ISP RAS Open Conference

発表年月： 2018年11月
SX-Aurora TSUBASA with Oscar Compiler Optimization

HironoriKasahara [招待有り]

in NEC Booth, IEEE ACM SC (Super Computing) 2018 Exhibition

発表年月： 2018年11月
CS HPC Award Ceremony on Nov. 13 in SC2018, Dallas having 13,000 participants

Hironori Kasahara [招待有り]

IEEE ACM SC (Super Computing) 2018

発表年月： 2018年11月
OSCAR Vector Multicore System Platinum Vector Accelerator on FPGA

Kazuki Miyamoto, Takumi Kawata, Ken Takahashi, Tomoya Kashimata, Yuto Abe, Boma A. Adhi, Yusuke Minato, Hiroki Mikami, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2018 Exhibition, Dallas (ダラス)

発表年月： 2018年11月
OSCAR Parallelizing & Power Reducing Compiler -Power is Reduced to 1/7 on ARM-

Kazuki Miyamoto, Takumi Kawata, Ken Takahashi, Tomoya Kashimata, Yuto Abe, Boma A. Adhi, Yusuke Minato, Hiroki Mikami, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2018 Exhibition, Dallas (ダラス)

発表年月： 2018年11月
OSCAR Automatic Parallelizing Compiler Automatic Speedup and Power Reduction

Kazuki Miyamoto, Takumi Kawata, Ken Takahashi, Tomoya Kashimata, Yuto Abe, Boma A. Adhi, Yusuke Minato, Hiroki Mikami, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2018 Exhibition, Dallas (ダラス)

発表年月： 2018年11月
Closing Address: AI and Robotics in Waseda University

Hironori Kasahara [招待有り]

Global AI Narratives Tokyo

発表年月： 2018年09月
組込み向けマルチ・メニーコア用並列化コンパイラ技術

笠原博徳 [招待有り]

組込み向けマルチ・メニーコアソフトウェア開発テクニカルセミナー

発表年月： 2018年09月
OSCAR Compiler for Automatic Multigrain Parallelization, Memory Optimization and Power Systems

Hironori Kasahara [招待有り]

International Symposium on Future of Computer Technology 2018：ISFCT 2018

発表年月： 2018年07月
IEEE Computer Society Annual Symposium on VLSI, オープニングアドレス

Hironori Kasahara [招待有り]

IEEE Computer Society Annual Symposium on VLSI

発表年月： 2018年07月
Low Power High Performance Multicore Hardware and Software Co-Design

Hironori Kasahara [招待有り]

IEEE Computer Society Annual Symposium on VLSI

発表年月： 2018年07月
Automatic Multigrain Parallelization, Memory Optimization and Power Reduction Compiler for Multicore Systems

Hironori Kasahara [招待有り]

ICS-2018: The 32nd ACM International Conference on Supercomputing

発表年月： 2018年06月
IEEE COOL Chips21, April 18-20, 2018 Symposium on Low-Power and High-Speed Chips and Systems

Hironori Kasahara [招待有り]

IEEE Symposium on Low-Power and High-Speed Chips(COOL CHIPS 21)

発表年月： 2018年04月
Future of High Performance Low Power Multicore Computing

Hironori Kasahara [招待有り]

The 80th National Convention of IPSJ

発表年月： 2018年03月
OSCAR Automatic Parallelizing and Power Reducing Multicore Compiler for Realtime Embedded to High Performance Computing

Hironori Kasahara [招待有り]

三菱電機情報技術総合研究所

発表年月： 2018年03月
Future of High Performance Green OSCAR Multicore Computing

Hironori Kasahara [招待有り]

International Symposium on Future of High Performance Green Computing 2018 (HPGC2018)

発表年月： 2018年03月
HPGC Round table

Hironori Kasahara [招待有り]

International Symposium on Future of High Performance Green Computing 2018 (HPGC2018)

発表年月： 2018年03月
High Performance Green Multicore Computing

Hironori Kasahara [招待有り]

hosted by Prof. Kastury, University of South Florida

発表年月： 2018年02月
High Performance Low Power OSCAR Multicore and Compiler

Hironori Kasahara [招待有り]

hosted by Prof. David Kuck, University of Texas

発表年月： 2018年02月
Green Multicore Computing: Co-design of Software and Architecture

Hironori Kasahara [招待有り]

Korea Software Congress 2017

発表年月： 2017年12月
Future of High Performance & Low Power Multicore Technology

Hironori Kasahara [招待有り]

SEMICON Japan2017 SuperTHEATERみらいビジョンフォーラム (Tokyo)

発表年月： 2017年12月
Green Multicore Computing and Industry Collaboration

Hironori Kasahara [招待有り]

外務省ロシアIT企業訪日研修 (Tokyo)

発表年月： 2017年11月
IEEE CS President Elect 2017, President 2018 Address

Hironori Kasahara [招待有り]

IEEE International Conference on Network and Service Management (Tokyo)

発表年月： 2017年11月
コンピュータサイエンスが先導する世界の潮流

笠原博徳 [招待有り]

早稲田大学「高度データ関連人材育成プログラム」キックオフシンポジウム (Tokyo)

発表年月： 2017年11月
OSCAR Automatic Parallelizing Compiler -Automatic Speedup and Power Reduction-[Parallel Processing of MATLAB/Simulink by OSCAR Compiler on Intel, ARM & Renesas multi cores, OSCAR Parallelizing & Power Reducing Compiler-Power is Reduced to 1/7 on ARM-,OSCAR Vector Multicore System -Platinum Vector Accelerator on FPGA-]

Hiroki Mikami, Boma Anantasatya Adhi, Tomoya Kashimata, Satoshi Karino, Kazuki Miyamoto, Takumi Kawata, Ken Takahashi, Tetsuya Makita, Tomoya Shirakawa, Yoshitake Oki, Toshiaki Kitamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2017 Exhibition, Denver (デンバー)

発表年月： 2017年11月
OSCAR自動並列化コンパイラ[OSCARコンパイラによるHaswellマルチコア上でのOpenCV顔認識処理の自動低消費電力化, OSCARコンパイラによるMATLAB/Simulinkより生成されたアプリケーションの自動並列化(Intel,arm,ルネサスチップ上)]

安藤和将, 白川智也, 仲田優哉, 清水勇希, 清水裕貴, 阿部佑人, 山本英雄, 島岡護, 見神広紀, 木村啓二, 笠原博徳

Embedded Technology 2017,パシフィコ横浜 (横浜)

発表年月： 2017年11月
Performance and Low Power for Multicores

Hironori Kasahara [招待有り]

University of Cambridge Astrophysics Group SKA(Square Kilometre Array telescope project) (Cambridge)

発表年月： 2017年10月
Multigrain Parallelization and Compiler/Architecture Co-design for 30 Years with LCPC

Hironori Kasahara [招待有り]

30th International Workshop on Languages and Compilers for Parallel Computing(LCPC) (Texas)

発表年月： 2017年10月
Software and Hardware for High Performance and Low Power Homogeneous and Heterogeneous Multicore Systems

Hironori Kasahara [招待有り]

CPS Summer School 2017 (Sardinia)

発表年月： 2017年09月
IEEE Computer Society President2018就任とグリーンマルチコア研究開発に関する産学連携研究

笠原博徳 [招待有り]

理工系情報学科・専攻協議会 H29年度総会・研究会・自由討論会プログラム (Tokyo)

発表年月： 2017年07月
自動並列化・省電力化コンパイラの最新動向

笠原博徳 [招待有り]

「ポストムーア世代の組込マルチコアと自動並列化・低消費電力化コンパイラ」シンポジウム (Tokyo)

発表年月： 2017年07月
Future of Green Multicore Computing

Hironori Kasahara [招待有り]

hosted by Prof. Stefano Zanero, Politecnico di Milano (Milano)

発表年月： 2017年07月
COMPSAC 2017 Plenary Panel Future of Computing: Exciting Research in Computers, Software and Applications Green Multicore Computing

Hironori Kasahara [招待有り]

IEEE COMPSAC 2017 (The 41th IEEE Computer Society International Conference on Computers, Software & Applications) (Torino)

発表年月： 2017年07月
Automatic Cache and Local Memory Optimization for Multicores

Hironori Kasahara [招待有り]

17th INTERNATIONAL FORUM ON MPSoC for software-defined hardware (Annecy)

発表年月： 2017年07月
2017 COOL Chips 20 Cerebration for the 20th Anniversary of IEEE Symposium on Low-Power and High-Speed Chips, Opening Address

Hironori Kasahara [招待有り]

IEEE Symposium on Low-Power and High-Speed Chips(COOL CHIPS 20) (Yokohama)

発表年月： 2017年04月
Cool Chips, Low Power Multicores, Open the Way to the Future, Panel Discussion

Hironori Kasahara [招待有り]

IEEE Symposium on Low-Power and High-Speed Chips(COOL CHIPS 20) (Yokohama)

発表年月： 2017年04月
The Low Power Multicore and Its Software for Embedded to HighPerformance Computing

Hironori Kasahara [招待有り]

3rd IEEE PCSC '17 (IEEE Pakistan Computer Society Congress), Key Note Speech, IEEE Computer Society Karachi Section, Arts Auditorium University of Karachi (UOK) (Karachi)

発表年月： 2017年04月
Integrated Development of Parallelizing and Power Reducing Compiler and Multicore Architecture for HPC to Embedded Applications

Hironori Kasahara [招待有り]

SISA (International Workshop A Strategic Initiative of Computing Systems an Applications) (早稲田)

発表年月： 2017年01月
IEEE Computer Society 2018 Presidentへの選出と高性能低電力マルチコアの研究開発

Hironori Kasahara [招待有り]

IEEE CSJapan Chapter Young Author Award 2016 及び笠原教授2018年会長就任記念の基調講演会 (Tokyo)

発表年月： 2016年12月
OSCAR自動並列化コンパイラ、Haswellマルチコア上でのOpenCV顔認識処理の自動低消費電力化、モデルベース開発により生成された自動車,医療モデルの自動並列化

五十公野克彦, 細川雄平, 安藤和将, 白川智也, 北村理咲子, 仲田優哉, 山本英雄, 島岡護, 見神広紀, 木村啓二, 笠原博徳

Embedded Technology 2016,パシフィコ横浜 (横浜)

発表年月： 2016年11月
OSCAR Automatic Parallelizing Compiler --Automatic Speedup and Power Reduction--

Akira Maruoka, Yuya Mushu, Satoshi Karino, Kazuki Miyamoto, Takumi Kawata, Kouhei Yamamoto, Tomoya Shirakawa, Yoshitake Oki, Toshiaki Kitamura, Moriyuki Takamura, Keiji Kimura, Hironori Kasahara

in ITBL Booth, IEEE ACM SC (Super Computing) 2016 Exhibition, Salt Lake City

発表年月： 2016年11月
Toward for Exa-scale and Beyond from Parallelizing Compiler Aspect

Hironori Kasahara [招待有り]

NPC2016 (Xian)

発表年月： 2016年10月
OSCAR Parallelizing and Power Reducing Compiler for Multicores

Hironori Kasahara [招待有り]

NPC2016 (Xian)

発表年月： 2016年10月
Parallelization and Power Reduction Compiler for Heterogeneous Multicores for Emerging Applications

Hironori Kasahara [招待有り]

IEEE ACM PACT2016 (Haifa)

発表年月： 2016年09月
Automatic Parallelization of Automobile Engine Control Programs on Multicores

Hironori Kasahara [招待有り]

16th International Forum on MPSoC for Software-defined Hardware (Nara)

発表年月： 2016年07月
COMPSAC 2106 Plenary Panel -Rebooting Computing: Future of Architecture and Software- 'Multicore Software and Architecture'

Hironori Kasahara [招待有り]

IEEE COMPSAC 2016 (The 40th IEEE Computer Society International Conference on Computers, Software & Applications) (Atlanta)

発表年月： 2016年07月
OSCAR Automatic Parallelizing and Power Reducing Compiler for Embedded to High Performance Multicore Applications

Hironori Kasahara [招待有り]

hosted by Prof.Vivek Sarkar, Rice University (Texas)

発表年月： 2016年06月
OSCAR Automatic Paralleling and Power Reducing Compiler for Embedded to High Performance Multicores

Hironori Kasahara [招待有り]

hosted by Prof. Vladimir Getov, School of Electronics and Computer Science, University of Westminster (London)

発表年月： 2016年05月
OSCAR Automatic Paralleling and Power Reducing Compiler for Multicores

Hironori Kasahara [招待有り]

INC12,IMEC (Leuven)

発表年月： 2016年05月
OSCAR自動並列化コンパイラ、Haswellマルチコア上でのOpenCV顔認識処理の自動低消費電力化、モデルベース開発により生成された血管検出プログラムの自動並列化

飯塚修平, 矢吹潤, 安藤和将, Bui Binh Duc, 鈴木貴広, 梅田弾, 五十公野克彦, 細川雄平, 山本英雄, 島岡護, 見神広紀, 木村啓二, 笠原博徳

Embedded Technology 2015,パシフィコ横浜 (横浜)

発表年月： 2015年11月
OSCAR Parallelizing and Power Reducing

Hironori Kasahara [招待有り]

hosted by Prof. Yan Solihin, Dept. of Electrical & Computer Eng. (North Carolina)

発表年月： 2015年09月
OSCAR Automatic Parallelization and Power Reduction Compiler for Homogeneous and Heterogeneous Multicores

Hironori Kasahara [招待有り]

GTC Japan 2015 (Tokyo)

発表年月： 2015年09月
Parallelization and Power Reduction of Embedded Real-time Applications by OSCAR Compiler on ARM and Intel Multicores

Hironori Kasahara [招待有り]

15th International Forum on MPSoC for Software-defined Hardware (Ventura)

発表年月： 2015年07月
Plenary Panel : Rebooting Computing -- Low Power Multicores with Accelerators and Automatic Parallelizing and Power Reducing Compiler for Exponential Performance Scaling --

Hironori Kasahara [招待有り]

IEEE COMPSAC 2015 (The 39th Annual International Computers, Software & Applications Conference) (Taichung)

発表年月： 2015年07月
最先端マルチコアプロセッサに関する産学連携研究---グリーン・マルチコア・コンピューティング---

笠原博徳 [招待有り]

マイクロ波・フォトニクス（ＭＷＰ）シンポジウム--スマート化とリジリエンスを実現するエネルギーインターネットとそれを支える最新技術動向-- (Tokyo)

発表年月： 2014年12月
Automatic Parallelization of MATLAB/Simulink on Multicore Processors -- Parallel processing of automobile engine control C code generated by embedded coder --

Hironori Kasahara [招待有り]

MathWorks Asian Research Faculty Summit 2014 (Tokyo)

発表年月： 2014年11月
OSCAR自動並列化コンパイラ、Androidマルチコア上での自動低消費電力化、Haswellマルチコア上でのOpenCV顔認識処理の自動低消費電力化

平野智大, 後藤隆志, 飯塚修平, 山本英雄, 見神広紀, 矢吹潤, 五十公野克彦, 藤枝美咲, 高村守幸, 木村啓二, 笠原博徳

Embedded Technology 2014パシフィコ横浜 (横浜)

発表年月： 2014年11月
Android Movie Player System Combined with Automatically Parallelized and Power Optimized Code by OSCAR Compiler

Duc Binh Bui, Tomohiro Hirano, Hillenbrand Dominic, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

情報処理学会組込みシステムシンポジウム2014 (ESS2014)

発表年月： 2014年10月
OSCAR コンパイラを用いた H.264/AVC デコーダの Android マルチコアでの低消費電力化

飯塚修平, 山本英雄, 平野智大, 後藤隆志, 見神広紀, 高橋宇一郎, 井上栄, 高村守幸, 木村啓二, 笠原博徳

情報処理学会第204回計算機アーキテクチャ研究会

発表年月： 2014年10月
Multi-platform Automatic Parallelization and Power Reduction by OSCAR Compiler

Hironori Kasahara [招待有り]

14th International Forum on Embedded MPSoC and Multicore (Margaux)

発表年月： 2014年07月
Hierarchical Parallel Processing of HEVC Encoder

Hiroki Mikami, Keiji Kimura, Hironori Kasahara

Poster Session, COOL Chips XVII, IEEE Symposium on Low-Power and High-Speed Chips

発表年月： 2014年04月
ずっとときめいていること，いまときめいていること

笠原博徳 [招待有り]

第200回計算機アーキテクチャ研究発表会 200回記念パネルセッション東京?業?学 (Tokyo)

発表年月： 2014年01月
OSCAR自動並列化コンパイラ、OSCAR API：マルチコアの自動高速化と電力削減

武藤康平, 後藤隆志, 山本英雄, 見神広紀, 平野智大, 高村守幸, 木村啓二, 笠原博徳

Embedded Technology 2013, パシフィコ横浜 (横浜)

発表年月： 2013年11月
「最先端マルチコアプロセッサに関する産学連携研究」～低消費電力マルチコアハード・ソフトの自動車、スマホ、医療、サーバへの応用～

笠原博徳 [招待有り]

EWE三月会

発表年月： 2013年10月
モデルベース設計により自動生成されたエンジン制御Cコードのマルチコア用自動並列化

梅田弾, 金羽木洋平, 見神広紀, 林明宏, 谷充弘(デンソー, 森裕司(デンソー, 木村啓二, 笠原博徳

組込みシステムシンポジウム (ESS2013)

発表年月： 2013年10月
Profile-Based Automatic Parallelization and Sequential Program Tuning for Android 2D Rendering on Nexus7

Kohei Muto, Takashi Goto, Hideo Yamamoto, Fujitsu Laboratories LTD, Hiroki Mikami, Tomohiro Hirano, Moriyuki Takamura(Fujitsu Laboratories LTD, Keiji Kimura, Hironori Kasahara

Poster Session, LCPC 2013, Qualcomm Research Silicon Valley

発表年月： 2013年09月
Parallel Processing of Multimedia Applications on TILEPro64

Yohei Kishimoto, Hiroki Mikami, Keiichi Nakano(Olympus Corpora, Akihiro Hayashi, Keiji Kimura, Hironori Kasahara

Poster Session, COOL Chips XVI, IEEE Symposium on Low Power and High-Speed Chips

発表年月： 2013年08月
OSCAR Parallelizing Compiler and Its Performance for Embedded Applications

Hironori Kasahara [招待有り]

13th International Forum on Embedded MPSoC and Multicore

発表年月： 2013年07月
パネルディスカッション「産学連携分野における起業及びその可能性について」

笠原博徳 [招待有り]

産学連携ベンチャーサミット－産学連携人材養成セミナープレイベント－, トーマツベンチャーサポート株式会社

発表年月： 2013年07月
新しいアプリケーション開拓への展望と課題（パネルディスカッション）

笠原博徳 [招待有り]

第195回計算機アーキテクチャ研究発表会

発表年月： 2013年01月
グリーン・コンピューティングに関する産学連携研究開発

笠原博徳 [招待有り]

第195回計算機アーキテクチャ研究発表会

発表年月： 2013年01月
Opportunities and Challenges of Application-Power Control in the Age of Dark Silicon

Dominic Hillenbrand, Yuuki Furuyama, Akihiro Hayashi, Keiji Kimura, Hironori Kasahara

Poster Session, The 8th HiPEAC conference, Berlin

発表年月： 2013年01月
グリーン・コンピューティング・システム研究開発センターでのマルチコア研究開発

笠原博徳 [招待有り]

EWE100周年記念イベント (Tokyo)

発表年月： 2012年11月
IT・エレクトロニクスの魅力と将来期待される人材像について（パネルディスカッション）

笠原博徳 [招待有り]

第4回 JEITA 産学連携シンポジウム IT・エレクトロニクスの将来と期待する人材像 (Tokyo)

発表年月： 2012年11月
グリーン・コンピューティングの将来と産業連携事例

笠原博徳 [招待有り]

第4回 JEITA 産学連携シンポジウム IT・エレクトロニクスの将来と期待する人材像 (Tokyo)

発表年月： 2012年11月
Green Computing Using Automatic Parallelizing and Power Reducing Compiler with Multiplatform API for Homogeneous and Heterogeneous Multicores

Hironori Kasahara [招待有り]

Illinois-Intel Parallelism Center at the University of Illinois at Urbana-Champaign I2PC Distinguished Speaker Series Seminar, (Illinois)

発表年月： 2012年10月
OSCAR Compiler and API for High Performance Low Power Multicores and Their Application to Smartphones, Automobiles, Medical Systems

Hironori Kasahara [招待有り]

Intel/Kai, Champaign, (Illinois)

発表年月： 2012年10月
Green Computing Systems Research and Development with Industry

Hironori Kasahara [招待有り]

工業技術研究院（ITRI）早稲田大学合同研究Workshop (Tokyo)

発表年月： 2012年10月
組込マルチコア用OSCAR APIを用いたTILEPro64 上て?のマルチメテ?ィアアフ?リケーションの並列処理

岸本耀平, 見神広紀, 中野恵一, 林明宏, 木村啓二, 笠原博徳

組込みシステムシンポジウム (ESS2012)

発表年月： 2012年10月
コンパイラレベルの低消費電力化

笠原博徳 [招待有り]

第43回STARCアドバンスト講座低消費電力化技術セミナー (Kawasaki)

発表年月： 2012年09月
生命を守る産業国際競争力を高めるグリーン・コンピューティング・システム

笠原博徳 [招待有り]

異業種TOP情報交換会 (Tokyo)

発表年月： 2012年07月
低消費電力マルチコアによるグリーン・コンピューティング

笠原博徳 [招待有り]

早稲田大学アドバンストマルチコアプロセッサ研究所・日立ITユーザ会共催, 2012年度第１回社会・公共システム分科会早稲田大学グリーン・コンピューティング・システム研究機構見学会 (Tokyo)

発表年月： 2012年07月
OSCAR Compiler for Automatic Parallelization and Power Reduction for Multicores and Manycores

Hironori Kasahara [招待有り]

12th International Forum on Embedded MPSoC and Multicore (Quebec)

発表年月： 2012年07月
メニーコアプロセッサのための自動並列化・電力制御コンパイラとAPI

笠原博徳 [招待有り]

NEDOメニーコアシンポジウム (Tokyo)

発表年月： 2012年03月
グリーンコンピューティングのためのマルチコア技術

笠原博徳 [招待有り]

2012年春季第59回応用物理学関係連合講演会特別企画シンポジウム, 早稲田大学 (Tokyo)

発表年月： 2012年03月
重粒子線がん治療用線量計算エンジンの自動並列化

林明宏, 松本卓司, 見神広紀, 木村啓二, 山本啓二, 崎浩典, 高谷保行, 笠原博徳

HPCS2012 - ハイパフォーマンスコンピューティングと計算科学シンポジウム

発表年月： 2012年01月
Multicore/Manycore Architectures and Software for Green Computing

Hironori Kasahara [招待有り]

The 34th Electrical Engineering Conference(EECON-34) (Pattaya)

発表年月： 2011年12月
Low Power Multicores, Parallelizing Compiler and Multiplatform API for Green Computing

Hironori Kasahara [招待有り]

Dasan Conference on "Green IT", The Korean Federation of Science and Technology Society (Jeju)

発表年月： 2011年11月
グリーン・コンピューティング・システム研究開発センター施設及び研究紹介

笠原博徳 [招待有り]

10月期イノベーション政策懇話会 (Tokyo)

発表年月： 2011年10月
Homogeneous and Heterogeneous Multicore / Manycore Processors, Parallelizing Compiler and Multiplatform API for Green Computing

Hironori Kasahara [招待有り]

Keynote Speech, MPSoC2011(11th International Forum on Embedded MPSoC and Multicore) (Beaune)

発表年月： 2011年07月
低消費電力リアルタイム処理用ホモジニアス／へテロジニアス・マルチコアと自動並列化コンパイラ及びマルチプラットフォーム用API

笠原博徳 [招待有り]

自動車技術会/計測自動制御学会, 第6回自動車制御とモデル研究専門委員会 (Tokyo)

発表年月： 2011年06月
グリーン・コンピューティング・システムの将来

笠原博徳 [招待有り]

早稲田大学グリーン・コンピューティング・システム研究開発センター開所記念シンポジウム：未来を拓くグリーンコンピューティング --環境にやさしい情報技術の将来にむけて-- (Tokyo)

発表年月： 2011年05月
OSCAR Low Power Manycores and Compiler and API for Exa-scale Supercomputing

Hironori Kasahara [招待有り]

Panel Discussion on GPUs for Climate models,Climate 13:The 13th International Specialist Meeting on the Next Generation Models of Climate Change and Sustainability for Advanced High Performance Computing Facilities (Hawaii)

発表年月： 2011年03月
ヘテロジニアスマルチコア向けソフトウエア開発フレームワーク及びAPI

Akihiro Hayashi, Yasutaka Wada, Takeshi Watanabe, Takeshi Sekiguchi, Masayoshi Mase, Jun Shirako, Keiji Kimura, Hironori Kasahara

日本情報処理学会 SACSIS2011-先進的計画基盤システムシンポジウム

発表年月： 2011年02月
Many-core Chip for Green Computing

Hironori Kasahara [招待有り]

8th International Workshop on Future Information Processing Technologies(IWFIPT) (Kyoto)

発表年月： 2010年10月
太陽電池駆動低消費電力マルチコア・メニーコアのハードウェアとソフトウェア

笠原博徳 [招待有り]

Bluespec User Group Meeting 2010 (Tokyo)

発表年月： 2010年07月
低消費電力高性能コンピュータの将来太陽電池で駆動できるマルチコア・メニーコアとソフトウェア

笠原博徳 [招待有り]

Hyperworks Technology Conference2010 (Tokyo)

発表年月： 2010年06月
OSCAR API for Real-time Low-Power Multicores

Keiji Kimura, Masayoshi Mase, Hiroki Mikiami, Takamichi Miyamoto, Jun Shirako, Hironori Kasahara [招待有り]

Waseda University Seoul National University Joint Workshop on Future Low Power Processor Architecture and Software (Tokyo)

発表年月： 2010年05月
OSCAR Low Power Multicores and Parallelizing Compiler for Performance and PowerReduction

Hironori Kasahara [招待有り]

Waseda University Seoul National University Joint Workshop on Future Low Power Processor Architecture and Software (Tokyo)

発表年月： 2010年05月
最先端低消費電力高性能プロセッサ技術のハードウェアとソフトウェア

笠原博徳 [招待有り]

ＥＷＥ三月会 (Tokyo)

発表年月： 2010年05月
NEDOメニーコア・プロセッサ技術(グリーンＩＴプロジェクト）の先導研究概要

笠原博徳 [招待有り]

低消費電力メニーコアプロセッサシステム技術シンポジウム (Tokyo)

発表年月： 2010年02月
低消費電力マルチコアのための並列化コンパイラ及びAPI

笠原博徳 [招待有り]

第35回ＳＴＡＲＣアドバンスト講座システムアーキテクチャー～マルチコアの将来像を探る『今後10年の技術戦略』～ (Tokyo)

発表年月： 2009年11月
最先端低消費電力コンピュータ（マルチコア・メニーコア）のハードウェアとソフトウェアの研究開発

笠原博徳 [招待有り]

早稲田電気工学会（ＥＷＥ） (Tokyo)

発表年月： 2009年11月
OSCAR Multicore Compiler and API for Low Power High Performance Computing

Hironori Kasahara

マイクロソフトリサーチ 21世紀コンピューティングカンファレンスポスタセッション

発表年月： 2009年11月
Compiler and API for Low Power High Performance Computing on Multicore and Manycore Processors

笠原博徳 [招待有り]

UPCRC Seminar hosted by Prof. Josep Torrrellas (Tokyo)

発表年月： 2009年10月
Future of Low Energy Computing Systems --- Low Power Multi-core and Many-core processors and Their Software ---

笠原博徳 [招待有り]

IEEE設立125周年テクニカルセミナ (Yokohama)

発表年月： 2009年10月
Roles of Parallelizing Compilers for Low Power Manycores”, Panel: "What do compiler optimizations mean for many-cores?"

笠原博徳 [招待有り]

The 22nd International Workshop on Languages and Compilers for Parallel Computing (LCPC09) (Illinois)

発表年月： 2009年10月
NEDO リアルタイム情報家電用マルチコア技術

早稲田大学(笠原・木村研究室), 日立製作所, ルネサステクノロジ

CEATEC JAPAN 2009, 幕張メッセ

発表年月： 2009年10月
太陽電池で駆動できる低消費電力マルチコアプロセッサとソフトウェア

笠原博徳 [招待有り]

早稲田大学2009年度第3回ＤＣＣ産学交流フォーラム (Tokyo)

発表年月： 2009年09月
OSCAR Parallelizing Compiler Cooperative Heterogeneous Multi-core Architecture

Akihiro Hayashi, Yasutaka Wada, Hiroaki Shikano, Teruo Kamiayama, Takeshi Watanabe, Takeshi Sekiguchi and Masayoshi Mase

The Eighteenth International Conference on Parallel Architectures and Compilation Techniques (PACT2009), Raleigh, North Carolina.

発表年月： 2009年09月
Multi-core API & Compiler Technology

Hironori Kasahara, Jun Shirako [招待有り]

The IEEE Computer Society 2009 Vail Computer Elements Workshop (Newark)

発表年月： 2009年06月
低消費電力マルチコアのための並列化コンパイラ及びAPI

笠原博徳 [招待有り]

情報処理学会 LSIとシステムのワークショップ2009「エネルギーと環境のためのLSIとシステム」 (Tokyo)

発表年月： 2009年05月
マルチコア上でのOSCAR APIを用いた並列化コンパイラによる低消費電力化手法

中川亮, 間瀬正啓, 白子準, 木村啓二, 笠原博徳

SACSIS2009 - 先進的計算基盤システムシンポジウム

発表年月： 2009年05月
NEDO リアルタイム情報家電用マルチコアの研究開発

早稲田大学(笠原・木村研究室), 日立製作所, ルネサステクノロジ

第12回組込みシステム開発技術展 (ESEC2009), 東京ビッグサイト

発表年月： 2009年05月
組み込みマルチコアが開く新市場とそれを支える並列コンパイラ技術の最前線

笠原博徳 [招待有り]

組み込みプロセッサ＆プラットホーム・ワークショップ2009 (Denver)

発表年月： 2009年04月
OSCAR Parallelizing Compiler and API for Low Power High Performance Multicores

Hironori Kasahara [招待有り]

The 11th International Specialist Meeting on The Next generation Models on Climate Change and Sustainability for Adavanced High-performance Computing Facilities (Climate Meeting 2009) (Tokyo)

発表年月： 2009年03月
低消費電力マルチコアプロセッサとソフトウェア技術

笠原博徳 [招待有り]

早稲田大学技術説明会 (Kitakyushu)

発表年月： 2009年03月
組込マルチコア用並列化コンパイラとAPIについて

笠原博徳 [招待有り]

トロン協会

発表年月： 2009年02月
Panel Discussions: Japanese Challenges for Multicore -Low Power High Performance Multicores,Compiler and API-

Hironori Kasahara [招待有り]

Intel Higher Education Program 2008 Asia Academic Forum

発表年月： 2008年10月
OSCAR Multicore Compiler for Low Power High Performance Computing

Hironori Kasahara

Intel Higher Education Program 2008 Asia Academic Forum

発表年月： 2008年10月
高性能ECOマルチコア・コンピュータ

笠原博徳・木村啓二研究室

テクノフェア早稲田

発表年月： 2008年10月
低炭素社会実現のためのマルチコア・テクノロジーと利用技術への挑戦

笠原博徳 [招待有り]

IBM HPCフォーラム 2008

発表年月： 2008年09月
低消費電力・高性能マルチコア技術

笠原博徳 [招待有り]

日本ヒートパイプ協会第27回総会・講演会

発表年月： 2008年07月
Multi-Core Technologies for Information Appliance (Parallelizing Compiler, Multi-Core API, 8CPU-LSI)

笠原博徳, 服部俊洋 [招待有り]

マイクロプロセッサ・フォーラム・ジャパン2008

発表年月： 2008年07月
Compiler Cooperative Heterogeneous Multicore Processor

Akihiro Hayashi, Yasutaka Wada, Hiroaki Shikano, Jun Shirako, Keiji Kimura, Hironori Kasahara

早稲田大学アンビエントGCOE 第2回国際シンポジウム「アンビエントSoCのナノテクノロジー、ITへの展開」

発表年月： 2008年07月
Compiler and API for Low Power High Performance Multicores

Hironori Kasahara [招待有り]

8th International Forum on Application-Specific Multi-Processor SoC (MpSoc '08)

発表年月： 2008年06月
OSCAR Low Power High Performance Multicore and Parallelizing Compiler

Hironori Kasahara [招待有り]

Nokia

発表年月： 2008年06月
情報家電用マルチコア上におけるマルチメディア処理のコンパイラによる並列化

宮本孝道, 浅香沙織, 見神広紀, 間瀬正啓, 木村啓二, 笠原博徳

SACSIS2008 - 先進的計算基盤システムシンポジウム

発表年月： 2008年05月
組込みマルチコア最先端並列化コンパイラ技術

笠原博徳 [招待有り]

第11回組込みシステム開発技術展（ESEC) 専門セミナー

発表年月： 2008年05月
OSCAR Multigrain Parallelizing Compiler for High Performance Low Power Multicores

Hironori Kasahara [招待有り]

The 14th Workshop on Compiler Techniques for High-Performance Computing(CTHPC2008)

発表年月： 2008年05月
Panel Discussions: Multi-Core and Many-Core: the 5 to 10 Year View

Hironori Kasahara [招待有り]

IEEE Symposium on Low-Power and High-Speed Chips COOLChips XI

発表年月： 2008年04月
Multicore Compiler for Low Power High Performance Embedded Computing

Hironori Kasahara [招待有り]

IEEE Symposium on Low-Power and High-Speed Chips COOLChips XI, Yokohama, Japan

発表年月： 2008年04月
Developed multicore was introduced in the CSTP at the Prime Minister's office

早稲田大学(笠原・木村研究室), 日立製作所, ルネサステクノロジ

Council for Science and Technology Policy 74th session

発表年月： 2008年04月
A Multigrain Parallelizing Compiler with Power Control for Multicore Processors

Hironori Kasahara [招待有り]

Google Headquarter, Hosted by Dr. Shih-wei Liao

発表年月： 2008年02月
A Multigrain Parallelizing Compiler with Power Control for Multicore Processors

Hironori Kasahara [招待有り]

Intel Headquarter, Hosted by Dr. Peng Tu

発表年月： 2008年02月
高性能低消費電力マルチコアのための最先端並列化コンパイラ技術

笠原博徳 [招待有り]

VDECリフレッシュ・セミナー

発表年月： 2008年01月
低消費電力・高性能マルチコアとコンパイラ技術

笠原博徳 [招待有り]

第５回Technology Link in W.T.L.O ～産学連携における国際化拠点の構築に向けて～

発表年月： 2007年10月
並列化コンパイラ協調型マルチコア技術簡単に使える高性能・低消費電力・高付加価値マルチコアプロセッサ

笠原博徳, 木村啓二

第５回Technology Link in W.T.L.O ～産学連携における国際化拠点の構築に向けて～

発表年月： 2007年10月
How is specifically multicore programming different from traditional parallel computing?", Panel Discussion on "How is specifically multicore programming different from traditional parallel computing?

Hironori Kasahara [招待有り]

The 20th International Workshop on Languages and Compilers for Parallel Computing (LCPC2007) Siebel Center for Computer Science Urbana, Illinois (Illinois)

発表年月： 2007年10月
A Multi-core Parallelizing Compiler for Low-Power High-Performance Computing

Hironori Kasahara [招待有り]

Colloquium Electrical and Computer Engineering, Computer and Information Technology Institute, Computer Science, and Dean of Engineering

発表年月： 2007年10月
情報家電用マルチコアSMP実行モードにおける制約付きCプログラムのマルチグレイン並列化

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 宮本孝道, 白子準, 中野啓史, 木村啓二, 笠原博徳

組込みシステムシンポジウム2007

発表年月： 2007年10月
マルチコア・イノベーション

笠原博徳 [招待有り]

早稲田大学125周年・理工学部100周年記念シンポジウム “イノベーティブ情報・電子・光技術”

発表年月： 2007年09月
Power-Aware Compiler Controllable Heterogeneous Chip Multiprocessor

Hiroaki Shikano, Jun Shirako, Yasutaka Wada, Keiji Kimura, Hironori Kasahara

The Sixteenth International Conference on Parallel Architectures and Compilation Techniques (PACT 2007), Brasov, Romania

発表年月： 2007年09月
最先端の組み込みマルチコア用コンパイラ技術

笠原博徳 [招待有り]

DAシンポジウム2007 －システムLSI設計技術とDA －

発表年月： 2007年08月
C Language Support in OSCAR Multigrain Parallelizing Compiler using CoSy

Masayoshi Mase, Keiji Kimura, Hironori Kasahara [招待有り]

ACE 2nd CoSy Community Gathering

発表年月： 2006年10月
最先端マルチコアコンパイラとその並列化・低消費電力化性能

笠原博徳 [招待有り]

アーム株式会社 ARMセミナー2006

発表年月： 2006年10月
最先端のコンピュータアーキテクチャ－経済産業省／ＮＥＤＯリアルタイム情報家電用マルチコアプロジェクトを中心として－

笠原博徳 [招待有り]

東京電力EWE講演会2006

発表年月： 2006年10月
Multi-core Parallelizing Compiler for Low Power High Performance Computing

Hironori Kasahara [招待有り]

University of Illinois at Urbana-Champaign, Hosted by Prof. David Padua

発表年月： 2006年10月
並列化コンパイラ協調型チップマルチプロセッサ技術

笠原博徳, 木村啓二, 白子準, 和田康孝, 中野啓史, 宮本孝道

STARCシンポジウム2006

発表年月： 2006年09月
Software Challenges in Multi-Core Chip Era (Panel Discussion)

Guang R. Gao, Kasahara Hironori, Vivek Sarkar, Skevos Evripidou, Murphy Brian [招待有り]

Workshop on Software Challenges for Multicore Architectures

発表年月： 2006年09月
OSCAR Multigrain Parallelizing Compiler for Multicore Architectures

Hironori Kasahara [招待有り]

Workshop on Software Challenges for Multicore Architectures

発表年月： 2006年09月
並列化コンパイラの最新動向

笠原博徳 [招待有り]

日本IBM 先駆的科学計算に関するフォーラム2006

発表年月： 2006年08月
情報家電用マルチコアと並列化コンパイラ

笠原博徳 [招待有り]

JEITAマイクロプロセッサ専門委員会講演会「マルチコアアーキテクチャの研究開発動向及び将来展望」

発表年月： 2006年08月
イノベーション創出を目指した産官学連携と人材育成の試み（「イノベーションの創出に向けた産学官連携の推進と人材の育成」パネリスト）

笠原博徳 [招待有り]

第５回産学官連携推進会議分科会

発表年月： 2006年06月
マルチコアプロセッサにおけるコンパイラ制御低消費電力化手法

白子準, 吉田宗広, 押山直人, 和田康孝, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

SACSIS2006 - 先進的計算基盤システムシンポジウム

発表年月： 2006年05月
マルチCPUアーキテクチャと並列化コンパイラ技術の動向（コンスーマー機器への応用）

笠原博徳 [招待有り]

ソニー株式会社技術講演会

発表年月： 2006年05月
並列化コンパイラ協調型低消費電力・高実効性能マルチコアプロセッサの動向

笠原博徳 [招待有り]

情報処理学会第158回計算機アーキテクチャ研究会（SHINING 2006）

発表年月： 2006年01月
並列化コンパイラ協調型チップマルチプロセッサ技術

笠原博徳, 木村啓二, 中野啓史, 白子準, 宮本孝道, 和田康孝

STARCシンポジウム2005

発表年月： 2005年09月
組み込みマルチコア用コンパイラ技術

笠原博徳 [招待有り]

アーム株式会社 ARMセミナー2005

発表年月： 2005年06月
最先端の高性能コンピュータ

笠原博徳 [招待有り]

文部科学省科学技術振興調整費新興分野人材養成プログラム「ナノ・IT・バイオ知財経営戦略スキルアッププログラム」特別講座「先端技術と知的財産①ナノ・IT編」

発表年月： 2005年05月
コンピュータ分野のロードマップ

笠原博徳 [招待有り]

NEDO 電子・情報技術ロードマップ成果報告会

発表年月： 2005年05月
チップマルチプロセッサ上でのマルチグレイン並列処理

和田康孝, 白子準, 宮本孝道, 中野啓史, 小高剛, 石坂一久, 木村啓二, 笠原博徳

EDS Fair 2005

発表年月： 2005年01月
HPC用自動並列化コンパイラの動向と将来課題

笠原博徳 [招待有り]

第１９回ＮＥＣ・ＨＰＣ研究会

発表年月： 2004年11月
世界一のコンパイラを作る--アドバンスト並列化コンパイラプロジェクト--

笠原博徳 [招待有り]

IBMライフサイエンス天城セミナー

発表年月： 2004年09月
150回研究会記念特別企画（２）パネル討論：アーキテクチャ研究の将来 “産官学連携による高付加価値チップマルチプロセッサの開発”

笠原博徳 [招待有り]

第150回計算機アーキテクチャ研究会

発表年月： 2004年05月
IBM pSeries 690 上での OSCAR マルチグレイン自動並列化コンパイラの性能評価

石坂一久, 白子準, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会第66回全国大会

発表年月： 2004年03月
Software Development on Large Parallel Supercomputers in Japan -- Parallelizing Compilers and Parallel Programming Language Projects --

H. Kasahara [招待有り]

U.S.-Japan Forum on the Future of Supercomputing, 米国工学アカデミー、(社)日本工学アカデミー

発表年月： 2004年03月
ミレニアムプロジェクトIT21アドバンスト並列化コンパイラとコンパイラ協調型チップマルチプロセッサ

笠原博徳 [招待有り]

NECソフト㈱第四回ＶＴＣ先端領域セミナー

発表年月： 2004年02月
ミレニアムプロジェクトIT21 アドバンスト並列化コンパイラ

笠原博徳 [招待有り]

(社)情報処理学会関西支部大会

発表年月： 2003年10月
ミレニアムプロジェクトIT21”アドバンスト並列化コンパイラ”とコンパイラ協調型チップマルチプロセッサ

笠原博徳 [招待有り]

㈱ルネサステクノロジ、㈱日立製作所第2回 Super H オープンフォーラム

発表年月： 2003年08月
ＩＴ競争力強化のための研究開発人材---経済産業省アドバンスト並列化コンパイラプロジェクトリーダ,JEITA及びSTARC産官学連携講座の経験を通して---

笠原博徳 [招待有り]

経済産業省大臣官房イノベーション・システムにおける研究開発人材に関する研究会

発表年月： 2003年04月
Multigrain Parallelizing Compiler for Chip Multiprocessors to High Performance Severs

H. Kasahara [招待有り]

Intel ICRC

発表年月： 2002年10月
NEDO-1 アドバンスト並列化コンパイラ技術

笠原博徳 [招待有り]

情報処理学会・電子情報通信学会ＦＩＴ (Forum on Information Technology), 大型プロジェクト紹介（国家プロジェクト紹介）

発表年月： 2002年09月
Multigrain Automatic Parallelization in Japanese Millenium Project IT21 Advanced Parallelizing Compiler

H. Kasahara, M. Obata, K. Ishizaka, K. Kimura, H. Kaminaga, H. Nakano, K. Nagasawa, A. Murai, H. Itagaki, J. Shirako [招待有り]

Proc. of IEEE PARELEC (IEEE International Conference on Parallel Computing in Electrical Engineering)

発表年月： 2002年09月
OSCAR Multigrain Parallelizing Compiler for Chip Multiprocessors to High Performance Severs

H. Kasahara [招待有り]

Polish-Japanese Institute of Information Technology (PJIIT) hosted by Prof. Marek Tudruj

発表年月： 2002年09月
Multigrain Parallel Processing in Japanese Millennium Project IT21 'Advanced Parallelizing Compiler'

H. Kasahara [招待有り]

Distinguished Lecture ECE Graduate Seminar hosted by Prof. Rudolf Eigenmann

発表年月： 2002年09月
Performance of Multigrain Parallelization in Japanese Millennium Project IT21 'Advanced Parallelizing Compiler'

H. Kasahara [招待有り]

Computer Engineering Seminar hosted by Prof. David Padua

発表年月： 2002年09月
ミレニアムプロジェクトIT21アドバンスト並列化コンパイラにおけるマルチグレイン並列処理

笠原博徳 [招待有り]

自律分散システム研究会

発表年月： 2002年08月
Multigrain Parallelization in Japanese Millennium Project IT21 'Advanced Parallelizing Compiler'

H. Kasahara [招待有り]

Chinese Academy of Science (ICT)

発表年月： 2002年07月
シングルチップマルチプロセッサにおける JPEGエンコーディングのマルチグレイン並列処理

小高剛, 内田貴之, 木村啓二, 笠原博徳

情報処理学会並列処理シンポジウム(JSPP2002)

発表年月： 2002年05月
自動並列化コンパイラ協調型シングルチップ・マルチプロセッサの研究

笠原博徳

JEITA/EDS Fair 2002

発表年月： 2002年01月
Future of Automatic Parallelizing Compiler

H. Kasahara [招待有り]

The 14th International Workshop on Languages and Compilers for Parallel Computing (LCPC'01) Panel: Future of Languages and Compilers

発表年月： 2001年08月
OSCAR Single Chip Multiprocessor and Multigrain Parallelizing Compiler

H. Kasahara [招待有り]

IEEE International Workshop on Advanced Compiler Technology for High Performance and Embedded Systems (IWACT 2001) Panel : New Architecture and Their Compilers

発表年月： 2001年07月
マルチグレイン並列処理用シングルチップマルチプロセッサにおけるデータ転送ユニットの検討

宮下直久, 木村啓二, 小高剛, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
近細粒度並列処理に適したシングルチップマルチプロセッサのメモリアーキテクチャの評価

松元信介, 木村啓二, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
マルチメディアアプリケーションのシングルチップマルチプロセッサ上での近細粒度並列処理

小高剛, 木村啓二, 宮下直久, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
メモリ容量を考慮したプレロード・ポストストアスケジューリングアルゴリズムの評価

田中崇久, 舟山洋央, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
マルチプロセッサシステム上でのキャッシュ最適化を考慮した粗粒度タスクスタティックスケジューリング手法

中野啓史, 石坂一久, 小幡元樹, 木村啓二, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
データマイニングツールdataFORESTを用いた異機種分散計算機環境におけるプロセッサ負荷予測

茂田有己光, 林拓也, 小出洋, 鹿島亨, 筒井宏明, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
異機種分散計算機環境におけるOSCARマルチグレイン並列化コンパイラを用いたメタスケジューリング手法

林拓也, 茂田有己光, 小出洋, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
標準タスクグラフセットを用いたデータ転送オーバーへッドを考慮したスケジューリングアルゴリズムの性能評価

山口高弘, 田中雄一, 飛田高雄, 笠原博徳

情報処理学会第62回全国大会

発表年月： 2001年03月
OSCARマルチグレイン並列化コンパイラとシングルチップ・マルチプロセッサ

笠原博徳 [招待有り]

京都大学大型計算機センター研究開発部第66回研究セミナー

発表年月： 2001年03月
アドバンスト並列化コンパイラ技術研究開発の概要

笠原博徳 [招待有り]

経済産業省・NEDOミレニアムプロジェクト

発表年月： 2001年01月
Multigrain Parallel Processing Model for Future Single Chip Multiprocessor Systems

H. Kasahara [招待有り]

ISHPC2000, Panel "Programming Models for New Architectures"

発表年月： 2000年10月
OSCAR Multigrain Parallelizing Compiler and Single Chip Multiprocessor

H. Kasahara [招待有り]

University of Illinois at Urbana-Champaign, Hosted by Prof. David Padua

発表年月： 2000年10月
モデレータ, スーパーパネル”ペタプロップスへの道”

笠原博徳 [招待有り]

情報処理学会, 2000年記念並列処理シンポジウム JSPP2000

発表年月： 2000年06月
メタスケジューリングのための資源情報サーバの構築

小出洋, 山岸信寛, 武宮博, 林拓也, 引田雅之, 笠原博徳

計算工学講演会論文集Vol. 5

発表年月： 2000年05月
標準タスクグラフセットを用いたマルチプロセッサスケジューリングアルゴリズムの性能評価

飛田高雄, 笠原博徳

情報処理学会2000年記念並列処理シンポジウム(JSPP2000)論文集

発表年月： 2000年05月
配列間接アクセスを用いないコード生成法による電子回路シミュレーションの高速化

間中邦之, 刑部亮, 前川仁孝, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
SMP上での有限要素・境界要素法併用法による電磁界解析アプリケーション並列処理

金子大作, 小幡元樹, 若尾真治, 小貫天, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
シングルチップマルチプロセッサの近細粒度並列処理に対する性能評価

加藤考幸, 尾形航, 木村啓二, 内田貴之, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
メモリ容量を考慮したデータプレロード・マルチプロセッサスケジューリング

増田高史, 飛田高雄, 舟山洋央, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
マルチグレイン並列処理における階層的並列処理のためのプロセッサクラスタリング決定手法

山本正行, 山本晃正, 小幡元樹, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
OpenMPを用いたマルチグレイン並列処理の実現

石坂一久, 小幡元樹, 瀧康太郎, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
解析時インライニングを用いたマルチグレイン自動並列化手法

吉井謙一郎, 松井巌徹, 小幡元樹, 熊澤慎也, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
データ依存のみを持つ任意形状のマクロタスクグラフに対するデータローカライゼーション手法

成清暁博, 八木哲志, 松崎秀則, 小幡元樹, 吉田明正, 笠原博徳

情報処理学会第60回全国大会

発表年月： 2000年03月
並列分散科学技術計算の支援環境-SSP-

武宮博, 太田浩史, 今村俊幸, 小出洋, 松田勝之, 樋口健二, 平山俊雄, 笠原博徳

計算工学講演会論文集

発表年月： 1999年05月
最早実行可能条件解析を用いたキャッシュ最適化手法

稲石大祐, 木村啓二, 藤本謙作, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会

発表年月： 1999年03月
処理とデータ転送のオーバーラップのための自動並列化手法

古郷誠, 田中崇久, 藤本謙作, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会

発表年月： 1999年03月
OSCARマルチグレイン並列化コンパイラを用いたスーパーコンピュータクラスタのためのメタ・スケジューリング手法

村杉明夫, 林拓也, 飛田高雄, 小出洋, 笠原博徳

情報処理学会第58回全国大会

発表年月： 1999年03月
マルチグレイン並列処理におけるサブルーチンを含むデータローカライゼーション手法

宇治川泰史, 成清暁博, 小幡元樹, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会

発表年月： 1999年03月
OSCARマルチグレイン並列化コンパイラにおける階層的並列処理手法

山本晃正, 稲石大祐, 宇治川泰史, 小幡元樹, 岡本雅巳, 笠原博徳

情報処理学会第58回全国大会

発表年月： 1999年03月
OSCAR Scalable Multigrain Parallelizing Compiler for Single Chip Multiprocessors to A Cluster of Supercomputers

H. Kasahara [招待有り]

Hosted by Prof. David Padua, University of Illinois at Urbana-Champaign

発表年月： 1998年10月
階層型マクロデータフロー処理における同一階層内ループ間データローカライゼーション手法

吉田明正, 越塚健一, 岡本雅巳, 小幡元樹, 笠原博徳

情報処理学会並列処理シンポジウムJSPP '98論文集

発表年月： 1998年06月
実用的並列最適化マルチプロセッサスケジューリングアルゴリズム PDF/IHS の大規模問題への適用と性能評価

飛田高雄, 笠原博徳

情報処理学会並列処理シンポジウムJSPP '98論文集

発表年月： 1998年06月
並列分散科学技術計算環境STA(4)─異機種並列計算機の統合利用環境の構築

今村俊幸, 太田浩史, 川崎啄治, 小出洋, 武宮博, 樋口健二, 久野章則, 笠原博徳, 相川裕史

計算工学講演会論文集

発表年月： 1998年05月
並列分散科学技術計算環境STA(3)─異機種並列計算機間通信ライブラリの構築

小出洋, 今村俊幸, 太田浩史, 川崎啄治, 武宮博, 樋口健二, 笠原博徳, 相川裕史

計算工学講演会論文集

発表年月： 1998年05月
並列分散科学技術計算環境STA(2)─エディタを中心に統合された並列プログラム開発環境PPDEの構築

太田浩史, 今村俊幸, 川崎啄治, 小出洋, 武宮博, 樋口健二, 笠原博徳, 相川裕史

計算工学講演会論文集

発表年月： 1998年05月
並列分散科学技術計算環境STA(1)─目的及び概要─

武宮博, 今村俊幸, 太田浩史, 川崎琢治, 小出洋, 笠原博徳, 相川裕史

計算工学講演会論文集

発表年月： 1998年05月
マルチグレイン並列化コンパイラとそのアーキテクチャ支援

笠原博徳 [招待有り]

社団法人電子情報通信学会, 信学技報, ICD98-10, CPSY98-10, FTS98-10

発表年月： 1998年04月
異機種並列分散コンピューティングのためのメタ・スケジューリングの構想

小出洋, 武宮博, 今村俊幸, 太田浩史, 川崎琢治, 樋口健二, 笠原博徳, 相川裕史

情報処理学会第56回全国大会

発表年月： 1998年03月
マクロタスク最早実行可能条件解析を用いたキャッシュ最適化手法

稲石大祐, 木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会

発表年月： 1998年03月
マルチグレイン並列処理用シングルチップマルチプロセッサアーキテクチャ

木村啓二, 尾形航, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会

発表年月： 1998年03月
科学技術計算プログラムにおけるマルチグレイン並列性の評価

小幡元樹, 松井巌徹, 松崎秀則, 木村啓二, 稲石大裕, 宇治川泰史, 山本晃正, 岡本雅巳, 笠原博徳

情報処理学会第56回全国大会

発表年月： 1998年03月
マルチグレイン並列処理におけるインタープロシージャ解析

松井巌徹, 岡本雅巳, 松崎秀則, 小幡元樹, 吉井謙一郎, 笠原博徳

情報処理学会第56回全国大会

発表年月： 1998年03月
一般的なマクロタスクグラフに対するループ間データローカライゼーション手法

松崎秀則, 吉田明正, 岡本雅巳, 松井巌徹, 小幡元樹, 宇治川泰史, 笠原博徳

情報処理学会第56回全国大会

発表年月： 1998年03月
２１世紀へ向けたＨＰＣにおける日本-ＥＵ技術移転と協力

笠原博徳 [招待有り]

教育・科学技術に関する日本・ＥＵ協力会議ラウンドテーブル論文集（学術講演）

発表年月： 1997年09月
電磁界解析における有限要素・境界要素併用法の並列処理

小幡元樹, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

電気学会電子・情報・システム部門大会講演論文集

発表年月： 1997年08月
階層型マクロデータフロー処理におけるデータローカライゼーション手法

越塚健一, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
階層型マクロデータフローのためのダイナミック/スタティック併用スケジューリング手法

桐原正樹, 岡本雅巳, 赤鹿秀樹, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
実行時間最小・実用的並列最適化マルチプロセッサ・スケジューリング・アルゴリズムの大規模問題への適用

飛田高雄, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
マルチプロセッサシステム上でのCFDの並列処理に関する研究

柳川慎, 橋本茂, 前川仁孝, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
電磁界解析のための有限要素・境界要素併用法の並列処理

小幡元樹, 前川仁孝, 坂本哲也, 若尾真治, 小貫天, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
マクロデータフロー処理における処理とデータ転送のオーバーラップ

橋本茂, 藤本謙作, 岡本雅巳, 笠原博徳

情報処理学会第54回全国大会

発表年月： 1997年03月
データ転送と処理のオーバーラップを考慮したヒューリスティックマルチプロセッサスケジューリングアルゴリズムの最適化アルゴリズムを用いた性能評価

角谷清司, 橋本茂, 笠原博徳

1996年電子情報通信学会春季大会講演論文集

発表年月： 1996年03月
電力系統過渡安定度計算の階層的並列処理手法

西川健, 前川仁孝, 中野恵一, 笠原博徳

情報処理学会第52回全国大会

発表年月： 1996年03月
有限要素法と境界要素法を利用した電磁界解析の並列処理

坂本哲也, 前川仁孝, 若尾真治, 小貫天, 笠原博徳

情報処理学会第52回全国大会

発表年月： 1996年03月
マルチプラットフォーム・マクロデータフローコンパイラの開発

安田泰勲, 合田憲人, 岩井啓輔, 岡本雅巳, 笠原博徳

情報処理学会第52回全国大会

発表年月： 1996年03月
データ転送と処理のオーバーラップを用いたデータ転送最小化自動並列化コンパイラ

藤本謙作, 橋本茂, 笠原博徳

情報処理学会第52回全国大会

発表年月： 1996年03月
階層型マクロデータフロー処理のためのマクロタスクスケジューリング手法

赤鹿秀樹, 岡本雅巳, 宮沢稔, 安田泰勲, 笠原博徳

情報処理学会第52回全国大会

発表年月： 1996年03月
ソーテッドコードブックベクトル量子化の並列処理

中野恵一, 笠原博徳

JSPP'95 論文集

発表年月： 1995年05月
OSCAR Fortran Multigrain Compiler

H. Kasahara [招待有り]

Stanford University, Hosted by Professor John L. Hennessy and Professor Monica Lam

発表年月： 1995年05月
マルチグレイン並列処理用アーキテクチャシミュレータの概要

太田昌人, 尾形航, 笠原博徳

電子情報通信学会1995年総合大会

発表年月： 1995年03月
リカレントニューラルネットワークにおける学習の並列処理

芹沢一, 前川仁孝, 中野恵一, 笠原博徳

電子情報通信学会1995年総合大会

発表年月： 1995年03月
電子回路シミュレーションの粗粒度/近細粒度並列処理手法

伊藤泰樹, 前川仁孝, 高井峰生, 西川健, 笠原博徳

情報処理学会第50回全国大会

発表年月： 1995年03月
商用共有メモリ型マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

岩崎清, 合田憲人, 笠原博徳, 成田誠之助

情報処理学会第50回全国大会

発表年月： 1995年03月
自動並列化コンパイラにおけるデータプレロード・ポストストアを用いたデータ転送オーバヘッドの隠蔽

藤本謙作, 笠原博徳

情報処理学会第50回全国大会

発表年月： 1995年03月
マルチグレイン並列処理におけるデータローカライゼーションのための近細粒度タスクスケジューリング

吉田明正, 尾形航, 岡本雅巳, 合田憲人, 笠原博徳

情報処理学会第50回全国大会

発表年月： 1995年03月
無同期近細粒度並列処理における並列コードスケジューリング

尾形航, 太田昌人, 吉田明正, 岡本雅巳, 笠原博徳

情報処理学会第50回全国大会

発表年月： 1995年03月
Array Subscript Bit Vector 表示によるデータ依存解析手法

山下浩一郎, 安田泰勲, 宮沢稔, 笠原博徳

情報処理学会第50回全国大会

発表年月： 1995年03月
粗粒度並列処理におけるDoall/シーケンシャルループ間データローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 山下浩一郎, 笠原博徳

情報処理学会第49回全国大会

発表年月： 1994年09月
マルチグレイン並列処理におけるデータローカライゼーション手法

吉田明正, 前田誠司, 尾形航, 笠原博徳

情報処理学会並列処理シンポジウム,JSPP'94論文集

発表年月： 1994年05月
分散共有メモリ型マルチプロセッサシステムにおけるデータ転送と処理のオーバーラップスケジューリング手法

平山直紀, 藤原和典, 笠原博徳

1994年電子情報通信学会春季全国大会

発表年月： 1994年03月
プロセッサ間通信を考慮した実行時間最小マルチプロセッサスケジューリングアルゴリズム

野沢幸輝, 笠原博徳

1994年電子情報通信学会春季全国大会

発表年月： 1994年03月
マクロデータフロー処理のためのジョブスケジューリング手法

合田憲人, 笠原博徳, 成田誠之助

情報処理学会第48回全国大会

発表年月： 1994年03月
主記憶共有型マルチプロセッサシステム上でのマクロデータフロー処理の性能評価

松本健, 合田憲人, 岩崎清, 笠原博徳

情報処理学会第48回全国大会

発表年月： 1994年03月
階層型マクロデータフロー処理におけるサブルーチン並列処理手法

宮沢稔, 岡本雅巳, 笠原博徳

情報処理学会第48回全国大会

発表年月： 1994年03月
マルチグレイン並列処理におけるタスク融合を用いたデータローカライゼション手法

前田誠司, 吉田明正, 笠原博徳

情報処理学会第48回全国大会

発表年月： 1994年03月
OSCARアプリケーション専用目的コンパイラにおける超階層マクロデータフロー処理

黒田泰, 田村光雄, 前川仁孝, 笠原博徳

情報処理学会第48回全国大会

発表年月： 1994年03月
自動並列化コンパイラ

笠原博徳 [招待有り]

情報処理学会超並列計算機の現状と将来シンポジウム

発表年月： 1994年02月
スタティックスケジューリングを用いたマルチプロセッサシステム上の無同期細粒度並列処理

尾形航, 吉田明正, 合田憲人, 岡本雅巳, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'93論文集

発表年月： 1993年05月
実行開始条件による並列性検出手法ループへの拡張

本多弘樹, 合田憲人, 岡本雅巳, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'93論文集

発表年月： 1993年05月
OSCARマルチグレインコンパイラにおける階層型マクロデータフロー処理手法

岡本雅巳, 合田憲人, 宮沢稔, 笠原博徳, 本多弘樹

情報処理学会並列処理シンポジウムJSPP'93論文集

発表年月： 1993年05月
並列コンピュータの動向

笠原博徳 [招待有り]

日本機械学会第70期総会先端技術フォーラム

発表年月： 1993年04月
OSCAR Multigrain Parallelizing compiler and Its Performance

H. Kasahara [招待有り]

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor Rudolf Eigenmann

発表年月： 1992年08月
近細粒度タスクを用いた電子回路シミュレーションの並列処理

前川仁孝, 田村光雄, W. Premchaiswadi, 笠原博徳, 成田誠之助

情報処理学会並列処理シンポジウムJSPP'92

発表年月： 1992年06月
並列計算機の実用化・商用化を逡巡させる諸要因とは？並列化コンパイラの現状と将来 (パネルディスカッション)

笠原博徳 [招待有り]

情報処理学会並列処理シンポジウムJSPP'92

発表年月： 1992年06月
Multi-grain Parallelizing Compiler and Its Performance

H. Kasahara [招待有り]

Third Workshop on Compilers for Parallel Computers, Panel: How good are parallelizing compilers in practice?

発表年月： 1992年06月
Fortran Multigrain Compiler for a Multiprocessor OSCAR

H. Kasahara [招待有り]

Rice University, Hosted by Professor Ken Kennedy

発表年月： 1991年10月
並列コンピュータの最新動向

笠原博徳 [招待有り]

ソニーコンピューターフェア'90

発表年月： 1991年06月
将来の並列処理のあるべき姿いま何をすべきか(パネルディスカッション)

笠原博徳 [招待有り]

情報処理学会並列処理シンポジウムJSPP'91

発表年月： 1991年05月
並列コンパイラの諸技術

笠原博徳 [招待有り]

電子情報通信学会第4回回路とシステム軽井沢ワークショップ論文集

発表年月： 1991年04月
マルチプロセッサシステムの動向

笠原博徳 [招待有り]

電子情報通信学会第4回回路とシステム軽井沢ワークショップ論文集

発表年月： 1991年04月
ロボット制御・シミュレーションの並列処理

H. Kasahara [招待有り]

計測自動制御学会SICE'88

発表年月： 1989年07月
OSCAR Fortran Compiler

H. Kasahara [招待有り]

IBM T. J. Watson Research Center, Hosted by Dr. Vivek Sarker

発表年月： 1989年07月
Parallel Processing of Robot Control and Simulation

H. Kasahara, S. Narita [招待有り]

Proc. Workshop on Parallel Algorithm of IEEE Conf. on Robotics and Automation

発表年月： 1989年05月
Fortran Macro-dataflow processing

H. Kasahara [招待有り]

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor David Padua

発表年月： 1989年04月
Parallel Processing of Real-time Dynamic Systems Simulation on OSCAR (Optimally SCheduled Advanced multiprocessoR)

H. Kasahara, H. Honda, S. Narita [招待有り]

Proc. 3rd NASA NSF DOD Conf. on Aerospace Computational Control

発表年月： 1989年04月
汎用マルチプロセッサシステムOSCARのアーキテクチャ

笠原博徳, 本多弘樹, 成田誠之助, 橋本親

情報処理学会コンピュータシンポジウム論文集

発表年月： 1989年02月
階層型挟み打ち探索法を用いたProlog OR並列処理

小林和男, 笠原博徳, 甲斐宗徳

情報処理学会並列処理シンポジウムJSPP'89論文集

発表年月： 1989年02月
階層型マルチプロセッサシステムOSCAR上でのFortran並列処理手法

本多弘樹, 広田雅一, 笠原博徳

情報処理学会並列処理シンポジウムJSPP'89論文集

発表年月： 1989年02月
OSCAR(Optimally Scheduled Advanced Multiprocessor)上での連続システムシミュレーションの並列処理

笠原博徳 [招待有り]

計測自動制御学会システムシンポジウム講演論文集

発表年月： 1988年08月
Multiprocessor Scheduling Algorithms and Parallel Processing

H. Kasahara [招待有り]

Erlangen-Nurnberg University, Hosted by Prof. Wolfgang Handler

発表年月： 1987年07月
Multiprocessor Scheduling Algorithms and Their application to Supercomputing

H. Kasahara [招待有り]

CSRD, University of Illinois at Urbana-Champaign, Hosted by Professor David Kuck

発表年月： 1985年12月
マルチプロセッサ・スケジューリング・アルゴリズムとその実システムの応用

笠原博徳, 甲斐宗徳, 成田誠之助

第7回情報処理論とその応用研究会

発表年月： 1984年11月
ロボット制御計算の並列処理

笠原博徳, 成田誠之助

第9回ロボット及び応用システム・シンポジウム

発表年月： 1984年10月
分散制御システムにおける負荷分割, 資源割り当て, 及びスケジューリング手法

笠原博徳, 成田誠之助

電気四学会連合大会

発表年月： 1982年11月

▼全件表示

共同研究・競争的資金等の研究課題

組み込みマルチコアプロセッサ向け自動並列化技術の開発

M社

研究期間:

2021年04月

-

2022年03月
コンパイラ「OSCAR」を用いた自動並列化技術と省電力化技術の適用による第一原理計算シミュレーションの評価

H社

研究期間:

2021年02月

-

2021年03月
組み込みマルチコアプロセッサ向け自動並列化技術の開発

M社

研究期間:

2020年

-

2021年
深層学習における推論処理の高速化・低消費電力化に関する研究

NT社

研究期間:

2020年

-

2021年
高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発／革新的AIエッジコンピューティング技術の開発／動的多分岐・結合トレース型ＡＩプロセッサのエコシステム開発配分額3,897,000円

NSI社

研究期間:

2020年

-

2021年
多粒子ビームの高速軌道解析アルゴリズム

H社

研究期間:

2020年

-

2021年
磁場中線量分布解析の高精度化

H社

研究期間:

2020年

-

2021年
深層学習における推論処理の高速化・軽量化に関する研究配分額3,000,000円

NT社

研究期間:

2019年

-

2020年
高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発／革新的AIエッジコンピューティング技術の開発／動的多分岐・結合トレース型ＡＩプロセッサのエコシステム開発配分額3,897,000円

NSI社

研究期間:

2019年

-

2020年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,500,000円

D社

研究期間:

2019年

-

2020年
遺伝的アルゴリズム（GA：Genetic Algorithm)の高速化に向けた検討配分額2,000,000円

H社

研究期間:

2019年

-

2020年
荷電粒子シミュレーション計算の高速化に関する共同研究配分額2,200,000円

H社

研究期間:

2019年

-

2020年
自動並列化コンパイラの研究配分額2,200,000円

N社

研究期間:

2019年

-

2020年
マルチコアプロセッサ用並列化コンパイラの機能拡張に係る研究配分額5,250,000円

OT社

研究期間:

2019年

-

2020年
高効率・高速処理を可能とするAIチップ・次世代コンピューティングの技術開発／革新的AIエッジコンピューティング技術の開発／動的多分岐・結合トレース型ＡＩプロセッサのエコシステム開発配分額3,823,000円

NSI社

研究期間:

2018年

-

2019年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,500,000円

D社

研究期間:

2018年

-

2019年
車載制御・信号処理向け並列コンパイラ及びベクトル演算システムの研究(2) 配分額2,160,000円

R社

研究期間:

2018年

-

2019年
自動並列化コンパイラの研究配分額2,160,000円

N社

研究期間:

2018年

-

2019年
マルチコアプロセッサ用並列化コンパイラの機能拡張に係る研究配分額11,500,000円

OT社

研究期間:

2018年

-

2019年
動画像認識処理の自動並列化に関する研究配分額1,080,000円

S社

研究期間:

2017年

-

2018年
オスカーコンパイラによるマルチコア機器の高速化の研究配分額3,000,000円

F社

研究期間:

2017年

-

2018年
組込みシステム向き並列最適化手法の研究配分額5,000,000円

M社

研究期間:

2017年

-

2018年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額5,000,000円

D社

研究期間:

2017年

-

2018年
自動並列化コンパイラの研究配分額1,080,000円

N社

研究期間:

2017年

-

2018年
車載制御・信号処理向け並列コンパイラ及びベクトル演算システムの研究(1) 配分額2,160,000円

R社

研究期間:

2017年

-

2018年
マルチコアプロセッサ用並列化コンパイラの機能拡張に係る研究配分額11,500,000円

OT社

研究期間:

2017年

-

2018年
車載制御ソフトウェア並列化における並列化技術の適用に関する課題導出と解決方法の策定配分額1,080,000円

H社

研究期間:

2017年

-

2018年
自動並列化コンパイラの研究配分額1,080,000円

N社

研究期間:

2016年

-

2017年
グリーンコンピューティング技術による機械学習プログラムの最適化配分額2,000,000円

H社

研究期間:

2016年

-

2017年
鉄道車両のトンネル突入解析向けソフトウェアの高速化配分額1,080,000円

H社

研究期間:

2016年

-

2017年
並列計算による粒子線治療システム向けソフトウエアの高速化配分額500,000円

H社

研究期間:

2016年

-

2017年
オスカーコンパイラによるマルチコア機器の高速化の研究配分額1,000,000円

F社

研究期間:

2016年

-

2017年
OSCAR並列化コンパイラを適用して、リファクタリングを施した交通シュミレータの並列化による処理の高速化の研究配分額1,000,000円

ND社

研究期間:

2016年

-

2017年
組み込みシステム向き並列最適化手法の研究配分額5,000,000円

M社

研究期間:

2016年

-

2017年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額12,000,000円

D社

研究期間:

2016年

-

2017年
車載マルチ・メニーコア向け並列化コンパイラの研究（２）配分額1,080,000円

R社

研究期間:

2016年

-

2017年
マルチコアプロセッサ用並列化コンパイラの機能拡張に係る研究配分額11,500,000円

OT社

研究期間:

2016年

-

2017年
グリーンコンピューティング技術によるシステム高度化の研究（４）配分額5,000,000円

H社

研究期間:

2016年

-

2017年
画像処理アルゴリズム等のヘテロジニアス・メニーコア向け自動並列化に関する研究配分額9,720,000円

O社

研究期間:

2016年

-

2017年
自動並列化コンパイラの研究配分額1,080,000円

N社

研究期間:

2015年

-

2016年
組込みシステム向き最適化手法の研究配分額5,000,000円

M社

研究期間:

2015年

-

2016年
マルチコア並列化コンパイラにおける自動メモリ管理方式の実用化配分額3,000,000円

JST知財活用促進ハイウェイ「大学特許価値向上支援」

研究期間:

2015年

-

2016年
画像処理及びアルゴリズム等のホモジニアス・メニーコア向け自動並列化に関する研究配分額9,720,000円

O社

研究期間:

2015年

-

2016年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,720,000円

D社

研究期間:

2015年

-

2016年
自動並列化コンパイラの研究配分額1,080,000円

N社

研究期間:

2015年

-

2016年
グリーンコンピューティング技術によるシステム高速化の研究（3）配分額5,000,000円

H社

研究期間:

2015年

-

2016年
マルチコア・アーキテクチャおよびコンパイラの研究配分額1,080,000円

R社

研究期間:

2015年

-

2016年
マクロタスク融合機能の開発配分額9,000,000円

OT社

研究期間:

2015年

-

2016年
ﾏﾙﾁｺｱﾌﾟﾛｾｯｻ用並列化ｺﾝﾊﾟｲﾗの実用化の研究配分額9,000,000円

OT社

研究期間:

2015年

-

2016年
低消費電力マルチコアプロセッサとその並列ソフトウェアに関する研究

日本学術振興会科学研究費助成事業

研究期間:

2012年

-

2015年03月

笠原博徳, HILLENBRAND D., HILLENBRAND Dominic

　概要を見る

The research lead to new results in the area of power control for mobile devices and for (cloud) servers which are found in data centers. On the Linux- and Android-operating system the run-time of OSCAR-compiled applications has been improved and also became more predictable. In order to achieve this success the operating system was modified to support more deterministic task to processor mappings. Furthermore the operating system was extended with a new programming interface (API) to control the performance of the processor cores. The API includes operations for dynamic frequency and voltage scaling (DVFS), clock- and power-gating. To assess the performance the operating system also collects data on CPU- and DRAM power consumption as well as processor temperature. The measurement setup performs fully automatic data acquisition. This allowed thousands of measurements to be collected over a month. The data was used to perform an offline design space exploration for a multi-core compiler run-time ("libgomp") and a scientific application. As a result the power consumption could be reduced without any modifications to the binary code of the application.
自動並列化コンパイラの研究配分額1,080,000円

N社

研究期間:

2014年

-

2015年
android OS搭載ｽﾏｰﾄﾌｫﾝ上へのﾏﾙﾁｺｱ最適化技術を用いた電力削減機能移植における課題抽出配分額1,000,000円

KC社

研究期間:

2014年

-

2015年
画像処理およびシミュレーションアルゴリズムの自動並列化に関する研究配分額9,720,000円

O社

研究期間:

2014年

-

2015年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額6,480,000円

D社

研究期間:

2014年

-

2015年
（BB＋AP）プラットフォーム開発に関する研究配分額7,500,000円

F社

研究期間:

2014年

-

2015年
グリーンコンピューティング技術によるシステム高速化の研究配分額10,400,000円

H社

研究期間:

2014年

-

2015年
マルチコア・アーキテクチャおよびコンパイラの研究配分額 1,080,000円

R社

研究期間:

2014年

-

2015年
マルチコアプロセッサ用並列化コンパイラの実用化の研究配分額9,000,000円

OT社

研究期間:

2014年

-

2015年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,450,000円

D社

研究期間:

2013年

-

2014年
マルチコアプロセッサ用並列化アクセラレータの研究開発配分額9,000,000円

OT社

研究期間:

2013年

-

2014年
画像処理およびシミュレーションアルゴリズムの自動並列化に関する研究配分額9,450,000円

O社

研究期間:

2013年

-

2014年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,450,000円

D社

研究期間:

2013年

-

2014年
自動並列化コンパイラの研究配分額4,725,000円

N社

研究期間:

2013年

-

2014年
（BB＋AP）プラットフォーム開発に関する研究配分額20,000,000円

F社

研究期間:

2013年

-

2014年
グリーンコンピューティング技術によるシステム高速化の研究配分額9,600,000円

H社

研究期間:

2013年

-

2014年
マルチコア・アーキテクチャおよびコンパイラの研究配分額4,725,000円

R社

研究期間:

2013年

-

2014年
画像処理およびシミュレーションアルゴリズムの自動並列化に関する研究配分額9,450,000円

O社

研究期間:

2012年

-

2013年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,450,000円

D社

研究期間:

2012年

-

2013年
マルチコア並列化の研究配分額3,000,000円

RK社

研究期間:

2012年

-

2013年
HEVCエンコーダを対象としたメニーコアプロセッサによる高速処理基盤の研究関する研究配分額1,000,000円

K社

研究期間:

2012年

-

2013年
自動並列化コンパイラの研究配分額 4,725,000円

N社

研究期間:

2012年

-

2013年
並列化コンパイラの車載適用研究配分額9,988,000円

T社

研究期間:

2012年

-

2013年
（BB＋AP）プラットフォーム開発に関する研究配分額 11,000,000円

F社

研究期間:

2012年

-

2013年
スーパーリアルタイムシミュレーション技術配分額10,000,000円

H社

研究期間:

2012年

-

2013年
マルチコア・アーキテクチャおよびコンパイラの研究配分額5,500,000円

R社

研究期間:

2012年

-

2013年
OSCAR APIを適用したメニーコア・サーバーの高速化及び省電力化の研究配分額9,450,000円

F社

研究期間:

2011年

-

2012年
次世代の車載電子制御システムにおける高速並列処理に関する研究配分額9,450,000円

D社

研究期間:

2011年

-

2012年
画像処理アルゴリズムの自動並列化に関する研究配分額9,450,000円

O社

研究期間:

2011年

-

2012年
スーパーリアルタイムシミュレーション技術配分額10,000,000円

H社

研究期間:

2011年

-

2012年
自動並列化コンパイラの研究配分額4,725,000円

N社

研究期間:

2011年

-

2012年
マルチコア・アーキテクチャ及びコンパイラの研究配分額5,500,000円

R社

研究期間:

2011年

-

2012年
並列化コンパイラの車載適用研究配分額12,075,000円

T社

研究期間:

2011年

-

2012年
平成21年度（2009年度）グリーンコンピュータセンター建設補助金配分額：1,490,000,000円

経済産業省

研究期間:

2009年08月

-

2011年03月
低消費電力メニーコア・プロセッサ基幹技術の先導研究

研究期間:

2009年

-

2010年
低消費電力メニーコア・アーキテクチャ及びコンパイラ、APIの先導研究配分額 24,753,750円

経済産業省・NEDO

研究期間:

2009年

　

　
情報家電用ヘテロジニアス・マルチコア技術の研究開発配分額 272,309,100円

経済産業省・NEDO

研究期間:

2007年

-

2009年
先進ヘテロジニアス・マルチプロセッサ（AHMP) 180,000,000円

経済産業省・NEDO

研究期間:

2004年07月

-

2007年06月
次世代コンパイラの構築

研究期間:

2007年

　

　
マルチコア・アーキテクチャおよびコンパイラの研究

研究期間:

2006年

-

2007年
自動並列化に関する研究

研究期間:

2005年

-

2007年
リアルタイム情報家電用マルチコア技術の研究開発配分額 470,747,550円

経済産業省・NEDO

研究期間:

2005年

-

2007年
並列システムの性能・電力評価技術の研究

研究期間:

2005年

-

2006年
自動並列化コンパイラ協調型チップマルチプロセッサ

研究期間:

2004年

-

2006年
先進ヘテロジニアス・マルチプロセッサ技術研究開発事業

研究期間:

2004年

-

2006年
インタラクティブエンタテインメント

研究期間:

2002年

-

2006年
フレシキシブルＳｏC向け並列処理技術の研究配分額 3,000,000円

株式会社日立製作所

研究期間:

2002年04月

-

2005年03月
自動並列化コンパイラ協調型シングル・チップ・マルチプロセッサの研究配分額 24,300,000円

株式会社半導体理工学研究センター

研究期間:

2001年04月

-

2004年03月
並列化コンパイラ協調型シングルチップマルチプロセッサ

研究期間:

2000年

-

2004年
ミレニアムプロジェクト：アドバンスト並列化コンパイラ技術（プロジェクトリーダ）総額 1,094,552,550円（内早稲田大学共同研究分 110,906,250円）

経済産業省・NEDO

研究期間:

2000年09月

-

2003年03月
アドバンスト並列化コンパイラ

研究期間:

2000年

-

2003年
人と環境に優しい次世代情報処理技術

文部科学省

研究期間:

1999年

-

2003年
計算機クラスタの研究動向調査とその応用研究配分額 4,000,000円

株式会社山武

研究期間:

1998年04月

-

2002年03月
シングル・チップ・マルチプロセッサの研究配分額11,900,000円

株式会社半導体理工学研究センター

研究期間:

1999年07月

-

2001年03月
マルチモーダルコラボレーションロボット

文部科学省

研究期間:

1997年

-

2001年
マルチプロセッサ用自動並列化技術配布額 120,000,000円

技術研究組合新情報処理開発機構

研究期間:

1998年01月

-

2000年03月
マルチプロセッサシステムに関する研究配分額 1,113,000円

財団法人京都高度技術研究所

研究期間:

1997年10月

-

2000年03月
並列処理技術の研究配分額 6,825,000円

富士通株式会社

研究期間:

1997年04月

-

2000年03月
並列化コンパイラシステムに関する研究配分額 5,715,000円

株式会社富士通研究所

研究期間:

1993年04月

-

2000年03月
超並列計算機用自動並列化コンパイラ実装に関する共同研究

日本学術振興会科学研究費助成事業

研究期間:

1998年

-

1999年

城和貴, 笠原博徳, 國枝義敏, 福田晃, 笹倉万里子, 中西恒夫

　概要を見る

本研究課題では、まず、本研究グループで既に実装を終えているC++版のParafrase-2を整理し、Parafrase-2の中間表現部分と並列化/最適化部分の分離を行なった。同時に、本研究グループで既に提案しているデータ分割グラフを拡張した統一的中間表現を定義し、古い中間表現の削除されたC++版のParafrase-2に実装した。データ分割グラフの拡張部分とは、データ通信の最適化を中間表現内部に組み込むことである。この通信最適化は、バス結合された共有メモリ型並列計算機からワークステーション・クラスタに至るまで、一元管理を目的としたcc-COMA(compiler-controlled COMA)によってサポートされる予定である.次に、統一的中間表現とコンパイラの並列化/最適化部分のインタフェイスの定義を、Promisプロジェクトと連動して行ない、双方の統一的中間表現に、結果として互換性を持たせるようにインタフェイスの設計を行なった。さらに、いくつかの並列化/最適化部分を、統一的中間表現インタフェイスに合わせた修正を行ない、Narafraseのプロトタイプとした。平成12年2月現在、既に本研究グループで提案した統一的中間表現からデータとプログラムを同時に分割するアルゴリズムの実装に着手したところである.このアルゴリズム実装と、Parafrase-2で実装されていた全ての並列化/最適化部分のインタフェイス対応を行なうことで、Narafraseの中心部分の実装を終える予定である。
マルチプロセッサコンピューティング

研究期間:

1998年

-

1999年
マルチモーダルな対話機能を有し人間と共同作業をする次世代ロボットの基礎研究

日本学術振興会科学研究費助成事業

研究期間:

1995年

-

1997年

橋本周司, 菅野重樹, 高西淳夫, 笠原博徳, 白井克彦, 成田誠之助

　概要を見る

本年度は、本計画の最終年度である。前年度末に試作した2体のヒューマノイド型ロボットをプラットホームとして、以下のような研究を行い、全員で統合システムとしての取りまとめを行なった。1)環境モデルと実画像の対応付けによる自己位置認識システムの精度向上を図るとともに、環境変化に応じたモデル変更の方式を検討し試作ロボットでの確認を行なった。2)音声と画像を手がかりとしたシーン中での対話相手の検出、およびカラー画像とロボット視覚系を用いた人間の顔表情とジェスチャー認識の実験を行なった。3)連続音声認識の精度向上を図ると共に、並列処理系による高速化を試み、ジェスチャー、表情を合わせた、人間型ロボットによるマルチモーダル対話の実験に成功した。4)試作ロボットをネットワークに接続し、遠隔地からの相互制御の実験を行い、情報ネットワークにおけるインターフェース端末としてロボットを使用する可能性を検討した。5)完成した2足歩行系の自由度を増やし、方向変化等をより自在にできるようにすると共に、頭部、腕部などとの協調制御方式を検討し、実験的に検証した。6)コンプライアンス制御による柔軟な腕機構の制御方式を改良すると共に、人間との共同作業とジェスチャー生成を行う安全な腕として、外装を含めた総合的な設計基準を検討した
マルチプロセッサ用自動並列化コンパイラとアーキテクチャ・サポートに関する研究

日本学術振興会科学研究費助成事業

研究期間:

1995年

-

1996年

笠原博徳

　概要を見る

本研究では、マルチグレイン並列処理のためのデータローカライゼーション手法、及びデータローカライゼーションによっても除去できなかったプロセッサ間データ転送をプロセッサ上でのタスク処理とオーバラップさせデータ転送オーバーヘッドを隠蔽する技術を開発するとともに、コンパイラにおけるマシンコードスケジューリングの高度化とそれを支援するマルチプロセッサシステムアーキテクチャによりプロセッサ間データ転送順序の最適化も可能とする無同期近細粒度処理技術を開発した。さらにそれらの有効性をアーキテクチャシミュレータ上あるいは実際のスーパーコンピュータ富士通VPP500上で示した。具体的には、データローカライゼーション手法に関する研究では、配列データの自動分割手法(ループ整合分割)とローカルメモリへの割当て法(パ-シャルスタティックスケジューリング)を開発し、OSCARタイプ・アーキテクチャシミュレータ上で有効性を検証した。また、データ転送と処理のオーバーラッピングスケジューリング技術の開発では、Fortranプログラムを解析し富士通VPP500用の並列化拡張言語VPP Fortranを出力するコンパイラ(プリプロセッサ)を開発し、4プロセッサのVPP500上で平均で15%程度実行時間を短縮できることを確めた。また、無同期近細粒度並列処理技術に関する研究では、高度なマシンコードスケジューリング技術をサポートするアーキテクチャを明確化するとともに、アーキテクチャシミュレータ上で無同期近細粒度並列処理におけるデータ転送順序最適化技術の性能評価を行い手法の有用性を確認した。以上の研究により、今後のベクトルパラレルスーパーコンピュータ、将来のシングルチッププロセッサのアーキテクチャ、及び自動並列化コンパイラに関する指針が得られた。なお以上の研究成果は、14件の学会論文誌論文あるいは国際会議論文として発表するとともに、1件の学会誌論文として掲載決定、1件の査読付きシンポジウム論文、5件の研究会論文、12件の全国大会論文とした発表されている
Data-Localization for Fortran Macrodataflow Computation Using Static Macrotask Fusion.

公益財団法人矢崎科学技術振興記念財団

研究期間:

1995年

　

　
スーパーコピュータ用自動並列化コンパイラに関する研究

日本学術振興会科学研究費助成事業

研究期間:

1993年

-

1995年

成田誠之助, 合田憲人, 本多弘樹, 笠原博徳

　概要を見る

主記憶共有マルチプロセッサシステム上でのFortranプログラムの並列処理では、従来よりマルチタスキングやマイクロカスキングなどの手法が用いられてきた.しかし,マルチタスキングでは,ユーザによる並列性指定が困難である,osコールなどによるスケジューリングオーバーヘッドが大きい等といった問題がある.マイクロタスキングは,最も広く用いられてきたループ並列化手法であるが,イタレーション間にまがる複雑なデータ依存やループ外への条件分岐によって並列化できないループが以前存在する.これらに対して当研究者当は、マクロデータフロー処理手法を提案した.マクロデータフロー処理手法では,コンパイラがプログラムを粗粒度タスクへ分割し,粗粒度タスクの最早実行可能条件を解析することにより粗粒度のアスク間の並列性を自動抽出する.コンパイラが各ソースプログラム専用に生成したスケジューリングルーチンを用いることで,スケジューリングオーバーヘッドを抑えることができる.また,マクロデータフロー処理を行なう場合,各データをデータ転送を最小化するよう考慮し,各プロセッサ上のローカルメモリに配置(データローカライズ)することによって,より効率の良い並列処理が可能となる.プロトタイプマルチプロセッサイステムOSCAR上での性能評価では,マクロデータフロー処理による粗粒度タスクの有効な並列処理を確認できた.また富士通VPP-500、Alliant FX/4、KSR1、NEC Cnju-3等,商用マルチプロセッサシステム上での性能評価でも,従来手法であるマルチタスキングおよびマイクロスタキングに比べ,マクロデータフロー処理の方が高い並列性の抽出が可能であることが分かった.さらに,それらの評価から従来手法に比べて低オーバーヘッドな処理を行なうことが可能で,プログラムの実行速度が向上することも確認された
マルチプロセッサ・システム上でのマルチグレイン並列処理に関する研究

日本学術振興会科学研究費助成事業

研究期間:

1993年

-

1994年

笠原博徳

　概要を見る

本マルチグレイン並列処理研究最終年度にあたる平成6年度では、当初の研究計画通り、平成5年度で開発した粗粒度並列処理手法と近細粒度並列処理手法及び従来の自動並列化コンパイラが使用していたループ並列化を階層的に組み合わせ、プログラム全域にわたる並列化を可能とするマルチグレイン並列化コンパイラを開発し、その性能を実マルチプロセッサシステム上で検証することに成功した。このマルチグレイン並列処理では、以下のような手順で並列化を行った。1)粗粒度並列処理手法により並列化されるマクロタスクをプロセッサクラスタに割当て並列処理する。2)プロセッサクラスタに割り当てられたマクロタスクがループ並列化が適用可能なループである場合には、プロセッサクラスタ内の複数プロセッサによりDoal1,Doacross等の技術を用いて並列処理する。3)プロセッサクラスタに割り当てられたマクロタスクが逐次形ループあるいは基本ブロックである場合には近細粒度並列処理手法を適用してプロセッサクラスタ内プロセッサにより並列処理を行う。また、上記マルチグレイン並列化コンパイラの開発においては平成5年度で開発した要素技術をさらに進歩させ、データ転送・同期等の並列処理オーバーヘッドを最小化する無同期近細粒度並列処理に関する研究も平行して行った。以上の研究成果は、別紙様式2に示すように、7件の学会論文誌論文、6件の国際会議論文、1件の海外図書における1章、3件の査読付きシンポジウム論文、10件の研究会論文、15件の全国大会論文、3件の学会誌あるいは論文誌解説論文として既発表あるいは発表予定である
信号処理を中心とする特定用途向けVLS[アーキテクチャ設計支援システムの研究

日本学術振興会科学研究費助成事業

研究期間:

1993年

　

　

白井克彦, 竹沢寿幸, 笠原博徳, 小林哲則, 松本隆, 秋月影雄

　概要を見る

われわれは、すでに本研究にさきだって5年間にわたり、高位記述に基づくVLSI設計支援システム(SYARDS)の研究を行ってきた。そして、このシステムを既存のVLSI論理合成システムと接続し評価を行い、このようなシステムの可能性を示した。本研究では、その基礎の上に立ってシステムをさらに高度化・一般化して、プロセッサ設計のみならず、その利用のための環境を含めたシステムを実現し、将来の上位設計支援技術の基礎を作ることを目的として進められた。具体的には、並列処理を含む仕様記述言語の整備、その解析系と命令のスケジューリング、シミュレータと処理回路合成などの問題を取り上げた。本研究のもう1つのテーマとしては、多層並列回路の設計が取り上げられた。この研究は、松本隆が遂行し画像処理に必要となる規則性抽出フィルタの設計など重要な成果が得られた。設計支援システム(SYARDS)は、高級言語(PascalまたはC)で記述されたアルゴリズムを実行する専用プロセッサを自動的に設計することを目的とするシステムである。この3年間の研究期間の中では、アルゴリズムに含まれる局所並列性を抽出した最適設計法、デジタル信号処理の実規模レベルのアルゴリズムを対象とする場合に必要となるビット幅決定の支援、C言語による並列処理記述の導入、パイプライン設計の最適化などの研究を進め、SYARDSを一層強力なシステムとすることができた。この間、プロセッサ設計においても、その高速化にともなって、ハードウェアとソフトウェアの両面から適切な設計を考えるCodesignの概念も生まれてきたが、本研究は元来、ハードウェアだけでなく、そのプログラムを生成するコンパイラについても同時に作成することを特長としており、Codesignの考え方とも親和性が高い。今後、SYARDSはこのような方向にも発展の可能性が高く、本研究の成果は今後のVLSI設計支援技術に大きな意義があると考えている
マルチプロセッサ・システム上での常微分方程式求解の並列処理に関する研究

日本学術振興会科学研究費助成事業

研究期間:

1988年

　

　

笠原博徳
マルチプロセッサ・スーパーコンピューターに関する共同研究

公益財団法人矢崎科学技術振興記念財団

研究期間:

1988年

　

　
音声特徴抽出法の高度化に関する研究

日本学術振興会科学研究費助成事業

研究期間:

1987年

-

1988年

白井克彦, 笠原博徳, 小林哲則, 中島隆之

　概要を見る

音声の特徴抽出を行う場合, 音声信号中に音声情報がいかなる形で埋め込まれているかを追求しながら, これらの効率的な抽出方法を開発していくことが必要である. 本研究では次の4つの側面からの問題に取り組んだ.1.生成モデルに基づく方法……音声生成モデルの精密化を行い, これから得られるパラメータの内, 有効性の高いものを有機的に組み合げ特徴抽出を行う. 本年度は母音モデルと子音モデルの融合を考え, 調音器官に対応する母音調音モデルの声道モデルへの変更を試みた. その結果, 声道モデルによってもほぼ正確に母音の推定を行うことができた.2.音声パワースペクトル包絡(PSE)に基づく方法……PSEを『短時間パワースペクトル特性において周波数軸上で零周波数を原点として基本数時間隔で標本化した値を原データ系列とし, そこから雑音成分を除いて推定される最適値である. 』と定義する. これを対数スペクトルパワー次元で余弦級数展開モデルで表してパラメータ推定を行った. その結果, 従来困難であった/mo/と/noの対の零を明確に捉えることができた.3.ベクトル量子化(VQ)に基づく方法……音響量を多角的に把握した上でベクトル量子化を適用し音響特徴と音韻特徴とのより有効な対応関係の確立をめざす. 本年度は量子化分布と呼ぶベクトル量子化頻度からなる特徴量を提案し, 音声信号中の話者性を捉えることを試みた. 具体的には, この特徴量により話者性を考慮した単語予備選択実験を行い, その有効性を確かめた.4.聴覚実験に基づく方法……母音知覚における周波数構造の影響に関して検討を行った. その際, 口膣形状に応じてホルマントの分類を行い前口膣, 後口膣の共振周波数に対応するものをそれぞれFホルマント, Bホルマントとした. これらのホルマント間の関係の母音知覚に対する影響を調べたが, 今後は子音を含めて音韻境界が他の環境要因にどの程度影響されるかを調べていく
マルチプロセッサ・システム上でのスパース・リニア方程式求解の並列処理に関する研究

日本学術振興会科学研究費助成事業

研究期間:

1987年

　

　

笠原博徳
超並列計算機用自動並列化コンパイラ実装に関する共同研究

　概要を見る

本研究課題では、まず、本研究グループで既に実装を終えているC++版のParafrase-2を整理し、Parafrase-2の中間表現部分と並列化/最適化部分の分離を行なった。同時に、本研究グループで既に提案しているデータ分割グラフを拡張した統一的中間表現を定義し、古い中間表現の削除されたC++版のParafrase-2に実装した。データ分割グラフの拡張部分とは、データ通信の最適化を中間表現内部に組み込むことである。この通信最適化は、バス結合された共有メモリ型並列計算機からワークステーション・クラスタに至るまで、一元管理を目的としたcc-COMA(compiler-controlled COMA)によってサポートされる予定である.次に、統一的中間表現とコンパイラの並列化/最適化部分のインタフェイスの定義を、Promisプロジェクトと連動して行ない、双方の統一的中間表現に、結果として互換性を持たせるようにインタフェイスの設計を行なった。さらに、いくつかの並列化/最適化部分を、統一的中間表現インタフェイスに合わせた修正を行ない、Narafraseのプロトタイプとした。平成12年2月現在、既に本研究グループで提案した統一的中間表現からデータとプログラムを同時に分割するアルゴリズムの実装に着手したところである.このアルゴリズム実装と、Parafrase-2で実装されていた全ての並列化/最適化部分のインタフェイス対応を行なうことで、Narafraseの中心部分の実装を終える予定である

▼全件表示

Misc

早稲田大学オープンイノベーション戦略—特集大学研究を支援する

笠原博徳

大学マネジメント = University & college management 17 ( 8 ) 12 - 19 2021年11月

CiNii
自動並列化コンパイラのコンパイル時間短縮のための実行プロファイル・フィードバックを用いたコード生成手法 (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2017)

藤野里奈, 韓吉新, 島岡護, 見神広紀, 宮島崇浩, 高村守幸, 木村啓二, 笠原博徳

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 510 ) 207 - 212 2017年03月

CiNii J-GLOBAL
自動車リアルタイム制御計算の複数クラスタ構成マルチコア上での並列化 (コンピュータシステム) -- (組込み技術とネットワークに関するワークショップETNET2017)

宮田仁, 島岡護, 見神広紀, 西博史, 鈴木均, 木村啓二, 笠原博徳

電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 116 ( 510 ) 177 - 182 2017年03月

CiNii J-GLOBAL
Android Video Processing System Combined with Automatically Parallelized and Power Optimized Code by OSCAR Compiler

Bui Duc Binh, Tomohiro Hirano, Hiroki Mikami, Hideo Yamamoto, Keiji Kimura, Hironori Kasahara

情報処理学会論文誌 57 ( 4 ) 2016年04月

　概要を見る

The emergence of multi-core processors in smart devices promises higher performance and low power consumption. The parallelization of applications enables us to improve their performance. However, simultaneously utilizing many cores would drastically drain the device battery life. This paper shows a demonstration system of real-time video processing combined with power reduction controlled by the OSCAR automatic parallelization compiler on ODROID-X2, an open Android development platform based on Samsung Exynos4412 Prime with 4 ARM Cortext-A9 cores. In this paper, we exploited the DVFS framework, core partitioning, and profiling technique and OSCAR parallelization - power control algorithm to reduce the total consumption in a real-time video application. The demonstration results show that it can cut power consumption by 42.8% for MPEG-2 Decoder application and 59.8% for Optical Flow application by using 3 cores in both applications.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.3 (online)------------------------------The emergence of multi-core processors in smart devices promises higher performance and low power consumption. The parallelization of applications enables us to improve their performance. However, simultaneously utilizing many cores would drastically drain the device battery life. This paper shows a demonstration system of real-time video processing combined with power reduction controlled by the OSCAR automatic parallelization compiler on ODROID-X2, an open Android development platform based on Samsung Exynos4412 Prime with 4 ARM Cortext-A9 cores. In this paper, we exploited the DVFS framework, core partitioning, and profiling technique and OSCAR parallelization - power control algorithm to reduce the total consumption in a real-time video application. The demonstration results show that it can cut power consumption by 42.8% for MPEG-2 Decoder application and 59.8% for Optical Flow application by using 3 cores in both applications.\n------------------------------This is a preprint of an article intended for publication Journal ofInformation Processing(JIP). This preprint should not be cited. Thisarticle should be cited as: Journal of Information Processing Vol.24(2016) No.3 (online)------------------------------

CiNii
LTE無線基地局におけるレイヤ2信号処理のOSCARコンパイラによる自動並列化

田中優利, 小松裕樹, 影浦直人, 見神広紀, 松元映二, 横山正浩, 江崎孝斗, 箕輪守彦, 高村守幸, 木村啓二, 笠原博徳

情報処理学会研究報告(Web) 2015 ( EMB-38 ) 2015年

J-GLOBAL
モデルベース開発向け画像処理ソフトウェアの並列化フレームワーク

梅田弾, 鈴木貴広, 見神広紀, 木村啓二, 笠原博徳

情報処理学会研究報告(Web) 2015 ( EMB-38 ) 2015年

J-GLOBAL
Android Movie Player System Combined with Automatically Parallelized and Power Optimized Code by OSCAR Compiler

BuiDucBinh, Tomohiro Hirano, Dominic Hillenbrand, Hiroki Mikami, Keiji Kimura, Hironori Kasahara

組込みシステムシンポジウム2014論文集 2014 55 - 62 2014年10月

CiNii
大規模無線センサネットワークにおける外乱を考慮したアーキテクチャ探索シミュレータの実装と評価

山下浩一郎, 鈴木貴久, 栗原康志, 大友俊也, 木村啓二, 笠原博徳

マルチメディア、分散協調とモバイルシンポジウム2014論文集 2014 ( 1 ) 1368 - 1377 2014年07月

CiNii J-GLOBAL
スマートグリッドをささえる新技術グリーンコンピューティングの展望

木村啓二, 笠原博徳

スマートグリッド 4 ( 4 ) 2014年

J-GLOBAL
モデルベース設計により自動生成されたエンジン制御Cコードのマルチコア用自動並列化

梅田弾, 金羽木洋平, 見神広紀, 林明宏, 谷充弘, 森裕司, 木村啓二, 笠原博徳

組込みシステムシンポジウム2013論文集 2013 104 - 113 2013年10月

CiNii
組込マルチコア用OSCAR APIを用いたTILEPro64上でのマルチメディアアプリケーションの並列処理

岸本耀平, 見神広紀, 中野恵一, 林明宏, 木村啓二, 笠原博徳

組込みシステムシンポジウム2012論文集 2012 22 - 30 2012年10月

CiNii
グリーンコンピューティングのためのマルチコア技術

笠原博徳

応用物理学会学術講演会講演予稿集 2012.1 9 - 9 2012年02月

DOI J-GLOBAL
自動並列化技術を用いたメディア処理オフロード

石坂一久, 酒井淳嗣, 枝廣正人, 宮本孝道, 間瀬正啓, 木村啓二, 笠原博徳

研究報告モバイルコンピューティングとユビキタス通信（MBL） 2010 ( 59 ) 1 - 7 2010年03月

　概要を見る

自動並列化技術と自動オフロード技術により，アプリプログラムを変更することなくメディア処理をヘテロマルチコア上で高速化する手法を提案する．メディア処理は高い演算性能を必要とするが，プロセッサの進歩はヘテロマルチコアへと進んでおりソフトウェアが複雑化する．本稿では，メディア処理アプリの特徴を利用し，コアへの処理の分割と並列化をアプリプログラマに隠蔽した高速化手法を提案する．実験では，提案手法により Window Media Player のソースコードを変更することなくデコード処理をオフロードすることができ，3 コアのアクセラレータを利用して 1.8 倍の性能向上が確認できた．This paper proposes new software architecture for media processing using the automatic parallelization and offload for hetero multicore. While media processing demands more and more computational power, it is difficult for a non-expert programmer to exploit hetero multicore that is a promising future processor architecture. The proposed method keeps programers away from parallelization and offloading for hetero multicore. Our experiments showed that the Windows Media Player speeduped 1.8 times by offloading the decoder to three cores accelerator without source code modification.

CiNii
瞬時電源遮断機構を用いたマルチコアSoC向け省電力ソフトウェア実行環境

小野内雅文, 十山圭介, 野尻徹, 佐藤真琴, 間瀬正啓, 白子準, 佐藤未来子, 高田雅士, 伊藤雅之, 水野弘之, 並木美太郎, 木村啓二, 笠原博徳

電子情報通信学会技術研究報告. CST, コンカレント工学 109 ( 367 ) 7 - 12 2010年01月

　概要を見る

8つのCPUコアを搭載するマルチコアSoC RP2と,自動並列化コンパイラOSCARを用いて,高い処理性能と省電力を両立するソフトウェア実行環境を構築した。この環境ではCPUコア数の増加に応じて処理速度を向上させるため,OSCARコンパイラと連携しデータの特性を考慮したメモリ配置を行うデータマッピング手法を開発し,各CPUコア上で実行される並列化タスク間のコミュニケーションオーバヘッド,すなわち,キャッシュコヒーレンシ維持とタスク間同期の時間を削減した。さらに,オンチップのCPUコアローカルメモリを活用した高速な電源遮断・復帰を実現する瞬時電源遮断機構を開発し,OSCARコンパイラとの連携によりプログラム実行中の待機CPUコアの電源を細粒度に遮断することで,無駄な電力消費を削減した。開発したソフトウェア実行環境上でセキュアAAC-LC圧縮処理を実行したところ,データマッピング手法を適用することにより,CPUコア数を1から8へと増やした場合に5.00倍の処理速度を達成した。さらに,瞬時電源遮断機構を併用することで,電力効率が10%向上することを確認した。

CiNii J-GLOBAL
H.264/AVCエンコーダのマルチコアプロセッサにおける階層的並列処理

見神広紀, 宮本孝道, 木村啓二, 笠原博徳

電子情報通信学会技術研究報告 109 ( 405(ICD2009 106-113) ) 2010年

J-GLOBAL
並列化コンパイラによるソフトウェアコヒーレンシ制御

間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究報告(CD-ROM) 2010 ( 1 ) 2010年

J-GLOBAL
OSCAR API標準解釈系を用いたParallelizable Cプログラムの評価

佐藤卓也, 見神広紀, 林明宏, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会研究報告(CD-ROM) 2010 ( 4 ) 2010年

J-GLOBAL
マルチコアプロセッサ上での粗粒度タスク並列処理のためのコンパイラによるローカルメモリ管理手法

中野啓史, 桃園拓, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会論文誌コンピューティングシステム（ACS） 2 ( 2 ) 63 - 74 2009年07月

　概要を見る

リアルタイム性および高性能，低電力が要求される情報家電機器では，オフチップ共有メモリに加え，小容量高速なローカルメモリを搭載したマルチコアプロセッサが開発されている．しかしながら，プログラマが手動でローカルメモリ容量を考慮しつつローカリティの最適化を行うことはきわめて困難であり，プログラム開発期間の短縮のためにはコンパイラによる自動最適化が必要となる．そこで，本論文では，容量制約のあるローカルメモリを有効に利用するための並列化コンパイル手法を提案する．提案手法ではまず，粗粒度タスク並列処理によりループやサブルーチン間の並列性を抽出する．続いてループ整合分割により，ローカルメモリサイズを考慮した粗粒度タスク分割を行う．従来のデータローカライゼーション手法は，分割されたデータを固定的にローカルメモリに割り当てていた．提案手法では，タスク分割後，データの定義あるいは参照時刻に基づくローカルメモリの割当てと解放を行い，より柔軟なローカルメモリ管理を実現する．オーディオ圧縮に用いられる AAC エンコーダを用いた性能評価の結果，固定的な割当てを行う従来のデータローカライゼーション手法と比較し，SH4A を 4 コア集積した RP1 マルチコア上で，約 2.6 倍，8 コア集積した RP2 マルチコア上で，約 2.5 倍の速度向上がそれぞれ得られた．Multicore processors integrating a small fast local memory for each core in addition to an off-chip shared memory has been developed for consumer electronics to meet real-time constraints, high performance and low power demand. However, data locality optimization by hand considering local memory size is much difficult. Therefore automatic compilation optimization is necessary to speed up application development time. This paper proposes a parallelizing compilation scheme which realizes effective use of limited local memory. First, the proposed scheme extracts parallelism among loops or subroutines using coarse grain task parallel processing. Subsequently, a loop is decomposed into smaller loops to fit local memory size using loop aligned decomposition. A conventional data localization scheme allocates decomposed data to fixed local memory address. On the other hand, the proposed scheme effectively allocates and deallocates decomposed data based on data definition and reference time. As the results, the proposed scheme gives us about 2.6 times speedup for AAC encoding program against the conventional scheme which does not manage each array on RP1 4 SH4A multicore processor and about 2.5 on RP2 8 SH4A multicore processor, respectively.

CiNii
マルチコアプロセッサ上での粗粒度タスク並列処理のためのコンパイラによるローカルメモリ管理手法

中野啓史, 桃園拓, 間瀬正啓, 木村啓二, 笠原博徳

情報処理学会論文誌トランザクション(CD-ROM) 2009 ( 1 ) 2009年

J-GLOBAL
ヘテロジニアスマルチコアプロセッサ上でのスタティックスケジューリングを用いたMP3エンコーダの並列化

和田康孝, 林明宏, 益浦健, 白子準, 中野啓史, 鹿野裕明, 木村啓二, 笠原博徳

情報処理学会論文誌トランザクション(CD-ROM) 2008 ( 1 ) 2008年

J-GLOBAL
階層グルーピング対応バリア同期機構の評価

山田海斗, 山田海斗, 間瀬正啓, 白子準, 木村啓二, 伊藤雅之, 服部俊洋, 水野弘之, 内山邦男, 笠原博徳

情報処理学会研究報告 2008 ( 39(ARC-178) ) 2008年

J-GLOBAL
ポインタ解析を用いた制約付きCプログラムの自動並列化

間瀬正啓, 馬場大介, 馬場大介, 長山晴美, 長山晴美, 村田雄太, 木村啓二, 笠原博徳

情報処理学会研究報告 2008 ( 39(ARC-178) ) 2008年

J-GLOBAL
情報家電用マルチコアSMP実行モードにおけるマルチグレイン並列処理

間瀬正啓, 馬場大介, 長山晴美, 田野裕秋, 益浦健, 宮本孝道, 白子準, 中野啓史, 木村啓二, 亀井達也, 服部俊洋, 長谷川淳, 伊藤雅樹, 佐藤真琴, 内山邦男, 小高俊彦, 笠原博徳

情報処理学会研究報告 2007 ( 55(ARC-173) ) 2007年

J-GLOBAL
独立に周波数制御可能な4320MIPS,SMP/AMP対応4プロセッサLSIの開発

早瀬清, 吉田裕, 亀井達也, 芝原真一, 西井修, 服部俊洋, 長谷川淳, 高田雅士, 入江直彦, 内山邦男, 小高俊彦, 高田究, 木村啓二, 笠原徳博

情報処理学会研究報告 2007 ( 55(ARC-173) ) 2007年

J-GLOBAL
産官学連携による高付加価値チップマルチプロセッサの開発(ARC150回記念「アーキテクチャ研究の将来」)

笠原博徳

情報処理学会研究報告. 計算機アーキテクチャ研究会報告 2004 ( 48 ) 57 2004年05月

CiNii
Multigrain parallel processing on compiler cooperative OSCAR chip multiprocessor architecture

Kimura, K., Kodaka, T., Obata, M., Kasahara, H.

IEICE Transactions on Electronics E86-C ( 4 ) 570 - 579 2003年04月

CiNii
共有メモリマルチプロセッサ上でのキャッシュ最適化を考慮した粗粒度タスク並列処理

石坂一久, 中野啓史, 八木哲志, 小幡元樹, 笠原博徳

情報処理学会論文誌 43 ( 4 ) 2002年

J-GLOBAL
メタスケジューリング--自動並列分散処理の試み

小出洋, 笠原博徳

Bit 33 ( 4 ) 36 - 41 2001年04月

CiNii
マルチグレイン並列化FORTRANコンパイラ

岡本雅巳, 小幡元樹, 松井巌徹, 松崎秀則, 笠原博徳, 成田誠之助

情報処理学会論文誌 40 ( 12 ) 1999年

J-GLOBAL
並列処理階層型粗粒度並列処理における同一階層内ループ間データローカライゼーション手法

吉田明正, 越塚健一, 岡本雅巳, 笠原博徳

情報処理学会論文誌 40 ( 5 ) 1999年

J-GLOBAL
FPGA向け逆数計算回路の設計

尾形航, 笠原博徳

電子情報通信学会技術研究報告. VLD, VLSI設計技術 98 ( 446 ) 53 - 59 1998年12月

　概要を見る

計算機アーキテクチャ研究において対象アーキテクチャを評価するには、ソフトウェアでエミュレートを行う、あるいは実際にハードウェアを製作して評価する等の手法が取られてきた。しかし前者の方法では評価に膨大な時間を要するという難点があり、一方後者の実際に製作する方法では多大な費用がかかる、開発から実際に稼動して評価に入るまでに相当の期間を要する、また一度製作した機体を改造して別のアーキテクチャの評価を行うことが事実上不可能、等の問題があった。これらの問題を解決する高速・浮動小数点演算機能を含む高機能、過大でない費用で実現可能、容易にアーキテクチャを改変可能なハードウェアアーキテクチャエミュレータを、S-RAM型の大規模なFPGAを用いて開発した。この上で実用に即したアプリケーションを走行させる際には浮動小数点の除算も多用されるが、これを効率よく実行する為に、FPGAの回路の特徴を活かした逆数計算回路を設計する。

CiNii
飯倉氏に対する回答

中野恵一, 笠原博徳

電子情報通信学会論文誌. D-2, 情報・システム 2-情報処理 79 ( 11 ) 1998 - 1999 1996年11月

　概要を見る

筆者らの論文に対して飯倉氏から寄せられた御指摘と御質問に答え,原論文中で「ひずみの下限値」計算および探索に関するオーバヘッドをどのように考慮しているかについて回答させて頂きます.また追試の結果,我々が報告したのと同様の性能が得られなかったとされるのは,原論文で示した,ヒューリスティックスを用いた探索順の決定法がインプリメントされていないからではないかと考えます.

CiNii
ICS'96参加報告

笠原博徳, 吉田明正

情報処理 37 ( 8 ) 785 - 787 1996年08月

CiNii
Array subscript bit vector表示による依存解析手法

山下浩一郎, 安田泰勲, 宮沢稔, 笠原博徳

全国大会講演論文集 50 3 - 4 1995年03月

　概要を見る

自動並列化コンパイラにおいて、ソースコード中の並列性を最大限に引き出すためには強力なデータ依存解析が必要である。特にループにおいてループキャリィドディペンデンス解析を行う場合には、制御変数の値域を考慮しつつ配列変数の添字式を解析しなければならない。データ依存解析の従来手法としてはGCD testが最も簡単な手法の一つとして知られているが、ネストしたループにおいて解析対象となる配列変数の添字式Subが式(1)のような複数の制御変数による線形一次式で表現される場合に適用できない。このような場合にはOmega testなどが使用されるが、最悪の条件下では解析時間のオーダー関数が指数関数となることが知られている。Sub=a_0+a_1・I_1+a_2・I_2+……a_k・I_k+……a_n・I_n(1)(ただしI_kは制御変数、a_kは定数係数)本稿ではこのようなネストループの問題に対して、各々の配列要素にビットを対応させたビットベクトルであるArray Subscript Bit vectorを用いたデータ依存解析手法を提案する。本手法は単純な論理演算によるネストループにおける複数制御変数線形一次式で表現される依存解析を短い時間で行なうことを可能とする。

CiNii
電子回路シミュレーションの粗粒度/近細粒度階層的並列手法

伊藤泰樹, 前川仁孝, 高井峰生, 西川健, 笠原博徳

全国大会講演論文集 50 37 - 38 1995年03月

　概要を見る

近年の半導体技術の進歩と共にVLSIの集積度は上昇し、回路の設計と検証に多くの時間とコストが必要になっている。中でも電子回路のシミュレーションに要する時間の短縮は重要な課題の一つである。従来より直接法を用いた電子回路シミュレーションの並列処理では、回路分割により粗粒度タスクを生成し、分割回路をプロセッサに割り当てて粗粒度並列処理を行なう方法が研究されてきた。本稿では、回路の自動分割を行ない、分割回路間での粗粒度並列処理と、分割回路内における直接解法のステートメントレベル近細粒度並列処理を、階層的に組み合わせる並列処理手法を提案する。

CiNii
マルチプロセッサスーパーコンピュータ上でのFORTRANプログラムのマクロデータフロー処理

合田憲人, 岡本雅巳, 尾形航, 本多弘樹, 笠原博徳, 成田誠之助

全国大会講演論文集 44 25 - 26 1992年02月

　概要を見る

高性能プロセッサを比較的少数結合した主記憶共有型マルチプロセッサ(マルチプロセッサスーパーコンピュータ)上での従来のFORTRANプログラムの並列処理では,マクロタスキング(サブルーチン並列処理)とマイクロタスキング(ループ並列処理)のみが行われていた.また,プログラム中からの粗粒度の並列性の抽出は,多くの場合ユーザーにゆだねられていた.本稿では,マルチプロセッサスーパーコンピュータ上でのFORTRANプログラムのマクロデータフロー処理手法FUJITSU LABORATORIES Ltd.を提案する.本手法では,コンパイラがプログラムの粗粒度タスク(マクロタスク)への分割,マクロタスク間の並列性抽出,各Fortranプログラム専用のダイナミックスケジューリングコードの生成等を自動的に行うため,低オーバーヘッドで効率の良い並列処理を行うことができる.

CiNii
村岡洋一著, "並列処理", 昭晃堂, A5判, 170 p., \3,300, 1986

笠原博徳

情報処理 29 ( 8 ) 921 1988年08月

CiNii

▼全件表示

産業財産権

PARALLEL PROGRAM GENERATING METHOD AND PARALLELIZATION COMPILING APPARATUS

3343351(EP)

Hironori Kasahara, Keiji Kimura, Dan Umeda, Hiroki Mikami

特許権
PARALLEL PROGRAM GENERATING METHOD AND PARALLELIZATION COMPILING APPARATUS

3343351(DE)

Hironori Kasahara, Keiji Kimura, Dan Umeda, Hiroki Mikami

特許権
PARALLEL PROGRAM GENERATING METHOD AND PARALLELIZATION COMPILING APPARATUS

3343351(GB)

Hironori Kasahara, Keiji Kimura, Dan Umeda, Hiroki Mikami

特許権
PARALLELISM EXTRACTION METHOD AND METHOD FOR MAKING PROGRAM

2950211(EP)

Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Yohei Kanehagi, Dan Umeda, Mitsuo Sawada

特許権
PARALLELISM EXTRACTION METHOD AND METHOD FOR MAKING PROGRAM

2950211(GB)

Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Yohei Kanehagi, Dan Umeda, Mitsuo Sawada

特許権
PARALLELISM EXTRACTION METHOD AND METHOD FOR MAKING PROGRAM

602014078600.6(DE)

Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Yohei Kanehagi, Dan Umeda, Mitsuo Sawada

特許権
METHOD OF GENERATING CODE EXECUTABLE BY PROCESSOR

3486767(EP)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
METHOD OF MANAGING A STORAGE AREA OF A MEMORY IN A MULTIPROCESSOR SYSTEM

3486767(GB)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
METHOD OF MANAGING A STORAGE AREA OF A MEMORY IN A MULTIPROCESSOR SYSTEM

602010065015.4(DE)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
PARALLEL PROGRAM GENERATING METHOD AND PARALLELIZATION COMPILING APPARATUS

10698670(US)

Hironori Kasahara, Keiji Kimura, Dan Umeda, Hiroki Mikami

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

2657839(EP)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

2657839(GB)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

602006059465.8(DE)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
PROCESSOR SYSTEM AND ACCELERATOR

2511672(GB)

Hironori Kasahara, Keiji Kimura

特許権
並列化コンパイラ、並列化コンパイル装置、及び並列プログラムの生成方法

特許6600888

笠原博徳, 木村啓二, 梅田弾, 見神広紀

特許権
並列化コンパイラ、並列化コンパイル装置、及び並列プログラムの生成方法

特許第6600888号

笠原博徳, 木村啓二, 梅田弾, 見神広紀

特許権

J-GLOBAL
METHOD OF GENERATING CODE EXECUTABLE BY PROCESSOR

2508992(EP)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
METHOD OF GENERATING CODE EXECUTABLE BY PROCESSOR

2508992(GB)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
METHOD OF GENERATING CODE EXECUTABLE BY PROCESSOR

602010059750.4(DE)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
プロセッサコア及びプロセッサシステム

特許第6525286号

笠原博徳, 木村啓二

特許権

J-GLOBAL
プロセッサコア及びプロセッサシステム

特許6525286

笠原博徳, 木村啓二

特許権
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, AND VEHICULAR DEVICE

10228923(US)

Yoshihiro Yatoh, Noriyuki Suzuki, Kenichi Mineta, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
並列化コンパイル方法、並列化コンパイラ、及び車載装置

特許6427055

峰田憲一, 鈴木範幸, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権
並列化コンパイル方法、及び並列化コンパイラ

特許6427054

矢頭義弘, 鈴木範幸, 峰田憲一, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権
並列化コンパイル方法、及び並列化コンパイラ

特許6427053

信田和志, 鈴木範幸, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権
PROCESSOR, ACCELERATOR, AND DIRECT MEMORY ACCESS CONTROLLER WITHIN A CORE READING/WRITING LOCAL SYNCHRONIZATION FLAG AREA FOR PARALLEL EXECUTION

10095657(US)

Hironori Kasahara, Keiji Kimura

特許権
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

1881405(EP)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

1881405(GB)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

1881405(FR)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

602007055494.2(DE)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
並列化コンパイラ、並列化コンパイル装置、及び並列プログラムの生成方法

笠原博徳, 木村啓二, 梅田弾, 見神広紀

特許権

J-GLOBAL
PARALLEL PROGRAM GENERATING METHOD AND PARALLELIZATION COMPILING APPARATUS

Hironori Kasahara, Keiji Kimura, Dan Umeda, Hiroki Mikami

特許権
マルチプロセッサシステム

特許第6335253号

笠原博徳, 木村啓二, 伊藤雅之, 亀井達也, 服部俊洋

特許権

J-GLOBAL
マルチプロセッサシステム

特許6335253

笠原博徳, 木村啓二

特許権
並列性の抽出方法及びプログラムの作成方法

特許6319880

笠原博徳, 木村啓二, 林明宏, 見神広紀, 金羽木洋平, 梅田弾, 沢田光男

特許権
並列性の抽出方法及びプログラムの作成方法

特許第6319880号

笠原博徳, 木村啓二, 林明宏, 見神広紀, 金羽木洋平, 梅田弾, 沢田光男

特許権

J-GLOBAL
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, AND VEHICULAR DEVICE

9934012(US)

Kazushi Nobuta, Noriyuki Suzuki, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
METHOD OF PROVIDING A NON-CACHEABLE AREA IN MEMORY

9928057(US)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
PROCESSOR, ACCELERATOR, AND DIRECT MEMORY ACCESS CONTROLLER WITHIN A PROCESSOR CORE THAT EACH READS/WRITES A LOCAL SYNCHRONIZATION FLAG AREA FOR PARALLEL EXECUTION

9846673(US)

Hironori Kasahara, Keiji Kimura

特許権
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, PARALLELIZING COMPILE APPARATUS, AND ONBOARD APPARATUS

9760355(US)

Yuji Mori, Mitsuhiro Tani, Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Dan Umeda, Yohei Kanehagi

特許権
ACCELERATOR AND PROCESSOR SYSTEM

I597661(TW)

Hironori Kasahara, Keiji Kimura

特許権
PROCESSOR SYSTEM AND ACCELERATOR

ZL201280065692.7(CN)

Hironori Kasahara, Keiji Kimura

特許権
プロセッサコア及びプロセッサシステム

笠原博徳, 木村啓二

特許権

J-GLOBAL
マルチプロセッサシステム

笠原博徳, 木村啓二, 伊藤雅之, 亀井達也, 服部俊洋

特許権

J-GLOBAL
プロセッサシステム及びアクセラレータ

特許6103647

木村啓二, 笠原博徳

特許権
プロセッサシステム及びアクセラレータ

特許第6103647号

笠原博徳, 木村啓二

特許権

J-GLOBAL
並列化コンパイル方法、並列化コンパイラ、及び車載装置

峰田憲一, 鈴木範幸, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権

J-GLOBAL
並列化コンパイル方法、並列化コンパイラ、及び車載装置

信田和志, 鈴木範幸, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権

J-GLOBAL
並列化コンパイル方法、並列化コンパイラ、及び車載装置

矢頭義弘, 鈴木範幸, 峰田憲一, 笠原博徳, 木村啓二, 見神広紀, 梅田弾

特許権

J-GLOBAL
並列化コンパイル方法、並列化コンパイラ、並列化コンパイル装置、及び、車載装置

特許6018022

森裕司, 谷充弘, 笠原博徳, 木村啓二, 林明宏, 見神広紀, 梅田弾, 金羽木洋平

特許権
並列化コンパイル方法、並列化コンパイラ、並列化コンパイル装置、及び、車載装置

特許第6018022号

森裕司, 谷充弘, 笠原博徳, 木村啓二, 梅田弾, 林明宏, 見神広紀, 金羽木洋平

特許権

J-GLOBAL
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

Kenichi Mineta, Noriyuki Suzuki, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, AND VEHICULAR DEVICE

Kenichi Mineta, Noriyuki Suzuki, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, AND VEHICULAR DEVICE

Yoshihiro Yatoh, Noriyuki Suzuki, Kenichi Mineta, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, AND VEHICULAR DEVICE

Kazushi Nobuta, Noriyuki Suzuki, Hironori Kasahara, Keiji Kimura, Hiroki Mkiami, Dan Umeda

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

2620840(EP)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

2620840(GB)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

602006047921.2(DE)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
PARALLELISM EXTRACTION METHOD AND METHOD FOR MAKING PROGRAM

Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Yohei Kanehagi, Dan Umeda, Mitsuo Sawada

特許権
METHOD OF GENRATING CODE WHICH IS EXECUTABLE BY A PROCESSOR AND STORAGE AREA MANAGEMENT METHOD

ZL201080057540.3(CN)

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
マルチプロセッサシステム

笠原博徳, 木村啓二, 伊藤雅之, 亀井達也, 服部俊洋

特許権

J-GLOBAL
並列化コンパイル方法、並列化コンパイラ、並列化コンパイル装置、及び、車載装置

森裕司, 谷充弘, 笠原博徳, 木村啓二, 梅田弾, 林明宏, 見神広紀, 金羽木洋平

特許権

J-GLOBAL
PARALLELIZATION COMPILING METHOD, PARALLELIZATION COMPILER, PARALLELIZING COMPILE APPARATUS, AND ONBOARD APPARATUS

Yuji Mori, Mitsuhiro Tani, Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Dan Umeda, Yohei Kanehagi

特許権
並列性の抽出方法及びプログラムの作成方法

笠原博徳, 木村啓二, 林明宏, 見神広紀, 金羽木洋平, 梅田弾, 沢田光男

特許権

J-GLOBAL
MULTIPROCESSOR SYSTE AND MULTIGRAIN PARALLELIZING COMPILER

8812880(US)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
PARALLELISM EXTRACTING METHOD AND PROGRAM CREATION METHOD

Hironori Kasahara, Keiji Kimura, Akihiro Hayashi, Hiroki Mikami, Yohei Kanehagi, Dan Umeda, Mitsuo Sawada

特許権
MEMORY MANAGEMENT METHOD, PROGRAM CREATION METHOD

ZL200880003780.8(CN)

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
マルチプロセッサシステムおよびマルチプロセッサシステムの同期方法

笠原博徳, 木村啓二, 伊藤雅之, 亀井達也, 服部俊洋

特許権

J-GLOBAL
プロセッサによって実行可能なコードの生成方法、記憶領域の管理方法及びコード生成プログラム

特許5283128

笠原博徳, 木村啓二, 間瀬正啓

特許権
プロセッサによって実行可能なコードの生成方法、記憶領域の管理方法及びコード生成プログラム

特許第5283128号

笠原博徳, 木村啓二, 間瀬正啓

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND MULTIPROCESSOR SYSTEM SYNCHRONIZATION METHOD

ZL200980103004(CN)

Hironori Kasahara, Keiji Kimura, Masayuki Ito, Tatsuya Kamei, Toshihiro Hattori

特許権
PROCESSOR SYSTEM AND ACCELERATOR

Hironori Kasahara, Keiji Kimura

特許権
プロセッサシステム及びアクセラレータ

笠原博徳, 木村啓二

特許権

J-GLOBAL
MEMORY MANAGEMENT METHOD, INFORMATION PROCESSING DEVICE, PROGRAM CREATION METHOD, AND PROGRAM

8438359(US)

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
メモリ管理方法、情報処理装置、プログラムの作成方法及びプログラム

特許5224498

笠原博徳, 木村啓二, 中野啓史, 仁藤拓実, 丸山貴紀, 三浦剛, 田川友博

特許権
メモリ管理方法、情報処理装置、プログラムの作成方法及びプログラム

特許第5224498号

笠原博徳, 木村啓二, 中野啓史, 仁藤拓実, 丸山貴紀, 三浦剛, 田川友博

特許権

J-GLOBAL
MEMORY MANAGEMENT METHOD, INFORMATION PROCESSING DEVICE, PROGRAM CREATON METHOD, AND PROGRAM

10-1186174(KR)

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
MEHTOD FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR AND MULTIGRAIN PARALLELIZING COMPILER

8250548(US)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Yasutaka Wada, Masaki Ito, Hiroaki Shikano

特許権
MULTIGRAIN PARALLELIZATION COMPILING METHOD

ZL2009100075365(CN)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
DATA TRANSFER UNIT IN MULTI-CORE PROCESSOR

8200934(US)

Hironori Kasahara, Keiji Kimura, Takashi Todaka, Tatsuya kamei, Toshihiro Hattori

特許権
MULTIPROCESSOR SYSTEM

ZL200910146644.0(CN)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
ヘテロジニアス・マルチプロセッサシステムの制御方法及びマルチグレイン並列化コンパイラ

特許4936517

笠原博徳, 木村啓二, 白子準, 和田康孝, 伊藤雅樹, 鹿野裕明

特許権
ヘテロジニアス・マルチプロセッサシステムの制御方法及びマルチグレイン並列化コンパイラ

特許第4936517号

笠原博徳, 木村啓二, 白子準, 和田康孝, 伊藤雅樹, 鹿野裕明

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND METHOD OF SYNCHRONIZATION FOR MULTIPROCESSOR SYSTEM

8108660(US)

Hironori Kasahara, Keiji Kimura, Masayuki Ito, Tatsuya Kamei, Toshihiro Hattori

特許権
MEMORY MANAGEMENT METHOD AND INFORMATION PROCESSING DEVICE IMPLEMENTING THE METHOD

2459802(GB)

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
MEMORY MANAGEMENT METHOD, INFORMATION PROCESSING DEVICE, PROGRAM CREATION METHOD, AND PROGRAM

2478874(GB)

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
GLOBAL COMPILER FOR CONTROLLING HETEROGENEOUS MULTIPROCESSOR

8051412(US)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
マルチプロセッサ及びマルチプロセッサシステム

特許4784842

笠原博徳, 木村啓二

特許権
マルチプロセッサ及びマルチプロセッサシステム

特許第4784842号

笠原博徳, 木村啓二

特許権

J-GLOBAL
ヘテロジニアスマルチプロセッサ向けグローバルコンパイラ

特許4784827

笠原博徳, 木村啓二, 鹿野裕明

特許権
ヘテロジニアスマルチプロセッサ向けグローバルコンパイラ

特許第4784827号

笠原博徳, 木村啓二, 鹿野裕明

特許権

J-GLOBAL
マルチプロセッサ

特許第4784792号

笠原博徳, 木村啓二

特許権

J-GLOBAL
マルチプロセッサ

特許4784792

笠原博徳, 木村啓二

特許権
プロセッサによって実行可能なコードの生成方法、記憶領域の管理方法及びコード生成プログラム

笠原博徳, 木村啓二, 間瀬正啓

特許権

J-GLOBAL
METHOD OF GENERATING CODE EXECUTABLE BY PROCESSOR

Hironori Kasahara, Keiji Kimura, Mase Masayoshi

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

7895453(US)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
プロセッサ及びデータ転送ユニット

特許4476267

笠原博徳, 木村啓二, 戸高貴司, 亀井達也, 服部俊洋

特許権
プロセッサ及びデータ転送ユニット

特許第4476267号

笠原博徳, 木村啓二, 戸▲高▼ 貴司, 亀井達也, 服部俊洋

特許権

J-GLOBAL
マルチプロセッサシステム

笠原博徳, 木村啓二

特許権

J-GLOBAL
マルチプロセッサシステムおよびマルチプロセッサシステムの同期方法

笠原博徳, 木村啓二, 伊藤雅之, 亀井達也, 服部俊洋

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND MULTIPROCESSOR SYSTEM SYNCHRONIZATION METHOD

Hironori Kasahara, Keiji Kimura, Masayuki Ito, Tatsuya Kamei, Toshihiro Hattori

特許権
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

ZL200680000666.0(CN)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
マルチプロセッサ

特許4304347

笠原博徳, 木村啓二

特許権
マルチプロセッサ

特許第4304347号

笠原博徳, 木村啓二

特許権

J-GLOBAL
黒体塗料及び温度測定方法並びに残留応力低減方法

笠原二郎, 山内澄男, 鬼塚博徳

特許権

J-GLOBAL
GLOBAL COMPILER FOR HETEROGENEOUS MULTIPROCESSOR

10-0878917(KR)

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
温度計測装置、温度計測方法、残留応力改善方法及びソフトウェアプログラム

宇多信喜, 笠原二郎, 西田圭吾, 鬼塚博徳

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

10-0861631(KR)

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
マルチプロセッサ

笠原博徳, 木村啓二

特許権

J-GLOBAL
メモリ管理方法、情報処理装置、プログラムの作成方法及びプログラム

笠原博徳, 木村啓二, 中野啓史, 仁藤拓実, 丸山貴紀, 三浦剛, 田川友博

特許権

J-GLOBAL
MEMORY MANAGEMENT METHOD, INFORMATION PROCESSING DEVICE, PROGRAM CREATION METHOD, AND PROGRAM

Hironori Kasahara, Keiji Kimura, Hirofumi Nakano, Takumi Nito, Takanori Maruyama, Tsuyoshi Miura, Tomohiro Tagawa

特許権
コンパイル方法、コンパイラ、およびコンパイル装置

特許4177681

笠原博徳, 石坂一久, 中野啓史, 小幡元樹

特許権
コンパイル方法、コンパイラ、およびコンパイル装置

特許第4177681号

笠原博徳, 石坂一久, 中野啓史, 小幡元樹

特許権

J-GLOBAL
マルチプロセッサ及びマルチプロセッサシステム

笠原博徳, 木村啓二

特許権

J-GLOBAL
プロセッサ及びデータ転送ユニット

笠原博徳, 木村啓二, 戸▲高▼ 貴司, 亀井達也, 服部俊洋

特許権

J-GLOBAL
マルチプロセッサシステム及びマルチグレイン並列化コンパイラ

特許4082706

笠原博徳, 木村啓二, 白子準, 伊藤雅樹, 鹿野裕明

特許権
マルチプロセッサシステム及びマルチグレイン並列化コンパイラ

特許第4082706号

笠原博徳, 木村啓二, 白子準, 伊藤雅樹, 鹿野裕明

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
ヘテロジニアス・マルチプロセッサシステムの制御方法及びマルチグレイン並列化コンパイラ

笠原博徳, 木村啓二, 白子準, 和田康孝, 伊藤雅樹, 鹿野裕明

特許権

J-GLOBAL
ヘテロジニアスマルチプロセッサ向けグローバルコンパイラ

笠原博徳, 木村啓二, 鹿野裕明

特許権

J-GLOBAL
GLOBAL COMPILER FOR HETEROGENEOUS MULTIPROCESSOR

Hironori Kasahara, Keiji Kimura, Hiroaki Shikano

特許権
マルチプロセッサシステム

笠原博徳, 木村啓二, 白子準, 伊藤雅樹, 鹿野裕明

特許権

J-GLOBAL
マルチプロセッサシステム及びマルチグレイン並列化コンパイラ

笠原博徳, 木村啓二, 白子準, 伊藤雅樹, 鹿野裕明

特許権

J-GLOBAL
MULTIPROCESSOR SYSTEM AND MULTIGRAIN PARALLELIZING COMPILER

Hironori Kasahara, Keiji Kimura, Jun Shirako, Masaki Ito, Hiroaki Shikano

特許権
コンパイル方法、コンパイラ、コンパイル装置、プログラムコード作成方法、プログラム、キャッシュ最適利用演算方法、およびキャッシュ最適利用演算装置

笠原博徳, 石坂一久, 中野啓史, 小幡元樹

特許権

J-GLOBAL
電子回路シミュレータ

笠原博徳, 間中邦之

特許権
電子回路シュミレータ

笠原博徳, 間中邦之

特許権

J-GLOBAL
シングルチップマルチプロセッサ

笠原博徳, 木村啓二

特許権

J-GLOBAL
発電プラントシミュレーション装置およびこの装置用のシミュレーションコード生成装置

特許第2731252号

成田誠之助, 笠原博徳, 神余浩夫, 佐々木和則

特許権

J-GLOBAL
発電プラントシミュレーション装置およびこの装置用のシミュレーションコード生成装置

特許2731252

成田誠之助, 笠原博徳, 神余浩夫, 佐々木和則

特許権
並列データ処理方式

成田誠之助, 笠原博徳

特許権
並列データ処理方式

成田誠之助, 笠原博徳

特許権
命令制御方式

成田誠之助, 笠原博徳, 橋本親, 引地正則, 富沢敬一

特許権

▼全件表示

現在担当している科目

修士論文（情報・通信）

大学院基幹理工学研究科

2026年通年
IoTシステム設計

大学院基幹理工学研究科

2026年春学期
Master's Thesis (Department of Computer Science and Communications Engineering)

大学院基幹理工学研究科

2026年通年
Seminar on Advanced Computing Systems D

大学院基幹理工学研究科

2026年秋学期
Seminar on Advanced Computing Systems C

大学院基幹理工学研究科

2026年春学期
Seminar on Advanced Computing Systems B

大学院基幹理工学研究科

2026年秋学期
Seminar on Advanced Computing Systems A

大学院基幹理工学研究科

2026年春学期
Research on Advanced Computing Systems

大学院基幹理工学研究科

2026年通年
Special Laboratory B in Computer Science and Communications Engineering

大学院基幹理工学研究科

2026年秋学期
Special Laboratory A in Computer Science and Communications Engineering

大学院基幹理工学研究科

2026年春学期
Advanced Computer Architecture

大学院基幹理工学研究科

2026年春学期
情報理工・情報通信特別実験B

大学院基幹理工学研究科

2026年秋学期
アドバンスト・コンピューティング・システム演習D

大学院基幹理工学研究科

2026年秋学期
アドバンスト・コンピューティング・システム演習C

大学院基幹理工学研究科

2026年春学期
アドバンスト・コンピューティング・システム演習B

大学院基幹理工学研究科

2026年秋学期
アドバンスト・コンピューティング・システム演習A

大学院基幹理工学研究科

2026年春学期
情報理工・情報通信特別実験A

大学院基幹理工学研究科

2026年春学期
アドバンスト・コンピューティング・システム研究

大学院基幹理工学研究科

2026年通年
コンピュータ・アーキテクチャ特論

大学院基幹理工学研究科

2026年春学期
IoTシステム設計

大学院創造理工学研究科

2026年春学期
情報理工・情報通信特別演習Ｂ

大学院基幹理工学研究科

2026年秋学期
情報理工・情報通信特別演習Ａ

大学院基幹理工学研究科

2026年春学期
アドバンスト・コンピューティング・システム研究

大学院基幹理工学研究科

2026年通年
IoTシステム設計

大学院先進理工学研究科

2026年春学期
コンピュータ・アーキテクチャ特論

基幹理工学部

2026年春学期
プロジェクト研究Ｂ

基幹理工学部

2026年秋学期
IoTシステム設計

基幹理工学部

2026年春学期
コンピュータアーキテクチャＡ　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
コンピュータアーキテクチャＡ

基幹理工学部

2026年秋学期
卒業論文Ａ（秋学期）

基幹理工学部

2026年秋学期
プロジェクト研究Ａ

基幹理工学部

2026年春学期
言語処理系　　【前年度成績S評価者用】

基幹理工学部

2026年春学期
言語処理系

基幹理工学部

2026年春学期
卒業論文Ｂ（春学期）

基幹理工学部

2026年春学期
卒業論文Ｂ

基幹理工学部

2026年秋学期
卒業論文Ａ　（集中）

基幹理工学部

2026年集中（春・秋学期）
卒業論文Ａ

基幹理工学部

2026年春学期
卒業論文Ｂ　18前再　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
卒業論文Ｂ（春学期）　18前再

基幹理工学部

2026年春学期
コンピュータアーキテクチャＢ【前年度成績S評価者用】

基幹理工学部

2026年秋学期
コンピュータアーキテクチャＢ

基幹理工学部

2026年秋学期
卒業論文Ｂ　18前再

基幹理工学部

2026年秋学期
卒業論文Ａ　18前再　【前年度成績S評価者用】

基幹理工学部

2026年春学期
情報理工学実験Ａ　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
情報理工学実験Ａ

基幹理工学部

2026年秋学期
情報理工学実験Ｂ

基幹理工学部

2026年春学期
卒業論文Ａ（秋学期）　18前再

基幹理工学部

2026年秋学期
卒業論文Ａ　18前再

基幹理工学部

2026年春学期
情報理工学実験Ｂ【前年度成績S評価者用】

基幹理工学部

2026年春学期
卒業論文Ａ　18前再　【前年度成績S評価者用】

基幹理工学部

2026年春学期
卒業論文Ｂ　18前再

基幹理工学部

2026年秋学期
卒業論文Ｂ　18前再　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
情報通信実験Ｂ【前年度成績S評価者用】

基幹理工学部

2026年春学期
卒業論文Ａ（秋学期）　18前再

基幹理工学部

2026年秋学期
情報通信実験Ｂ

基幹理工学部

2026年春学期
情報通信実験Ａ　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
情報通信実験Ａ

基幹理工学部

2026年秋学期
コンピュータアーキテクチャＡ　【前年度成績S評価者用】

基幹理工学部

2026年秋学期
コンピュータアーキテクチャＡ

基幹理工学部

2026年秋学期
IoTシステム設計

基幹理工学部

2026年春学期
卒業論文Ａ　18前再

基幹理工学部

2026年春学期
Graduation Thesis A　(Fall)[S Grade]【For students enrolled before 2022】

基幹理工学部

2026年秋学期
Graduation Thesis A　(Spring)【For students enrolled before 2022】

基幹理工学部

2026年春学期
Graduation Thesis A　(Fall)【For students enrolled before 2022】

基幹理工学部

2026年秋学期
Graduation Thesis A (Spring) [S Grade]

基幹理工学部

2026年春学期
Graduation Thesis A (Fall)

基幹理工学部

2026年秋学期
Graduation Thesis A (Spring)

基幹理工学部

2026年春学期
Graduation Thesis B (Fall) [S Grade]

基幹理工学部

2026年秋学期
Graduation Thesis B (Spring) [S Grade]

基幹理工学部

2026年春学期
Graduation Thesis B (Fall)

基幹理工学部

2026年秋学期
Graduation Thesis B (Spring)

基幹理工学部

2026年春学期
Computer Science and Communications Engineering Laboratory A [S Grade]

基幹理工学部

2026年秋学期
Computer Science and Communications Engineering Laboratory A

基幹理工学部

2026年秋学期
IoTシステム設計

基幹理工学部

2026年春学期
コンピュータ・アーキテクチャ特論

基幹理工学部

2026年春学期
プロジェクト研究Ｂ

基幹理工学部

2026年秋学期
卒業論文Ｂ

基幹理工学部

2026年秋学期
卒業論文Ａ　（集中）

基幹理工学部

2026年集中（春・秋学期）
プロジェクト研究Ａ

基幹理工学部

2026年春学期
言語処理系

基幹理工学部

2026年春学期
コンピュータアーキテクチャＢ

基幹理工学部

2026年秋学期
卒業論文Ｂ（春学期）

基幹理工学部

2026年春学期
卒業論文Ｂ（春学期）　18前再

基幹理工学部

2026年春学期
卒業論文Ａ

基幹理工学部

2026年春学期
卒業論文Ａ（秋学期）

基幹理工学部

2026年秋学期
Project Research Fall

基幹理工学部

2026年秋学期
Project Research Spring

基幹理工学部

2026年春学期
Introduction to Computers and Networks

基幹理工学部

2026年春学期
Computer Science and Communications Engineering Laboratory B

基幹理工学部

2026年春学期
Advanced Computer Architecture

基幹理工学部

2026年春学期
Graduation Thesis A (Fall) [S Grade]

基幹理工学部

2026年秋学期
Graduation Thesis A　(Spring)[S Grade]【For students enrolled before 2022】

基幹理工学部

2026年春学期

▼全件表示

他学部・他研究科等兼任情報

理工学術院大学院基幹理工学研究科
附属機関・学校グローバル・エデュケーション・センター

学内研究所・附属機関兼任歴

2024年

-

2026年

理工学術院総合研究所兼任研究員
2024年

-

2026年

カーボンニュートラル社会研究教育センター兼任センター員
2024年

-

2025年

アドバンストマルチコアプロセッサ研究所プロジェクト研究所所長

特定課題制度（学内資金）

マルチプロセッサシステム用自動並列化コンパイラに関する研究

1997年成田　誠之助, 吉田　明正, 高井　峰生, 藤本　謙作

　概要を見る

本研究では、価格性能比が優れ使いやすい２１世紀のハイパフォーマンスコンピュータ(HPC)及び汎用マイクロプロセッサを開発するために必須なマルチプロセッサ用自動並列化コンパイラに関する研究を行った。　自動並列化コンパイラは、ユーザプログラム中から並列性を抽出し、その並列実行可能部分をハードウェア性能を引き出せるようにスケジューリングし、並列マシンコードを生成するプログラムである。本コンパイラ技術により、HPC 分野においてはハードウェアの持つ高い性能を有効に引き出しプログラムを実行時の真の性能を高め、価格性能比を改善するとともに、使いやすさを向上させることができる。また、汎用マイクロプロセッサの分野では、現在主流のスーパースカラやVLIW方式は命令レベルの並列性の限界から将来的な実効性能の向上が難しいと予測されており、本研究は21世紀初頭の有力なアーキテクチャになると考えられるシングルチップ・マルチプロセッサの重要な基礎技術になると考えられる。　具体的には、本研究では、以下の事項に関する研究を行った。（1）マルチグレイン並列化技術　マルチグレイン並列化技術は、筆者らが提案している独自の並列化手法で、従来のマルチプロセッサシステムが使用していたループ並列化技術に加え、サブルーティン、ループ、基本ブロック間の粗粒度並列性を利用するマクロデータフロー処理技術、プロセッサ間でステートメントあるいは複数命令レベルの並列性を利用する（近）細粒度処理技術を階層的に組み合わせる手法である。（2）データローカライゼーション技術（データ分散技術）　現在のマルチプロセッサシステムでは、各プロセッサがローカルメモリあるいは分散共有メモリを有するものが多く、このようなシステム上で効果的な並列処理を行う時には、これらのメモリを有効に使用しプロセッサ間のデータ転送を最小化することが重要である。本研究では、このためのデータ及び処理の自動分割及びプロセッサへの割り当て法について研究を行った。（3）マルチプロセッサ・スケジューリング技術（マッピング技術）　強ＮＰ完全である実行時間最小マルチプロセッサスケジューリング問題に対する実用的な並列最適化アルゴリズムの開発とその性能評価を行った。このスケジューリング問題に関する最適解は他機関では従来タスク数数十程度しか求まったことが報告されていないが、今回の研究では千タスク以上の超大規模問題まで求解できることを確かめている。　これらの研究成果の一部は、１３件の論文誌及び国際会議論文、２件の査読付きシンポジウム、１８件の査読無し研究会（一部発表予定の論文含む）・シンポジウムジウム論文、１２件の全国大会論文として発表した。