甲藤 二郎 (カットウ ジロウ)

写真a

所属

理工学術院 基幹理工学部

職名

教授

ホームページ

http://www.katto.comm.waseda.ac.jp/

兼担 【 表示 / 非表示

  • 理工学術院   大学院基幹理工学研究科

  • 附属機関・学校   グローバルエデュケーションセンター

学内研究所等 【 表示 / 非表示

  • 2020年
    -
    2022年

    国際情報通信研究センター   兼任研究員

  • 2020年
    -
    2022年

    理工学術院総合研究所   兼任研究員

学位 【 表示 / 非表示

  • 東京大学   博士(工学)

経歴 【 表示 / 非表示

  • 2004年
    -
    2008年

    新エネルギー・産業技術総合開発機構 主任研究員

  • 2004年
    -
    2008年

    早稲田大学 理工学部 教授

  • 2008年
    -
     

    早稲田大学 基幹理工学部 教授   School of Fundamental Science and Engineering

  • 1999年
    -
    2004年

    早稲田大学 理工学部 助教授

  • 1992年
    -
    1999年

    NEC C&C研究所

全件表示 >>

所属学協会 【 表示 / 非表示

  •  
     
     

    ACM

  •  
     
     

    IEEE

  •  
     
     

    画像電子学会

  •  
     
     

    映像情報メディア学会

  •  
     
     

    情報処理学会

全件表示 >>

 

研究分野 【 表示 / 非表示

  • 通信工学

  • 計算機システム

研究キーワード 【 表示 / 非表示

  • マルチメディア信号処理

  • コンピュータネットワーク

論文 【 表示 / 非表示

  • IoT-centric service function chainingorchestration and its performance validation

    Hibiki Sekine, Kenji Kanai, Jiro Katto, Hidehiro Kanemitsu, Hidenori Nakazato

    2021 IEEE 18th Annual Consumer Communications and Networking Conference, CCNC 2021    2021年01月

     概要を見る

    In order to simplify deployment and management of IoT services, Network Function Virtualization (NFV) and Service Function Chaining (SFC) are promising solutions, and much researchers have conducted these topics. To enhance the reliability of former research efforts, in this paper, we propose an orchestration framework for IoT-centric SFC by using Docker and Kubernetes. The framework enables an automatic IoT service deployment by satisfying service requirements and computing and network resource constraints. In such deployment, we apply a Virtual Network Function (VNF)/Service Function (SF) placement problem to achieve efficient utilization of the resources. We set an objective function as minimizing both numbers of SF instances and communications and build a mathematical model based on Integer Linear Programming (ILP). To validate it, we implement a model for the framework and evaluate the performances by carrying out a numerical evaluation and a real experiment. From the evaluation results, we confirm that the proposed approach can reduce the number of SF placements and the number of communications among SF instances.

    DOI

  • Performance evaluations of channel estimation using deep-learning based super-resolution

    Daiki Maruyama, Kenji Kanai, Jiro Katto

    2021 IEEE 18th Annual Consumer Communications and Networking Conference, CCNC 2021    2021年01月

     概要を見る

    Thanks to breakthrough and evolution of deep learning in computer vision areas, adaptation of deep learning into communication systems are getting lots of attention to researchers. Recently, a channel estimation method by using a deep learning-based image super-resolution (SR) technique, namely ChannelNet, has been proposed. Inspired by this research, in this paper, we propose a deep SR based channel estimation method by applying more accurate deep learning-based SR network architecture, EDSR. In order to enhance intelligibility and reliability of deep SR based channel estimation methods, we evaluate the performance of several deep SR based channel estimation methods (SRCNN, ChannelNet and EDSR) by carrying out practical 5G simulations. From the evaluations, the results conclude that the deep SR based channel estimation methods can potentially improve accuracy of channel estimation and reduce BER characteristics.

    DOI

  • Fully Neural Network Mode Based Intra Prediction of Variable Block Size

    Heming Sun, Lu Yu, Jiro Katto

    2020 IEEE International Conference on Visual Communications and Image Processing, VCIP 2020     21 - 24  2020年12月

     概要を見る

    Intra prediction is an essential component in the image coding. This paper gives an intra prediction framework completely based on neural network modes (NM). Each NM can be regarded as a regression from the neighboring reference blocks to the current coding block. (1) For variable block size, we utilize different network structures. For small blocks 4×4 and 8×8, fully connected networks are used, while for large blocks 16×16 and 32×32, convolutional neural networks are exploited. (2) For each prediction mode, we develop a specific pre-trained network to boost the regression accuracy. When integrating into HEVC test model, we can save 3.55%, 3.03% and 3.27% BD-rate for Y, U, V components compared with the anchor. As far as we know, this is the first work to explore a fully NM based framework for intra prediction, and we reach a better coding gain with a lower complexity compared with the previous work.

    DOI

  • Enhanced Intra Prediction for Video Coding by Using Multiple Neural Networks

    Heming Sun, Zhengxue Cheng, Masaru Takeuchi, Jiro Katto

    IEEE Transactions on Multimedia   22 ( 11 ) 2764 - 2779  2020年11月

     概要を見る

    This paper enhances the intra prediction by using multiple neural network modes (NM). Each NM serves as an end-To-end mapping from the neighboring reference blocks to the current coding block. For the provided NMs, we present two schemes (appending and substitution) to integrate the NMs with the traditional modes (TM) defined in high efficiency video coding (HEVC). For the appending scheme, each NM is corresponding to a certain range of TMs. The categorization of TMs is based on the expected prediction errors. After determining the relevant TMs for each NM, we present a probability-Aware mode signaling scheme. The NMs with higher probabilities to be the best mode are signaled with fewer bits. For the substitution scheme, we propose to replace the highest and lowest probable TMs. New most probable mode (MPM) generation method is also employed when substituting the lowest probable TMs. Experimental results demonstrate that using multiple NMs will improve the coding efficiency apparently compared with the single NM. Specifically, proposed appending scheme with seven NMs can save 2.6%, 3.8%, and 3.1% BD-rate for Y, U, and V components compared with using single NM in the state-of-The-Art works.

    DOI

  • HEVC video coding with deep learning based frame interpolation

    Joi Shimizu, Zhengxue Cheng, Heming Sun, Masaru Takeuchi, Jiro Katto

    2020 IEEE 9th Global Conference on Consumer Electronics, GCCE 2020     433 - 434  2020年10月

     概要を見る

    Recent researches in video frame interpolation show great progress. In this paper, we propose a novel video compression method which incorporates deep learning based frame interpolation into HEVC which is the current video compression standard. Experimental results show that our approach can outperform HEVC in some scenarios.

    DOI

全件表示 >>

書籍等出版物 【 表示 / 非表示

  • IT Text: インターネットプロトコル

    分担

    オーム社  2005年10月

  • ディジタル放送教科書

    分担

    IDGジャパン  2003年02月

  • H.323/MPEG-4教科書

    分担

    IEインスティチュート  2001年04月

Misc 【 表示 / 非表示

  • Perceptual Quality Study on Deep Learning Based Image Compression

    Zhengxue Cheng, Pinar Akyazi, Heming Sun, Jiro Katto, Touradj Ebrahimi

    Proceedings - International Conference on Image Processing, ICIP   2019-September   719 - 723  2019年09月

     概要を見る

    Recently deep learning based image compression has made rapid advances with promising results based on objective quality metrics. However, a rigorous subjective quality evaluation on such compression schemes have rarely been reported. This paper aims at perceptual quality studies on learned compression. First, we build a general learned compression approach, and optimize the model. In total six compression algorithms are considered for this study. Then, we perform subjective quality tests in a controlled environment using high-resolution images. Results demonstrate learned compression optimized by MS-SSIM yields competitive results that approach the efficiency of state-of-the-art compression. The results obtained can provide a useful benchmark for future developments in learned image compression.

    DOI

  • Deep Residual Learning for Image Compression

    Zhengxue Cheng, Heming Sun, Masaru Takeuchi, Jiro Katto

       2019年06月

    機関テクニカルレポート,技術報告書,プレプリント等  

     概要を見る

    In this paper, we provide a detailed description on our approach designed for<br />
    CVPR 2019 Workshop and Challenge on Learned Image Compression (CLIC). Our<br />
    approach mainly consists of two proposals, i.e. deep residual learning for<br />
    image compression and sub-pixel convolution as up-sampling operations.<br />
    Experimental results have indicated that our approaches, Kattolab, Kattolabv2<br />
    and KattolabSSIM, achieve 0.972 in MS-SSIM at the rate constraint of 0.15bpp<br />
    with moderate complexity during the validation phase.

  • Learning image and video compression through spatial-temporal energy compaction

    Zhengxue Cheng, Heming Sun, Masaru Takeuchi, Jiro Katto

    Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition   2019-June   10063 - 10072  2019年06月

     概要を見る

    Compression has been an important research topic for many decades, to produce a significant impact on data transmission and storage. Recent advances have shown a great potential of learning based image and video compression. Inspired from related works, in this paper, we present an image compression architecture using a convolutional autoencoder, and then generalize image compression to video compression, by adding an interpolation loop into both encoder and decoder sides. Our basic idea is to realize spatial-temporal energy compaction in learning image and video compression. Thereby, we propose to add a spatial energy compaction-based penalty into loss function, to achieve higher image compression performance. Furthermore, based on temporal energy distribution, we propose to select the number of frames in one interpolation loop, adapting to the motion characteristics of video contents. Experimental results demonstrate that our proposed image compression outperforms the latest image compression standard with MS-SSIM quality metric, and provides higher performance compared with state-of-the-art learning compression methods at high bit rates, which benefits from our spatial energy compaction approach. Meanwhile, our proposed video compression approach with temporal energy compaction can significantly outperform MPEG-4, and is competitive with commonly used H.264. Both our image and video compression can produce more visually pleasant results than traditional standards.

    DOI

  • Methods for adaptive video streaming and picture quality assessment to improve QoS/QoE performances

    Kenji Kanai, Bo Wei, Zhengxue Cheng, Masaru Takeuchi, Jiro Katto

    IEICE Transactions on Communications   E102B ( 7 ) 1240 - 1247  2019年

     概要を見る

    This paper introduces recent trends in video streaming and four methods proposed by the authors for video streaming. Video traffic dominates the Internet as seen in current trends, and new visual contents such as UHD and 360-degree movies are being delivered. MPEG-DASH has become popular for adaptive video streaming, and machine learning techniques are being introduced in several parts of video streaming. Along with these research trends, the authors also tried four methods: route navigation, throughput prediction, image quality assessment, and perceptual video streaming. These methods contribute to improving QoS/QoE performance and reducing power consumption and storage size.

    DOI

  • Throughput Prediction Using Recurrent Neural Network Model

    Bo Wei, Mayuko Okano, Kenji Kanai, Wataru Kawakami, Jiro Katto

    2018 IEEE 7th Global Conference on Consumer Electronics, GCCE 2018     88 - 89  2018年12月

     概要を見る

    To ensure good quality of experience for user when transmitting video content, throughput prediction can contribute to the selection of proper bitrate. In this paper, we propose a throughput prediction method with recurrent neural network (RNN) model. Experiments are conducted to evaluate the methods, and the results indicate that proposed method can decrease the prediction error by a maximum of 29.39% compared with traditional methods.

    DOI

全件表示 >>

産業財産権 【 表示 / 非表示

全件表示 >>

受賞 【 表示 / 非表示

  • 電子情報通信学会 フェロー

    2015年09月  

  • 電子情報通信学会 通信ソサイエティ 活動功労賞

    2006年09月  

  • 電子情報通信学会 学術奨励賞

    1995年09月  

  • SPIE VCIP 1991, Best Student Paper Award

    1991年11月  

共同研究・競争的資金等の研究課題 【 表示 / 非表示

  • 無線LANを用いた車載APの広域被覆配置による広域高速大容量通信

    基盤研究(B)

    研究期間:

    2019年04月
    -
    2022年03月
     

    村瀬 勉, 金井 謙治, 甲藤 二郎, 計 宇生, 策力 木格, 小畑 博靖, 塩田 茂雄, 宮田 純子

     概要を見る

    以下の3つの研究テーマを実施した。
    ■研究テーマ1: 車の移動制御・最適ルート誘導制御においては、(a)目的地に向かう車両の最短経路ではなく、需要のある場所への迂回ルートをとったときの、得失を評価する。■成果:車両が移動する経路を2.5倍居ないに納めるという条件のもと、最適なルート制御を行うことで、最短経路の場合よりも、スループットを280%(=約4倍)向上させることができる、という結果を得た。これにより、車両のルート制御をうまく行うことで、所望のスループットを得るという当初の目的が概ね達成できる見込みとなった。
    ■研究テーマ2: 干渉緩和技術・最適AP選択技術においては、(d) APへの接続可否制御、APへの負荷分散制御を提案する。■成果: 移動するAPに連続して接続するための基礎検討を行った。IEEE802.11adのミリ波通信においては、移動する車との通信は、非常に短時間に高速で情報を転送する必要があることがわかった。そのため、現在普及しているIEEE802.11acなどの帯域では、混信(干渉)が大きすぎ実用が困難であることがわかった。一方、11adを用いる本研究の方法では、干渉や混信の影響よりもハンドオーバの制御方法で性能が決まることが判明し、ハンドオーバの最適化方法として、ビーコン送出間隔の調整と、ハンドオーバタイミングを決定する技術を開発した。
    ■研究テーマ3: 高速短時間通信技術においては、(g)IEEE802.11adのミリ波通信方法の移動通信における性能を評価する。■成果:車内のアクセスポイントと車外の歩行者のスマホとで通信するモデルにおいて、ミリ波通信は、車両のボディが障害物とある影響で性能が大きく変わってくることが明らかになった。特に金属ボディでの減衰は極めて大きく、逆に、ガラスを通した場合には、それほどでも無いことなどを定量的に明らかにした。

  • 世界最高水準のモバイルICT環境を実現する次世代情報通信基盤と応用実証

    基盤研究(A)

    研究期間:

    2015年04月
    -
    2019年03月
     

    甲藤 二郎, 村瀬 勉, 金井 謙治, 嶋本 薫, 津田 俊隆, 市野 将嗣, 亀山 渉

     概要を見る

    本申請の研究開発課題として以下を設定した。基盤技術として、(1) 無線通信履歴の取得、(2) 履歴を活用した品質予測、(3) 品質予測に基づく配信制御と経路探索、拡張技術として、(4) 大規模化、セキュリティ、センサー活用、新無線技術、QoE評価、(5) プロトタイプ実装。(1)~(3)に関しては、機械学習を適用した通信品質予測、QoEを最大化する適応配信制御、通信品質を最大化する移動経路提示、等の提案を行った。(4)~(5)に関しては、クラウド拡張、センサー利用による精度改善、実ネットワークにおける実装評価実験、等を行った。その上で、一連の研究成果を、査読付きの国際学会と論文誌で発表した。

  • 稠密な無線LANの高品質化を実現するユーザ移動制御方法

    基盤研究(B)

    研究期間:

    2015年04月
    -
    2018年03月
     

    村瀬 勉, 塩田 茂雄, 関屋 大雄, 小室 信喜, 橘 拓至, 小畑 博靖, 甲藤 二郎, 金井 謙治, 大西 洋文

     概要を見る

    本研究では,プロトコル・アクセス制御といった通信制御には手を加えず,ユーザ(あるいは端末)を制御対象とし,ユーザを物理的に移動させる「ユーザ移動制御」技術を開発した.移動にはコストがかかるため、どの程度のゲインが得られるかを定量的に評価して、把握しておく必要がある。評価においては、複数のユーザを移動させる場合の,対象ユーザ・距離・方向の組み合わせ爆発を避けるためのヒューリスティック解法も必要である。網トポロジや無線固有の特性を考慮して,様々なモデルに対して,解析・シミュレーション・実機実験を通して,ユーザ移動制御方法の有効性を立証した.

  • ソフトウェア無線・音響統合プラットフォームの開発と動画像配信実験

    挑戦的萌芽研究

    研究期間:

    2013年04月
    -
    2015年03月
     

    甲藤 二郎

     概要を見る

    本研究開発では、ソフトウェア無線とソフトウェア音響のプラットフォーム作成と評価実験を行なった。ソフトウェア無線に関してはGNU Radioを活用し、送信電力、変調方式、誤り訂正方式などを変化させながら計測実験を行ない、応用として音楽、静止画像、動画像の無線伝送実験を行なった。ソフトウェア音響に関しては市販のスピーカとマイク、MATLABを使用し、同じく送信音量、変調方式、誤り訂正方式などを変化させて特性計測を行ない、音楽と静止画像の配信実験を行なった。ソフトウェア音響に関しては動画像伝送までは至らなかったが、学会の評価は高く、2015年3月開催のIEEE WCNC 2015に採択された。

  • ハイブリッド型TCP輻輳制御の性能改善と実装評価

    基盤研究(B)

    研究期間:

    2008年
    -
    2010年
     

    甲藤 二郎, 蘇 洲

     概要を見る

    本研究では、高速・広帯域ネットワーク、無線ネットワーク、海中センサーネットワークそれぞれに適したトランスポートプロトコルに関する研究開発を進めた。それぞれについて、理論構築、シミュレーション実験、実装実験を併用して性能改善と評価を進め、既存方式を上回る新規な方式提案を実現した。また、将来的なトランスポートプロトコルの統合に向けた指針を得た。

全件表示 >>

特定課題研究 【 表示 / 非表示

  • 深層学習を用いた画像圧縮・画像通信に関する研究開発

    2020年  

     概要を見る

    本研究開発では、深層学習を用いた画像圧縮と画像通信に関する研究開発を行った。画像圧縮に関しては、動画像圧縮におけるイントラ予測の特性改善、エンドエンド学習型画像圧縮の固定小数点実装、RNNを用いた学習型画像圧縮、フレーム補間を活用した動画像圧縮、等に関する検討を行った。また、成果発表は、IEEE TMM、CVPR、VCIP、ICIP、ICASSP等で行い、VCIPにおける発表はBest Paper Awardを受賞した。画像通信に関しては、映像ストリーミングにおける適応レート制御、無線通信に対する超解像応用、等の検討を行った。また、成果発表は、国際学会のWCNCとCCNCで行った。

  • 深層学習適用による革新的な画像圧縮と映像配信に関する研究開発

    2019年  

     概要を見る

    本研究開発では、深層学習を用いた画像圧縮と画像通信に関する研究開発を行った。画像圧縮に関しては、深層学習を用いた静止画像の非可逆圧縮と可逆圧縮、動画像の非可逆圧縮に関する検討を行った。画像通信に関しては、深層学習を用いた適応レート制御と360度映像拡張に関する検討を行った。研究成果は、CVPR、ICIP、VCIP、PCS、ISM、ICCE等の国際会議で発表を行うと共に、IEEE Trans. CSVT、IEEE Access、IEICE Trans. Comm. 等の査読付き論文誌にも採録された。また、2020年度も、CVPR、ICASSP等の国際学会やIEEE Trans. Multimedia、IEEE Trans. CSVT等の論文誌への採録が確定している。

  • 遅延クリティカルアプリケーションのための基盤技術開発と体系化

    2017年  

     概要を見る

    本研究開発では、クラウドを活用するマルチメディアサービスについて、サービス時間の短縮に貢献するエッジコンピューティングのプロトタイプ実装と特性評価を行った。一つの検討例では、OpenStackを活用したエッジコンピューティングのプロトタイプシステムを作成し、具体的なアプリケーションとして映像配信と人物検知を実装した。また、別の検討例では、エッジコンピューティングを活用した映像監視を想定し、人物検知の結果に応じて配信レートを増減する適応映像配信システムを作成した。その上で、それぞれのプロトタイプの実機実験評価として、低遅延化の効果を確認した。

  • RFファインダーの研究開発

    2015年  

     概要を見る

    無線通信情報と可視光・赤外線カメラの併用によって無線通信機器の位置をピンポイントで特定するセンサフュージョン型測位システム「RFファインダー」の研究開発を進めた。無線LANアクセスポイントを対象に、スマートフォンを用いたSSIDや電波受信電力の取得によっておよその位置を推定し、赤外線カメラによって、熱源として無線LANアクセスポイントの位置を特定した。一方、Raspberry PiなどのIoTデバイスも試したが、こちらは熱源として特定するには、温度がさほど高くならないことも確認した。また、可視光カメラと赤外線カメラをハイブリッド使用した人物検出の精度改善についても実験を行ない、成果発表を行なった。

  • 快適で省電力なスマート・ワイヤレス・ナビゲーション

    2014年  

     概要を見る

    快適で省電力な無線通信を実現するスマート・ワイヤレス・ナビゲーションに関する研究開発を進めてきた。スマートフォンなどを用いて、セルラー基地局と無線LANアクセスポイントの位置、時刻、通信品質、消費電力を収集し、無線信号マップを作成する。そして、そのマップを活用して通信品質の未来予測を行ったり、通信品質を最大化する経路を提示したりすることに応用する。今年度は科学研究費補助金の採択を目指し、論文投稿と学会発表の実績作りを進め、最終的には基盤研究(A)に採択されることができた。

全件表示 >>

 

現在担当している科目 【 表示 / 非表示

全件表示 >>

 

委員歴 【 表示 / 非表示

  • 2014年06月
    -
    2016年06月

    映像情報メディア学会  編集長

  • 2012年
    -
    2015年

    IEEE ComSoC  Tech News Editorial Board

  • 2012年06月
    -
    2014年05月

    画像電子学会  財務理事

  • 2007年05月
    -
    2013年04月

    電子情報通信学会 ネットワークシステム研究専門委員会  専門委員

  • 2013年
    -
     

    IEEE Healthcom 2013  Technical Program Committee

全件表示 >>