#
#

深層学習に関連した研究

ViTを用いた
Transportation Mode Detection

Deep Learning related Research

Transportation Mode Detection using ViT

Transportation Mode Detection (TMD)は、高度道路交通システム(ITS)やライフログにとって重要な課題です。 スマートフォンに内蔵されたセンサーを利用したTMDは、低コストで効果的なソリューションとなり得ます。 近年、多くの研究がTMDに焦点を当てていますが、その性能はさらなる応用に必要な要件を満たすものではありません。 本論文では、TMDを実現するために、構造特徴と空間的相互作用特徴を組み合わせ、複数のセンサーの寄与の重みを考慮した新しいネットワークフレームワークを提案します。 まず、生データを分割してスペクトル画像に変換し、ResNetとVision Transformers(Vit)を用いて、それぞれ構造特徴と空間的相互作用特徴を抽出します。 異なるセンサーの寄与を考慮するため、ECAモジュールを用いて各センサーの重みを再校正します。 提案手法の性能をSussex-Huawei Locomotion-Transportation (SHL)データセットで評価した結果、ベースラインを少なくとも10%上回る性能を示しています。

Transportation Mode Detection (TMD) is an important task for Intelligent Transportation System (ITS) and Lifelog. TMD using smartphone built-in sensors can be a low-cost and effective solution. In recent years, many studies have focused on TMD, yet their performance cannot meet the requirements for further application. In this paper, we propose a new network framework to realize TMD, which combines structure feature and spatial interaction feature, and considers the weights of multiple sensors’ contribution. First, raw data is segmented and transformed into a spectrum image and then ResNet and Vision Transformers (Vit) are used to extract structure and spatial interaction features, respectively. To consider the contribution of different sensors, weights of each sensor are recalibrated using a ECA module. Finally, Multi-Layer Perceptron (MLP) is introduced to fuse these two different kinds of features. The performance of the proposed method is evaluated on the public Sussex-Huawei Locomotion-Transportation (SHL) dataset, it outperforms the baselines by at least 10%.


参考文献 REFERENCES
Ye Tian, Dulmini Hettiarachchi, Shunsuke Kamijo, “Transportation Mode Detection Combining CNN and Vision Transformer with Sensors Recalibration Using Smartphone Built-In Sensors,” Sensors (MDPI), 22(17) 6453, 2022.