ニュース&イベント NEWS & EVENTS

2019.11.11 Mon UP

強化学習を用いた自律分散型の無線ネットワーク技術を開発
~省電力で安定した無線通信を実現するIoTシステムの構築に貢献~

研究の要旨とポイント

  • 「強化学習」を用いることで、IoTデバイスが"自ら"最適なチャネルを選択する自律分散型の無線通信管理プロトコルを開発しました。
  • 新たなプロトコルは、多数のIoTデバイスが同時に通信を行う多い環境でもデータパケットの干渉・衝突が起きにくく、省電力・小演算機能のIoTデバイスにも実装が可能でした。
  • 多数のIoTデバイスが混在し、大規模なIoT環境(Massive IoT)でも安定したネットワークを提供する無線管理技術として、応用が期待されます。

昨今、あらゆるモノが通信でつながる「IoT(Internet of Things)」が注目されています。国際的なIT業界団体であるCompTIA(コンピュータ技術産業協会、コンプティア)は、IoTデバイスの数は2020年までに500億個、2030年には1,250億台に達すると予測しています。 (https://www.comptia.org/content/research/sizing-up-the-internet-of-things)
これほど膨大な通信機器が混在する状況では、パケットの干渉や衝突など、ネットワークの混雑によるデータ転送の失敗が大きな問題となってきます。IoTの用途の多くは工場やビル、農場などにおける様々なデータをリアルタイムかつ大量に取得して、ビッグデータとして活用することです。この際に必要な各種センサーはスマートフォンや家電とは違い、演算機能やデータを蓄えるストレージ、データ転送のために使える電力がいずれも小さいため、このようなデバイスでも安定した無線通信を可能にする技術が求められています。

同じ周波数帯域(Hz)でも、異なるチャネルを使うことができればネットワークは混雑しません。そのため、IoTデバイスにそのつど最適なチャネルを割り当て、安定した通信を行う「マルチチャネル」型のアルゴリズムが開発されてきました。しかし、「マルチチャネル」型アルゴリズムは、デバイスごとの時刻の同期や、デバイス間での頻繁な通信などが必要なため、省電力・小演算機能のデバイスへの実装には向いていません。
東京理科大学工学部電気工学科の長谷川幹雄教授と慶應義塾大学大学院政策・メディア研究科の金成主特任准教授らの研究グループは、強化学習によって個々のIoTデバイスが"自ら"最適なチャネルを選択する「自律分散型」のアルゴリズムを開発し、省電力・小演算機能のデバイスに実装しました。その結果、30台以上のIoTデバイスが密集し、ネットワーク負荷が頻繁に変化するような環境でも、安定した無線通信を実現することに成功しました。研究グループは今後、本研究で構築したプロトタイプを建物の室内環境のモニタリングシステムに導入し、実証実験を行う予定です。

【研究の背景】

無線通信の混雑は、同じ周波数帯の電波で通信を行うIoTデバイスが多数ある場合に起こります。たとえば、私たちが日ごろ使用するインターネットでも、ホテルやオフィスなどで1台のWi-Fiルータに多くのパソコンやスマートフォンを同時に接続すると、通信の遅延や断絶が起きることがあります。IoTの世界では、あらゆるモノに取り付けられた無数のセンサーが、常時情報を送信しようとするため、混雑はより深刻です。

通信の継続と遅延の軽減をはかる手段の1つが、ルータと個々のIoTデバイスに、同一の波長帯の中でもなるべく接続負荷が少ないチャネルをそのつど選択、調整させる「マルチチャネル」と呼ばれる技術です。マルチチャネルでは、IoTデバイスが、接続を希望するチャネルに実際に接続を試みて、そのチャネルが他のデバイスに既に使われていないかを確認しています。チャネルが空いていなければ通信は行えないため、空いたチャネルが見つかるまで繰り返し探すことになります。ルータと全てのデバイスを含むネットワーク全体の時計を精密に合わせる「時刻同期」を行うことで、送受信のタイミングをコントロールして、チャネル接続の成功率を上げることはできます。しかし、そうした複雑なアルゴリズムを実装するには、ストレージが大きく、演算機能も高いデバイスが必要です。また、チャネルの探索には余分な電力がかかります。

大規模なIoTの用途の多くは従来のスマートフォンやパソコンとは違い、川の水位や農場の土の温度、工場設備の振動など様々なデータをセンサーから収集し、モニタリングや分析を行うものです。使用するIoTデバイスの数は膨大ですが、その多くが省電力・小ストレージのデバイスです。このため、これらのデバイスで、安定したデータ通信を行うための新たなチャンネル制御技術が必要でした。

【研究の詳細】

長谷川教授らは、「強化学習」によってIoTデバイスが"自ら"最適なチャネルを選び出せるようなアルゴリズムを開発しました。強化学習とは機械学習の一つの手法で、行動の結果得られる報酬が最大になるように学習を行います。
今回のアルゴリズムは、強化学習の課題の1つ「多腕バンディット(MAB)」問題をモデルとしています。MABの名前の由来は複数のスロットマシン(腕状のハンドルを引いて回す)から報酬を得るギャンブラー(バンディット)です。ギャンブラーは最大の報酬を得るため、スロットがあたる確率の高いマシンを見つけだそうとします。マシンは事前には検証できず、ギャンブラーは実際のプレイの中で、マシンの「探索」と報酬の「搾取」をバランスよく繰り返し、報酬を最大化する方法を考える必要があります。

MABを本研究にあてはめると、ギャンブラーは「IoTデバイス」、スロットマシンは「チャネル」となります。つまり、IoTデバイスが報酬(接続の成功)を得られる確率が最も高いチャネルを選択するアルゴリズムが必要になります。今回は、共同研究者である金特任准教授が開発した、「綱引き(tug-of-war, TOW*1)」ダイナミクスと呼ばれる原理をベースとした独自の強化学習アルゴリズムを用いました。これは、すべてのチャネルが持っている報酬の総量が保存されるというルールにもとづいたアルゴリズムで、無線通信のように報酬が得られる確率が環境に応じて変化しやすい用途に適しています。
長谷川教授らは、その強化学習アルゴリズムを実装したIoTデバイスを「コグニティブIoTプロトタイプ(以下、コグニティブIoT)」と命名しました。コグニティブIoTは一枚のコンピュータ基板から構成されており、強化学習の他には少量のデータの送受信を行うという簡単な機能しか持っていません。送信と受信を同時に行うことはできず、送受信を行わない時はスリープモードになり、消費電力を最小限に抑える設定となっています。

実験では、920MHz帯の物理層を使った標準規格IEEE802.15.4g/4eの通信プロトコルを使用し、30台のコグニティブIoTと、チャネルの異なる3台のルータを用意しました。コグニティブIoTは3つの無線チャネルの中から1つを選んでデータを送信し、データを受け取ったルータからデータの到着を知らせるメッセージを受信します。このメッセージの到着をもって、送信が成功した(報酬が得られた)と判断し、次の送信のためのチャネルを選択するというしくみです。また、コグニティブIoTとの比較用として、強化学習のアルゴリズムが実装されておらず、あらかじめ設定されたチャネルでのみ通信が行えるデバイスを用意して、同じ実験を行いました。

検証の結果、30台のコグニティブIoTは、1メートル×1メートル区画の密集した場所に設置しても安定したデータ送信を行えることが確認できました。また、一部のチャネルに負荷を加えて、ネットワークの混雑を疑似的に再現したところ、コグニティブIoTはチャネルを固定されたデバイスと比較してチャネル接続の成功率が高いこと、ネットワーク中の全てのデバイスが公平なチャネル接続機会を得られていることがわかりました。更に、チャネルに加える負荷を経時的に変化させたところ、コグニティブIoTでは負荷の高まったチャネルへの接続が回避されており、強化学習によって最適なチャネル選択が行えるようになっていることが確認できました。
本研究の意義について、長谷川教授は「大規模なIoT環境を想定した、強化学習を用いた自律分散型無線ネットワークの研究はまだほとんど例がありません。今回、省電力・小ストレージのデバイスへの実装が可能になったことにより、研究と実用化のいずれも、これからさらに広がっていくと期待しています」と話しています。

*1 Tug-of War dynamics:
•特許第6145766号、US14/780166、EPC14774425.4、KR10-2015-7026885
•S.-J. Kim et al., BioSystems 101, 29-36 (2010)
•S.-J. Kim et al., New J. Phys. 17, 083023 (2015)

【論文情報】

雑誌名 Applied Sciences (Appl. Sci. 2019, 9, 3730)
論文タイトル A Reinforcement-Learning-Based Distributed Resource Selection Algorithm for Massive IoT
著者 Jing Ma, So Hasegawa, Song-Ju Kim and Mikio Hasegawa
DOI https://doi.org/10.3390/app9183730

長谷川研究室のページ
研究室のページ:http://haselab.ee.kagu.tus.ac.jp/
長谷川教授のページ:https://www.tus.ac.jp/fac_grad/p/index.php?26b3

当サイトでは、利用者動向の調査及び運用改善に役立てるためにCookieを使用しています。当ウェブサイト利用者は、Cookieの使用に許可を与えたものとみなします。詳細は、「プライバシーポリシー」をご確認ください。