この記事ではドライバー同定という運転に関する情報からドライバーを当てるという問題について紹介します。まずこの分野の背景知識として同定における3つの階層というものを説明し、最後に最近の事例をいくつか紹介していきたいと思います。
AI技術開発部データサイエンスGの菊地です。DRIVE CHARTという次世代AIドラレコを用いた事故削減サービスで運転ビッグデータの分析を担当しています。今回はそのような運転データの活用法として、ドライバー同定に関する最新動向を調査しました。ドライバー同定とは、運転に関する情報から"運転のクセ”を抽出することでドライバーが誰であったかを当てるという問題です。例えば損害保険で補償すべきドライバーによる事故であったか、いつもと違う動きをしているが盗難されていないか、運転作業を離れて別の人に任せていないか、といったシーンで使われる技術になります。
ドライバー同定でよくあるアプローチが「運転の荒さ」に関する指標を作ることです。もしこれをうまく作ることができれば、荒い・普通・荒くないといったカテゴリーを作ることができます。さらにこれを様々な要素に分解していくことで、より多くのドライバーを同定していこうというのが基本的な流れとなっています。これは学力テストで例えてみると「勉強が得意」という指標を作るのに、国語、数学、英語などのよく知られた教科に分けることで多角的な検討を行うということに相当します。さらには文法、読解といったより細かい区分けでの観察も重要となってきます。ドライバー同定の面白いところは、そのような過程で国語、数学、英語よりも、理系・文系のような区分けの方が当てはまりがいい、国語と英語で共通して読解問題につまずきがあるといった区分けに関する新しい知見を得られる点です。
運転特性の分野においても教科と単元のようなものがあります。例えばよく用いられるのが、交差点×急ブレーキといった急ブレーキに関する指標です。実際の運転シーンにおいて急ブレーキは頻繁に観察されるのに加え、回数・強さなどに個人差が出やすいことが知られています。ただ一般にはドライバー同定に有効な区分けを見つけることは難しく試行錯誤を伴います。そこで本ブログでは、これまでの取り組みがどのような区分けを用いてきたのかを中心に、直近5年くらいの研究結果のまとめを行いました。ここからはその区分けを3つの階層に分けて順番に説明します。
さきほど理系・文系のように例えましたが、運転操作は一見複雑なようで、実際にドライバーが操作できるのはアクセル・ブレーキのペダル(スピードコントロール)とハンドル(ハンドルコントロール)の2種類しかありません。
一般にドライバーがスピードを落とそうとするとき、操作できるのは確かにブレーキだけなのですが、ブレーキを踏むときの走行スピードによって、急減速と急停止という2種類の急ブレーキがあります。前者は走行中にスピードを大きく下げるもので、ググッーと踏み込むので体が前のめりになるような急ブレーキです。これは免許を取り立ての若年者に多いとされています。後者は停止前にスピードを素早く下げるもので、ガンッと踏み込んで戻すので体がカックンと跳ねるような急ブレーキです。これは高齢者に多いとされています。この急停止はスピードがあまり出ていないので、一般的な荒っぽいイメージの急ブレーキとは違いますが、前後の追突を引き起こす判断遅れを示す指標ということで、これも運転操作のクセの一つとなります。
アクセルにも同じように2種類の急アクセルがあります。急発進と急加速です。前者は停止状態からスピードをすぐ上げるようなアクセルに相当するものです。ただこれはスーパーカーのような発進力があれば別ですが、通常の運転ではほとんど観察されません。後者は走行中にスピードを大きく上げるもので追い越しや合流などで見られます。これはある程度の頻度で観測されますが、そもそも急アクセルは圧倒的に発生頻度が低いため、スピードコントロールに関する運転指標といえば急ブレーキが第一選択となります。
ドライバーができるもう一つの操作がハンドリングです。同じように2種類の急ハンドルがあります。前者はカーブや車線変更、後者は交差点での右左折などで見受けられるものです。特に急ブレーキに注目する場合、交差点での急ハンドルは急ブレーキを伴うことも多いので重要な指標となります。
第一の階層「運転操作のクセ」を調べる指標例
こういった運転のクセは車両センサーによって計測します。具体的には、走行中の急ブレーキには高スピードでの計測に向いている加速度センサー、停止前の急ブレーキには低スピードに向いているジャイロセンサー(角速度センサー)というものを用います。また加速度センサーから算出される躍度という指標を用いることもあります。
これらの第一の階層によるドライバー同定では、運転操作はどのような環境であっても比較が可能であるという仮定で行われています。もしデータ数に余裕がある場合には、環境の違いを考慮して運転操作の比較を行った方がドライバー同定の精度が上がることがあります。そこで次は第二の区分けである環境の違いについて紹介します。
道路状況は時々刻々と変わるため、環境条件の区分けを決めるための事前検証は難しいものになります。過去の知見を紹介します。交差点における急停止の特徴を調べようとしたとき、環境の区分けとしては交差点全体でいいのか、それとも信号の有無まで考慮した方がいいのか。粗すぎる区分けでは微妙な違いを表現できなくなってしまいますし、細かすぎる区分けではサンプル数が足りずに統計的なミスリードをしてしまうかもしれません。一般論としては、信号なし交差点の数は信号あり交差点の4倍近くあるため、両者は分けて分析した方がいいとされています。
交差点という環境では様々な情報を処理した上での運転操作が要求されるため、ドライバーの運転特徴も多様化してきます。例えば同じ交差点であっても、ラッシュ時と非ラッシュ時で急ブレーキの回数・強さが変化してきます。このように環境を区分けの条件として用いることでドライバーの認知・判断の特徴を判別しやすくなります。また夜間は視界が悪くなるにも関わらず、スピードを出しがちになるドライバーがいます。これは本来であれば夜間や悪天候の際には通常より慎重に運転すべきにも関わらずスピードを出してしまう、というドライバーの性格にも近いような指標となっています。他にも道路環境による区分けとしては、エリア(住宅街、商業地)、道路等級・道路種(高速道路、国道、県道、一般道)、道幅(広路、狭路)などがあります。これらの道路環境の違い自体が注目すべきポイントの場合は、次の第三の階層として取り扱うこともあります。ここでは一般的な交差点を分類するための方法として第二の階層を紹介しました。実際にはこれらを十分に考慮できるほどデータが得られているのは稀なので、第二の階層では目的に合わせて深掘りしていくことになると思います。エリアに関しては次のところでも解説します。
第二の階層「環境による運転操作のクセ」を調べる指標例
次に今回調査したドライバー同定の最近の動向を紹介します。これらは第二の階層である環境×運転操作での区分けに対して、グループという括りを設定することでより効果的にドライバー同定をする手法になります。
これまで見てきたようにドライバー同定にはいくつもの区分けが必要とされるため、日常の運転データを年単位で収集するのが一般的となっています。このようにシミュレーターやテストコースではなく、日常の運転を分析の対象とする取り組みを自然運転データ分析(Naturalistic Driving Study, NDS)といいます。このようなデータは運転のクセを見つける上では望ましいものの、運転環境が多様なために例外の少ない区分けを見つけるのが難しくなります。そこで第三の階層はグループによる区分けを用います。これは過度に汎用的であることは目指さずに、運転の特徴に関わらない区分けも併用していこうというものです。これは学校によって教科への取り組みが違うのであれば、学力とは関係のない学校名で分けてから、学校内での学力別に誰かを当てるという方法です。当然ながらこれまで同様にデータを分割することには変わりないので、適切な区分けを行わないと統計的に必要なデータ数ではなくなってしまいます。
このように第三の階層ではグループの作り方がコツとなりますが、いくつかの面白い方法があるので以下に紹介します。文献1-3が今回調査した最近の事例、文献4はこれらをまとめたものになります。
共通項のあるグループで、○○という環境×運転操作をするタイプ(文献1, 2017)
初めにも紹介しましたが、損害保険の担当者が事故時のドライバーが誰であったかを知りたいというケースがあります。この場合、社内の全契約者の中から当てるというよりは、車両情報から契約家族を先に限定して、その家族の中からドライバーを当てる方が自然な流れです。文献1では家族というグループを作ることで、217家族(1年間)のドライバーを対象に若年者、父親、母親、その他の家族、不明という家族内カテゴリーの同定を行いました。指標としては、急加速・急減速の回数、走行時間、走行距離、時間帯、平日・休日、直前に乗っていた人を利用しています。このように家族においては、平日日中に近距離での利用が多い、休日しか利用しないなど、運転する時間帯、距離・時間、経路などが決まっていることがあり、その場合には同定が簡単化されます。特に今回は家族ごとのグループ化を行ったことで、これまで意味を持たなかった直前に乗っていた人という区分けを作ることに成功しています。あくまで損害保険の業務としては精度が100%とならないのでサポート情報という位置付けになりますが、損害保険とドライバー同定の相性の良さが伝わるかと思います。このような運転特性とは違った観点でグループ化することで、新しい区分けを作り出せることがあります。年齢や性別、その他にも身体的能力でのグループ化など、いわゆる群間差の検証でよく用いられるものがこのカテゴリーを用いた同定方法になります。
ある走行エリアの中で、○○という環境×運転操作をするタイプ(文献2, 2018)
ドライバーの属性以外にも有効なグループ分けの手法があります。それは事前に主な走行エリアを調べ ることで候補の人数を減らしてしまうという方法です。文献2ではこの走行エリアの違いというグループでドライバーを事前に振り分けることで、38人(2ヶ月間)のドライバー同定を行いました。まず運転特性からNew YorkとHartfordのどちらのエリアでの走行かを大別して、それぞれのエリア内でドライバー同定を行うという2段階の方法を用いています。さらに難しい現実的な条件として、通勤先であるオフィスエリアは共通しているものの、それぞれの自宅である生活エリアは異なっているというやや重なりのあるエリア分割にも挑戦しています。指標としては、速度、加速度、躍度、角速度のセンサー値、時間帯を利用しています。どの条件にも当てはまらないドライバーは不明ということになりますが、別エリアを走行している可能性もあるので必ずしも不正解ということではありません。また商業地と住宅地では運転特性が異なることが知られていますが、第二の階層である環境特性での区分けは走行エリアと深い関係があります。例えば前者では信号あり交差点が多く、後者では信号なし交差点が多くなるため、走行エリアでのグルーピングはドライバーを同定しやすくするだけでなく、運転特徴を際立たせることにおいても有効な手段の1つになっています。 ある走行経路の中で、○○という環境×運転操作をするタイプ(文献3, 2019)
日常の走行においては様々な環境の違いがあるため、より良い結果を得るためには、わずかな運転の違いが果たしてノイズなのか個人のクセなのかを見分けなければなりません。日常走行を用いることと条件を揃えたいということが一致することは稀です。ただ公共バスやルート配送のドライバーが同定の対象である場合、決まった経路を走行し続けるため、あたかもテストコースの実践版といった検証が可能になります。またバス停や配送先といったポイントごとに停止・発進を繰り返すため効率よく停止に関する運転特徴を収集することができます。このように走行経路というグループを作ることで、渋滞状況の違いなどはありますが、同じ場所で運転特性を比較することが可能になります。文献3ではシャトルバスのドライバー13人(10ヶ月間)を対象に同定を行いました。指標としては加速度の分布のみで、急ブレーキには至らない中程度の強さとなるブレーキにクセがないかを検出しています。このように同じ場所でのデータを収集し続けることで、ブレーキがやや強めといった目立ちづらい特徴も比較できるようになりました。この他にも上で説明した道路等級・道路種のような道路に関するグルーピングはこのカテゴリーとして考えることもできます。特に高速道路や狭路ではその他の道路よりも運転特徴の違いが顕著に出るので、経路だけでなく道路に関してグループ化するのも有効な場合があります。
第三の階層「グループと環境による運転操作のクセ」を調べる指標例
今回は車両センサーを中心に説明しましたが、他にもカメラセンサーのような観点の違う測定機器であったり、市街地や一般道を走行しているなどの情報を得るための地図情報も重要なヒントの一つになります。以下に今回紹介した論文を挙げますので興味のある方は参考に読んでみて下さい。
1. Moreira-Matias L et al. (2017) "On developing a driver identification methodology using in-vehicle data recorders", IEEE Trans on Intelligent Transportation Systems, 18(9), 2387–2396.
2. Chowdhury A et al. (2018) "Investigations on driver unique identification from smartphone’s GPS data alone", J Advanced Transportation, 9702730.
3. Virojboonkiate N et al. (2019) "Public transport driver identification system using histogram of acceleration data", J Advanced Transportation, 6372597.
4. Gahr B et al. (2019) "Driver identification via brake pedal signals—A replication and advancement of existing techniques", Proc in Intelligent Transportation Systems (ITSC).
興味のある方は 採用ページ も見ていただけると嬉しいです。
Twitter @mot_techtalk のフォローもよろしくお願いします!