2019.12.19

“学習済みモデル搭載のエッジ端末”で手軽にAIの恩恵を。オプティムのAIカメラサービスに迫る

リンクをクリップボードにコピーしました
img

ある分野で作成した学習済みモデルを他の分野にも汎用的に使えないものか−−。AIを活用する現場で最近、こんな声が聞かれます。
特定の課題に特化した学習によってAIが大きな力を発揮する一方で、個別のケースに基づいた学習済みモデルの利用はその専門性や独自性の高さから「課題ごとに個別開発しなければならない」「同じような処理を重複して開発しがち」など、効率的が思うように進んでいないのが現状です。
そんな中、AIを活用とした産業向けソリューションを提供するテック企業・オプティムは、現場の機器レベルで高速な推論処理を実現するエッジAI技術を駆使し、さまざまな分野で共通してニーズのある学習済みモデルを汎用化させた「OPTiM AI Camera」を開発。煩雑な学習や開発作業なしにAIを課題解決に利用できるパッケージを開発しました。
OPTiM AI Cameraは具体的にどんな機能を持つのか、そこにエッジAI技術はどう生かされているのか−−。株式会社オプティム 経営企画本部ディレクターの山本大祐氏に聞きました。

人体検知モデルを学習済み。11業種の課題に「すぐ使える」パッケージサービス「OPTiM AI Camera」

img

――山本
「OPTiM AI Cameraは店鋪や施設など業界別・利用目的別に設置されたカメラからデータを収集し、学習済みモデルを活用して画像解析を行うことでマーケティング、セキュリティー、業務効率などの領域を支援するパッケージサービスです。

さまざまな業種の課題やニーズにあわせて収集したデータをもとに生成した学習済みモデルを備えており、学習やカスタマイズをすることなく、すぐに導入できます」

OPTiM AI Cameraで提供されている学習済みモデルが対応する業種は現在11業種。店舗向けに入店者数やその属性を自動検出したり、交通機関向けには「ホームでのふらつき」など事故につながる乗客の行動を自動検出するなど、これまで導入前に大量の学習プロセスを必要としてきた推論処理が、製品の導入とともにそのまま利用できるといいます。
このような画像認識処理を導入するためには、事前の学習プロセスや課題に応じたカスタマイズ作業に大きな時間を取られ、導入の障壁となってきました。
OPTiM AI Cameraではそれぞれのケースにおける学習済みモデルを共通化。エッジAIの技術を駆使してこれらをエッジ端末側にあらかじめ組み込むことによって、手軽に「人体検知学習済みのカメラ機能」を現場に導入できるといいます。

――山本
「経済において利益を生むのは小売や事務作業といった人間が関わる分野、いわゆる『第二次産業』以降の産業が大多数です。これらの分野では共通して「人の動きを検出する」学習済みモデルが重宝されることがわかっていました。

学習済みモデルを共通化して配布すれば、課題にあわせて『パーツを選ぶ』ような感覚でAIの恩恵をすぐに受けられ、ビジネスの大幅なスケールが期待できます」

「クラウド処理を待っていられない」OPTiM AI CameraにエッジAIが必要だった理由

OPTiM AI Cameraは、その判別処理の迅速さが大きな特徴。これを実現するためにはカメラから送られる大量かつ大容量の画像データを瞬時に解析し、推論処理へリアルタイムに反映させる必要があります。
この技術的なニーズを達成するためには、エッジAIの導入が必須であったといいます。

img

――山本
「人体検知を始めとする画像認識処理においては、詳細なデータを取得するため、現場に多数の端末を設置し、それぞれにおいて高精細な画像データを生成します。

すべての端末から上がってくる膨大なデータをクラウドで処理しようとすると多大なネットワーク負荷がかかり、回線が逼迫してしまいます。このため、データ生成地点(=エッジ)で処理を完了できる仕組みがどうしても必要だったのです」

エッジ、すなわちこれまでで言うローカル環境側の端末のみで解析処理を完了できるのはエッジAIの大きなメリットのひとつ。処理済みの比較的軽いデータをクラウドへ上げるようにすれば、ネットワーク負荷を大幅に減らすことができます。
エッジAIの導入は、「処理の高速化という面でも必要だった」と山本氏は話します。

――山本
「カメラで捉える状況は逐一変化するため、それを監視する端末には軽快な動作が求められます。都度都度処理をクラウドに任せて、その結果を待っていては間に合いません。

ローカル側で迅速に判定処理を行う必要性からも、エッジAIの導入は必要でした」

クラウド側で生成した推論をふたたびローカル側に戻し、エッジ端末のなかで完結させることができれば、処理の度にサーバーへ問い合わせをすることなく、処理時間を大幅に短縮することができます。
もっとも、このためにはエッジ端末側にも一定以上のハードウェアが必要。その選定は、システム全体のパフォーマンスを決定づける重要な要素になります。
オプティムではGPUを内蔵したHPのワークステーションをエッジ端末として採用していますが、その理由もハードウェア上のニーズが大きく影響していました。

――山本
「HPのワークステーションはスペックや動作の安定性で多くの実績があり、今回のようなタフさを求められる現場での使用にはぴったりでした。

OPTiM AI Cameraにおいては、接続するカメラの台数に応じてHP Z2 Mini G4 WorkstationやHP Z4 G4 Workstation、HP Z6 G4 Workstationと、それぞれの条件に見合った処理スペックのワークステーションを切り替えて使用しています」

img

「ユーザーはベンダーを気にしない。だからこそ柔軟なカスタマイズを」

もうひとつ山本氏が採用の決め手として挙げたのが、「カスタマイズの柔軟さ」という要素。エッジAIにおいてはGPUの性能=処理性能と考えがちですが、開発を進めるにつれ、実はCPUなどのスペックも少なからず影響を及ぼすことがわかったといいます。

img

――山本
「このような状況では、たとえば『CPUのスペックだけを上げたい』というように極めてピンポイントなスペック変更が必要なケースがよく出てきます。

HPではパーツ単位で柔軟に組み替えて製品を出荷してくれるし、不具合時にも全国の代理店を経由してサポートが受けられる。こうした点も採用の決め手となりました」

AI開発の現場において、ハードウェア部分のチューニングは大きな手間のひとつ。ハードウェア面を信頼できるベンダーに任せ、開発者側はロジックの改良にリソースを集中させるという方針をオプティムでは取っていることがわかります。
ネットワーク負荷や通信速度、またハードウェア的なボトルネックといったあらゆる要素に対してPoCレベルで直接的なチューニングを行いやすいという環境は、開発スピードを担保する面でも非常に大きな意味を持つと言えそうです。

――山本
「カメラのメーカーからすれば、いかに自社の製品を売り上げるかが目的となるわけで、売上げアップのためにAIを搭載するという向きもあるでしょう。しかしエンドユーザーにとって、OPTiM AI Cameraにどこのメーカーのカメラが使われているかは関係ありません。さらに言えば、課題を解決できればどこの会社のAIを搭載していても構わないはずです。

我々のソリューションは、あらゆるデバイスやAIエンジンを接続していけるような存在にならなければいけないと考えています。」

オプティムが考えるのは、あくまでユーザーファーストな課題解決。搭載する学習済みモデルも自社開発にこだわらず、誰でも手軽にAI技術を利用できる総合的なプラットフォームの構築を通じて、AIそのものの裾野を広げていくという姿勢が印象的でした。
かつてパソコンは、黎明期はさまざまなベンダーで個別にOSやハードを開発していた状況から規格化を経て「日用品化」していきました。AIもまた、背後の細かな構成を気にすることなく、純粋な課題解決の道具として気軽に使える時代へと進化していく過程にあるのかもしれません。

img

(制作:Ledge.ai 執筆:天谷窓大)