Better Brain,
Better Chain.

scroll

NEWS

ABOUT ailia SDK

ailia SDKの特徴

物体検出・画像分類・特徴抽出。
クラウドで学習したモデルを簡単にアプリに組み込み。
高速なディープラーニングがあなたの手に。

エッジ(端末)側での推論に特化した
ディープラーニングミドルウェア
簡単にアプリに組み込むことができ、
GPUを最大限活用した高速な推論を実現
完全自社開発で一貫したAPIと低レイヤーをカバーする
高度なサポートを提供

POINT01

クラウドで学習したモデルを
簡単にアプリに組み込み

  • 物体検出
  • 画像分類
  • 特徴抽出
  • 骨格検出

クラウドで学習したモデルと画像を読み込んで、簡単にアプリに画像認識を実装することができます。
従来、必要であった前処理と後処理のコードをailiaのユーティリティクラスが提供します。
また、インターネット上で公開さ れている動作確認済みのモデルや、パートナーが提供するモデルを使用することもできます。

学習済み係数一覧(GitHub)

POINT02

Unity Pluginを提供

Unity Pluginを提供。Unityを使⽤することで簡単にWebカメラの映像を取り込むことができ、ailiaのC# APIを使⽤して画像認識を実装することができます。

POINT03

重み係数の圧縮に対応

独⾃の重み係数圧縮を搭載しています。学習済みの重み係数をエッジ側のデバイスに圧縮して転送することで、通信時間やストレージを1/3まで節約することができます。

POINT04

マルチプラットフォームで⾼速なGPU推論

マルチプラットフォームでGPUを使⽤した⾼速な推論が可能です。特定のメーカーに依存しない⾼速推論を実現します。

DEMO

デモムービー

YOLOによる物体検出

YOLOの学習済み係数を使用して人や車などの位置を検出することができます。
Darknetを使用して独自に学習を行った係数を読み込ませることも可能です。

Gender/Age/EmotionNetによる性別、年齢、感情推定

YOLO Faceを使用して顔を検出した後、顔画像に対して各種ネットワークを適用することで、
性別や年齢、感情を推定することができます。

VGG16による特徴抽出

VGG16を使用することで画像から特徴量を抽出することができます。
特徴量同士の距離を計算することで、画像の類似度を計算することができ、
画像検索エンジンなどを簡単に実装することができます。

ailia Multi-Person PoseEstimatorによる骨格検出

株式会社Acculusが提供する骨格検出モデルに対応。
OpenPoseとは異なるアルゴリズムで高速な骨格検出を実現します。

CUSTOMIZE

カスタマイズした認識が可能

学習フレームワークからailiaで読み込めるONNX形式に変換するスクリプトを同梱しているので
簡単なスクリプトで変換可能

<Pytorch>

import torch
from torchvision import models
vgg16 = models.vgg16(pretrained=True)
x = Variable(torch.randn(1, 3, 224, 224))
torch.onnx.export(vgg16, x, 'vgg16_pytorch.onnx', verbose=True, opset_version=10)

<Chainer>

import chainercv.links as C
import onnx_chainer
model = C.VGG16(pretrained_model='imagenet')
x = np.zeros((1, 3, 224, 224), dtype=np.float32)
onnx_chainer.export(model, x, filename='vgg16_chainer.onnx', opset_version=10)

<Keras>

import keras2onnx
onnx_model = keras2onnx.convert_keras(model, model.name, target_opset=10)
temp_model_file = 'vgg16_keras.onnx'
onnx.save_model(onnx_model, temp_model_file)

<TensorFlow>

import tf2onnx
frozen_graph_def = tf.graph_util.convert_variables_to_constants(sess,sess.graph.as_graph_def(),["vgg16/predictions/Softmax"])
graph1 = tf.Graph()
with graph1.as_default():
    tf.import_graph_def(frozen_graph_def)
    onnx_graph = tf2onnx.tfonnx.process_tf_graph(graph1, input_names=["import/block1_conv1/kernel:0"], output_names=["import/vgg16/predictions/Softmax:0"],opset=10)
    model_proto = onnx_graph.make_model("vgg16_tensorflow")
    with open("vgg16_tensorflow.onnx", "wb") as f:
        f.write(model_proto.SerializeToString())

以下のレイヤー/ネットワークに対応。
未対応なものの追加もサポート可能

<対応レイヤー>

Category ONNX (opset=10) CaffeModel
Arithmetic Layers Abs
Acos
Acosh
Add Eltwise
And
Asin
Asinh
Atan
Atanh
Cos
Cosh
Div
Equal
Erf
Exp
Greater
Less
Log
Max
Min
Mul Scale
Neg
Not
Or
Pow
Reciprocal
Sign
Sin
Sinh
Sub
Sum
Sqrt
Tan
Xor
Convolution Layers Conv Convolution
ConvTranspose Deconvolution
Pooling Layers AveragePool Pooling
MaxPool
GlobalAveragePool
GlobalMaxPool
Neuron Layers Elu
LeakyRelu
Lrn Lrn
PRelu
Relu Relu
Sigmoid Sigmoid
TanH TanH
FullyConnected Layers Gemm Affine
Matmul
Softmax Layers SoftMax SoftMax
Normalization Layers BatchNormalization BatchNorm
InstanceNormalization
Upsampling Layers Resize
Dropout Layers Dropout Dropout
Silence
Reduction Layers ReduceL1
ReduceL2
ReduceMax
ReduceMean
ReduceMin
ReduceProd
ReduceSum
ReduceSquare
ReduceSumSquare
Reshape Layers DepthToSpace
Expand
Flatten Fletten
Reshape Reshape
Shape
Squeeze
Transpose
Unsqueeze
Slice Layers Concat Concat
Crop
Gather
NonZero
Pad
Reorg
Scatter
Slice
Split Split
Tile
Cast Layers Cast
Ceil
Clip
Floor
Identity
Round
Flow Layers Loop
Where
Data Layers Constant Constant
ConstantOfShape
Data Data
Detection Layers NonMaxSuppression
RoiAlign
TopK
RNN Layers LSTM

<ネットワーク>

ArcFace, Bert, BlazeFace, DeepLabV3, GoogleNet, HRNet, InceptionV3, LightWeightHumanPoseEstimation, MobilenetSSD, MobilenetV2, MobilenetV3, Noise2Noise, ResNet50, VGG16, VGGFace2, YOLO v1, YOLO v2, YOLO v3

CASE STUDY

利用例

Unityを使用したインタラクティブサイネージ

デジタルサイネージの前にいる人の位置や姿勢を検出して、
3Dキャラクターが適切なアクションをすることで、
インタラクションが楽しめるサイネージを実装することができます。

受付システムにおける人物検出

画像認識によって来場者を検出することで、
来訪先のアノテーションなどを提示することができます。

実店舗Analyticsにおける 人数カウント

画像認識によって実店舗の来客数や性別・年齢を計測することで、
マーケティングデータとして活用することができます。

SPEC

仕様および提供物

項目 仕様
入力形式 ONNX (opset=10), CaffeModel
対応OS Windows, Mac, iOS, Android, Linux, 組み込み機器(オプション対応)
ライブラリ形式 Static, Dynamic
API C++, C#, Python, JNI, Unity
BLAS IntelMKL, Accelerate.framework
GPGPU Metal, Vulkan, RenderScript, C++AMP, OpenCL, cuDNN
SIMD命令セット SSE2, AVX, NEON

TRIAL

ailia SDKを30日間評価できる無料の評価版をダウンロードすることができます。
現在、オープンベータテストとして評価版を提供しています。

CONTACT

・「Unity」は、Unity Technologiesが日本およびその他の国において保有する商標または登録商標です。
・Windowsは、米国Microsoft Corporationの米国及びその他の国における登録商標です。
・Androidは、Google Inc.の商標です。
・Macは、Apple Inc.の商標です。
・その他記載されている商品・サービスは各社の商標です。