忠実度の高い合成データによる機械学習モデルの開発

Synthetic Datasetsにより、高忠実度の3D環境で生成されたカメラ、LiDAR、レーダー、その他のセンサーデータを用いて、機械学習モデルの堅牢性を向上させることができます。数百万ものラベル付きサンプルを、多様なアクター、行動、環境条件を使用して生成することも可能です。

主な機能

センサーハードウェアを再現するために調整された検証済みのセンサーモデルライブラリ:カメラ、LiDAR、レーダーなどをサポート
プログラムによって生成される誤りのないグランドトゥルースラベル、既存のパイプラインとの統合を可能にする柔軟なアノテーションフォーマット
アセットと手続き的に生成された 3D 環境は、ドメインランダム化やタスクドメインへのカスタマイズに対応
高水準データセット定義言語とビジュアルエディタにより、必要なデータを簡単に定義可能
データセット管理ツールにより、統計情報の表示、データのフィルタリング、データのエクスポートが可能
クラウドファーストのインフラストラクチャにより、迅速なデータセット生成、柔軟なスケーラビリティ、容易なコラボレーションを実現

機械学習開発ループを加速

モデル結果を統合し、失敗事例に対応するためのデータを自動生成します。スケーラブルな合成データ生成により、データの希薄性の問題、クラスの不均衡、その他のバイアスに対して迅速に対応します。

光の軌跡から再現した反射や屋内外の難しい照明条件に対応した合成カメラデータ
倉庫や農場などのオートモーティブ以外にも対応したデータ生成

高密度なラベルを用いた学習

セマンティックセグメンテーション、深度、オプティカルフローなど、実データでは入手に高いコストがかかったり、入手が不可能な高密度なラベルを、プログラムで生成し学習に使用できます。

ピクセル単位のセマンティックセグメンテーション
ピクセル単位の深度
ピクセル単位のオプティカルフロー

タスクの領域を広げる

転移学習に合成データを利用することで、新しい地域、クラス、センサーハードウェアに迅速に拡張することができます。交通標識などの地域固有の資産を利用することで、実データに依存せずに、安全な運用の拡張が可能です。

合成データを使ってラベリングの自動化

合成データを使って自動ラベリングを学習させることで、手動でのデータラベリングの効率と精度を向上させることができます。ラベル付けされた合成データを利用して、実データでの半教師付き学習を開始できます。

プログラムによる2/3次元境界線 (黄・紫)、レーンマーキングの生成 (緑)

機械学習チームの効率性向上

Applied Intuitionのクラウドファーストツールは、機械学習チーム全体に渡り、データの定義、生成、管理を容易に行えるようにします。

高水準言語、ログ、シナリオからのデータセット生成

機械学習モデルの学習を拡張し、市場投入までの時間を短縮

実データを補完

実データが少ない場合や収集が困難な場合に、合成データを増補して使用することができます。

データラベリングコストの削減

大規模で多様な合成データセットを活用することで、実データのラベリングに費やす時間とリソースを最小限に抑えることができます。

データ収集の高速化

数ヶ月単位を要する実データ収集に対し、数日単位で生成可能な合成データにより、機械学習チームの市場投入までの時間を加速できます。