プレスリリース要約
日本最大級の学習用データプロバイダー「Nexdata」を展開するDatatang株式会社は、2026年6月2日に開催される「AI Market ExCon 2026」への出展を発表しました。AI開発の多角化に伴い教師データの不足や品質向上が課題となる中、同社が持つ膨大なデータ資産と独自のデータ収集体制が、今後の産業AIをどう加速させるか注目が集まります。
Datatang株式会社は、2026年6月2日にベルサール汐留で開催されるAI特化型展示会「AI Market ExCon 2026」に出展し、同社が展開するAI学習データブランド「Nexdata」の最新ソリューションを披露します。同イベントは、AI導入を検討する企業向けに40社以上のリーディングカンパニーが集結する国内最大級のカンファレンスです。Nexdataはブース番号40にて、総計4.5PBに及ぶ膨大な既製データセットや、8000㎡の広さを誇る「フィジカルAIデータ収集工場」を基盤とした、高品質な教師データソリューションをワンストップで提案します。
今回の出展では、特に需要が高まっている4つの注力分野(フィジカルAI・VLA、自動運転、LLM・VLM・生成AI、音声認識・合成)に焦点を当てた展示を行います。実世界でのロボット動作を支援する一人称視点動画データや、自動運転向けの多次元アノテーションデータ、さらにはマルチモーダル学習に対応した日本語テキストや専門分野のデータなど、開発現場の即戦力となるデータ基盤を網羅しています。ブース内では、自社工場のオンライン見学や、2026年の開発ロードマップに沿った最新データセットの先行公開も予定されています。
Journalポイント
実はこれ、AI開発の成否を分ける『教師データ』の準備プロセスを、劇的に効率化する取り組みなんです。自社でデータを集める手間がほぼゼロになります。
え、そうなんですか?ネット上に転がっている無料のデータを集めてAIに学習させるだけでは、実用的なレベルには達しないということでしょうか?
その通りです。特に自動運転やロボットなどの物理的な動作を伴うAIでは、実世界で撮影した高精度な映像や、それに対する正確なアノテーションと呼ばれるタグ付け作業が不可欠なんです。これらを一から用意するのは、企業の開発者にとって途方もない重労働なんですよ。
確かに、アノテーション作業を自社でやるのは大変そうですね。でも、具体的にどれくらいの規模のデータが必要になるものなのですか?
「アノテーション」というのは、画像やテキストなどのデータに情報タグを付与してAIが理解できるようにする作業のことです。今回のNexdataは、なんと総計4.5PBという途方もない規模のデータセットを保有しています。
4.5ペタバイトって想像もつかない量ですね!最近流行りのLLMなどの文章生成AIでも、そうしたデータが必要になるのですか?
「LLM」というのは、大規模言語モデルのことで、ChatGPTなどの高度な対話型AIの基盤となる技術です。はい、LLMの学習にも日本語の専門書や、図表を含んだ質の高いテキストデータが不可欠で、同社はそれらも網羅しています。
なるほど。自社にデータ収集のノウハウがなくても、すぐに最先端のAI開発に着手できるわけですね。他社も同じようなサービスを提供しているのでしょうか?
実は業界全体が、単なるデータ提供から「実世界データの再現」へとシフトしています。Nexdataが8000㎡の専用工場でロボット用の実稼働データを収集しているように、物理世界とAIを繋ぐデータの価値が急速に高まっています。
AI의進化を支えているのは、こうした泥臭くも精密なデータ収集のインフラだったのですね。とても勉強になりました!

Datatang株式会社
- 代表
- 神部 育也
- 所在地
- 東京都千代田区神田淡路町2-105 ワテラスアネックス6階
- URL
- www.datatang.co.jp
