プレスリリース要約

学習用データプロバイダーのDatatangは、ブランド「Nexdata」としてJSAI2026に出展します。同社は、注目が集まるフィジカルAIや自動運転向けの最新データセット100選を先行公開するほか、8,000平米規模のデータ収集工場のバーチャル見学や事例紹介の講演を行い、AI開発の期間短縮を支援します。

Datatang株式会社は、2026年6月8日から12日までGメッセ群馬およびオンラインで開催される「2026年度人工知能学会全国大会(JSAI2026)」にスポンサーとして出展し、講演を行います。ブースでは、同社が保有する総計4.5PB(ペタバイト)の既製データセットの中から、2026年に開発された最新のデータセット100件超を先行公開します。これらはフィジカルAI、自動運転、音声認識、生成AIなどのモデル開発期間を短縮する即納可能なデータ群です。さらに、同社が擁する8,000平方メートル規模のフィジカルAIデータ収集工場のオンライン見学や、実地見学の案内も実施されます。

同社は6月11日に「NexdataのフィジカルAIデータ基盤:4つの収集手法比較と8,000㎡収集工場の事例紹介」と題したスポンサー講演に登壇します。物理世界で稼働するロボットや自動運転などの「フィジカルAI」開発において、高品質な学習データの収集プロセスや実際のファクトリでの事例が詳しく解説される予定です。また、学生や研究者向けには、国際学会Interspeech2026の音声言語モデルコンテスト「MLC-SLM Challenge」への参加募集も行い、14言語・約2,100時間の大規模会話音声データセットを活用したグローバルな挑戦の機会を提供します。

Journalポイント

編集部

実はこれ、AIの学習データをまるで自動車のように工場で大量生産する時代が来ているということなんです。

え、データって工場で作れるんですか?そもそもフィジカルAIって何ですか?

読者
編集部

フィジカルAIというのは、ロボットや自動運転のように、頭脳であるAIが現実の物理世界(フィジカル)と結びついて動作する技術のことです。この開発には、現実のリアルな動きや環境のデータが大量に必要になるため、専用の収集工場が作られたんですよ。

なるほど。でも、データなんて自分たちでインターネットから集めたり、シミュレーションで作ったりすればいいんじゃないですか?

読者
編集部

ネット上のデータだけでは、ロボットの微細な操作や自動運転の複雑な道路状況には対応できません。Datatangは、8,000平方メートルもの巨大な工場に最新ロボットや専門の操縦員を配備し、現実世界の超高精度なデータをシステマチックに収集しているんです。

そんな規模でデータを集めているんですね!最新のLLMや画像認識のデータもそこで作られているんでしょうか?

読者
編集部

LLMというのは大規模言語モデルのことで、文章の生成や理解を行うAIのことです。Datatangでは、LLMや画像とテキストを組み合わせたVLM(視覚言語モデル)向けに、2026年最新のデータセットを100件以上も用意しており、即座に開発に活用できます。

VLMは画像も理解するAIですね。そうした専門データセットを自社で一から作ろうとすると、アノテーションなどの作業が大変そうですね。

読者
編集部

アノテーションというのは、収集したデータに「これはロボットの手」「これは障害物」といったタグ情報を付与する作業のことです。実は業界全体が、こうした膨大な手間がかかる前処理を外部調達し、コアなAIモデル開発に集中する流れへシフトしているんですよ。

データの調達力がAI開発の勝敗を分けるのですね。今回の学会での発表、とても興味が湧きました!

読者
Datatang株式会社 ニュース要点の図解

Datatang株式会社

代表
神部 育也
所在地
東京都千代田区神田淡路町2-105 ワテラスアネックス6階
URL
www.datatang.co.jp

この企業とつながりたい方、興味がある方はこちらから

Connect Journalでは、掲載企業へのおつなぎ・詳細情報のご提供を行っております。
お気軽にお問い合わせください。

お問い合わせ