汎用視覚大規模モデル「DINO-X」

IDEA研究院は、汎用視覚大規模モデル「DINO-X」を発表しました。このモデルは、オープンワールドの物体認識に対応し、テキスト提示、視覚提示、カスタム提示、さらには無提示入力をサポートしています。

主な特徴：

提供されるバージョン：

APIインターフェースも提供されています。

ブログ：DINO-Xについて
論文：arXiv論文
APIドキュメント：DINO-X API

コメントを残す コメントをキャンセル