AI Safeguardは、カーネギーメロン大学とスタンフォード大学と共同で最新の軽量多模態モデル「Ivy-VL」をオープンソース化しました。
Ivy-VLは3Bのパラメータを持ち、複数のベンチマークテストでPaliGemma 3B、Moondream2、Qwen2-VL-2B、InternVL2-2B、InternVL2_5-2Bなどを超えました。
画像とテキストの入力に対応し、テキスト出力が可能で、さまざまな視覚的質問応答や画像理解タスクに利用できます。
AIメガネやスマートフォンなどのデバイスに展開することもできます。