AI Safeguardは軽量多模態モデル「Ivy-VL」をオープンソース化しました。

AI Safeguardは、カーネギーメロン大学とスタンフォード大学と共同で最新の軽量多模態モデル「Ivy-VL」をオープンソース化しました。

Ivy-VLは3Bのパラメータを持ち、複数のベンチマークテストでPaliGemma 3B、Moondream2、Qwen2-VL-2B、InternVL2-2B、InternVL2_5-2Bなどを超えました。

画像とテキストの入力に対応し、テキスト出力が可能で、さまざまな視覚的質問応答や画像理解タスクに利用できます。

AIメガネやスマートフォンなどのデバイスに展開することもできます。

モデル:https://huggingface.co/AISafeguard/lvy-VL-llava

コメントを残す