視覚推論モデル「QVQ」を紹介します

視覚推論モデル「QVQ」を紹介します。このモデルは視覚理解と複雑な問題解決能力を強化し、MMMUベンチマークで70.3ポイントを達成しています。

主な特徴：

An example for visual math problem solving. pic.twitter.com/APwMIob8kH
— Qwen (@Alibaba_Qwen) December 24, 2024

コメントを残す コメントをキャンセル