最新バージョンのGUIインテリジェントエージェント「CogAgent-9B-20241220」を公開しました。このバージョンでは以下の点が大幅に強化されています:
特徴
- GUIインターフェース認識能力の向上:ユーザーインターフェース内の要素や情報をより正確に理解し処理できます。
- 推論と予測の精度向上:タスク実行時の推論や予測能力が大幅に改善されました。
- アクションスペースの充実:より多様な操作タイプに対応し、幅広いインタラクションニーズを満たします。
- タスク適応性と汎化能力:異なるタスクやアプリケーションシナリオに適応する能力が向上しています。
- 中英バイリンガル対応:スクリーンショットや言語入力を基にスムーズな対話を実現します。
リソースリンク
- GitHub: https://github.com/THUDM/CogAgent/blob/main/README_zh.md
- 技術ドキュメント: https://cogagent.aminer.cn/blog#/articles/cogagent-9b-20241220-technical-report
この最新版CogAgentは、GUI操作およびマルチタスクシナリオ向けに強力なサポートを提供し、多言語および多様な場面でのスマートアプリケーション開発に適しています。