コンテンツへスキップ
出席者
- マーク・チェン
- ジョン・アラード
- ジュリー・ウォン
- ジャスティン・リース
発言要約
マーク・チェン
- OpenAIの最新の進展に関する紹介と概要説明
- O1をプレビュー版から正式リリースし、ChatGPTに統合することを発表
- O1のAPIでの提供予定を発表
- モデルカスタマイズのための**強化ファインチューニング(RFT: Reinforcement Fine-Tuning)**の紹介
- 現在はプレビュー版であり、来年の一般公開を予定
- RFTの法務、金融、エンジニアリング、保険など多分野への利点を強調
- Thompson Reutersとの提携により、O1 Miniを法務アシスタントとしてファインチューニングするプロジェクトを言及
ジョン・アラード
- 自己紹介とOpenAIでの役割
- 監督型ファインチューニングと強化ファインチューニングの比較
- RFTの仕組みの解説(モデルが考える余地を与え、正しい回答を強化するプロセス)
- RFTの効率性を強調(わずか数十例で可能)
- GPT-4やO1シリーズなど、最前線モデルの訓練にOpenAI内部で使用されている強化学習を言及
ジュリー・ウォン
- 自己紹介とOpenAIでの役割
- RFTとその応用例について詳細解説
- 科学研究(特に希少疾患の遺伝的原因の解明)でのRFT活用の例
- ジャスティン・リースとバークレー研究所での研究内容を紹介
ジャスティン・リース
- 自己紹介とバークレー研究所での役割
- 希少遺伝疾患に関する研究の重要性と計算ツールの役割を説明
- OpenAIと協力してRFTを活用し、疾患原因の推論を改善する取り組みを紹介
- 科学出版物や症例報告から抽出されたデータセットの使用について説明
強化ファインチューニングのデモンストレーション
- ジョンとジュリーが、ジャスティンのデータセットを用いたRFTプロセスを段階的にデモンストレーション
- 新しいモデルの作成、トレーニングおよび検証データセットのアップロード、グレーダーの定義について説明
- トレーニングプロセスとファインチューニングされたモデルの性能評価を解説
- モデルの性能改善を示すクリスマス風テーマのプロットを表示
閉会の挨拶
- ジュリーがRFTの汎用性と多分野での応用可能性を強調
- 強化ファインチューニングのアルファプログラム拡大を発表
- RFT研究プログラムへの参加を奨励
- マークが、RFTを活用した科学・知識分野での進展に対する期待を表明
閉会のジョーク
- ジュリーがクリスマスにちなんだジョークを披露(「サンタの自動運転そりとモデルの“パインチューニング”」について)
キーポイント
- 強化ファインチューニング(RFT): 強化学習を活用し、モデルの推論力や性能を向上させる新しいカスタマイズ手法
- 応用分野: 法務、金融、エンジニアリング、保険、科学研究など、深い専門知識を必要とする分野での利点
- デモンストレーション: 希少疾患に関するデータセットを使用したRFTプロセスの詳細な実演
- アルファプログラム: RFTの実験を促進するため、アルファプログラムの拡大を発表
- 将来の展望: 来年初頭に強化ファインチューニングを一般公開予定
次のアクション
- RFT研究プログラムに興味のある組織は、ライブ配信説明欄に記載されたリンクから申し込むこと
- 来週のセッションに参加し、さらなる更新情報を得ること
上にスクロール