ChatPaper.aiChatPaper

LearnLM: 学習のためのGeminiの改善

LearnLM: Improving Gemini for Learning

December 21, 2024
著者: LearnLM Team, Abhinit Modi, Aditya Srikanth Veerubhotla, Aliya Rysbek, Andrea Huber, Brett Wiltshire, Brian Veprek, Daniel Gillick, Daniel Kasenberg, Derek Ahmed, Irina Jurenka, James Cohan, Jennifer She, Julia Wilkowski, Kaiz Alarakyia, Kevin McKee, Lisa Wang, Markus Kunesch, Mike Schaekermann, Miruna Pîslar, Nikhil Joshi, Parsa Mahmoudieh, Paul Jhun, Sara Wiltberger, Shakir Mohamed, Shashank Agarwal, Shubham Milind Phal, Sun Jae Lee, Theofilos Strinopoulos, Wei-Jen Ko, Amy Wang, Ankit Anand, Avishkar Bhoopchand, Dan Wild, Divya Pandya, Filip Bar, Garth Graham, Holger Winnemoeller, Mahvish Nagda, Prateek Kolhar, Renee Schneider, Shaojian Zhu, Stephanie Chan, Steve Yadlowsky, Viknesh Sounderajah, Yannis Assael
cs.AI

要旨

現在の生成AIシステムは、デフォルトで情報を提示するように調整されており、人間のチューターのように学習を促進することはありません。これらのシステムの様々な教育利用事例に対処するために、私たちは教育行動の注入の課題を教育的指示の追跡として再構築しました。トレーニングと評価の例には、後続のモデルのターンで現れる特定の教育属性を記述するシステムレベルの指示が含まれます。このフレームワークは、モデルを特定の教育学の定義に拘束することを避け、代わりに教師や開発者が望ましいモデルの振る舞いを指定できるようにします。また、迅速に拡大するGeminiモデルの機能に加えて、学習のためのGeminiモデルの改善の道を開けます。これらは、初期の技術レポートとは大きく異なる重要な変更点です。教育的指示の追跡を行うトレーニングが、Google AI Studioで利用可能なLearnLMモデルを生み出し、様々な学習シナリオで専門家によって大幅に好まれることを示します。平均的な好みの強さは、GPT-4oより31\%、Claude 3.5より11\%、Gemini 1.5 Proモデルに基づくLearnLMより13\%高いです。
English
Today's generative AI systems are tuned to present information by default rather than engage users in service of learning as a human tutor would. To address the wide range of potential education use cases for these systems, we reframe the challenge of injecting pedagogical behavior as one of pedagogical instruction following, where training and evaluation examples include system-level instructions describing the specific pedagogy attributes present or desired in subsequent model turns. This framing avoids committing our models to any particular definition of pedagogy, and instead allows teachers or developers to specify desired model behavior. It also clears a path to improving Gemini models for learning -- by enabling the addition of our pedagogical data to post-training mixtures -- alongside their rapidly expanding set of capabilities. Both represent important changes from our initial tech report. We show how training with pedagogical instruction following produces a LearnLM model (available on Google AI Studio) that is preferred substantially by expert raters across a diverse set of learning scenarios, with average preference strengths of 31\% over GPT-4o, 11\% over Claude 3.5, and 13\% over the Gemini 1.5 Pro model LearnLM was based on.

Summary

AI-Generated Summary

PDF222December 24, 2024