grote modellen zijn geweldige agenten, maar vaak te groot, gesloten of kwetsbaar om fijn te tunen idee: train een klein model om context te creëren voor een bevroren groot model, beoordeel de outputs van het grote model, gebruik dat als beloning voor het kleine model groep voor contextafstemming. meer hieronder
11,61K