Az edzés és a teszt veszteséges ábrák megértése

Csatoltam egy ábrát, amely 6 alsávot tartalmaz alább. Mindegyiken az edzés és a tesztveszteség látható több korszakban. Csak az egyes grafikonokat megnézve, hogyan láthatom, melyik a legjobb? Melyek vannak túl vagy túl. Melyek romlanak az egyes korszakokkal?

tesztveszteség-ábrák

2 válasz 2

Feltéve, hogy a vonat és az érvényesítési halmaz az összehasonlított görbékben megegyezik, a a legjobb görbe valószínűleg a legalacsonyabb validációs veszteségértékű.

Számozása balról jobbra és felülről lefelé, azt mondanám, hogy a legjobb az # 5 (második sor, második oszlop).

Most bontsuk le, mi történik az egyes cselekményekben:

Nagyon magas értékek, látszólag véletlenszerűek, semmilyen csökkenést nem okoznak sem a vonat, sem az érvényesítési veszteségek: a modell nem tanul; valószínűleg van valami baj a modellel vagy az optimalizálási folyamattal, esetleg valami hiperparaméter-érték borzasztóan hibás.

Csökkenő értékek mind az edzés, mind az érvényesítési veszteségek esetében, az érvényesítési veszteség különbséggel rendelkezik az edzéssel szemben, és mindkettő stabilizálódott (azaz valószínűleg egyikük sem lesz alacsonyabb - ha ebben kétség merül fel, akkor több idő marad nekik): Ok, de van hová fejlődnünk, ha rendszeresítjük a modellt úgy, hogy az edzésgörbét felsőbbé és az érvényesítést eggyel lejjebb.

Kezdetben mindkét görbe leereszkedik, majd az érvényesítés a 800 lépés körül kezdődik: túlfeszített. Próbálkozzon a modell rendszeresítésével, és ha ez nem hatékony, használja a korai leállítást annak a modellnek a használatához, amely a legjobban teljesít az érvényesítési adatokon. Kipróbálhat valamilyen hiperparamétert is, vagy olyan tanulási sebesség ütemezéssel rendelkezik, amely idővel kisebb lesz.

Mindkét görbe ereszkedik, és úgy tűnik, ezt egy ideig folytatják: a képzés nem fejeződött be, hagyjon több időt a képzésre.

Mindkét görbe a kezdeti fennsík ellenére ereszkedik le, és eléri a mélypontot, az edzés és az érvényesítési görbék között nincs különbség: valószínűleg javíthatja a modell súlyának inicializálását. Egyébként ez a diagram tűnik a legjobbnak, mivel az érvényesítési görbe eléri a legalacsonyabb értéket, és nincs túlillesztés.

Mindkét görbe felfelé halad: valami nincs rendben, valószínűleg abban, ahogyan meghatározza a veszteségfüggvény optimalizálási folyamatát.

Nem látok egyértelmű esetet az alulrablásról a parcelláid között. Alulteljesítési forgatókönyv esetén azt látnánk, hogy a modell tanul valamit, de mind a képzési, mind az érvényesítési veszteségek túl magas értékeken stabilizálódnak. Ez a modell kapacitásának hiányára utalhat, megakadályozva azt, hogy megfelelően rögzítse az adatok eloszlását a címkékhez képest.