Zusammenfassung
Große Sprachmodelle wie GPT-4 zeigen so genannte emergente Fähigkeiten, also Fähigkeiten, die erst ab einer bestimmten Netzwerkgröße auftreten - oder vielleicht doch nicht?
Eine neue Forschungsarbeit zeigt, dass bisher bekannte emergente Fähigkeiten eher ein Produkt der verwendeten Metrik sind - mit der richtigen Methode zeigt sich statt eines spontanen Leistungssprungs ein gleichmäßiger Anstieg.
Das Team vermutet daher, dass alle bisher gefundenen emergenten Fähigkeiten eine Illusion sind.
https://the-decoder.de/sind-emergente-fa...obal-de-DE
Große Sprachmodelle wie GPT-4 zeigen so genannte emergente Fähigkeiten, also Fähigkeiten, die erst ab einer bestimmten Netzwerkgröße auftreten - oder vielleicht doch nicht?
Eine neue Forschungsarbeit zeigt, dass bisher bekannte emergente Fähigkeiten eher ein Produkt der verwendeten Metrik sind - mit der richtigen Methode zeigt sich statt eines spontanen Leistungssprungs ein gleichmäßiger Anstieg.
Das Team vermutet daher, dass alle bisher gefundenen emergenten Fähigkeiten eine Illusion sind.
https://the-decoder.de/sind-emergente-fa...obal-de-DE
__________________
16 Jahre AB.com und davor ein paar Jahre Juchu.de
