Aigest.

Zero-shot

Zaktualizowano:

Zero-shot learning to zdolność modelu sztucznej inteligencji do wykonania zadania, którego nie widział podczas treningu, bazując wyłącznie na instrukcjach lub opisach. Model wykorzystuje swoją ogólną wiedzę, aby zrozumieć nowe polecenie i wygenerować odpowiedź.

Zero-shot learning odnosi się do sytuacji, w której model AI jest w stanie rozwiązać problem lub wykonać zadanie bez wcześniejszego zobaczenia żadnych przykładów tego konkretnego zadania podczas fazy treningowej. Zamiast uczyć się na podstawie par wejście-wyjście dla każdego nowego zadania, model polega na swojej wcześniej nabytej ogólnej wiedzy o języku, pojęciach i relacjach między nimi.

Kluczowym elementem jest to, że model otrzymuje instrukcję w języku naturalnym opisującą, co ma zrobić. Na przykład, jeśli model został wytrenowany na dużej ilości tekstu, może być w stanie sklasyfikować recenzje filmów jako pozytywne lub negatywne, nawet jeśli nigdy nie widział przykładów recenzji filmów z przypisanymi etykietami. Wystarczy, że otrzyma polecenie typu: „Sklasyfikuj poniższą recenzję jako pozytywną lub negatywną”.

Jest to szczególnie przydatne w przypadku zadań, dla których trudno jest zebrać duże zbiory danych treningowych, lub gdy chcemy, aby model był elastyczny i potrafił szybko adaptować się do nowych wymagań bez konieczności ponownego trenowania. Zero-shot learning różni się od few-shot learning, gdzie model otrzymuje kilka przykładów nowego zadania, aby lepiej zrozumieć kontekst.

Przeczytaj więcej