Aigest.
Biznes AI

Dostrojony model AI Bridgewater przewyższa GPT i Claude w analizie finansowej, obniżając koszty

Hedge fund Bridgewater we współpracy z Thinking Machines Lab opracował dostrojony model AI, który znacznie lepiej radzi sobie z oceną dokumentów finansowych niż czołowe modele, takie jak GPT czy Claude, przy ułamku koszt

RA

Udostępnij
Dostrojony model AI Bridgewater przewyższa GPT i Claude w analizie finansowej, obniżając koszty
Fot. The Decoder

Hedge fund Bridgewater oraz Thinking Machines Lab ogłosiły, że ich dostrojony model sztucznej inteligencji, oparty na otwartym kodzie, przewyższa najsilniejsze modele AI w ocenie dokumentów finansowych, oferując jednocześnie znacznie niższe koszty. Wyniki te pochodzą z wewnętrznej ewaluacji przeprowadzonej przez oba podmioty.

Inwestorzy codziennie mierzą się z ogromną ilością informacji – wiadomości, analiz, sprawozdań korporacyjnych i e-maili. Według raportu AIA Labs Bridgewater i Thinking Machines Lab, startupu założonego przez byłą CTO OpenAI, Mirę Murati, prawdziwym wyzwaniem nie jest samo czytanie, lecz ciągłe podejmowanie drobnych, powtarzalnych decyzji o tym, co jest naprawdę istotne. To właśnie ten proces selekcji i oceny badacze chcieli zautomatyzować.

Wyzwania w analizie finansowej dla AI

Zdefiniowano sześć zadań odzwierciedlających codzienną rutynę inwestora. Przykładem może być ocena, czy artykuł finansowy jest istotny dla dyrektora, lub czy dokument banku centralnego sygnalizuje kierunek przyszłych zmian stóp procentowych. Dla doświadczonych inwestorów te decyzje są trywialne, choć często trudno im ubrać swoje rozumowanie w słowa. Raport podaje wymowny przykład: nagłówek o roszczeniach Trumpa do Grenlandii jest oznaczany jako nieistotny, podczas gdy groźba Trumpa dotycząca nowych taryf celnych na Chiny jest wysoce istotna, mimo że oba tematy dotyczą geopolityki i finansów.

Modele frontierowe, takie jak warianty Gemini, Claude i GPT, początkowo osiągały jedynie około 50 procent dokładności przy użyciu podstawowych promptów. Nawet po zastosowaniu instrukcji napisanych przez ekspertów i trójpoziomowego systemu ocen (relevantne i interesujące, relevantne, ale nieinteresujące, nieistotne), dokładność wzrosła do około 70-75 procent. To wciąż było poniżej progu 80 procent, który autorzy ustalili jako niezbędny do wiarygodnego wdrożenia.

Co więcej, nowsze modele oferowały marginalną poprawę w stosunku do kosztów. Na przykład, GPT 5.4 był o 43 procent droższy niż GPT 5.2, ale tylko nieznacznie dokładniejszy.

Klucz do sukcesu: dostrojenie i prywatne dane

Rozwiązaniem okazało się dostrojenie (fine-tuning) – ponowne szkolenie modelu o otwartej wadze na zastrzeżonych przykładach. Kluczowym elementem była ocena inwestorów Bridgewater. Początkowo do etykietowania dokumentów zatrudniono zewnętrznych wykonawców, ale wiele z ich etykiet okazało się błędnych. Aby uniknąć angażowania drogich profesjonalistów do przeglądania wszystkiego, badacze zastosowali sprytne obejście: pierwszy model uczył się na podstawie tych niedoskonałych etykiet i ponownie oceniał te same dokumenty. Wszędzie tam, gdzie model i oryginalna etykieta się nie zgadzały, prawdopodobnie występował błąd. Tylko te sporne przypadki trafiały do inwestorów w celu korekty.

Szkolenie odbyło się na platformie Tinker firmy Thinking Machines Lab, zbudowanej na bazie otwartego modelu Qwen3-235B. W wewnętrznej ocenie zespołu, dostrojony model osiągnął 84,7 procent dokładności, w porównaniu do 78,2 procent dla najlepszego testowanego modelu frontierowego. Co więcej, jego uruchomienie kosztowało blisko 14 razy mniej. Należy jednak zaznaczyć, że nie jest to niezależne porównanie, a obie firmy mają interes w promowaniu swojego produktu.

Znaczenie dla przyszłości AI w biznesie

Odkrycie to, wykraczające poza same liczby, jest niezwykle istotne. Pokazuje ono, że duże laboratoria, takie jak OpenAI, nie wchłonęły jeszcze wszystkich dostępnych danych. Ogromne zasoby prywatnych danych korporacyjnych i niewykorzystanej ludzkiej ekspertyzy nadal istnieją i stanowią realne pole do znaczącej poprawy. Jest to szczególnie prawdziwe w przypadku firm, które celowo utrzymują swoje najcenniejsze dane w tajemnicy. Przekazanie tych danych zewnętrznym laboratoriom wiąże się z ryzykiem konkurowania z produktem zbudowanym na ich podstawie.

Dostrojenie otwartych modeli za pomocą narzędzi takich jak Tinker oferuje firmom alternatywę. Pozwala im zachować kontrolę nad wagami modeli, danymi, a w zależności od konfiguracji, nawet nad samymi jednostkami GPU. To podejście podkreśla rosnące znaczenie personalizacji i wykorzystania unikalnych, wewnętrznych zasobów wiedzy w rozwoju sztucznej inteligencji, co może zrewolucjonizować sposób, w jaki przedsiębiorstwa wykorzystują AI do przewagi konkurencyjnej, jednocześnie chroniąc swoje najcenniejsze aktywa informacyjne.

Źródło: the-decoder.com

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Hugging Face integruje wyniki Every Eval Ever bezpośrednio na stronach modeli
Tylko trzy modele AI przetrwały test prowadzenia startupu przez 500 dni z zyskiem
Meta: Rozwój agentów AI wolniejszy niż zakładał Zuckerberg, pomimo gigantycznych inwestycji
Tesla ogranicza wydatki pracowników na AI do 200 dolarów tygodniowo
Anthropic rozważa współpracę z Samsungiem nad własnym chipem AI
AI przyspiesza doskonałość operacyjną, ale wymaga solidnych podstaw procesowych

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.