Dostrojony model AI Bridgewater przewyższa GPT i Claude w analizie finansowej, obniżając koszty
Hedge fund Bridgewater we współpracy z Thinking Machines Lab opracował dostrojony model AI, który znacznie lepiej radzi sobie z oceną dokumentów finansowych niż czołowe modele, takie jak GPT czy Claude, przy ułamku koszt

Hedge fund Bridgewater oraz Thinking Machines Lab ogłosiły, że ich dostrojony model sztucznej inteligencji, oparty na otwartym kodzie, przewyższa najsilniejsze modele AI w ocenie dokumentów finansowych, oferując jednocześnie znacznie niższe koszty. Wyniki te pochodzą z wewnętrznej ewaluacji przeprowadzonej przez oba podmioty.
Inwestorzy codziennie mierzą się z ogromną ilością informacji – wiadomości, analiz, sprawozdań korporacyjnych i e-maili. Według raportu AIA Labs Bridgewater i Thinking Machines Lab, startupu założonego przez byłą CTO OpenAI, Mirę Murati, prawdziwym wyzwaniem nie jest samo czytanie, lecz ciągłe podejmowanie drobnych, powtarzalnych decyzji o tym, co jest naprawdę istotne. To właśnie ten proces selekcji i oceny badacze chcieli zautomatyzować.
Wyzwania w analizie finansowej dla AI
Zdefiniowano sześć zadań odzwierciedlających codzienną rutynę inwestora. Przykładem może być ocena, czy artykuł finansowy jest istotny dla dyrektora, lub czy dokument banku centralnego sygnalizuje kierunek przyszłych zmian stóp procentowych. Dla doświadczonych inwestorów te decyzje są trywialne, choć często trudno im ubrać swoje rozumowanie w słowa. Raport podaje wymowny przykład: nagłówek o roszczeniach Trumpa do Grenlandii jest oznaczany jako nieistotny, podczas gdy groźba Trumpa dotycząca nowych taryf celnych na Chiny jest wysoce istotna, mimo że oba tematy dotyczą geopolityki i finansów.
Modele frontierowe, takie jak warianty Gemini, Claude i GPT, początkowo osiągały jedynie około 50 procent dokładności przy użyciu podstawowych promptów. Nawet po zastosowaniu instrukcji napisanych przez ekspertów i trójpoziomowego systemu ocen (relevantne i interesujące, relevantne, ale nieinteresujące, nieistotne), dokładność wzrosła do około 70-75 procent. To wciąż było poniżej progu 80 procent, który autorzy ustalili jako niezbędny do wiarygodnego wdrożenia.
Co więcej, nowsze modele oferowały marginalną poprawę w stosunku do kosztów. Na przykład, GPT 5.4 był o 43 procent droższy niż GPT 5.2, ale tylko nieznacznie dokładniejszy.
Klucz do sukcesu: dostrojenie i prywatne dane
Rozwiązaniem okazało się dostrojenie (fine-tuning) – ponowne szkolenie modelu o otwartej wadze na zastrzeżonych przykładach. Kluczowym elementem była ocena inwestorów Bridgewater. Początkowo do etykietowania dokumentów zatrudniono zewnętrznych wykonawców, ale wiele z ich etykiet okazało się błędnych. Aby uniknąć angażowania drogich profesjonalistów do przeglądania wszystkiego, badacze zastosowali sprytne obejście: pierwszy model uczył się na podstawie tych niedoskonałych etykiet i ponownie oceniał te same dokumenty. Wszędzie tam, gdzie model i oryginalna etykieta się nie zgadzały, prawdopodobnie występował błąd. Tylko te sporne przypadki trafiały do inwestorów w celu korekty.
Szkolenie odbyło się na platformie Tinker firmy Thinking Machines Lab, zbudowanej na bazie otwartego modelu Qwen3-235B. W wewnętrznej ocenie zespołu, dostrojony model osiągnął 84,7 procent dokładności, w porównaniu do 78,2 procent dla najlepszego testowanego modelu frontierowego. Co więcej, jego uruchomienie kosztowało blisko 14 razy mniej. Należy jednak zaznaczyć, że nie jest to niezależne porównanie, a obie firmy mają interes w promowaniu swojego produktu.
Znaczenie dla przyszłości AI w biznesie
Odkrycie to, wykraczające poza same liczby, jest niezwykle istotne. Pokazuje ono, że duże laboratoria, takie jak OpenAI, nie wchłonęły jeszcze wszystkich dostępnych danych. Ogromne zasoby prywatnych danych korporacyjnych i niewykorzystanej ludzkiej ekspertyzy nadal istnieją i stanowią realne pole do znaczącej poprawy. Jest to szczególnie prawdziwe w przypadku firm, które celowo utrzymują swoje najcenniejsze dane w tajemnicy. Przekazanie tych danych zewnętrznym laboratoriom wiąże się z ryzykiem konkurowania z produktem zbudowanym na ich podstawie.
Dostrojenie otwartych modeli za pomocą narzędzi takich jak Tinker oferuje firmom alternatywę. Pozwala im zachować kontrolę nad wagami modeli, danymi, a w zależności od konfiguracji, nawet nad samymi jednostkami GPU. To podejście podkreśla rosnące znaczenie personalizacji i wykorzystania unikalnych, wewnętrznych zasobów wiedzy w rozwoju sztucznej inteligencji, co może zrewolucjonizować sposób, w jaki przedsiębiorstwa wykorzystują AI do przewagi konkurencyjnej, jednocześnie chroniąc swoje najcenniejsze aktywa informacyjne.
Źródło: the-decoder.com
Komentarze
Zaloguj się, aby dołączyć do dyskusji.
Nikt jeszcze nie skomentował. Bądź pierwszy!
Czytaj dalej

Hugging Face integruje wyniki Every Eval Ever bezpośrednio na stronach modeli
Hugging Face wprowadza nową funkcjonalność, która umożliwia wyświetlanie wyników ewaluacji Every Eval Ever (EEE) bezpośrednio na stronach modeli, ułatwiając porównywanie i ocenę ich wydajności.
Redakcja Aigest3 dni temu

Tylko trzy modele AI przetrwały test prowadzenia startupu przez 500 dni z zyskiem
Badacze z Uniwersytetu Princeton stworzyli CEO-Bench, symulację, w której agenci AI zarządzają fikcyjną firmą programistyczną przez 500 dni, a większość modeli bankrutuje.
Redakcja Aigest5 dni temu

Meta: Rozwój agentów AI wolniejszy niż zakładał Zuckerberg, pomimo gigantycznych inwestycji
Mark Zuckerberg przyznał, że rozwój agentów AI w Meta Platforms postępuje wolniej niż oczekiwano, mimo znaczących inwestycji i restrukturyzacji. Firma przeznacza miliardy dolarów na infrastrukturę AI, dążąc do dogonienia
Redakcja Aigest5 godz. temu

Tesla ogranicza wydatki pracowników na AI do 200 dolarów tygodniowo
Tesla wprowadziła limit wydatków na narzędzia AI dla swoich pracowników, ustalając go na 200 dolarów tygodniowo. Decyzja ta ma na celu kontrolę kosztów, jednocześnie promując wewnętrzne platformy AI.
Redakcja Aigest6 godz. temu

Anthropic rozważa współpracę z Samsungiem nad własnym chipem AI
Anthropic, jeden z czołowych graczy na rynku sztucznej inteligencji, prowadzi rozmowy z Samsungiem na temat stworzenia niestandardowego chipa AI. Ruch ten wpisuje się w szerszy trend firm technologicznych dążących do uni
Redakcja Aigest22 godz. temu

AI przyspiesza doskonałość operacyjną, ale wymaga solidnych podstaw procesowych
Sztuczna inteligencja rewolucjonizuje sposób pracy, a organizacje z ugruntowanymi ramami procesowymi są najlepiej przygotowane do wykorzystania jej potencjału w celu osiągnięcia doskonałości operacyjnej na dużą skalę.
Redakcja Aigestwczoraj
Bądź na bieżąco ze światem AI
Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.