Aigest.
Biznes AI

Patronus AI pozyskuje 50 mln dolarów na cyfrowe światy do testowania agentów AI

Patronus AI, startup założony przez byłych badaczy Meta AI, zebrał 50 milionów dolarów w rundzie finansowania Serii B. Firma tworzy symulowane środowiska cyfrowe do testowania agentów sztucznej inteligencji, co ma kluczo

RA

Udostępnij
Patronus AI pozyskuje 50 mln dolarów na cyfrowe światy do testowania agentów AI
Fot. Patronus AI

Startup Patronus AI, założony w 2023 roku przez byłych badaczy Meta AI, Ananda Kannappana i Rebeccę Qian, ogłosił pozyskanie 50 milionów dolarów w rundzie finansowania Serii B. Inwestycję poprowadził Greenfield Partners, z udziałem Notable Capital, Lightspeed, Datadog i Samsung. Dzięki tej rundzie, łączne finansowanie firmy osiągnęło 70 milionów dolarów. Środki zostaną przeznaczone na rozwój „cyfrowych światów” służących do intensywnego testowania agentów sztucznej inteligencji, co ma zapewnić ich niezawodność w złożonych zadaniach.

Agenci AI stają się coraz bardziej zaawansowani, przechodząc od prostego odpowiadania na pytania do autonomicznego wykonywania wieloetapowych, skomplikowanych zadań. Zanim jednak będzie można im zaufać w kwestiach takich jak rezerwowanie podróży czy analiza finansowa, twórcy modeli i startupy budujące tych agentów muszą upewnić się, że działają oni niezawodnie w szerokim zakresie scenariuszy.

Cyfrowe światy dla niezawodności AI

Patronus AI rozwiązuje ten problem, tworząc symulowane środowiska cyfrowe, w których można oceniać wydajność agentów. Firma wykorzystuje tak zwane „modele cyfrowego świata” do replikowania stron internetowych i wewnętrznych systemów. W tych środowiskach agenci są poddawani testom obciążeniowym po przeszkoleniu, używając uczenia przez wzmacnianie, które iteracyjnie nagradza udane wykonanie zadania i karze za błędy.

Według Glenna Solomona, dyrektora zarządzającego w Notable Capital, zapotrzebowanie na symulowane środowiska Patronus jest niemal nienasycone. Praktycznie każde wiodące laboratorium AI i wiele wschodzących startupów to obecnie klienci firmy. Przychody Patronus wzrosły 15-krotnie w ciągu ostatniego roku, co świadczy o znacznym zainteresowaniu inwestorów.

Wyzwania i analogie

Laboratoria AI dostrzegają dużą wartość w tych cyfrowych symulacjach, ponieważ dają one agentom możliwość wypróbowania różnych, czasem nieprzewidywalnych scenariuszy. Firma porównuje swoje podejście do sposobu, w jaki Waymo szkoliło autonomiczne samochody, najpierw budując syntetyczne światy do testowania pojazdów pod kątem rzadkich zagrożeń, takich jak trudne warunki pogodowe czy dziecko biegnące za piłką.

Różnica w przypadku agentów AI polega na tym, że często mają tendencję do „chodzenia na skróty”, co prowadzi do niewłaściwego wykonania zadania. Solomon podkreśla, że „Patronus jest naprawdę dobry w wykrywaniu tych sztuczek i upewnianiu się, że modele są odpowiedzialne”.

Obecnie Patronus dostarcza swoje symulowane cyfrowe światy dla inżynierii oprogramowania i finansów, ale, jak zaznacza Kannappan, to dopiero początek. Firma koncentruje się na problemach, które można natychmiast zweryfikować, ale planuje rozszerzyć działalność na obszary trudniejsze do weryfikacji. Kannappan dodaje, że celem jest stworzenie środowiska, w którym agent może działać przez 10 godzin, 10 dni, a nawet 10 tygodni.

Konkurencja i unikalne podejście

Patronus uważa, że główną konkurencją są wewnętrzne zespoły, które laboratoria AI już zbudowały do oceny zachowania agentów. Chociaż firmy zajmujące się danymi ludzkimi, takie jak Mercor i Surge, pomagają twórcom modeli w uczeniu przez wzmacnianie, Patronus działa inaczej, oceniając zachowanie agentów bez udziału człowieka. To odróżnia ich od tradycyjnych metod, gdzie wysokie wyniki w benchmarkach nie zawsze przekładają się na rzeczywistą zdolność AI do poprawnego wykonywania złożonych zadań.

Rozwój zaawansowanych agentów AI wymaga solidnych metod weryfikacji ich działania w realnych, często nieprzewidywalnych warunkach. Inwestycja w Patronus AI podkreśla rosnące zapotrzebowanie na narzędzia, które zapewnią niezawodność i bezpieczeństwo systemów opartych na sztucznej inteligencji, zanim zostaną one szeroko wdrożone w kluczowych sektorach gospodarki. To kluczowy krok w budowaniu zaufania do autonomicznych systemów, które mają coraz większy wpływ na nasze codzienne życie i biznes.

Źródło: techcrunch.com

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Gemini 3.5 Flash z wbudowaną funkcją obsługi komputera
Netris pozyskuje 15 mln dolarów od a16z na przyspieszenie uruchamiania neochmur AI
Macy's stawia na sztuczną inteligencję: od niewidzialnego wsparcia po spersonalizowane zakupy
Generatywna AI rewolucjonizuje modelowanie katastrof w ubezpieczeniach, ale z ryzykiem halucynacji
OpenAI i Broadcom prezentują „Jalapeño” – autorski układ dla wnioskowania LLM
MoEngage stawia na miliony agentów AI w przyszłości marketingu, przejmując Aampe

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.