Aigest.
Newsy

OpenClaw udostępnia aplikacje mobilne dla iOS i Androida, łączące telefony z samodzielnym agentem AI

OpenClaw wprowadza natywne aplikacje towarzyszące dla iOS i Androida, które przekształcają smartfony w węzły sieci samodzielnie hostowanego agenta AI, rozszerzając jego możliwości o funkcje urządzenia.

RA

Udostępnij
OpenClaw udostępnia aplikacje mobilne dla iOS i Androida, łączące telefony z samodzielnym agentem AI
Fot. MarkTechPost

OpenClaw, projekt niezależnego, otwartego oprogramowania, udostępnił natywne aplikacje towarzyszące dla systemów iOS i Android. Aplikacje te, dostępne do bezpłatnego pobrania, nie są samodzielnymi chatbotami, lecz przekształcają smartfony w węzły (nodes) w sieci samodzielnie hostowanego agenta AI. Główny agent działa na oddzielnej bramie (Gateway), co stanowi kluczowy element architektury systemu.

Architektura OpenClaw: Gateway i Węzły

OpenClaw to osobisty asystent/agent AI stworzony przez Petera Steinbergera we współpracy ze społecznością. Projekt jest niezależny i nie jest powiązany z firmą Anthropic. Jego rdzeń został napisany w TypeScript, a środowisko uruchomieniowe to Node 24 (zalecane) lub Node 22.19+. Brama (Gateway) może być uruchamiana na systemach macOS, Linux lub Windows za pośrednictwem WSL2.

Agent komunikuje się z użytkownikiem poprzez popularne aplikacje czatowe, takie jak WhatsApp, Telegram, Discord, Slack, Signal i iMessage. Potrafi przeglądać sieć, wykonywać polecenia systemowe (shell commands) oraz czytać i zapisywać pliki. Współpracuje z różnymi modelami AI – hostowanymi, subskrypcyjnymi, bramowymi lub lokalnymi – wymagając od użytkownika dostarczenia klucza API od wybranego dostawcy. System utrzymuje pamięć trwałą i obsługuje umiejętności oraz wtyczki tworzone przez społeczność.

Brama (Gateway) stanowi pojedynczą płaszczyznę kontrolną, zarządzającą sesjami, routingiem, kanałami, narzędziami i zdarzeniami. Użytkownik uruchamia jeden proces bramy na swojej maszynie lub serwerze. Wszystkie wiadomości czatu trafiają zawsze do bramy, nigdy bezpośrednio na telefon. Węzeł to urządzenie towarzyszące, które łączy się z bramą za pośrednictwem WebSocket na domyślnym porcie 18789. Każdy węzeł rejestruje się z rolą „node” podczas parowania i udostępnia powierzchnię poleceń poprzez node.invoke, obejmującą rodziny komend takie jak canvas.*, camera.*, device.*, notifications.* i system.*. Dokumentacja wyraźnie podkreśla, że „Węzły są urządzeniami peryferyjnymi, a nie bramami”. W sieci lokalnej aplikacje wykrywają bramę za pomocą mDNS/Bonjour. Do zdalnego dostępu OpenClaw zaleca użycie Tailscale z punktem końcowym wss://.

Rozszerzone możliwości dzięki integracji z urządzeniami mobilnymi

Telefon, jako węzeł, nadaje agentowi AI „ciało”, udostępniając mu sprzęt specyficzny dla urządzenia i integrując go z przepływami pracy. Aplikacja na iOS paruje się za pomocą kodu QR lub kodu konfiguracji. Obsługuje czat, tryb rozmowy w czasie rzeczywistym i w tle (Talk mode) oraz zatwierdzenia. Użytkownicy iOS mogą udostępniać tekst, linki i multimedia do OpenClaw. Opcjonalne funkcje obejmują dostęp do kamery, ekranu, lokalizacji, zdjęć, kontaktów, kalendarza i przypomnień.

Aplikacja na Androida również działa jako węzeł towarzyszący, oferując strumieniowe odpowiedzi czatu, załączniki graficzne i pełną historię sesji. Tryb rozmowy wykorzystuje ElevenLabs lub systemowy syntezator mowy (TTS). Interaktywna powierzchnia Canvas umożliwia agentowi renderowanie pulpitów nawigacyjnych i narzędzi. Android wymaga udzielania uprawnień pojedynczo, a usługa działająca w tle utrzymuje połączenie z bramą.

Przykłady zastosowań obejmują zbieranie danych terenowych, gdzie agent wykorzystuje kamerę iOS do fotografowania warunków, a lokalizacja taguje zdjęcia współrzędnymi GPS. Innym przykładem jest kontekstowe przypomnienie, które aktywuje zadanie po dotarciu do określonego miejsca. Agent może również odczytywać przychodzące powiadomienia na Androidzie i tworzyć odpowiedzi, a także wyświetlać pulpity nawigacyjne na ekranie za pośrednictwem powierzchni Canvas. Tryb rozmowy umożliwia ciągłą konwersację głosową bez użycia rąk. Należy pamiętać, że przechwytywanie obrazu z kamery i ekranu wymaga, aby aplikacja była aktywna na pierwszym planie; wywołania w tle zwracają błąd.

Konfiguracja i bezpieczeństwo

Aby rozpocząć, należy najpierw uruchomić bramę na obsługiwanym hoście (macOS, Linux lub Windows via WSL2) za pomocą poleceń npm install -g openclaw@latest i openclaw onboard --install-daemon. Następnie, po otwarciu aplikacji mobilnej, można wybrać wykrytą bramę lub ręcznie wprowadzić hosta i port. Aplikacja łączy się z rolą „node” i wysyła żądanie parowania urządzenia, które musi zostać zatwierdzone z poziomu interfejsu CLI bramy (openclaw devices approve <requestId>).

Komendy związane z prywatnością, takie jak camera.snap, camera.clip i screen.record, są domyślnie wyłączone. Użytkownik musi wyraźnie włączyć je w konfiguracji bramy, dodając je do listy allowCommands w pliku ~/.openclaw/openclaw.json. Lista denyCommands zawsze ma priorytet nad allowCommands. Dane uwierzytelniające parowania są przechowywane na urządzeniu, a każde połączenie węzła wymaga jawnego zatwierdzenia. Przechwytywanie obrazu z kamery i ekranu jest chronione uprawnieniami i działa tylko na pierwszym planie. Połączenia ws:// są ograniczone do sieci LAN i hostów .local; publiczne lub Tailscale punkty końcowe wymagają bezpiecznego punktu końcowego wss:// TLS.

Udostępnienie aplikacji mobilnych przez OpenClaw znacząco rozszerza możliwości samodzielnie hostowanych agentów AI, umożliwiając im interakcję ze światem fizycznym za pośrednictwem funkcji smartfonów. Ta architektura, oddzielająca logikę agenta od urządzenia końcowego, otwiera nowe perspektywy dla personalizowanych i kontekstowych asystentów AI, jednocześnie kładąc nacisk na kontrolę użytkownika nad prywatnością i dostępem do danych.

Źródło: marktechpost.com

Udostępnij

Komentarze

Zaloguj się, aby dołączyć do dyskusji.

Nikt jeszcze nie skomentował. Bądź pierwszy!

Czytaj dalej

Sztuczna inteligencja a rynek pracy: nowe dane komplikują debatę o utracie miejsc pracy
Newsy

Sztuczna inteligencja a rynek pracy: nowe dane komplikują debatę o utracie miejsc pracy

Raport firm Ramp i Revelio Labs wskazuje, że przedsiębiorstwa intensywnie inwestujące w AI szybciej zwiększają zatrudnienie, nawet na stanowiskach niższego szczebla, co podważa tezę o masowych zwolnieniach.

Redakcja Aigest10 godz. temu

Base44 wprowadza własny model AI, dążąc do niezależności na rynku platform vibe-codingu
Newsy

Base44 wprowadza własny model AI, dążąc do niezależności na rynku platform vibe-codingu

Platforma vibe-codingowa Base44, przejęta przez Wix, uruchomiła własny model sztucznej inteligencji, aby zwiększyć optymalizację, obniżyć koszty i wzmocnić swoją pozycję rynkową w obliczu rosnącej konkurencji.

Redakcja Aigest11 godz. temu

Korea Południowa inwestuje ponad 900 mld dolarów w półprzewodniki i AI, by uniknąć „RAMageddonu”
Newsy

Korea Południowa inwestuje ponad 900 mld dolarów w półprzewodniki i AI, by uniknąć „RAMageddonu”

Korea Południowa ogłosiła ambitny plan inwestycyjny o wartości ponad 900 miliardów dolarów, mający na celu umocnienie jej pozycji w sektorach półprzewodników i sztucznej inteligencji, a także złagodzenie globalnego niedo

Redakcja Aigest20 godz. temu

Rośnie zaufanie do agentów AI w zadaniach technicznych, zwłaszcza w obszarze danych
Newsy

Rośnie zaufanie do agentów AI w zadaniach technicznych, zwłaszcza w obszarze danych

Nowe badanie ujawnia rosnące zaufanie ekspertów technologicznych do agentów AI w automatyzacji zadań, szczególnie w obszarze zarządzania danymi. Kluczowe dla sukcesu okazuje się dostarczanie odpowiedniego kontekstu bizne

Redakcja Aigest23 godz. temu

Uderzenie rakietowe w irańską szkołę: AI i przestarzała infrastruktura celownicza armii USA
Newsy

Uderzenie rakietowe w irańską szkołę: AI i przestarzała infrastruktura celownicza armii USA

Dochodzenie w sprawie ataku rakietowego na irańską szkołę ujawniło poważne luki w systemie celowniczym armii USA, mimo zastosowania sztucznej inteligencji na dużą skalę. Główne problemy to brak komunikacji między systema

Redakcja Aigestwczoraj

Luka w Claude Code pozwala na przejęcie kontroli nad komputerami deweloperów przez złośliwe repozytoria GitHub
Newsy

Luka w Claude Code pozwala na przejęcie kontroli nad komputerami deweloperów przez złośliwe repozytoria GitHub

Badacze bezpieczeństwa odkryli nową metodę ataku, która umożliwia cyberprzestępcom uzyskanie pełnej kontroli nad maszynami deweloperów. Wykorzystuje ona narzędzia do kodowania AI, takie jak Claude Code, do uruchamiania u

Redakcja Aigestwczoraj

Bądź na bieżąco ze światem AI

Najważniejsze newsy, recenzje i poradniki — raz w tygodniu, prosto na maila. Bez spamu.