Anthropic wzywa laboratoria sztucznej inteligencji do wstrzymania rozwoju i ostrzega, że ludzie ryzykują utratę kontroli

Anthropic wzywa główne laboratoria sztucznej inteligencji (AI), aby rozważyły skoordynowaną i możliwą do zweryfikowania przerwę w rozwoju, ostrzegając, że szybki postęp technologiczny może wkrótce pozwolić systemom AI na udoskonalanie się szybciej, niż społeczeństwo będzie w stanie zarządzać ryzykiem.

Twórca Claude powiedział, że zdolność sztucznej inteligencji do samodzielnego wykonywania zadań podwaja się mniej więcej co cztery miesiące i zmierza w kierunku „rekurencyjnego samodoskonalenia”, czyli punktu, w którym technologia może się udoskonalać bez interwencji człowieka.

„Jeśli systemy będą w stanie w pełni zbudować swoich własnych następców, znacznie ważniejsze staną się sposoby, w jakie je zabezpieczamy, monitorujemy i kształtujemy ich zachowanie” – stwierdził startup w długim poście na blogu w czwartek, dodając, że przerwa pozwoli społeczeństwu „poradzić sobie z jego ogromnymi konsekwencjami”.

“Jeszcze nie osiągnęliśmy tego celu, a rekursywne samodoskonalenie nie jest nieuniknione. Może jednak nastąpić wcześniej, niż większość instytucji jest na to przygotowana” – napisali w poście współzałożyciel Anthropic Jack Clark i dyrektor Instytutu Anthropic, Marina Favaro.

Wraz ze wzrostem wydajności technologii narosły obawy, że zaawansowane systemy sztucznej inteligencji mogą wymknąć się spod kontroli człowieka i spowodować szkody społeczne.

Własny model Mythos firmy Anthropic na początku tego roku wywołał falę uderzeniową w branżach, w tym w bankowości i oprogramowaniu, dzięki możliwości znajdowania luk w istniejącym kodzie.

Jednak regulacje są powolne, zwłaszcza w USA, gdzie mieści się większość wiodących laboratoriów zajmujących się sztuczną inteligencją.

Zarządzenie wykonawcze administracji Trumpa wydane na początku tego tygodnia nałożyło ciężar na same laboratoria, prosząc je o dobrowolne przedłożenie najbardziej wydajnych modeli do rządowych testów cyberbezpieczeństwa przed publikacją.

Badacze zajmujący się sztuczną inteligencją również już wcześniej nawoływali do przerwy, ale nie odnieśli większego sukcesu.

Elon Musk, właściciel laboratorium AI xAI, znalazł się w gronie zwolenników inicjatywy non-profit Future of Life Institute z 2023 r., mającej na celu wstrzymanie rozwoju sztucznej inteligencji na sześć miesięcy, aby dać czas na montaż barier ochronnych.

Anthropic od dawna pozycjonuje się jako laboratorium sztucznej inteligencji skupiające się na bezpieczeństwie.

Na początku tego roku odmówił armii amerykańskiej wykorzystania swoich modeli do nadzoru wewnętrznego i w pełni autonomicznej broni, co wywołało ostry sprzeciw rządu, który umieścił go na czarnej liście bezpieczeństwa narodowego, która zacznie obowiązywać później w 2026 r.

W piątek agencja Reuters podała, że w niektórych częściach rządu USA spór wykazuje oznaki złagodzenia.

Mimo to Anthropic w dalszym ciągu wypuszcza coraz potężniejsze modele, a w lutym wycofał się z kluczowego zobowiązania dotyczącego bezpieczeństwa, stwierdzając, że nie będzie już powstrzymywał potencjalnie niebezpiecznej sztucznej inteligencji, jeśli rywale będą bliscy jej możliwości.

Niedawno wyceniono ją na 965 miliardów dolarów w ramach ogromnej rundy finansowania i w poniedziałek poufnie złożono wniosek o pierwszą ofertę publiczną w USA, co wyprzedziło konkurencyjne OpenAI zarówno pod względem wyceny, jak i wyścigu o zapewnienie kluczowego finansowania.

Skoordynowane działanie

W czwartkowym poście Anthropic przestrzegł, że jednostronne lub źle skoordynowane spowolnienie może przynieść odwrotny skutek, jeśli mniej ostrożni gracze będą nadal posuwać się naprzód, potencjalnie zmniejszając ogólne bezpieczeństwo.

Stwierdzono, że znacząca przerwa wymagałaby porozumienia między „wieloma dobrze wyposażonymi laboratoriami” działającymi na pograniczu technologicznym, a także zasad określających, jakie warunki uruchomią lub zniosą taką przerwę i kto będzie ją nadzorował.

„Z kolei jednostronna pauza na jedno laboratorium jest możliwa do natychmiastowego osiągnięcia, ale daje znacznie mniej efektów: zmieniłoby to, kto jest liderem, ale nie stworzyłoby szerszego procesu deliberacji, którego obecnie brakuje” – stwierdził startup.

Jej dział badawczy, Anthropic Institute, planuje zbadać systemy niezbędne do wspierania spowolnienia gospodarczego, a w nadchodzących miesiącach zwoła decydentów, badaczy, grupy społeczeństwa obywatelskiego i konkurencyjne firmy zajmujące się sztuczną inteligencją, aby omówić zarządzanie ryzykiem, takie jak rekurencyjne samodoskonalenie.

OpenAI, xAI, Alphabet, Meta Platforms i francuski Mistral nie odpowiedziały natychmiast na prośby o komentarz na temat tego, czy dołączą do rozmowy.