«Chrzestna matka SI» Fei-Fei Li przewiduje kolejny przełom w myśleniu przestrzennym
Znana badaczka sztucznej inteligencji Fei-Fei Li, założycielka startupu World Labs, uważa, że następny duży przełom w SI nastąpi nie w przetwarzaniu języka, lecz w obszarze myślenia przestrzennego.
Jej zdaniem, dopiero nauka rozumienia ruchu, odległości, interakcji obiektów i praw fizyki pozwoli sztucznej inteligencji przejść od analizy informacji do pełnoprawnej interakcji z człowiekiem.
Li zaznacza, że nawet najnowocześniejsze modele językowe pozostają „ślepe na fizykę”: potrafią analizować teksty i obrazy, ale nie są w stanie określać odległości, orientacji przedmiotów ani przewidywać skutków ich przemieszczania się.
Badaczka tłumaczy to ewolucją: ludzka inteligencja rozwinęła się z potrzeby postrzegania świata i poruszania się w nim, natomiast mowa pojawiła się później. Dlatego prawdziwa sztuczna inteligencja powinna posiadać wewnętrzne modele świata, w którym obowiązują prawa fizyki.
Li proponuje przejście od modeli językowych do modeli światowych — systemów, które mogą tworzyć i modyfikować sceny trójwymiarowe, przestrzegając logiki przyczynowo-fizycznej. Takie modele powinny być generatywne, multimodalne i interaktywne.
World Labs pracuje już nad prototypem o nazwie Marble, zdolnym do tworzenia stabilnych scen 3D na podstawie multimodalnych zapytań.
Fei-Fei Li dostrzega największy potencjał przestrzennie świadomej SI w robotyce, planowaniu złożonych działań oraz badaniach naukowych. Uważa, że zdolność maszyn do rozumienia przestrzeni stanie się kluczem do nowego etapu rozwoju sztucznej inteligencji.
Dla kontekstu: OpenAI, wiodąca firma w dziedzinie sztucznej inteligencji, znalazła się w centrum dyskusji po komentarzu dyrektora finansowego Sary Fry, która wspomniała o możliwej potrzebie państwowego „gwarantowania” wydatków na chipy w wysokości 1,4 biliona dolarów.
Ponadto japońscy twórcy anime wystąpili przeciwko Sora 2.