Apple jest mocno pod tym względem spóźniony, ale jego nowy model sztucznej inteligencji o otwartym kodzie źródłowym do edycji obrazów pokazuje, że i po czasie można wnieść w tę przestrzeń trochę ciekawych rozwiązań. Model o nazwie MLLM-Guided Image Editing (MGIE), który wykorzystuje multimodalne modele dużego języka do interpretowania poleceń tekstowych, ma umożliwić prowadzenie zmian, retuszu i przeróbek fotografii.
Jak sztuczna inteligencja może przerobić obraz
Narzędzie umożliwia edycję zdjęć na podstawie tekstu wpisywanego przez użytkownika. Wystarczy napisać np. „usuń drzewo w tle” albo „wprowadź na sfotografowanym ekranie komputera zielony obraz”, a bot to zrobi. Co więcej, narzędzie, które gigant stworzył w kooperacji z naukowcami z Uniwersytetu Kalifornijskiego w Santa Barbara, może też interpretować polecenia – gdy użytkownik napisz o pizzy na zdjęciu „uczyń ją zdrowszą”, MGIE wyedytuje na obrazie np. warzywne składniki.
Czytaj więcej
Ledwie gogle Apple Vision Pro ukazały się na amerykańskim rynku, a już oferowane są też w Rosji, pomimo sankcji i wyjścia koncernu z tego rynku. Cena szokuje, bo jest trzy razy wyższa niż w USA, gdzie też jest wyśrubowana.
Wszystko to jest dopiero przygrywką. Tim Cook, szef koncernu z Cupertino, zapowiedział, że jeszcze w br. firma ogłosi szczegóły rozwoju własnej sztucznej inteligencji. Na czerwcowej konferencji WWDC spółka ma zaprezentować ulepszoną Siri - to informacje nieoficjalne. Inteligentny wirtualny asystent ma być dostępny nie tylko na iPhone`ach, ale też na innych sprzętach z logo nadgryzionego jabłka. - Będziemy inwestować w technologie kształtujące przyszłość. Dotyczy m.in. AI, której poświęcamy ogromną ilość czasu i wysiłku – przekonuje Cook.