Popularny system AI, z którym można było porozumiewać się za pomocą klawiatury, teraz będzie w stanie słuchać poleceń, a co więcej odpowiadać na nie generowanym automatycznie głosem (ma być pięć głosów do wyboru). Na tym nie koniec – OpenAI wdroży też jeszcze jedną przydatną funkcjonalność, a mianowicie rozpoznawanie obrazów. W efekcie będzie można ChatGPT pokazać zrobione zdjęcie, by omówić to, co na nim się znajduje. Twórcy chatbota wskazują, że za pośrednictwem technologii rozpoznawania obrazu algorytmy będą w stanie rozpoznać np. punkt orientacyjny sfotografowany podczas podróży i na żywo przekazać głosem bota, co interesującego możemy zobaczyć w okolicy.

Czytaj więcej

ChatGPT wraca do łask. Szkoły rzuciły się na sztuczną inteligencję

„Kiedy będziesz w domu, zrób zdjęcia swojej lodówki, aby usłyszeć, co z tych produktów można zrobić na obiad. Zadawaj pytania uzupełniające, aby uzyskać przepis krok po kroku. A po obiedzie pomóż dziecku rozwiązać pracę domową matematyki, robiąc zdjęcie, zakreślając zadanie i prosząc o wskazówki” – tak OpenAI opisuje możliwe zastosowania nowych funkcjonalności ChatGPT.

Sztuczna inteligencja przeanalizuje obrazy

Opcje głosowej komunikacji i rozpoznawania obrazu pojawią się w systemie w ciągu dwóch tygodni. Nowatorskie funkcje nie będą dostępne dla wszystkich. Korzystać będą mogli z nich jedynie płatni subskrybenci, używający wersji ChatGPT Plus lub Enterprise (dla firm). Wiadomo, że funkcje głosowe bota mają być dostępne na systemy operacyjne iOS i Android, gdy opcję rozpoznawania obrazów (obsługiwaną przez modele GPT-3,5 i GPT-4) będzie można ustawić na wszystkich platformach. W OpenAI wskazują, iż obraz, który bot jest w stanie „zobaczyć” i „zrozumieć” to nie tylko fotografie, ale także dokumenty tekstowe i graficzne, czy zrzuty ekranu.