ChatGPT 4.0 a ChatGPT-4o na pierwszy rzut oka różni się tym, że “zero” w nazwie zamieniono na literę. Zmiana w zapisie może i jest mała, ale to “O” zmienia wszystko. Przygotujcie się na nowości, które przygotowali dla Was pracownicy OpenAI — i to zmiany dla wszystkich, za darmo!
Model od wszystkiego
Litera “O” w nazwie nowego Chatu oznacza “omni”, czyli wszystko. Nowy, lepszy model językowy otwiera niedostępne do tej pory możliwości dla użytkowników ChatGPT, również tych korzystających z darmowego konta. Nowe narzędzie potrafi analizować obrazy, rozmawiać z nami i analizować emocje mówiącego.
Rozmowa — Ze sztuczną inteligencją mogliśmy rozmawiać już wcześniej, m.in. dzięki aplikacji. Był to jednak proces strasznie żmudny dla ChatuGPT. Nasz głos przechodził przez 3 różne modele, gdzie pierwszy transkrybował dźwięk na tekst, kolejny analizował wprowadzone dane, a trzeci konwertował z powrotem tekst na dźwięk. W tym procesie czatbot tracił wiele ważnych informacji, takich jak ton, dźwięki w tle oraz emocje. GPT 4o robi to automatycznie – dane są przetwarzane przez jedną sieć neuronową, więc nie dość, że przyjmuje więcej informacji, to wykonuje mniej kroków po drodze.
Dla przykładu, na konferencji OpenAI jeden z prowadzących panelu dyskusyjnego pokazał, jak model analizuje oddech rozmówcy. ChatGPT w czasie rzeczywistym udzielał porad dotyczących poprawy technik oddychania i prowadził rozmowę, która w znacznym stopniu odzwierciedlała dyskusję dwójki ludzi.
Analiza otoczenia — Nowa funkcja GPT-4o, która umożliwia „widzenie”, stanowi znaczny postęp w interakcji między sztuczną inteligencją a użytkownikami. Dzięki temu program potrafi dostrzec za pomocą kamery otoczenie i na przykład, rozwiązać zadanie zapisane na kartce. Chat nie zatrzymał się jednak na udzieleniu odpowiedzi, a zaczął tłumaczyć sposób rozwiązania problemu. Nowy model potrafi przeglądać kody programistyczne, figury geometryczne, wykresy czy tabele i analizować je. Potrafi szukać mocnych stron czy dostrzegać potencjalne błędy.
Tłumaczenie na żywo — Najbardziej przełomowa wydaje się być funkcja tłumaczenia języków obcych w czasie rzeczywistym. Dlaczego najbardziej? Po konferencji akcje m.in. Duolingo, czyli największej aplikacji do nauki języków, momentalnie spadły. Możecie o tym poczytać w postach publikowanych przez Wojtka Kardysa na jego koncie na X’ie. Program rozpoznawał zdania wypowiedziane w języku włoskim i natychmiast tłumaczył je na język angielski. Następnie odpowiadał po angielsku i tłumaczył te odpowiedzi z powrotem na włoski. Ta innowacja z pewnością zrewolucjonizuje podróżowanie, ułatwiając komunikację międzykulturową i eliminując bariery językowe.
Lepiej, szybciej, więcej
“Omnimodel” osiąga wydajność na poziomie GPT-4 Turbo w zakresie tekstu, rozumowania i inteligencji kodowania, ustanawiając jednocześnie nowe wysokie standardy w zakresie możliwości wielu języków, audio i wizyjnych. Dodatkowo ma wbudowane zabezpieczenia w różnych modalnościach, poprzez techniki takie, jak filtrowanie danych szkoleniowych i udoskonalanie zachowania modelu po szkoleniu. Stworzono także nowe systemy bezpieczeństwa.
GPT-4o jest 2x szybszy, o połowę tańszy i ma 5x wyższe limity szybkości w porównaniu do GPT-4 Turbo. „Planujemy w nadchodzących tygodniach udostępnienie funkcjonalności audio i wideo – za pośrednictwem API – małej grupie zaufanych partnerów” – podsumowują.
Produkt OpenAI przeszedł również etap współpracy zewnętrznej z ponad 70 zewnętrznymi ekspertami w takich dziedzinach, jak psychologia społeczna, czy dezinformacja, aby zidentyfikować ryzyko wprowadzone lub wzmocnione przez nowo dodane możliwości
Jeśli sami chcecie dowiedzieć się więcej o możliwościach ChatuGPT po aktualizacji, możecie to zrobić tutaj.
Prezent dla właścicieli „jabłek”
Oprócz nowego systemu OpenAI zaprezentował również aplikację na komputery z systemem macOS. Dzięki niej będziecie mogli korzystać z Chatu bezpośrednio na Waszych sprzętach, co może znacznie przyspieszyć pracę aplikacji oraz możliwości, takie jak widzenie ekranu czy implementacja danych.
W pierwszej kolejności została przygotowana aplikacja dla systemu macOS, którą będą mogli pobrać posiadacze subskrypcji ChatGPT Plus.
Oprogramowanie na komputery umożliwi również rozmawianie z czatbotem głosowo, nie trzeba będzie już wpisywać danych z klawiatury. Aplikacja ma zostać udostępniona użytkownikom za darmo w nadchodzących tygodniach. OpenAI planuje również stworzyć oprogramowanie na system Windows, natomiast będziecie musieli na nią poczekać jeszcze kilka miesięcy.
GPT-4o to nie tylko kolejny krok naprzód w technologii sztucznej inteligencji, ale prawdziwa rewolucja w sposobie, w jaki komunikujemy się z maszynami. Dzięki nowym funkcjom, takim jak analiza obrazów, rozpoznawanie emocji i tłumaczenie na żywo, OpenAI otwiera przed użytkownikami niespotykane dotąd możliwości. Te innowacje nie tylko ułatwiają codzienne zadania, ale również zbliżają nas do przyszłości, w której bariery językowe i komunikacyjne przestają istnieć. GPT-4o jest dowodem na to, że przyszłość sztucznej inteligencji już nadeszła, a jej potencjał jest ogromny.
W pełni wykorzystując atuty sztucznej inteligencji, możemy osiągnąć rzeczy, które wcześniej były niemożliwe. W naszej firmie AI wykorzystywana jest do wielu zadań i każdego dnia szukamy możliwości na jeszcze skuteczniejsze wykorzystanie jej w naszych obowiązkach. Mimo tego możecie być pewni, że ten tekst powstał z minimalnym użyciem sztucznej inteligencji 😉