GPT-4 is coming next week – and it will be multimodal, says Microsoft Germany

2023-03-10T09:55:15+01:00 Vorlon 0 hejto.pl

Premiera GPT-4 jest nieuchronna, jak wspomniał Andreas Braun, CTO firmy Microsoft w Niemczech, na inauguracyjnym wydarzeniu AI 9 marca 2023 r.
GPT-4 pojawi się w przyszłym tygodniu: podczas trwającego około godziny hybrydowego wydarzenia informacyjnego zatytułowanego „ AI in Focus – Digital Kickoff ” poinformowano w dniu 9 marca 2023 r. szczegółowe informacje o firmach i ich ofercie Azure-OpenAI. Impreza inauguracyjna odbyła się w języku niemieckim, obecny był serwis informacyjny Heise. Raczej od niechcenia Andreas Braun, CTO Microsoft Niemcy i Lead Data & AI STU, wspomniał o zbliżającej się premierze GPT-4. Fakt, że Microsoft dopracowuje multimodalność za pomocą OpenAI, nie powinien już być tajemnicą od czasu wydania Kosmos-1 na początku marca.
„Wprowadzimy GPT-4 w przyszłym tygodniu”
„W przyszłym tygodniu wprowadzimy GPT-4, tam będziemy mieli modele multimodalne, które będą oferować zupełnie inne możliwości – na przykład wideo” – powiedział Braun. CTO nazwał LLM „zmieniaczem gier”, ponieważ uczy maszyny rozumienia języka naturalnego, który następnie rozumie w sposób statystyczny to, co wcześniej było czytelne i zrozumiałe tylko dla ludzi. W międzyczasie technologia zaszła tak daleko, że w zasadzie „działa we wszystkich językach”: możesz zadać pytanie po niemiecku i uzyskać odpowiedź po włosku. Dzięki multimodalności Microsoft(-OpenAI) „uczyni modele wszechstronnymi”.
Zakłócenia i „zabijanie starych ulubieńców”
Do Brauna dołączyła dyrektor generalna Microsoft Germany, Marianne Janik, która mówiła ogólnie o przełomach spowodowanych sztuczną inteligencją w firmach. Janik podkreślił potencjał sztucznej inteligencji do tworzenia wartości i mówił o punkcie zwrotnym w czasie – obecny rozwój AI i ChatGPT były „momentem iPhone'a”. Mówiła, że nie chodzi o zastępowanie miejsc pracy, ale o wykonywanie powtarzalnych zadań w inny sposób niż dotychczas. Jednym z punktów, o którym często zapomina się w publicznych dyskusjach, jest to, że „my w Niemczech wciąż mamy wiele dziedzictwa w naszych firmach” i „utrzymujemy stare skarby przy życiu przez lata”.
Zakłócenia niekoniecznie oznaczają utratę miejsc pracy. Potrzeba „wielu ekspertów, aby wykorzystać sztuczną inteligencję jako wartość dodaną” – podkreślił Janik. Tradycyjne opisy stanowisk zmieniają się, aw wyniku wzbogacenia o nowe możliwości pojawiają się nowe, ekscytujące zawody. Zaleca firmom tworzenie wewnętrznych „centrów kompetencyjnych”, które mogą szkolić pracowników w zakresie korzystania z AI i łączyć pomysły w projekty. Czyniąc to, „należy wziąć pod uwagę migrację starych ulubieńców”.
Ponadto CEO podkreślił, że Microsoft nie wykorzystuje danych klientów do trenowania modeli (co jednak nie dotyczy lub nie dotyczyło przynajmniej ich partnera badawczego OpenAI zgodnie z polityką ChatGPT). Janik mówiła o „demokratyzacji” – przez co miała na myśli tylko natychmiastową użyteczność modeli w ramach oferty Microsoft, w szczególności ich szeroką dostępność poprzez integrację AI na platformie Azure, Outlook i Teams.
Przypadki użycia, które są już dziś możliwe
Clemens Sieber (Senior AI Specialist) i Holger Kenn (Chief Technologist Business Development AI & Emerging Technologies, obaj Microsoft Niemcy) przedstawili wgląd w praktyczne wykorzystanie AI i konkretne przypadki użycia, nad którymi obecnie pracują ich zespoły, ale także w zaplecze techniczne. Kenn wyjaśnił, na czym polega multimodalna sztuczna inteligencja, która może odpowiednio tłumaczyć tekst nie tylko na obrazy, ale także na muzykę i wideo. Mówił o osadzaniach, które służą do wewnętrznej reprezentacji tekstu w modelu, oprócz klasy modelu GPT-3.5. Według Kenna odpowiedzialna sztuczna inteligencja jest już wbudowana w produkty firmy Microsoft, a „miliony zapytań można mapować na interfejsy API” za pośrednictwem chmury. Większość słuchaczy zapewne zgodziła się z nim co do podstawowej oceny, że czas zacząć. Zwłaszcza w obszarze programowania,
Clemens Siebler zilustrował przypadkami użycia to, co jest już dziś możliwe. Na przykład rozmowy telefoniczne z zamianą mowy na tekst mogłyby być nagrywane, a agenci call center nie musieliby już ręcznie streszczać i wpisywać treści. Według firmy Siebler może to zaoszczędzić 500 godzin pracy dziennie dla dużego klienta firmy Microsoft w Holandii, który odbiera 30 000 połączeń dziennie. A prototyp projektu powstał w ciągu dwóch godzin, jeden programista zrealizował projekt w dwa tygodnie (plus dodatkowy czas na ostateczną implementację). Według niego trzy najczęstsze przypadki użycia to odpowiadanie na pytania dotyczące wiedzy firmowej dostępnej tylko dla pracowników, przetwarzanie dokumentów wspomagane przez sztuczną inteligencję oraz półautomatyzacja poprzez przetwarzanie języka mówionego w call and response center.
Zapytany o niezawodność operacyjną i wierność faktom, Siebler powiedział, że sztuczna inteligencja nie zawsze odpowie poprawnie, dlatego konieczna jest walidacja. Firma Microsoft tworzy obecnie metryki zaufania w celu rozwiązania tego problemu. Klienci często korzystają ze wsparcia AI tylko na własnych zbiorach danych, głównie do czytania ze zrozumieniem i wysyłania zapytań do danych inwentaryzacyjnych, gdzie modele są już dość dokładne. Jednak tekst generowany przez model pozostaje generatywny i dlatego nie jest łatwo weryfikowalny. „Budujemy wokół tego pętlę informacji zwrotnych z kciukami w górę i kciukami w dół” – powiedział Siebler – jest to proces iteracyjny. Co ciekawe, żaden z czterech pracowników Microsoftu nie skomentował integracji AI we własnej wyszukiwarce firmy, „nowym Bing”. Ostatni panel nie był otwarty na pytania publiczności.
tłumaczenie Google Translate
źródło: https://www.heise.de/news/GPT-4-is-coming-next-week-and-it-will-be-multimodal-says-Microsoft-Germany-7540972.html

GPT-4 is coming next week – and it will be multimodal, says Microsoft Germany

Komentarze (0)