Odbudowa Alexy: w jaki sposób Amazon łączy modele, agentów i korzystanie z przeglądarki, aby zapewnić inteligentniejszą sztuczną inteligencję

Dołącz do naszych codziennych i cotygodniowych newsletterów, aby otrzymywać najnowsze aktualizacje i ekskluzywne treści na temat wiodących w branży relacji z AI. Dowiedz się więcej
Amazon stawia na interoperacyjność agentów i łączenie modeli, aby zwiększyć skuteczność swojego nowego asystenta głosowego Alexa, wyposażając swojego flagowego asystenta głosowego w funkcje agentów i zadania obsługiwane za pomocą przeglądarki.
Ta nowa Alexa została przemianowana na Alexa+, a Amazon podkreśla, że ta wersja „robi więcej”. Na przykład może teraz proaktywnie informować użytkowników, czy dostępna jest nowa książka ich ulubionego autora lub że ich ulubiony artysta jest w mieście — a nawet oferować kupno biletu. Alexa+ rozumuje za pomocą instrukcji i kontaktuje się z „ekspertami” w różnych bazach wiedzy, aby odpowiadali na pytania użytkowników i wykonywali zadania, takie jak „Gdzie jest najbliższa pizzeria do biura? Czy moim współpracownikom będzie smakować? — Zrób rezerwację, jeśli uważasz, że tak będzie”.
Innymi słowy, Alexa+ łączy w sobie agentów AI, możliwości komputera i wiedzę zdobywaną od większego ekosystemu Amazon, aby stać się, jak ma nadzieję Amazon, bardziej wydajnym i inteligentniejszym domowym asystentem głosowym.
Alexa+ działa obecnie na modelach Nova firmy Amazon i modelach firmy Anthropic . Jednak Daniel Rausch, wiceprezes ds. Alexy i Echo w Amazon, powiedział VentureBeat, że urządzenie pozostanie „niezależne od modelu” i że firma może wprowadzić inne modele (przynajmniej modele dostępne w Amazon Bedrock ), aby znaleźć najlepszy do wykonywania zadań.
„[Chodzi o] wybranie właściwych integracji do wykonania zadania, ustalenie właściwego rodzaju instrukcji, co jest potrzebne do faktycznego wykonania zadania, a następnie zorganizowanie całości” — powiedział Rausch. „Najważniejszą rzeczą do zrozumienia jest to, że Alexa będzie nadal ewoluować z najlepszymi modelami dostępnymi w dowolnym miejscu w Bedrock”.
Mieszanie modeli lub trasowanie modeli pozwala przedsiębiorstwom i innym użytkownikom wybierać odpowiedni model AI do wykorzystania w oparciu o zapytanie po zapytaniu. Deweloperzy coraz częściej zwracają się w stronę mieszania modeli, aby obniżyć koszty. W końcu nie na każde polecenie musi odpowiedzieć model rozumowania; niektóre modele lepiej wykonują pewne zadania.
Jednostka Amazona zajmująca się chmurą i sztuczną inteligencją, AWS , od dawna jest zwolennikiem mieszania modeli. Niedawno ogłosiła funkcję w Bedrock o nazwie Intelligent Prompt Routing , która kieruje monity do najlepszego modelu i rozmiaru modelu w celu rozwiązania zapytania.
I to może działać. „Mogę powiedzieć, że nie mogę powiedzieć, jakiego modelu używa Alexa w przypadku jakiejkolwiek odpowiedzi na dane zadanie” — powiedział Rausch.
Rausch powiedział, że Alexa+ łączy agentów na trzy różne sposoby. Pierwszy to tradycyjne API; drugi to wdrażanie agentów, którzy mogą nawigować po stronach internetowych i aplikacjach, takich jak Computer Use firmy Anthropic ; trzeci to łączenie agentów z innymi agentami.
„Jednak w centrum tego wszystkiego, w koordynacji wszystkich tych różnych rodzajów doświadczeń, znajdują się te podstawowe, bardzo kompetentne, najnowocześniejsze programy studiów LLM” – powiedział Rausch.
Dodał, że jeśli aplikacja innej firmy ma już własnego agenta, ten agent może nadal komunikować się z agentami pracującymi w Alexa+, nawet jeśli agent zewnętrzny został utworzony przy użyciu innego modelu.
Rausch podkreślił, że zespół Alexa wykorzystał narzędzia i technologię Bedrock, w tym nowe narzędzia do orkiestracji wielu agentów .
Mike Krieger, dyrektor ds. produktów firmy Anthropic, powiedział portalowi VentureBeat, że nawet wcześniejsze wersje Claude'a nie będą w stanie spełnić oczekiwań Alexa+.
„Naprawdę interesujący moment 'Dlaczego teraz?' jest widoczny w wersji demonstracyjnej, ponieważ oczywiście modele stały się lepsze” — powiedział Krieger. „Ale gdybyś spróbował zrobić to z 3.0 Sonnet lub naszymi modelami poziomu 3.0, myślę, że miałbyś wiele problemów z jednoczesnym użyciem wielu różnych narzędzi”.
Chociaż ani Rausch, ani Krieger nie potwierdzili, którego konkretnego modelu Anthropic użył Amazon do stworzenia Alexa+, warto zaznaczyć, że Anthropic wydał w poniedziałek Claude 3.7 Sonnet , który jest dostępny na platformie Bedrock.
Wielu użytkowników po raz pierwszy zetknęło się z AI za pośrednictwem asystentów głosowych AI, takich jak Alexa, Google Home, a nawet Siri firmy Apple. Umożliwiają one ludziom outsourcing niektórych zadań, takich jak włączanie świateł. Nie posiadam urządzenia Alexa ani Google Home, ale niedawno dowiedziałem się, jak wygodne może być posiadanie jednego z nich podczas pobytu w hotelu. Mogłem powiedzieć Alexie, aby wyłączyła alarm, włączyła światła i odsłoniła zasłony, będąc jeszcze pod kołdrą.
Ale podczas gdy Alexa, urządzenia Google Home i Siri stały się wszechobecne w życiu ludzi, zaczęły pokazywać swój wiek, gdy popularna stała się generatywna sztuczna inteligencja. Nagle ludzie chcieli więcej odpowiedzi w czasie rzeczywistym od asystentów AI i żądali inteligentniejszych rozwiązań zadań, takich jak dodawanie wielu spotkań do kalendarzy bez potrzeby wielu podpowiedzi.
Amazon przyznał, że rozwój sztucznej inteligencji tej generacji, a zwłaszcza agentów, pozwolił Alexie w końcu wykorzystać swój potencjał.
„Do tej pory możliwości Alexy były dla nas ograniczone przez technologię” — powiedział Panos Panay, wiceprezes ds. urządzeń i usług w Amazon, podczas prezentacji.
Rausch powiedział, że mamy nadzieję, iż Alexa+ będzie się nadal udoskonalać, będą dodawane nowe modele i że dzięki temu więcej osób będzie mogło zapoznać się z możliwościami tej technologii.
Jeśli chcesz zaimponować swojemu szefowi, VB Daily ma dla Ciebie rozwiązanie. Dajemy Ci wewnętrzny wgląd w to, co firmy robią z generatywną sztuczną inteligencją, od zmian regulacyjnych po praktyczne wdrożenia, dzięki czemu możesz dzielić się spostrzeżeniami, aby uzyskać maksymalny zwrot z inwestycji.
Przeczytaj naszą Politykę prywatności
Dziękujemy za subskrypcję. Sprawdź więcej newsletterów VB tutaj .
Wystąpił błąd.

venturebeat