Google представляє Gemini Intelligence для Android з новими функціями

Сьогодні Google оголосила про появу Gemini Intelligence в операційній системі Android. Ця нова інтеграція штучного інтелекту має на меті допомогти користувачам проактивно виконувати щоденні завдання, зберігаючи при цьому зосередженість на конфіденційності та контролі персональних даних. За словами компанії, нові функції почнуть впроваджуватися поетапно, починаючи з цього літа, з запланованим дебютом на останніх смартфонах Samsung Galaxy S26 та Google Pixel 10. Пізніше, до кінця року, доступність буде поширена на інші пристрої Android, включаючи смарт-годинники, автомобілі, окуляри та ноутбуки.
Автоматизація завдань та візуальний контекст
Однією з головних нових функцій є можливість автоматизувати дії, які потребують кількох кроків у різних програмах. Google зазначає, що останні кілька місяців вона вдосконалювала ці функції в моделях Galaxy S26 та Pixel 10, зосереджуючись на популярних програмах доставки їжі та пасажирських перевезень. Мета полягає в тому, щоб помічник міг орієнтуватися в інтерфейсах для виконання складних завдань, таких як бронювання велосипеда для заняття в фізкультурі або пошук навчальної програми в Gmail та додавання необхідних книг до кошика.
Ця автоматизація стає більш комплексною завдяки додаванню контексту екрана або зображення. Замість ручного перемикання між програмами для копіювання даних, система може перетворити візуальний контекст на негайну дію. Наприклад, переглядаючи список покупок у додатку для нотаток, користувач може натиснути кнопку ввімкнення/вимкнення та попросити помічника створити кошик для доставки. В іншому описаному сценарії йдеться про те, що під час фотографування туристичної брошури у вестибюлі готелю можна попросити його знайти схожий тур для групи з шести осіб. Прогрес відображається за допомогою сповіщень, і система діє лише за командою, яка завжди вимагає остаточного підтвердження від користувача для завершення операції.
Інтеграція з браузером та заповнення форм
Починаючи з кінця червня, пристрої Android отримають оптимізованого для веб-перегляду помічника з навігації. Gemini в Chrome допоможе вам ефективніше шукати, узагальнювати та порівнювати контент. Саме в цьому контексті Chrome перетворюється на інтелектуального агента з Gemini та функцією «Автоматичний перегляд», яка дозволяє браузеру виконувати рутинні завдання від імені користувача, такі як планування зустрічей або резервування паркувальних місць.
Паралельно, функція автозаповнення Google почне використовувати особистий інтелект помічника. Android автоматично заповнюватиме складні текстові поля в різних програмах, витягуючи відповідну інформацію з пов'язаних сервісів. Компанія заявляє, що з'єднання між помічником та автозаповненням є суворо необов'язковим. Це означає, що користувач вибирає, чи встановлювати це з'єднання і коли, з можливістю ввімкнення або вимкнення цієї функціональності в налаштуваннях системи в будь-який час.
Транскрипція голосу та створення власних віджетів
Щоб вирішити звичайні труднощі перетворення голосу в текст, Google представить Rambler. Ця функція розроблена для розуміння природного способу мовлення людей, який часто включає вагання, повторення та паузи. Користувач може говорити природно, а система витягує важливі частини для побудови лаконічного повідомлення. Аудіо використовується лише для транскрипції в режимі реального часу та не зберігається. Крім того, Rambler підтримує кілька мов одночасно, з можливістю перемикатися між мовами в одному реченні та розуміти нюанси кожної з них, гарантуючи, що остаточне повідомлення звучить природно, але водночас вишукано.
Нарешті, інтерфейс операційної системи отримує оновлення з впровадженням віджетів, згенерованих штучним інтелектом. Функція «Створити мій віджет» пропонує можливість створення персоналізованих панелей інструментів за допомогою описів природною мовою. Користувач може щотижня замовити три рецепти, багаті на білок, або створити віджет погоди, орієнтований лише на швидкість вітру та кількість опадів. Ці інструменти працюють як на смартфонах, так і на годинниках з Wear OS. Весь візуальний досвід базується на мові дизайну Material 3 Expressive, яку було оновлено, щоб зменшити відволікаючі фактори та допомогти користувачеві зосередитися на найважливішому.