20 травня 2025 року в місті Маунтін-В’ю відбулася щорічна конференція розробників Google I/O 2025, яка стала платформою для анонсування найновіших технологічних досягнень компанії. Основна увага була приділена революційним розробкам у сфері штучного інтелекту, зокрема, представленню нових моделей та платформ, що відкривають нові можливості у відеозв’язку, генеративному контенті та персоналізованих сервісах.
Про це розповідає UBB
Нові технології у відеозв’язку та штучному інтелекті
Одним із головних анонсів конференції стала платформа Google Beam — інноваційна система для відеозв’язку, яка створює реалістичний 3D-ефект присутності за допомогою штучного інтелекту та шести камер. Технологія забезпечує точну відтворюваність рухів та голосу співрозмовника, створюючи ілюзію перебування в одній кімнаті. Перші пристрої з цією платформою з’являться для ранніх користувачів у 2025 році.
Крім того, компанія покращила функції Google Meet, додавши можливість автоматичного перекладу мовлення у реальному часі, що дозволить бізнес-клієнтам ефективно спілкуватися без мовних бар’єрів. На даний момент ця функція працює з англійської на іспанську у бета-версії для користувачів AI Pro та Ultra, з планами розширення кількості мов.
Генеративний контент: відео та зображення
Значну увагу на конференції було приділено новим генеративним моделям Veo 3 та Imagen 4. Veo 3 — це система для створення якісного відеоконтенту зі звуком, діалогами та ефектами, доступна з 21 травня у застосунку Gemini за ціною $249,99 на місяць. Модель дозволяє генерувати відео за текстовими або візуальними підказками, значно покращуючи його якість порівняно з попередніми версіями.
Модель Imagen 4 здатна створювати фотореалістичні та абстрактні зображення високої деталізації з роздільною здатністю до 2K, включно з деталями тканин, крапель води і хутра.
Інновації у штучному інтелекті та розробках для бізнесу
На конференції було представлено оновлений Gemini Live, який тепер включає універсального ШІ-асистента Project Astra з підтримкою камери та спільним доступом до екрана. Ця функція вже використовується для підготовки до співбесід і тренувань, і стає доступною для користувачів Android і iOS.
Google також працює над створенням агентів на базі ШІ, зокрема, проект Mariner, що автоматично виконує завдання, наприклад, пошук житла або запис на перегляди. Ці можливості вже доступні розробникам через API Gemini і незабаром з’являться у застосунках Gemini, Chrome і пошуку.
Крім того, компанія оголосила про впровадження персоналізованих розумних відповідей у Gmail, які автоматично знайдуть потрібні документи і сформують відповідь згідно з вашим стилем.
У рамках презентації було представлено новий AI Mode для пошуку, що дозволяє ставити довгі та уточнювальні запити, а також оновлення системи Deep Research, яка тепер підтримує завантаження власних файлів та зображень.
Для розробників Google презентувала Stitch — інструмент для автоматичної генерації інтерфейсів веб- та мобільних застосунків, а також розширила функціонал ШІ-асистента Jules.
Модель Gemini 2.5 отримала значне оновлення, покращене майже за всіма параметрами, з додаванням режиму глибокого мислення Deep Think. Паралельно була оновлена операційна система Wear OS 6, а для розробників доступні нові інструменти у Play Store.
На завершення конференції було оголошено про інвестиції у розмірі $150 мільйонів у компанію Warby Parker, що займається виробництвом окулярів.