Google Home отримує Gemini: опис камер реального часу
Google Home отримує велике оновлення з Gemini, яке тепер може словами описувати те, що показує жива трансляція з домашньої камери.
Gemini поступово заходить у сценарії «розумного дому» і тепер береться за найскладніше місце в цій екосистемі: відео. The Verge звернув увагу на апдейт, у якому асистент може «переказувати побачене з live-камери текстом», щоб власнику не доводилося щоразу відкривати трансляцію й «вчитуватися» в картинку. Формат виглядає як логічне продовження коротких описів подій зі сповіщень, але тепер фокус зсувається на живий потік.
Домашні камери зазвичай дають багато шуму: тіні, коти, машини під вікном. Люди або вимикають нотифікації, або звикають їх ігнорувати. Текстовий опис з боку моделі може перетворити «рух у кадрі» на більш придатну підказку на кшталт «людина біля дверей» чи «посилка на порозі» (приклади наводять західні оглядачі, але формулювання завжди залежатиме від сцени й якості картинки).
Описувати відео в реальному часі означає обробляти чутливі дані. Для користувача тут важать три речі: де саме відбувається обчислення (на пристрої чи в хмарі), чи зберігаються фрагменти, і як система поводиться з помилковими «висновками» моделі. У домашній безпеці хибне спрацювання лише дратує, а пропущена подія вже створює ризик. Тому запуск таких функцій зазвичай йде поетапно, з обмеженнями за мовами й регіонами.
Раніше вже писалося про перехід Google від Assistant до Gemini в різних продуктах і про те, як компанія збирає єдиний «мозок» для пошуку, Android та сервісів. Камери та дверні дзвінки лишалися складною зоною, бо там немає «запиту», є потік подій. Опис live-відео переводить цю зону в текст, а текст легко лягає в автоматизації та сценарії.
Google підтягує AI-функції в сегмент, де давно змагаються Amazon, Apple та виробники камер із власними застосунками. Якщо опис live-кадру запрацює стабільно, користувачі отримають швидший контроль без постійного перегляду відео, а виробники камер отримають новий аргумент у підписках та преміум-функціях.
Нагадаємо, що Google додає нові функції та вкладки в Translate.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn
Відеосервіс Zoom анонсує технологію цифрових двійників, які самостійно відвідуватимуть робочі зустрічі. Про це пише TechCrunch.…
IT-гігант Meta (материнська компанія Facebook) офіційно оголосив про придбання Moltbook — вірусної соціальної мережі, яка…
Експериментальний агент штучного інтелекту ROME, якого створили дослідники, пов'язані з китайською компанією Alibaba, продемонстрував неочікувану…
Центральне бюро боротьби з кіберзлочинністю Польщі (CBZC) провело масштабну операцію, результатом якої стало викриття групи…
Microsoft оголосила про початок інтеграції технологій Anthropic у свої сервіси, представивши новий інструмент Copilot Cowork,…
Компанія Anthropic оголосила про доступність у Claude Code бета-версії нового інструменту Code Review. Він розробленій…