Google мечтает о большем, когда дело доходит до искусственного интеллекта. И теперь она делает важный шаг к созданию искусственного интеллекта, который действительно понимает физический мир, обучая его с помощью видео на YouTube. (Moneycontrol)
В недавнем эпизоде подкаста Possible генеральный директор Google DeepMind Демис Хассабис объяснил, как компания планирует объединить два своих мощных инструмента искусственного интеллекта: Gemini, который создан для понимания и генерации текста, изображений и аудио, и Veo, который создает видео. Вместе они могли бы сформировать супер-умного помощника, который не просто отвечает на вопросы, но и на самом деле понимает, как устроен мир.
«Мы всегда строили Gemini как мультимодальный с самого начала», — сказал Хассабис. «И причина, по которой мы это сделали, заключается в том, что у нас есть видение идеи универсального цифрового помощника, который действительно помогает вам в реальном мире».
Проще говоря, Google хочет создать искусственный интеллект, который не просто общается или рисует картинки, а смотрит, слушает и учится на всем, включая видео.
И да, большая часть этого видеообучения, скорее всего, взята с YouTube. Поскольку Google владеет платформой, у него есть доступ к огромной библиотеке контента, показывающего реальную деятельность — приготовление пищи, строительство, спорт, научные эксперименты и многое другое. «В основном, просматривая видео на YouTube — много видео на YouTube — [Veo 2] может понять, знаете, физику мира», — сказал Хассабис.
Цель? Более умный ИИ, который может «видеть» и интерпретировать мир так же, как это делают люди. Подумайте о помощнике, который не просто даст вам рецепт, но и поймет, как ингредиенты ведут себя при приготовлении, потому что он видел тысячи видео, демонстрирующих это в действии.
Google не одинок в этой гонке. OpenAI и Amazon также работают над аналогичными «омни» моделями — системами искусственного интеллекта, которые могут обрабатывать все, от текста до изображений и звуков, одновременно.
Конечно, все это требует огромных объемов данных. Google заявил, что некоторые из его моделей могут быть обучены на контенте YouTube, в зависимости от соглашений с создателями. В прошлом году компания даже обновила свои условия обслуживания, чтобы разрешить более широкое использование контента для обучения ИИ.
MC Tech Desk
(в пересказе)
Некоммерческое сообщество журналистов Non profit
Семь Новостей. https://t.me/Fable_Teller
#политика #экономика #культура #новости
LitPatrol. https://t.me/ValeriusRu
#литература #книги #афоризмы